Data Science (im Modul Datenverarbeitung) - abgesagt
Achtung: Wegen kurzfristiger Übernahme der Vorlesung Datenbanken muss die Vorlesung Data Science leider entfallen.
Überblick
Dieser Kurs deckt Methoden aus dem Bereich Data Science ab. Konkret konzentrieren wir uns auf Clustering-Algorithmen und probabilistische graphische Modelle & Inferenz und betrachten Textmodellierung und Information Retrieval als Anwendung von Clustering-Ideen und probabilistischer Modellierung.
Inhatlich überschneidet sich die Vorlesung mit der Vorlesung Einführung in die Künstliche Intelligenz aus dem Sommersemester 2022 in geplanten sechs Vorlesungen (PGM Teil).
Randbemerkung: Diese Vorlesung ist so ausgelegt, dass sie das Modul Mustererkennung und Maschinelles Lernen gut ergänzt.
Diese Vorlesung wird namentlich ab der nächsten PO-Änderung Data Science heißen.
Für weitere Informationen melden Sie sich bitte im Learnweb-Kurs an, sobald er existiert.
Themen (vorläufig) und Präsentationsmaterial
- Überblick (pptx, pdf)
- Einleitung (pptx, pdf)
- Clustering
- Grundlegende Algorithmen (pptx, pdf)
- Distanzmaße (pptx, pdf)
- Bewertungskriterien (pptx, pdf)
- Weitergehende Algorithmen (pptx, pdf)
- Probabilistische graphische Modelle (PGMs)
- Probabilistische Modellierung (pptx, pdf)
- Exakte Inferenz (pptx, pdf)
- Approximative Inferenz (pptx, pdf)
- Lernalgorithmen (pptx, pdf)
- Sequentielle PGMs und Inferenz (pptx, pdf)
- Textmodellierung & Information Retrieval
- Vorverarbeitung (pptx, pdf)
- Information Retrieval und dessen Bewertung
- Vektor-basierte Verarbeitung (pptx, pdf)
- Probabilistische Verarbeitung (pptx, pdf)
- Erweiterung: Korpusannotationen (pptx, pdf)
Literatur
- Clustering: folgt
- Probabilistic Graphical Models - Principles and Techniques, Daphne Koller und Nir Friedman
Alle Versionen sind online auffindbar.