Data Science (im Modul Datenverarbeitung) - abgesagt

Achtung: Wegen kurzfristiger Übernahme der Vorlesung Datenbanken muss die Vorlesung Data Science leider entfallen.

Überblick

Dieser Kurs deckt Methoden aus dem Bereich Data Science ab. Konkret konzentrieren wir uns auf Clustering-Algorithmen und probabilistische graphische Modelle & Inferenz und betrachten Textmodellierung und Information Retrieval als Anwendung von Clustering-Ideen und probabilistischer Modellierung.

Inhatlich überschneidet sich die Vorlesung mit der Vorlesung  Einführung in die Künstliche Intelligenz aus dem Sommersemester 2022 in geplanten sechs Vorlesungen (PGM Teil).

Randbemerkung: Diese Vorlesung ist so ausgelegt, dass sie das Modul Mustererkennung und Maschinelles Lernen gut ergänzt.

Diese Vorlesung wird namentlich ab der nächsten PO-Änderung Data Science heißen.

Für weitere Informationen melden Sie sich bitte im Learnweb-Kurs an, sobald er existiert.

Themen (vorläufig) und Präsentationsmaterial

  1. Überblick (pptx, pdf)
  2. Einleitung (pptx, pdf)
  3. Clustering
    1. Grundlegende Algorithmen (pptx, pdf)
    2. Distanzmaße (pptx, pdf)
    3. Bewertungskriterien (pptx, pdf)
    4. Weitergehende Algorithmen (pptx, pdf)
  4. Probabilistische graphische Modelle (PGMs)
    1. Probabilistische Modellierung (pptx, pdf)
    2. Exakte Inferenz (pptx, pdf)
    3. Approximative Inferenz (pptx, pdf)
    4. Lernalgorithmen (pptx, pdf)
    5. Sequentielle PGMs und Inferenz (pptx, pdf)
  5. Textmodellierung & Information Retrieval
    1. Vorverarbeitung (pptx, pdf)
    2. Information Retrieval und dessen Bewertung
    3. Vektor-basierte Verarbeitung (pptx, pdf)
    4. Probabilistische Verarbeitung (pptx, pdf)
    5. Erweiterung: Korpusannotationen (pptx, pdf)

Literatur

  • Clustering: folgt
  • Probabilistic Graphical Models - Principles and Techniques, Daphne Koller und Nir Friedman

Alle Versionen sind online auffindbar.