Anwendungen, zum Beispiel im Bereich Künstliche Intelligenz (KI) oder Informationstechnologie im Allgemeinen, beinhalten häufig ein System, welches große Mengen an Daten im Kern hält. Dieses System arbeitet mit heterogenen, möglicherweise unstrukturierten Daten (Texte, Diagramme, Bilder, Zeitreihen, Videos). Algorithmen verarbeiten diese Daten um einen implizit oder explizit formulierten Zweck der Anwendung zu erfüllen, wie zum Beispiel Lernalgorithmen, welche ein Modell erzeugt oder verbessern, welches enkodiert, woraus die Daten ursprünglich mal generiert wurden. So ein Modell fängt domänenspezifische Aspekte der Semantik ein, welche Menschen nutzen, wenn sie die Daten interpretieren. Datenverarbeitung geht aber noch so viel weiter und beinhaltet auch die Anfragebeantwortung. Algorithmen um Anfragen auf Modellen mit einer bestimmten Semantik - und nicht direkt auf den Daten - zu beantworten, so genannte Inferenzalgorithmen, ermöglichen es einem System die Daten weiter bezüglich der Semantik auszuwerten. Besonders wenn Systeme Entscheidungen treffen oder im weiteren Sinne in einer Umgebung handeln, müssen die Systeme in der Lage sein Erklärungen für ihre Aktionen zu liefern bzw. allgemeiner formuliert, müssen sie nachvollziehbar in ihrer Umgebung handeln. Moderne Aspekte der Datenverarbeitung bzw. Data Science beschäftigen sich mit diesen komplexen Anforderungen an solche Systeme.
Im speziellen interessieren wir uns in dieser Arbeitsgruppe für
- Statistisch-relationale KI (statistical relational AI, StarAI), besonders probabilistische Inferenz (sowohl wahrscheinlichkeitstheoretisch als auch entscheidungstheoretisch) in relationalen Domänen
- Textverständnis, besonders Annotationen und Kontextdarstellungen
- Mensch-bewusste KI (human-aware AI), besonders Entscheidungsfindung in mensch-bewussten Agenten