Data Science (DS)

Die Art, in welchem Umfang und in welcher Form Daten zur Verfügung stehen, hat sich mit flächedeckender Social-Media-Nutzung, extensiven Logdaten und sogenannten Mehrwertdiensten stark verändert. Allen ist gemein, dass die Daten der Kunden den Hauptwertbestand darstellen. Exemplarisch sind das nebst bekannten Social-Media-Vertretern Payback-Kartensysteme, Health-Tracker, GSM und GPS-Tracker in Autos und Handys, Internet-of-Things-Daten und Tracking-Systeme für das Klickverhalten der Nutzer im Web.

Aufgabe des Data-Science ist zum Einen die infrastrukturelle Herausforderung, mit den zumeist umfangreichen und z.T. als Datenstrom eintreffenden Daten umzugehen. Zum Anderen gilt es jedoch, Wert aus diesen Daten in Form von Zusammenhängen zu generieren. Dies ist die eigentliche Kernaufgabe. Die anfallenden Daten sind dabei häufig unstrukturiert und die zu findenden Zusammenhänge befinden sich z.T im Bereich bisher unbeachteter Fragestellungen, für die es keine vorgedachten Lösungen gibt. Als Data-Mining-Methoden kommen daher u.a. solche des unüberwachten, aber auch des überwachten maschinellen Lernens zum Einsatz. Dies geschieht z.B. in Form schwacher KI auf Basis einer Deep-Learning-Architektur. Typische statistische Themenfelder hierbei sind die Regression, die Kategorisierung, Cluster-Bildung/Ähnlichkeiten und Überlebensmodelle.

Ansprechpartner: Arne Scheffer (CIT)
Tel: 0251 83-31581