|
Münster (upm)
Prof. Dr. Frank Glorius (links) und Philipp Pflüger erklären im Interview, was Molecular Machine Learning bedeutet.<address>© WWU - Marius Kühnemund</address>
Prof. Dr. Frank Glorius (links) und Philipp Pflüger erklären im Interview, was Molecular Machine Learning bedeutet.
© WWU - Marius Kühnemund

"Wir müssen lernen, die Chemie als Datenwissenschaft zu verstehen"

Frank Glorius und Philipp Pflüger über das neue Forschungsgebiet "Molecular Machine Learning"

„Molecular Machine Learning“ (MML) ist ein neuer Forschungszweig mit dem Potenzial, die chemische Forschung zu verändern. Prof. Dr. Frank Glorius, Koordinator des von der Deutschen Forschungsgemeinschaft (DFG) geförderten neuen Schwerpunktprogramms „Molecular Machine Learning”, SPP 2363, und Chemie-Doktorand Philipp Pflüger, der das Programm mit entwickelt hat, beleuchten im Gespräch mit Christina Hoppenbrock, was MML bedeutet, welche Chancen und Herausforderungen dieses neue Forschungsfeld mit sich bringt und wie die Berufswelt von morgen im Bereich Chemie aussieht.

 

Welche Rolle spielt maschinelles Lernen („Machine Learning“) generell in der Chemie?

Frank Glorius: Die meisten Fragen, mit denen wir in der Chemie und besonders im Fachgebiet der Synthesechemie konfrontiert sind, erfordern das Erkennen von komplexen Mustern. Dabei müssen wir Zusammenhänge zwischen den Strukturen von unterschiedlichen Molekülen, Reaktionen oder analytischen Daten erkennen. Obwohl Chemiker und Chemikerinnen bereits viel leisten, kommen wir an unsere Grenzen, wenn es um große Datenmengen, beispielsweise Tausende von chemischen Reaktionen, geht. In diesen Fällen kann Machine Learning helfen, wichtige Muster zu erkennen und basierend darauf allgemeingültige Modelle zu erstellen. Vorhersagen dieser Modelle können Laborchemiker dann wieder nutzen, um zum Beispiel die Ausbeuten von Reaktionen abzuschätzen.

Philipp Pflüger: Die Chemie und insbesondere die Industrie durchläuft hier eine regelrechte Transformation. Wir erkennen, dass passende Algorithmen und Modelle uns die Möglichkeiten geben, effizienter zu arbeiten und Probleme schneller zu lösen. Machine Learning kann uns bestimmte Arbeiten abnehmen oder erleichtern. Chemikerinnen und Chemiker können sich dadurch auf kreative und innovative Aufgaben fokussieren.

Und worauf bezieht sich der Zusatz „molekular“, also auf Englisch „Molecular Machine Learning“?

Frank Glorius: Das Konzept von Machine Learning gibt es schon seit den 1950er Jahren, und seit Computer immer leistungsfähiger werden, machen sich unterschiedliche Fachgebiete diese „selbst lernenden Algorithmen“ zunutze. Besonders in der Texterkennung oder bei der Verarbeitung von numerischen Werten, also Zahlen, ist das vergleichsweise einfach, da Programme diese Datentypen direkt verarbeiten können. Für Moleküle und Reaktionen ist dies anders. Es gibt kein einheitliches und maschinenlesbares Format, in dem wir die Strukturen unserer Materie in ein Programm einspeisen können. Obwohl es einige unterschiedliche Lösungsansätze gibt, stellt uns dieses sogenannte Encoding von Molekülen noch immer vor große Herausforderungen.

Philipp Pflüger: MML kann uns helfen, chemische Daten zu verstehen und zu nutzen. Dafür müssen wir diese technischen Methoden allerdings zunächst ergründen, an chemische Fragestellungen anpassen und teilweise neu entwickeln. Erst dann können wir feststellen was selbstlernende Algorithmen für die Chemie leisten können und vor allem wo Limitationen liegen.

Chemiker haben in der Regel keine Ausbildung in Informatik. Wer soll die nötigen Computerprogramme entwickeln?

Frank Glorius: In unseren Curricula werden tatsächlich nur wenige Kenntnisse zur Verwendung von Programmiersprachen vermittelt, sodass Promovierende vieles erst vergleichsweise spät lernen. Dass alle Chemiker zu Software-Entwicklern werden, kann und sollte aber auch nicht das Ziel sein. Unsere Erfahrung zeigt hier, dass nur Kooperation der Schlüssel zum Erfolg auf einem so interdisziplinären Gebiet sein kann.

Aber wie bündelt man die nötigte Expertise?

Frank Glorius: Uns war klar, dass dafür eine Plattform nötig ist, die Informatiker, Chemiker, Pharmazeuten, Mathematiker und viele mehr zusammenbringt. Wir haben uns systematisch angeschaut, wer in Deutschland auf diesem Gebiet arbeitet, und konnten ein erstes Netzwerk etablieren. Das Feedback, das wir bekommen haben, war überwältigend positiv. Das SPP 2363 bietet Experten aus allen Bereichen nun die Möglichkeit, sich zu Themen des MML auszutauschen, Synergien zu entdecken und letztendlich ein wichtiges Themenfeld aktiv zu gestallten.

Inwiefern profitieren die Studierenden davon?

Philipp Pflüger: Ich hoffe, dass wir Studierenden dabei viel voneinander lernen können. Meiner Erfahrung nach haben viele junge Promovierende ein Bedürfnis danach, sich auch mit Themen aus anderen Bereichen auseinanderzusetzen, um Dinge zu lernen, die für sie fundamental neu sind. Dies ist, in häufig homogenen Forschungsgruppen, nicht einfach und erfordert eine riesige Eigeninitiative. Ich bin davon überzeugt, dass Programme wie das SPP dieses Interesse fördern und den Blickwinkel angehender Forscher weiten.

Der Einsatz von Computern ist für Chemiker Alltag. Der Einsatz Künstlicher Intelligenzen könnte die Arbeitswelt jedoch deutlich verändern.<address>© WWU - Marius Kühnemund</address>
Der Einsatz von Computern ist für Chemiker Alltag. Der Einsatz Künstlicher Intelligenzen könnte die Arbeitswelt jedoch deutlich verändern.
© WWU - Marius Kühnemund
Was erwartet junge Menschen, die heute Chemie studieren – wird der Job von Chemikerinnen und Chemikern in Zukunft ein anderer sein als heute?

Frank Glorius: So wie der Beruf von Chemikern vor 20 Jahren ein ganz anderer war als heute, wird er auch in zehn Jahren ein anderer sein. Natürlich spielen technische Entwicklungen hierbei eine entscheidende Rolle. Wie schon jetzt in einigen Bereichen werden wir in Zukunft Methoden haben, die Chemiker in jedem Schritt ihres Arbeitsalltags unterstützen. Wir müssen offen gegenüber diesen Werkzeugen werden und einen Wandel zulassen. Dabei ist Technologie immer mit dem Risiko verbunden zu scheitern und wir sollten eine Fehlerkultur aufbauen. Wir müssen lernen, die Chemie als Datenwissenschaft zu verstehen, um unsere Ergebnisse systematisch betrachten zu können. Dieses Datenbewusstsein bildet sich in der Industrie langsam aus und auch als wissenschaftliche Gemeinschaft fangen wir an, den Wert unserer Daten als Ganzes zu sehen.

Herr Pflüger, Sie sind ein junger Chemiker. Für Sie wird die Berufswelt von morgen alltäglich werden …

Philipp Pflüger: Ich habe das Glück, beide Seiten des gleichen Gebiets kennenzulernen: die Laborchemie in ihren vielen Facetten und die Chemoinformatik mit neuen Sichtweisen und Ansätzen. In der Kombination sehe ich unglaubliches Potenzial für die Entwicklung neuer Werkzeuge. Ich möchte gerne Teil des aktuellen Wandels sein und hoffe, mit kreativen und anwenderfreundlichen Lösungen meine Kolleginnen und Kollegen in den Laboren unterstützen zu können. Meine Hoffnung ist, dass wir das Potenzial des MML gemeinsam voll ausschöpfen können. Ich denke, dass zu dieser Aufgabe auch gehört, zukünftige Anwendungen so zu entwickeln, dass Chemiker keine Informatikkenntnisse benötigen – die entwickelte Software sollte ein intuitives Werkzeug sein.

Welche Rolle spielt das SPP 2363 dabei, die jungen Leute vorzubereiten?

Philipp Pflüger: Exzellente Forschung wird von gut ausgebildeten jungen Menschen getragen. Deshalb ist es mir unglaublich wichtig, dass das Schwerpunktprogram, welches primär auf die Forschung ausgerichtet ist, auch die Lehre verändert. Ich hoffe, dass beteiligte Forschende ein Interesse daran entwickeln, Themen wie Data Science oder Chemoinformatik in Curricula aufzunehmen und möchte, dass auch wir Promovierende dies mittragen. Der SPP dient hier wieder als Plattform, um sich auszutauschen, Lehrerfahrungen zu teilen und um Hemmschwellen abzubauen. Wir haben sowohl in der Informatik als auch in der Chemie bereits erste Seminare zu Themen wie Chemoinformatik und Machine Learning betreut und waren immer wieder begeistert, wie groß das Interesse der Studierenden an interdisziplinärer Forschung ist. Meine Hoffnung ist, dass das SPP uns die Möglichkeit gibt, langfristige Kooperationen aufzubauen, die dann gemeinsame Lehrangebote tragen.

Frank Glorius: Neben Lehrangeboten geht es auch um die Ausbildung von Doktoranden und zukünftigen Professoren. Unser SPP gibt dem wissenschaftlichen Nachwuchs die Chance, sich auf diesem modernen Feld weiterzuentwickeln.

Von Synthesechemikern hört man immer wieder, dass molekularen Reaktionen eine Ästhetik innewohnt. Diese Schönheit oder Eleganz – die für Laien nicht ohne Weiteres ersichtlich ist – ist für viele Chemiker ein Antrieb, Synthesewege zu kreieren und zu optimieren …

Philipp Pflüger: … Natürlich sind Ästhetik und Eleganz zentrale Punkte der organischen Chemie, wir sehen uns manchmal als molekulare Architekten. Aber Synthesechemie als anwendungsbezogene Wissenschaft muss per se elegant sein, um effizient und nutzbar zu sein. Hier könnte man so manches Streben nach Eleganz eher als Notwendigkeit und weniger als intrinsischen Antrieb bezeichnen. Allerdings erfordert das Designen von Methoden und Synthesen immer eine besondere Kreativität. Ähnliches gilt auch für Schach. Diesem Spiel und einigen Spielzügen sagt man eine Ästhetik nach, und mit dem Aufkommen der Schachcomputer konnte man beobachten, dass Künstliche Intelligenzen (KI) in der Tat anders spielen als Menschen. Diese Algorithmen entwickeln ganz neue Strategien und Züge mit eigener Eleganz, wodurch wir nun an einem Punkt sind, an dem wir Menschen mit KI trainieren. Auf lange Sicht ist dieser Trend, dass wir von Computern lernen können und unsere „Kreativitäten“ verbinden, auch in der Chemie zu erwarten.

Frank Glorius: Zum jetzigen Zeitpunkt ist das noch nicht abzuschätzen, denn besonders in der Chemie entwickelt sich das Feld gerade erst. Wie immer, wenn ein Hype oder Trend aufkommt, gibt es Leute, die Technologie überschätzen, und andere, die sie unterschätzen. Die Wahrheit liegt dann oft dazwischen und wir können nur unser Bestes geben, diese neuen Werkzeuge verantwortungsvoll zu ergründen und weiterzuentwickeln. Ich sehe das pragmatisch: Menschen und Maschinen haben unterschiedliche Stärken und Schwächen. Wir Menschen müssen schauen, dass wir Künstliche Intelligenzen sinnvoll mit Vorhandenem kombinieren. Mit diesem Ziel vor Augen wäre eine Symbiose von menschlichen Fähigkeiten und Künstlichen Intelligenzen sehr elegant.

 

© WWU - Philipp Pflüger"> Logo des neuen Schwerpunktprogramms "Molecular Machine Learning"<address>© WWU - Philipp Pflüger</address>
Logo des neuen Schwerpunktprogramms "Molecular Machine Learning"
© WWU - Philipp Pflüger
Das Schwerpunktprogramm „Molecular Machine Learning” startet im Frühjahr 2022. Schon bevor es losgeht, suchen die Organisatoren nach Studierenden, die mitmachen möchten. Interessierte können sich bei Prof. Dr. Frank Glorius melden (glorius@uni-muenster.de).

 

Terminhinweis:

13. Januar 2022, 15 Uhr (online per Zoom): 4th International Mini-Symposium on Molecular Machine Learning (MML) 2022

Die internationale Symposiumreihe zu „Molecular Machine Learning“ bringt international führende Wissenschaftler aus Forschungsgebieten wie Automatisierung, Reaktionsvorhersage, computergestützter Reaktionsplanung und Wirkstoffforschung sowie datenbasiertem molekularem Design zusammen. Die von Prof. Dr. Frank Glorius organisierten Konferenzen verfolgen das Ziel, modernste Forschung und Ideen zu vermitteln, um zu einer starken und transparenten Machine Learning Community in der Chemie beizutragen. Interessierte sind herzlich willkommen.

Links zu dieser Meldung