Neue Strategie zur Beurteilung der Anwendbarkeit von Reaktionen
Chemikerinnen und Chemiker entwickeln und optimieren neue chemische Reaktionen häufig an sogenannten Modellsystemen, das heißt an einfachen, leicht zugänglichen Substraten. Anschließend zeigen sie beispielhaft an bis zu etwa 100 anderen Substraten, dass die Reaktion funktioniert. Diese Demonstration vielseitiger Anwendbarkeit heißt im Fachjargon „Scope“. Durch eine subjektive Auswahl der Substrate entsteht jedoch häufig ein verzerrtes Bild der Anwendungsbreite der neu entwickelten Reaktion. Oft ist unklar, ob sie zur Synthese eines gewünschten Produktes genutzt werden kann. Ein Team um den Chemiker Prof. Dr. Frank Glorius von der Universität Münster schlägt daher nun eine Möglichkeit vor, die Modellsubstrate zur Evaluation einer neuen chemischen Reaktion computergestützt – und somit unvoreingenommen – auszuwählen.
Die Auswahl der Substrate orientiert sich an der Komplexität und den strukturellen Eigenschaften echter pharmazeutischer Verbindungen. „Unsere Methode zielt darauf ab, die Qualität und den Informationsgehalt chemischer Reaktionsdaten zukünftig zu verbessern und Wissenslücken zu schließen“, betont Frank Glorius. Ein vertieftes Verständnis neuer Reaktionen senke die Barrieren für deren Anwendung sowohl im akademischen als auch im industriellen Kontext. Die Verfügbarkeit hochwertiger, unvoreingenommen generierter Daten erleichtere darüber hinaus den Einsatz von maschinellem Lernen signifikant und ebne den Weg für eine umfassendere Nutzung der Daten. Die Arbeit ist in der Fachzeitschrift ACS Central Science veröffentlicht.
Versuche, die Entwicklung und Evaluierung von chemischen Reaktionen zu standardisieren und zu objektivieren, seien noch ziemlich neu und nicht weit verbreitet. „Wir möchten mit unserer Publikation einen ‚Umdenkprozess‘ anstoßen. Statt möglichst vielen Experimenten, die oft voreingenommen geplant sind oder einen vorab ersichtlichen Ausgang haben, sollte der bestmögliche Informationsgewinn über neue chemische Reaktionen im Vordergrund stehen“, sagt Erstautor Debanjan Rana.
Auch andere Wissenschaftler habe bereits versucht, chemische Reaktionen anhand von „besser“ ausgewählten Substraten zu bewerten. Diese Arbeiten beschränkten sich jedoch auf Spezialfälle – entweder auf fest ausgewählte Strukturen mit pharmazeutischer Relevanz oder auf speziell für eine einzige Reaktion zugeschnittene Strukturen, die jedoch in einem aufwändigen Verfahren berechnet und ausgewählt werden müssen. Im Gegensatz zu den vorhergegangenen Arbeiten berücksichtigt die von dem münsterschen Team vorgestellte Methode die gesamte Struktur eines Moleküls. Sie ist somit universell für jede chemische Reaktion anwendbar.
Mitautor Niklas Hölter unterstreicht, dass der Scope von zentraler Bedeutung in allen Publikationen der chemischen Synthese sei. „Chemiker treffen die Auswahl der zu testenden Substrat-Verbindungen aber häufig voreingenommen“, ergänzt er. „Beispielsweise wählen sie Substrate, die strukturell einfach, dem Modellsubstrat ähnlich oder schlichtweg gerade im Labor verfügbar sind. Erfolglose Reaktionen erwähnen sie in ihrer Publikation häufig überhaupt nicht, um ein besseres Bild abzugeben.“
Bei der Synthese von neuen chemischen Verbindungen, beispielsweise Wirkstoffe oder Materialien, müssen Chemiker aus einer großen Anzahl bekannter chemischer Reaktionen und Methoden diejenige auswählen, die zur Herstellung der Zielverbindung am besten geeignet ist. Hierfür berücksichtigen sie mehrere Faktoren wie die Ausbeute des gewünschten Produktes sowie Umwelt- und sicherheitstechnische Aspekte. Die Entwicklung neuer, vielseitig einsetzbarer chemischer Reaktionen ist daher nach wie vor ein Schwerpunkt aktueller chemischer Forschung.
Zur Methode: Das Team der Universität Münster überführte mittels sogenannter molekularer Fingerprints alle zugelassenen pharmazeutischen Wirkstoffe in einen digitalen Code. Mit nicht überwachtem maschinellen Lernen und Clustering-Methoden entwickelten sie ein Modell, welches diesen „Raum“ pharmazeutischer Wirkstoffe in chemisch sinnvolle Regionen einteilt, basierend auf den Molekülstrukturen. Zur Evaluation einer neuen chemischen Reaktion lassen sich Tausende potenzieller Test-Substrate mithilfe des Machine-Learning-Modells in denselben Raum hineinprojizieren. Aus dem Zentrum jeder der zuvor identifizierten Regionen wird automatisiert ein Test-Substrat ausgewählt, um den gesamten Raum ohne Bias abzudecken.
Die Deutsche Forschungsgemeinschaft (DFG) unterstützte die Arbeit finanziell (Schwerpunktprogramm SPP 2363: Utilization and Development of Machine Learning for Molecular Applications – Molecular Machine Learning).
Originalveröffentlichung
Debanjan Rana, Philipp M. Pflüger, Niklas P. Hölter, Guangying Tan, and Frank Glorius (2024): Standardizing Substrate Selection: A Strategy toward Unbiased Evaluation of Reaction Generality; ACS Central Science Article ASAP; DOI: 10.1021/acscentsci.3c01638