Heim > Artikel > Technologie-Peripheriegeräte > Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit
Die Entdeckung chemischer Reaktionen wird nicht nur davon beeinflusst, wie schnell experimentelle Daten erhalten werden können, sondern auch davon, wie einfach es für Chemiker ist, diese Daten zu verstehen. Die Aufdeckung der mechanistischen Grundlagen neuer katalytischer Reaktionen ist ein besonders komplexes Problem, das oft Fachwissen in der rechnerischen und physikalischen organischen Chemie erfordert. Es ist jedoch wichtig, katalytische Reaktionen zu untersuchen, da sie die effizientesten chemischen Prozesse darstellen.
Kürzlich berichteten Burés und Larrosa vom Department of Chemistry der University of Manchester (UoM), Großbritannien, über ein Modell für maschinelles Lernen, das zeigt, dass tief trainieren kann Modell neuronaler Netze zur Analyse allgemeiner kinetischer Daten und zur automatischen Erläuterung der entsprechenden mechanistischen Kategorien ohne zusätzliche Benutzereingaben. Das Modell identifiziert verschiedene Arten von Mechanismen mit hervorragender Genauigkeit.
Die Ergebnisse zeigen, dass die KI-gesteuerte Mechanismusklassifizierung ein leistungsstarkes neues Werkzeug ist, das die Mechanismusaufklärung vereinfachen und automatisieren kann. Es wird erwartet, dass diese Arbeit die Entdeckung und Entwicklung vollautomatisierter organischer Reaktionen weiter vorantreibt.
Die Forschung trug den Titel „Organischer Reaktionsmechanismus durch maschinelles Lernen“ und wurde am 25. Januar 2023 in „# 🎜🎜#“ veröffentlicht. Natur》Up.
Papierlink: https: //www.nature.com/articles/s41586-022-05639-4
Die aktuelle Kinetikanalyse-Pipeline besteht aus drei Hauptschritten: Extrahieren kinetischer Eigenschaften aus experimentellen Daten, Vorhersage kinetischer Eigenschaften für alle möglichen Mechanismen und Extrahieren der experimentellen Eigenschaften mit den vorhergesagten Eigenschaften.
Seit mehr als einem Jahrhundert extrahieren Chemiker mechanistische Informationen aus Reaktionsgeschwindigkeiten. Eine heute noch verwendete Methode besteht darin, die Anfangsgeschwindigkeit einer Reaktion zu bewerten und sich dabei auf den Verbrauch der ersten paar Prozent des Ausgangsmaterials zu konzentrieren. Diese Methode ist beliebt, da die zeitliche Änderung der Reaktantenkonzentration zu Beginn der Reaktion in den meisten Fällen linear ist und daher einfach zu analysieren ist. Obwohl diese Technik aufschlussreich ist, ignoriert sie Änderungen der Reaktionsgeschwindigkeiten und -konzentrationen, die über einen Großteil des Zeitverlaufs auftreten.
In den letzten Jahrzehnten wurden fortschrittlichere Methoden entwickelt, um die Konzentrationen von Reaktionskomponenten während des Reaktionsprozesses zu bewerten. Diese Methoden werden durch mathematische Techniken weiter erleichtert, die die Anzahl der an einem Reaktionsschritt beteiligten Komponenten (auch bekannt als die Reihenfolge der Reaktionskomponenten) aus reaktionskinetischen Diagrammen erkennen lassen. Diese Techniken werden sicherlich weiterhin Einblicke in die chemische Reaktivität liefern, sie beschränken sich jedoch auf die Analyse der Reihenfolge der Reaktionskomponenten und nicht auf die Bereitstellung einer umfassenderen mechanistischen Hypothese, die das kinetische Verhalten eines katalytischen Systems beschreibt.
Abbildung 1: Korrelationssumme der kinetischen Analyse Neueste Technologie . (Quelle: Paper)
KI verändert den Bereich der Dynamikanalyse
Hier zeigen Forscher, dass ein auf simulierten Kinetikdaten trainiertes Deep-Learning-Modell in der Lage ist, verschiedene Mechanismen aus zeitlichen Konzentrationsverteilungen korrekt aufzuklären. Modelle für maschinelles Lernen vereinfachen die kinetische Analyse, indem sie die Ableitung von Geschwindigkeitsgesetzen sowie die Extraktion und Vorhersage kinetischer Eigenschaften überflüssig machen und so die Aufklärung von Reaktionsmechanismen in allen Syntheselabors erheblich erleichtern.
Aufgrund der ganzheitlichen Analyse aller verfügbaren kinetischen Daten verbessert diese Methode die Fähigkeit zur Abfrage von Reaktionskurven, eliminiert potenzielle menschliche Fehler während der kinetischen Analyse und erweitert den Bereich der analysierbaren Kinetik um nicht-stationäre Zustände (einschließlich Aktivierung und Desaktivierungsprozesse) und reversible Reaktionen. Dieser Ansatz würde die derzeit verfügbaren kinetischen Analysemethoden ergänzen und wäre besonders in den schwierigsten Situationen nützlich.
Forscher definierten 20 Arten von Reaktionsmechanismen und entwickelten Geschwindigkeitsgesetze für jeden Typ. Jeder Mechanismus wird mathematisch durch einen Satz kinetischer Konstanten (k1, … kn) und eine Funktion der gewöhnlichen Differentialgleichung (ODE) der Konzentration der chemischen Spezies beschrieben. Anschließend lösten sie diese Gleichungen und erstellten Millionen von Simulationen, die den Zerfall von Reaktanten und die Produktion von Produkten beschreiben. Diese simulierten Kinetikdaten werden verwendet, um Lernalgorithmen zu trainieren, um charakteristische Signaturen für jede mechanistische Klasse zu identifizieren. Das resultierende Klassifizierungsmodell verwendet kinetische Kurven als Eingabe, einschließlich Anfangs- und Zeitkonzentrationsdaten, und gibt die mechanistische Klasse der Reaktion aus.
Abbildung 2: Mechanistischer Umfang und Datenzusammensetzung. (Quelle: Paper)
Das Training von Deep-Learning-Modellen erfordert oft große Datenmengen, was erhebliche Herausforderungen darstellen kann, wenn diese Daten experimentell erfasst werden müssen.
Der Ansatz von Burés und Larrosa zum Trainieren des Algorithmus vermeidet den Engpass bei der Generierung großer Mengen experimenteller kinetischer Daten. In diesem Fall konnten die Forscher eine Reihe von ODEs numerisch lösen, um 5 Millionen Dynamikproben für das Modelltraining und die Validierung zu generieren, ohne stationäre Näherungen zu verwenden.
Das Modell enthält 576.000 trainierbare Parameter und verwendet eine Kombination aus zwei Arten von neuronalen Netzen: (1) neuronales Netzwerk mit langem Kurzzeitgedächtnis, ein wiederkehrendes neuronales Netzwerk, das zur Verarbeitung von Zeitdatenreihen (d. h. Zeitkonzentrationsdaten) verwendet wird; (2) Vollständig verbundenes neuronales Netzwerk zur Verarbeitung nichtzeitlicher Daten (d. h. anfängliche Konzentration des Katalysators und Merkmale, die bei jedem kinetischen Lauf aus dem Langzeitgedächtnis extrahiert werden). Das Modell gibt für jeden Mechanismus eine Wahrscheinlichkeit aus, die sich auf 1 summiert.
Die Forscher bewerteten das trainierte Modell anhand eines Testsatzes simulierter kinetischer Kurven und zeigten, dass es diese Kurven mit einer Genauigkeit von 92,6 % korrekt den Mechanismusklassen zuordnete.
Abbildung 3: Leistung des maschinellen Lernmodells auf dem Testsatz, mit sechs Zeitpunkten für jede kinetische Kurve. (Quelle: Papier)
Das Modell funktioniert auch dann gut, wenn absichtlich „verrauschte“ Daten eingeführt werden, was bedeutet, dass es zur Klassifizierung experimenteller Daten verwendet werden kann.
Abbildung 4: Die Auswirkung von Fehlern und der Anzahl der Datenpunkte auf die Leistung des maschinellen Lernmodells. (Quelle: Papier)
Schließlich verglichen die Forscher ihr Modell anhand mehrerer zuvor berichteter experimenteller kinetischer Kurven. Der vorhergesagte Mechanismus stimmt gut mit den Schlussfolgerungen früherer kinetischer Studien überein. In einigen Fällen identifizierte das Modell auch mechanistische Details, die in der Originalarbeit nicht erkannt wurden. Für eine anspruchsvolle Reaktion schlägt das Modell drei sehr ähnliche mechanistische Kategorien vor. Allerdings geben die Autoren zu Recht an, dass es sich bei diesem Ergebnis nicht um einen Fehler, sondern um ein Merkmal ihres Modells handelt, da es darauf hindeutet, dass weitere spezifische Experimente erforderlich sind, um den Mechanismus zu erforschen. Abbildung 5: Fall mit experimentellen kinetischen Daten Forschung. (Quelle: Papier)
Zusammenfassend haben Burés und Larrosa eine Methode entwickelt, die nicht nur die Ableitung mechanistischer Hypothesen aus kinetischen Studien automatisiert, sondern auch den langen Prozess ermöglicht die kinetische Analyse anspruchsvoller Reaktionsmechanismen. Wie bei jedem technologischen Fortschritt in der Datenanalyse sollten die daraus resultierenden mechanistischen Klassifizierungen als Hypothesen betrachtet werden, die einer weiteren experimentellen Unterstützung bedürfen. Es besteht immer die Gefahr einer Fehlinterpretation kinetischer Daten, aber die Fähigkeit des Algorithmus, den richtigen Reaktionspfad mit hoher Genauigkeit auf der Grundlage einer kleinen Anzahl von Experimenten zu identifizieren, könnte mehr Forscher davon überzeugen, eine kinetische Analyse auszuprobieren.
Somit könnte dieser Ansatz die Einbeziehung der kinetischen Analyse in Reaktionsentwicklungsprozesse populär machen und vorantreiben, insbesondere da Chemiker immer vertrauter mit Algorithmen des maschinellen Lernens werden.
Das obige ist der detaillierte Inhalt vonDas Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!