Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit

王林
王林nach vorne
2023-04-13 15:04:03708Durchsuche

Die Entdeckung chemischer Reaktionen wird nicht nur davon beeinflusst, wie schnell experimentelle Daten erhalten werden können, sondern auch davon, wie einfach es für Chemiker ist, diese Daten zu verstehen. Die Aufdeckung der mechanistischen Grundlagen neuer katalytischer Reaktionen ist ein besonders komplexes Problem, das oft Fachwissen in der rechnerischen und physikalischen organischen Chemie erfordert. Es ist jedoch wichtig, katalytische Reaktionen zu untersuchen, da sie die effizientesten chemischen Prozesse darstellen.

Kürzlich berichteten Burés und Larrosa vom Department of Chemistry der University of Manchester (UoM), Großbritannien, über ein Modell für maschinelles Lernen, das zeigt, dass tief trainieren kann Modell neuronaler Netze zur Analyse allgemeiner kinetischer Daten und zur automatischen Erläuterung der entsprechenden mechanistischen Kategorien ohne zusätzliche Benutzereingaben. Das Modell identifiziert verschiedene Arten von Mechanismen mit hervorragender Genauigkeit.

Die Ergebnisse zeigen, dass die KI-gesteuerte Mechanismusklassifizierung ein leistungsstarkes neues Werkzeug ist, das die Mechanismusaufklärung vereinfachen und automatisieren kann. Es wird erwartet, dass diese Arbeit die Entdeckung und Entwicklung vollautomatisierter organischer Reaktionen weiter vorantreibt.

Die Forschung trug den Titel „Organischer Reaktionsmechanismus durch maschinelles Lernen“ und wurde am 25. Januar 2023 in „# 🎜🎜#“ veröffentlicht. Natur》Up.

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit

Papierlink: ​https: //www.nature.com/articles/s41586-022-05639-4​

Traditionelle Aufklärung des chemischen Reaktionsmechanismus# Bestimmung Die genaue Abfolge der grundlegenden Schritte bei der Umwandlung von Substraten in Produkte ist entscheidend für die rationale Verbesserung von Synthesemethoden, die Entwicklung neuer Katalysatoren und die sichere Vergrößerung industrieller Prozesse. Um den Reaktionsmechanismus aufzuklären, müssen mehrere kinetische Kurven erfasst und menschliche Experten müssen eine kinetische Analyse der Daten durchführen. Obwohl sich die Reaktionsüberwachungstechnologie in den letzten Jahrzehnten so weit verbessert hat, dass die kinetische Datenerfassung vollständig automatisiert werden kann, hat sich der theoretische Rahmen, der der mechanistischen Aufklärung zugrunde liegt, nicht im gleichen Tempo weiterentwickelt.

Die aktuelle Kinetikanalyse-Pipeline besteht aus drei Hauptschritten: Extrahieren kinetischer Eigenschaften aus experimentellen Daten, Vorhersage kinetischer Eigenschaften für alle möglichen Mechanismen und Extrahieren der experimentellen Eigenschaften mit den vorhergesagten Eigenschaften.

Seit mehr als einem Jahrhundert extrahieren Chemiker mechanistische Informationen aus Reaktionsgeschwindigkeiten. Eine heute noch verwendete Methode besteht darin, die Anfangsgeschwindigkeit einer Reaktion zu bewerten und sich dabei auf den Verbrauch der ersten paar Prozent des Ausgangsmaterials zu konzentrieren. Diese Methode ist beliebt, da die zeitliche Änderung der Reaktantenkonzentration zu Beginn der Reaktion in den meisten Fällen linear ist und daher einfach zu analysieren ist. Obwohl diese Technik aufschlussreich ist, ignoriert sie Änderungen der Reaktionsgeschwindigkeiten und -konzentrationen, die über einen Großteil des Zeitverlaufs auftreten.

In den letzten Jahrzehnten wurden fortschrittlichere Methoden entwickelt, um die Konzentrationen von Reaktionskomponenten während des Reaktionsprozesses zu bewerten. Diese Methoden werden durch mathematische Techniken weiter erleichtert, die die Anzahl der an einem Reaktionsschritt beteiligten Komponenten (auch bekannt als die Reihenfolge der Reaktionskomponenten) aus reaktionskinetischen Diagrammen erkennen lassen. Diese Techniken werden sicherlich weiterhin Einblicke in die chemische Reaktivität liefern, sie beschränken sich jedoch auf die Analyse der Reihenfolge der Reaktionskomponenten und nicht auf die Bereitstellung einer umfassenderen mechanistischen Hypothese, die das kinetische Verhalten eines katalytischen Systems beschreibt.

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit Abbildung 1: Korrelationssumme der kinetischen Analyse Neueste Technologie . (Quelle: Paper)

KI verändert den Bereich der Dynamikanalyse

Maschinelles Lernen verändert sich und revolutioniert die Art und Weise, wie Chemiker Probleme lösen, vom Entwurf von Molekülen und Routen über die Synthese von Molekülen bis hin zum Verständnis von Reaktionsmechanismen. Burés und Larrosa übertragen diese Revolution nun auf die kinetische Analyse, indem sie Modelle des maschinellen Lernens verwenden, um Reaktionen anhand ihrer simulierten kinetischen Eigenschaften zu klassifizieren.

Hier zeigen Forscher, dass ein auf simulierten Kinetikdaten trainiertes Deep-Learning-Modell in der Lage ist, verschiedene Mechanismen aus zeitlichen Konzentrationsverteilungen korrekt aufzuklären. Modelle für maschinelles Lernen vereinfachen die kinetische Analyse, indem sie die Ableitung von Geschwindigkeitsgesetzen sowie die Extraktion und Vorhersage kinetischer Eigenschaften überflüssig machen und so die Aufklärung von Reaktionsmechanismen in allen Syntheselabors erheblich erleichtern.

Aufgrund der ganzheitlichen Analyse aller verfügbaren kinetischen Daten verbessert diese Methode die Fähigkeit zur Abfrage von Reaktionskurven, eliminiert potenzielle menschliche Fehler während der kinetischen Analyse und erweitert den Bereich der analysierbaren Kinetik um nicht-stationäre Zustände (einschließlich Aktivierung und Desaktivierungsprozesse) und reversible Reaktionen. Dieser Ansatz würde die derzeit verfügbaren kinetischen Analysemethoden ergänzen und wäre besonders in den schwierigsten Situationen nützlich.

Spezifische Forschung

Forscher definierten 20 Arten von Reaktionsmechanismen und entwickelten Geschwindigkeitsgesetze für jeden Typ. Jeder Mechanismus wird mathematisch durch einen Satz kinetischer Konstanten (k1, … kn) und eine Funktion der gewöhnlichen Differentialgleichung (ODE) der Konzentration der chemischen Spezies beschrieben. Anschließend lösten sie diese Gleichungen und erstellten Millionen von Simulationen, die den Zerfall von Reaktanten und die Produktion von Produkten beschreiben. Diese simulierten Kinetikdaten werden verwendet, um Lernalgorithmen zu trainieren, um charakteristische Signaturen für jede mechanistische Klasse zu identifizieren. Das resultierende Klassifizierungsmodell verwendet kinetische Kurven als Eingabe, einschließlich Anfangs- und Zeitkonzentrationsdaten, und gibt die mechanistische Klasse der Reaktion aus.

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit

Abbildung 2: Mechanistischer Umfang und Datenzusammensetzung. (Quelle: Paper)

Das Training von Deep-Learning-Modellen erfordert oft große Datenmengen, was erhebliche Herausforderungen darstellen kann, wenn diese Daten experimentell erfasst werden müssen.

Der Ansatz von Burés und Larrosa zum Trainieren des Algorithmus vermeidet den Engpass bei der Generierung großer Mengen experimenteller kinetischer Daten. In diesem Fall konnten die Forscher eine Reihe von ODEs numerisch lösen, um 5 Millionen Dynamikproben für das Modelltraining und die Validierung zu generieren, ohne stationäre Näherungen zu verwenden.

Das Modell enthält 576.000 trainierbare Parameter und verwendet eine Kombination aus zwei Arten von neuronalen Netzen: (1) neuronales Netzwerk mit langem Kurzzeitgedächtnis, ein wiederkehrendes neuronales Netzwerk, das zur Verarbeitung von Zeitdatenreihen (d. h. Zeitkonzentrationsdaten) verwendet wird; (2) Vollständig verbundenes neuronales Netzwerk zur Verarbeitung nichtzeitlicher Daten (d. h. anfängliche Konzentration des Katalysators und Merkmale, die bei jedem kinetischen Lauf aus dem Langzeitgedächtnis extrahiert werden). Das Modell gibt für jeden Mechanismus eine Wahrscheinlichkeit aus, die sich auf 1 summiert.

Die Forscher bewerteten das trainierte Modell anhand eines Testsatzes simulierter kinetischer Kurven und zeigten, dass es diese Kurven mit einer Genauigkeit von 92,6 % korrekt den Mechanismusklassen zuordnete.

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit

Abbildung 3: Leistung des maschinellen Lernmodells auf dem Testsatz, mit sechs Zeitpunkten für jede kinetische Kurve. (Quelle: Papier)

Das Modell funktioniert auch dann gut, wenn absichtlich „verrauschte“ Daten eingeführt werden, was bedeutet, dass es zur Klassifizierung experimenteller Daten verwendet werden kann.

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit

Abbildung 4: Die Auswirkung von Fehlern und der Anzahl der Datenpunkte auf die Leistung des maschinellen Lernmodells. (Quelle: Papier)

Schließlich verglichen die Forscher ihr Modell anhand mehrerer zuvor berichteter experimenteller kinetischer Kurven. Der vorhergesagte Mechanismus stimmt gut mit den Schlussfolgerungen früherer kinetischer Studien überein. In einigen Fällen identifizierte das Modell auch mechanistische Details, die in der Originalarbeit nicht erkannt wurden. Für eine anspruchsvolle Reaktion schlägt das Modell drei sehr ähnliche mechanistische Kategorien vor. Allerdings geben die Autoren zu Recht an, dass es sich bei diesem Ergebnis nicht um einen Fehler, sondern um ein Merkmal ihres Modells handelt, da es darauf hindeutet, dass weitere spezifische Experimente erforderlich sind, um den Mechanismus zu erforschen. Abbildung 5: Fall mit experimentellen kinetischen Daten Forschung. (Quelle: Papier)

Das Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit Zusammenfassend haben Burés und Larrosa eine Methode entwickelt, die nicht nur die Ableitung mechanistischer Hypothesen aus kinetischen Studien automatisiert, sondern auch den langen Prozess ermöglicht die kinetische Analyse anspruchsvoller Reaktionsmechanismen. Wie bei jedem technologischen Fortschritt in der Datenanalyse sollten die daraus resultierenden mechanistischen Klassifizierungen als Hypothesen betrachtet werden, die einer weiteren experimentellen Unterstützung bedürfen. Es besteht immer die Gefahr einer Fehlinterpretation kinetischer Daten, aber die Fähigkeit des Algorithmus, den richtigen Reaktionspfad mit hoher Genauigkeit auf der Grundlage einer kleinen Anzahl von Experimenten zu identifizieren, könnte mehr Forscher davon überzeugen, eine kinetische Analyse auszuprobieren.

Somit könnte dieser Ansatz die Einbeziehung der kinetischen Analyse in Reaktionsentwicklungsprozesse populär machen und vorantreiben, insbesondere da Chemiker immer vertrauter mit Algorithmen des maschinellen Lernens werden.

Das obige ist der detaillierte Inhalt vonDas Modell des maschinellen Lernens klassifiziert organische Reaktionsmechanismen mit herausragender Genauigkeit. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen