Heim > Artikel > Technologie-Peripheriegeräte > Genauigkeit >98 %, GPT basierend auf der Elektronendichte wird in der chemischen Forschung verwendet, veröffentlicht im Nature-Unterjournal
Herausgeber | Violet
Der chemische Raum synthetisierter Moleküle ist sehr breit. Eine effektive Erforschung dieses Feldes erfordert Vertrauen über rechnerische Screening-Technologien wie Deep Learning, um schnell eine Vielzahl interessanter Verbindungen zu entdecken
Die Umwandlung molekularer Strukturen in digitale Darstellungen und die Entwicklung entsprechender Algorithmen zur Generierung neuer molekularer Strukturen sind der Schlüssel zur chemischen Entdeckung
Kürzlich an der University of Glasgow, Großbritannien Das Forschungsteam schlug ein maschinelles Lernmodell zur Erzeugung von Wirt-Gast-Bindungen vor. Dieses Modell ist in der Lage, Daten im Simplified Molecular Linear Input Specification (SMILES)-Format mit einer Genauigkeit von bis zu 98 % zu lesen eine Genauigkeit von 98 %. Umfassende Beschreibung von Molekülen im zweidimensionalen Raum
Erzeugen Sie eine dreidimensionale Darstellung der Elektronendichte und des elektrostatischen Potenzials des Wirt-Gast-Systems und optimieren Sie dann die Erzeugung des Gasts Durch den Gradientenabstieg wurde schließlich eine effiziente Darstellung und Transformation von Gaststrukturen mit Cucurbituril und metallorganischen Käfigen erreicht, was zur Entdeckung von 9 führte zuvor validierte CB[6]-Gäste und 7 nicht gemeldete Objekte und entdeckte 4 nicht gemeldete
98 % GPT basierend auf der Elektronendichte für die chemische Forschung, veröffentlicht im Nature-Unterjournal „ />Objects.98 %, GPT basierend auf der Elektronendichte wird in der chemischen Forschung verwendet, veröffentlicht in der Unterzeitschrift „Nature“ />Der Arbeitsablauf umfasst die folgenden Schritte:
(1) Der 3D-Elektronendichte-Volumen-Trainingssatz wird aus den Molekülen in der Öffentlichkeit abgeleitet Durch die Modellierung dieses 3D-Elektronendichtevolumen-Trainingssatzes mit einem Variations-Autoencoder (VAE) wurde ein „Molekülgenerator“ erstellt, der die Generierung von 3D-Elektronendichtevolumina ermöglicht, die über die aus dem QM9-Datensatz abgeleiteten hinausgehen. Der VAE-Molekülgenerator kodiert ein 3D-Elektronendichtevolumen in einen eindimensionalen (1D) latenten Raum und erzeugt dann das dem Molekül entsprechende 3D-Elektronendichtevolumen durch Dekodierung aus diesem 1D-Latentraum. Interessanterweise können mit dieser Methode nur chemisch einwandfreie Moleküle hergestellt werden. (2) Der VAE-Molekülgenerator und der Optimierungsalgorithmus für den Gradientenabstieg werden verwendet, um eine Bibliothek von Gastmolekülen (in Form von 3D-Elektronendichtevolumina) für ein bestimmtes Wirtsmolekül zu generieren. Gastmoleküle entstehen durch Minimierung der Überlappung zwischen Wirts- und Gastelektronendichten bei gleichzeitiger Optimierung ihrer elektrostatischen Wechselwirkungen. (3) Da es für menschliche Bediener eine Herausforderung sein kann, 3D-Elektronendichtevolumina in chemisch interpretierbare Strukturen umzuwandeln, wurde das Transformer-Modell darauf trainiert, diese Volumina auf eine Weise in eine SMILES-Darstellung umzuwandeln, die für professionelle Chemiker leichter verständlich ist Das Format erfasst alle notwendigen Informationen, die zur Beschreibung des Moleküls erforderlich sind. Nachdem mithilfe von Computersimulationen potenzielle Gastmoleküle für CB[6] undgeneriert wurden, wurde ein In-vitro-Workflow etabliert, um die vielversprechendsten Kandidaten experimentell zu testen.
Das verwendete experimentelle Verfahren wird unten beschrieben. (1) Die durch den Computer-Workflow erzeugten Objekte von CB[6] undwurden von Chemieexperten für experimentelle Tests klassifiziert. Vielversprechende Gäste zum Testen werden auf der Grundlage ihrer strukturellen Ähnlichkeit mit bekannten Gästen von CB[6] oder , der Intuition professioneller Chemiker und ihrer kommerziellen Verfügbarkeit ausgewählt.
(2) Verwenden Sie die direkte zu bestimmen. Es ist erwähnenswert, dass der Gast erzeugt wurde Der Computer Mischungen, die Moleküle enthalten, von denen bisher bekannt war, dass sie an Wirte binden (oder eng mit ihnen verwandt sind), und Moleküle, die sich der Intuition von Experten entziehen -Gastsysteme: Cucurbituril (CB[n]) und metallorganische Käfige sind zu literaturverifizierten und nicht gemeldeten Objekten geworden. Der Algorithmus generierte außerdem 9 bisher bekannte Objekte für CB[6]. und die Affinität von CB[6] für diese neuen Gäste wurde durch direkte
Titration in HCO2H/H2O 1:1v/vIn allen 7 Fällen wird eine Reihe von Signalen für das Wirt-Gast-System beobachtet, was darauf hinweist, dass Das System erfährt einen schnellen Austausch auf der NMR-Zeitskala. Nach der Komplexierung verschiebt sich die aliphatische Kettenresonanz der Gastmoleküle nach oben, was darauf hinweist, dass sie im CB[6]-Hohlraum eingekapselt sind Forschung, veröffentlicht in „Nature Sub-Journal“ /> Die Assoziationskonstante mit CB[6] folgt dem zuvor festgestellten Trend und reicht von 13,5 M^− 1 bis 5.470 M^−1.
98 %, GPT basierend auf der Elektronendichte wird in der chemischen Forschung verwendet, veröffentlicht in der Unterzeitschrift „Nature“ />Abbildung: Optimierung von CB[6] und zuvor bekannten Objekten und optimierten Objekten von. (Quelle: Papier )
Fürgeneriert der Optimierungsalgorithmus nur unbekannte Gastmoleküle, und die Bindungsstärke zwischen vier potenziellen nicht gemeldeten Gästen und [Pd214](BArF)4 wird in allen vier Fällen durch direkte größere Hohlräume haben und größere Gastmoleküle erfordern. In zukünftigen Studien werden Datensätze verwendet, die größere Moleküle enthalten, wie beispielsweise der GDB-17-Datensatz.
Danach: „Unser Ziel ist es, die Auswahl neuer Liganden in den Generierungsprozess einzubetten, Moleküle auf automatisierten Syntheseplattformen (wie Chemputer-Robotern) autonom zu synthetisieren, den Kreislauf zwischen Optimierung und Test zu schließen und einen cyber-physikalischen Abschluss zu schaffen.“ Schleifensystem.“
Das obige ist der detaillierte Inhalt vonGenauigkeit >98 %, GPT basierend auf der Elektronendichte wird in der chemischen Forschung verwendet, veröffentlicht im Nature-Unterjournal. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!