Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

WBOY
WBOYOriginal
2024-08-06 19:34:02968Durchsuche

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

Herausgeber |. KX

Retrosynthese ist eine entscheidende Aufgabe in der Arzneimittelforschung und organischen Synthese, und KI wird zunehmend eingesetzt, um den Prozess zu beschleunigen.

Bestehende KI-Methoden weisen eine unbefriedigende Leistung und eine begrenzte Vielfalt auf. In der Praxis verursachen chemische Reaktionen häufig lokale molekulare Veränderungen mit erheblichen Überschneidungen zwischen Reaktanten und Produkten.

Davon inspiriert schlug Hou Tingjuns Team an der Zhejiang-Universität vor, die einstufige retrosynthetische Vorhersage als eine Aufgabe zur Bearbeitung von Molekülketten neu zu definieren und die Zielmolekülkette iterativ zu verfeinern, um Vorläuferverbindungen zu erzeugen. Außerdem wird ein editierungsbasiertes retrosynthetisches Modell EditRetro vorgeschlagen, mit dem qualitativ hochwertige und vielfältige Vorhersagen erzielt werden können.

Umfangreiche Experimente zeigen, dass das Modell beim Standard-Benchmark-Datensatz USPTO-50 K eine hervorragende Leistung mit einer Top-1-Genauigkeit von 60,8 % erzielt.

Die Ergebnisse zeigen, dass EditRetro gute Generalisierungsfähigkeiten und Robustheit aufweist, was sein Potenzial im Bereich der KI-gesteuerten Planung chemischer Synthesen unterstreicht.

Verwandte Forschung mit dem Titel „Retrosynthesevorhersage mit einem iterativen String-Editing-Modell“ wurde am 30. Juli in „Nature Communications“ veröffentlicht.

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

Link zum Papier: https://www.nature.com/articles/s41467-024-50617-1

Die Gestaltung molekularer Synthesepfade ist eine wichtige Aufgabe in der organischen Synthese, die für die Biomedizin und Pharmazeutika wichtig ist und es ist in verschiedenen Bereichen wie der Materialindustrie von großer Bedeutung.

Die retrosynthetische Analyse ist die am weitesten verbreitete Methode zur Entwicklung synthetischer Routen. Dabei werden etablierte Reaktionen genutzt, um Moleküle iterativ in einfachere, leichter zu synthetisierende Vorläufer zu zerlegen.

In den letzten Jahren hat die KI-gesteuerte Retrosynthese die Erforschung komplexerer Moleküle erleichtert und den Zeit- und Arbeitsaufwand für die Entwicklung synthetischer Experimente erheblich reduziert. Die Vorhersage der Retrosynthese in einem Schritt ist ein wichtiger Bestandteil der Retrosyntheseplanung. Derzeit gibt es mehrere Deep-Learning-basierte Methoden mit hervorragenden Ergebnissen. Diese Methoden lassen sich grob in drei Kategorien einteilen: vorlagenbasierte Methoden, vorlagenfreie Methoden und halbvorlagenbasierte Methoden.

Hier konzentrieren sich die Forscher auf die templatfreie retrosynthetische Vorhersage. schlagen vor, das Problem als molekulare String-Editierungsaufgabe neu zu definieren und EditRetro vorzuschlagen, ein editierungsbasiertes Retrosynthesemodell, das qualitativ hochwertige und vielfältige Vorhersagen erzielen kann.

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

Abbildung: Schematische Darstellung der vorgeschlagenen EditRetro-Methode basierend auf der molekularen String-Retrosynthese. (Quelle: Papier)

Das Kernkonzept dieser Forschung besteht darin, Reaktantenketten durch einen iterativen Bearbeitungsprozess unter Verwendung von Levenshtein-Operationen zu erzeugen. Der Ansatz ist von den jüngsten Fortschritten bei bearbeitungsbasierten Sequenzgenerierungsmodellen inspiriert. Insbesondere werden Operationen von EDITOR verwendet, einem bearbeitungsbasierten Transformer, der für die neuronale maschinelle Übersetzung entwickelt wurde.

EditRetro-Übersicht

Das EditRetro-Modell enthält drei Bearbeitungsvorgänge, nämlich Sequenzneupositionierung, Platzhaltereinfügung und Markereinfügung, um Reaktantenketten zu generieren. Es wird durch ein Transformer-Modell implementiert, das aus einem Encoder und drei Decodern besteht, die beide aus gestapelten Transformer-Blöcken bestehen.

  • Relocation-Decoder: Relocation-Vorgänge umfassen grundlegende Token-Bearbeitungsvorgänge wie Beibehalten, Löschen und Neuanordnen. Es kann mit dem Prozess der Identifizierung von Reaktionszentren verglichen werden, einschließlich der Neuordnung und Löschung von Atomen oder Gruppen, um Synthone zu erhalten.
  • Platzhalterdecoder: Die Strategie zum Einfügen von Platzhaltern (Klassifikator) sagt die Anzahl der Platzhalter voraus, die zwischen benachbarten Token eingefügt werden sollen. Es spielt eine entscheidende Rolle bei der Bestimmung der Struktur von Reaktanten, ähnlich wie bei der Identifizierung der Positionen hinzugefügter Atome oder Gruppen in Zwischensynthonen, die aus der Sequenzneupositionierungsphase stammen.
  • Token-Decoder: Token-Einfügungsstrategie (Klassifikator), verantwortlich für die Generierung von Kandidaten-Tokens für jeden Platzhalter. Dies ist entscheidend für die Bestimmung der tatsächlichen Reaktanten, die zur Synthese des Zielprodukts verwendet werden können. Dieser Prozess kann als ein ähnlicher Prozess angesehen werden, der von Synthons durchgeführt wird, kombiniert mit Operationen zum Einfügen von Platzhaltern.

EditRetro-Modell verbessert die Erzeugungseffizienz durch seinen nicht-autoregressiven Decoder. Obwohl EditRetro zusätzliche Decoder zur iterativen Vorhersage von Bearbeitungsvorgängen enthält, führt es Bearbeitungsvorgänge innerhalb jedes Decoders parallel durch (d. h. nicht-autoregressive Generierung).

Wenn ein Zielmolekül angegeben wird, nimmt der Encoder dessen Zeichenfolge als Eingabe und generiert die entsprechende versteckte Darstellung, die dann als Eingabe für das Queraufmerksamkeitsmodul des Decoders verwendet wird. Ebenso verwendet der Decoder bei der ersten Iteration auch die Produktzeichenfolge als Eingabe. Während jeder Decodierungsiteration werden die drei Decoder nacheinander ausgeführt.

Besser als der Ausgangswert, erzeugen Sie genaue Reaktanten

Die Forscher bewerteten die vorgeschlagene Methode anhand der öffentlichen Benchmark-Datensätze USPTO-50K und USPTO-FULL. Umfangreiche experimentelle Ergebnisse zeigen, dass diese Methode andere Basislinien hinsichtlich der Vorhersagegenauigkeit übertrifft, einschließlich der hochmodernen sequenzbasierten Methode R-SMILES und der auf Diagrammbearbeitung basierenden Methode Graph2Edits.

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

EditRetro Umfangreiche Experimente mit dem Benchmark-Retrosynthese-Datensatz USPTO-50K zeigen, dass EditRetro mit einer Top-1-Exakt-Matching-Genauigkeit von 60,8 % eine überlegene Leistung erzielt.

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

Darüber hinaus erreichte die Top-1-Exakt-Matching-Genauigkeit im größeren USPTO-FULL-Datensatz 52,2 %, was ihre Wirksamkeit bei vielfältigeren und anspruchsvolleren chemischen Reaktionen beweist.

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

EditRetro zeigt auch in Bezug auf RoundTrip- und MaxFrag-Genauigkeit eine bessere Leistung als Basismethoden. Dies zeigt, dass EditRetro chemische Regeln effektiv lernen kann.

Darüber hinaus bietet EditRetro durch ein gut gestaltetes Inferenzmodul vielfältige Vorhersagen. Dieses Modul kombiniert Relocation-Sampling und Sequenzerweiterung, um vielfältige und sich ändernde Vorhersagen zu generieren. Bei der Neupositionierungsstichprobe werden Vorhersagen zu Neupositionierungsmaßnahmen erfasst, wodurch die Identifizierung unterschiedlicher Reaktionsorte ermöglicht wird. Die Sequenzverbesserung generiert unterschiedliche Bearbeitungspfade von verschiedenen Produktvarianten zu Reaktanten und erhöht dadurch die Vorhersagegenauigkeit und -vielfalt. Diese beiden Strategien wirken zusammen, um die Genauigkeit und Vielfalt der Vorhersagen zu erhöhen.

Weitere Experimente bestätigten die Überlegenheit von EditRetro bei einigen komplexeren Reaktionen, einschließlich chiraler Reaktionen, Ringöffnungs- und Ringbildungsreaktionen. Die Ergebnisse bestätigen die Überlegenheit von EditRetro in diesen anspruchsvollen Szenarien und demonstrieren seine Fähigkeit, verschiedene Arten chemischer Umwandlungen zu bewältigen.

Praktikabilität bei der mehrstufigen Syntheseplanung

Insbesondere die erfolgreiche Anwendung von EditRetro in vier mehrstufigen Retrosyntheseplanungsszenarien zeigt seine Praktikabilität.

Um den Nutzen von EditRetro bei der Syntheseplanung zu bewerten, wurden vollständige chemische Pfade durch sequentielle retrosynthetische Vorhersagen entworfen. Die Forscher wählten vier Zielverbindungen mit wichtigem pharmazeutischem Wert für die Bewertung aus: Febuxostat, Osimertinib, ein allosterischer Aktivator von GPX4 und der DDR1-Kinase-Inhibitor INS015_037.

Die Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht

Illustration: EditRetros mehrstufige retrosynthetische Vorhersage. (Quelle: Papier)

Alle vier Beispiele führten zu Retrosynthesewegen, die sehr gut mit den in der Literatur berichteten übereinstimmten, wobei die meisten Vorhersagen unter den ersten beiden rangierten. Von den 16 betrachteten Einzelschritten hatten 10 eine Vorhersagegenauigkeit von 1. Diese Ergebnisse zeigen das praktische Potenzial von EditRetro für praktische retrosynthetische Vorhersagen.

Diese Methode soll praktische Anwendungen im Bereich der Retrosyntheseplanung finden, indem sie wertvolle Erkenntnisse liefert und die Gestaltung effizienter Syntheserouten erleichtert.

Das obige ist der detaillierte Inhalt vonDie Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature“ veröffentlicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn