Heim >Technologie-Peripheriegeräte >KI >Training mit Millionen von Kristalldaten zur Lösung kristallographischer Phasenprobleme, die Deep-Learning-Methode PhAI wird in Science veröffentlicht
Bis heute sind die durch die Kristallographie ermittelten Strukturdetails und Präzision, von einfachen Metallen bis hin zu großen Membranproteinen, mit keiner anderen Methode zu erreichen. Die größte Herausforderung, das sogenannte Phasenproblem, bleibt jedoch die Gewinnung von Phaseninformationen aus experimentell bestimmten Amplituden.
Forscher der Universität Kopenhagen, Dänemark, haben eine Deep-Learning-Methode namens PhAI entwickelt, um Kristallphasenprobleme zu lösen. Ein Deep-Learning-Neuronales Netzwerk, das mit Millionen künstlicher Kristallstrukturen und den entsprechenden synthetischen Beugungsdaten trainiert wird, kann genaue Elektronendichtekarten erstellen. .
Untersuchungen zeigen, dass diese auf Deep Learning basierende Ab-initio-Strukturlösungsmethode das Phasenproblem mit einer Auflösung von nur 2 Angström lösen kann, was nur 10 % bis 20 % der verfügbaren Daten bei atomarer Auflösung entspricht, während herkömmliche Ab-initio Methoden erfordern typischerweise eine atomare Auflösung.
Relevante Forschung trug den Titel „PhAI: Ein Deep-Learning-Ansatz zur Lösung des kristallographischen Phasenproblems“ und wurde am 1. August in „Science“ veröffentlicht.
Link zum Papier: https://www.science.org/doi/10.1126/science.adn2777Kristallographie ist eine der zentralen Analysetechniken in den Naturwissenschaften. Die Röntgenkristallographie ermöglicht einen einzigartigen Einblick in die dreidimensionale Struktur von Kristallen.
Um die Elektronendichtekarte zu rekonstruieren, müssen genügend komplexe Strukturfaktoren $F$ der Beugungsreflexe bekannt sein. In einem herkömmlichen Experiment wird nur die Amplitude $|F|$ erhalten, während die Phase $phi$ verloren geht. Dies ist ein kristallographisches Phasenproblem.
Abbildung: Standard-Flussdiagramm zur Bestimmung der Kristallstruktur. (Quelle: Paper)Ein großer Durchbruch gelang in den 1950er und 1960er Jahren, als Karle und Hauptmann** sogenannte direkte Methoden zur Lösung von Phasenproblemen entwickelten. Die direkte Methode erfordert jedoch Beugungsdaten mit atomarer Auflösung. Das Erfordernis einer atomaren Auflösung ist jedoch eine empirische Beobachtung.
In den letzten Jahren wurden traditionelle direkte Methoden durch Dual-Space-Methoden ergänzt. Die derzeit verfügbaren Ab-initio-Methoden scheinen an ihre Grenzen gestoßen zu sein. Eine allgemeine Lösung des Phasenproblems bleibt unbekannt.
Mathematisch gesehen kann jede Kombination aus Strukturfaktoramplitude und -phase einer inversen Fourier-Transformation unterzogen werden. Physikalische und chemische Anforderungen (z. B. eine atomarähnliche Elektronendichteverteilung) legen jedoch Regeln für die möglichen Kombinationen von Phasen fest, die mit einer Reihe von Amplituden übereinstimmen. Fortschritte im Deep Learning ermöglichen es, diesen Zusammenhang zu untersuchen, möglicherweise tiefergehend als mit den aktuellen Ab-initio-Methoden.
Hier haben Forscher der Universität Kopenhagen einen datengesteuerten Ansatz gewählt und Millionen künstlicher Kristallstrukturen und deren entsprechende Beugungsdaten verwendet, um Phasenprobleme in der Kristallographie zu lösen.
Studie zeigt, dass diese auf Deep Learning basierende Ab-initio-Strukturlösungsmethode mit einer Auflösung von nur minimalem Gitterebenenabstand (dmin) = 2,0 Å durchgeführt werden kann, wobei nur die für die direkte Methode erforderlichen Daten verwendet werden (10 % bis 20 %). .
Neuronales Netzwerkdesign und Training
Das konstruierte künstliche neuronale Netzwerk heißt PhAI, das die Strukturfaktoramplitude |F| akzeptiert und den entsprechenden Phasenwert ϕ ausgibt. Die Architektur von PhAI ist in der folgenden Abbildung dargestellt.
Abbildung: Die neuronale Netzwerkmethode PhAI löst das Phasenproblem. (Quelle: Paper) Die Anzahl der Strukturfaktoren in einer Kristallstruktur hängt von der Elementarzellengröße ab. Abhängig von den Rechenressourcen sind der Größe der Eingabedaten Grenzen gesetzt. Die Amplituden der Eingabestrukturfaktoren werden auf der Grundlage der Miller-Indizes (h, k, l) gemäß der 1-Reflexion ausgewählt.トレーニングされたニューラル ネットワークは良好なパフォーマンスを発揮します 対応する回折データの解像度が高ければ、テストされたすべての構造 (N = 2387) を解くことができ、低解像度の構造を解くのに優れています。データ 優れたパフォーマンス。ニューラル ネットワークが無機構造に対してトレーニングされることはほとんどありませんが、そのような構造を完全に解決できます。
電荷フリップ法は、高解像度データを処理する場合には良好に機能しますが、データ解像度が低下するにつれて、適切に正しい解を生成する能力は徐々に低下しますが、それでも 1.6 Å % 構造の解像度で約 32 ピクセルを解決します。電荷反転によって特定される構造の数は、さらなる実験と反転閾値などの入力パラメータの変更によって改善できます。
PhAI アプローチでは、このメタ最適化はトレーニング中に実行され、ユーザーが実行する必要はありません。これらの結果は、位相を最初から計算するには原子分解能データが必要であるという結晶学における一般的な概念が崩れている可能性があることを示唆しています。 PhAI は 10% ~ 20% の原子分解能データのみを必要とします。
この結果は、原子分解能が ab initio 法には必要なく、深層学習ベースの構造決定に新しい道を開くことを明確に示しています。この深層学習アプローチの課題
は、ニューラル ネットワークをスケールすることです。つまり、より大きな単位セルの回折データには、トレーニング中に大量の入出力データと計算コストが必要になります。将来的には、この方法を一般的なケースに拡張するには、さらなる研究が必要です。Das obige ist der detaillierte Inhalt vonTraining mit Millionen von Kristalldaten zur Lösung kristallographischer Phasenprobleme, die Deep-Learning-Methode PhAI wird in Science veröffentlicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!