ホームページ >テクノロジー周辺機器 >AI >結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載
今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。
デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するために、数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練されたディープラーニング ニューラル ネットワークを使用して、正確な電子密度マップを生成できることを開発しました。
研究によると、この深層学習ベースの非経験的構造解析手法は、わずか 2 オングストロームの解像度で位相問題を解決できます。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当しますが、従来の非経験的構造解析手法では、位相問題を解決できます。通常、この方法では原子レベルの分解能が必要です。
関連研究は「PhAI: 結晶相問題を解決するための深層学習アプローチ」と題され、8月1日付けの「Science」誌に掲載されました。
論文リンク: https://www.science.org/doi/10.1126/science.adn2777結晶学は、自然科学の中核となる分析手法の 1 つです。 X 線結晶構造解析は、結晶の 3 次元構造についての独自の見解を提供します。
電子密度マップを再構成するには、回折反射の複雑な構造因子 $F$ が十分にわかっていなければなりません。従来の実験では、振幅 $|F|$ のみが取得され、位相 $phi$ は失われます。これは結晶相の問題です。
図: 標準的な結晶構造決定のフローチャート。 (出典: 論文)大きな進歩は 1950 年代と 1960 年代に起こり、Karle と Hauptmann** が位相問題を解決するためのいわゆる直接法を開発しました。ただし、直接法では原子分解能の回折データが必要です。ただし、原子分解能の要件は経験的な観察です。
近年、伝統的な直接法はデュアルスペース法によって補完されています。 現在利用可能な ab initio メソッドは限界に達しているようです。位相問題に対する一般的な解決策は依然として不明です。
数学的に言えば、構造因子の振幅と位相の任意の組み合わせを逆フーリエ変換することができます。 ただし、物理的および化学的要件 (原子に似た電子密度分布を持つなど) により、一連の振幅と一致する位相の可能な組み合わせにルールが課されます。深層学習の進歩により、おそらく現在の ab initio 手法よりもさらに深く、この関係を調査できるようになります。
ここで、コペンハーゲン大学の研究者らは、結晶学における位相問題を解決することを目的として、何百万もの人工結晶構造とそれに対応する回折データを使用してデータ駆動型のアプローチを採用しました。
研究によると、この深層学習ベースの非経験的構造解法手法は、直接法で必要なデータのみを使用して、最小格子面距離 (dmin) = 2.0 Å のみの解像度で 10% ~ 20% 実行できることが示されています。 。
ニューラルネットワークの設計とトレーニング
構築された人工ニューラルネットワークはPhAIと呼ばれ、構造因子振幅|F|を受け取り、対応する位相値ϕを出力します。 PhAIのアーキテクチャを以下の図に示します。
図: PhAI ニューラル ネットワーク手法は位相問題を解決します。 (出典: 論文) 結晶構造における構造因子の数は単位胞サイズに依存します。コンピューティング リソースに応じて、入力データのサイズに制限が設けられます。入力構造因子の振幅は、1 の反射に従うミラー指数 (h、k、l) に基づいて選択されます。훈련된 신경망은 잘 작동합니다. 해당 회절 데이터의 해상도가 좋으면 테스트된 모든 구조(N = 2387)를 해결할 수 있으며 저해상도의 구조를 더 잘 해결할 수 있습니다. 데이터 뛰어난 성능. 신경망은 무기 구조에 대해 거의 훈련되지 않지만 이러한 구조를 완벽하게 해결할 수 있습니다.
전하 반전 방법은 고해상도 데이터를 처리할 때 잘 작동하지만 데이터 해상도가 감소함에 따라 합리적으로 정확한 솔루션을 생성하는 능력이 점차 감소하지만 여전히 1.6Å의 해상도에서 약 32픽셀을 해결합니다. 구조. 전하 뒤집기로 식별된 구조의 수는 추가 실험과 임계값 뒤집기와 같은 입력 매개변수 변경을 통해 개선될 수 있습니다.
PhAI 접근 방식에서 이 메타 최적화는 훈련 중에 수행되며 사용자가 수행할 필요가 없습니다. 이러한 결과는 원자 분해능 데이터가 처음부터 위상을 계산하는 데 필요하다는 결정학의 일반적인 개념이 깨질 수 있음을 시사합니다. PhAI에는 10~20%의 원자 분해능 데이터만 필요합니다.
이 결과는 ab initio 방법에는 원자 분해능이 필요하지 않으며 딥 러닝 기반 구조 결정을 위한 새로운 길을 열어준다는 것을 명확하게 보여줍니다.
이 딥 러닝 접근 방식의 과제 는 신경망을 확장하는 것입니다. 즉, 더 큰 단위 셀에 대한 회절 데이터에는 훈련 중에 많은 양의 입력 및 출력 데이터와 계산 비용이 필요합니다. 향후에는 이 방법을 일반적인 경우로 확장하기 위한 추가 연구가 필요하다.
以上が結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。