ホームページ >テクノロジー周辺機器 >AI >結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

王林
王林オリジナル
2024-08-08 21:22:30593ブラウズ

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

編集者 | KX

今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。

デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するために、数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練されたディープラーニング ニューラル ネットワークを使用して、正確な電子密度マップを生成できることを開発しました。

研究によると、この深層学習ベースの非経験的構造解析手法は、わずか 2 オングストロームの解像度で位相問題を解決できます。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当しますが、従来の非経験的構造解析手法では、位相問題を解決できます。通常、この方法では原子レベルの分解能が必要です。

関連研究は「PhAI: 結晶相問題を解決するための深層学習アプローチ」と題され、8月1日付けの「Science」誌に掲載されました。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

論文リンク: https://www.science.org/doi/10.1126/science.adn2777

結晶学は、自然科学の中核となる分析手法の 1 つです。 X 線結晶構造解析は、結晶の 3 次元構造についての独自の見解を提供します。

電子密度マップを再構成するには、回折反射の複雑な構造因子 $F$ が十分にわかっていなければなりません。従来の実験では、振幅 $|F|$ のみが取得され、位相 $phi$ は失われます。これは結晶相の問題です。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

図: 標準的な結晶構造決定のフローチャート。 (出典: 論文)

大きな進歩は 1950 年代と 1960 年代に起こり、KarleHauptmann** が位相問題を解決するためのいわゆる直接法を開発しました。ただし、直接法では原子分解能の回折データが必要です。ただし、原子分解能の要件は経験的な観察です。

近年、伝統的な直接法はデュアルスペース法によって補完されています。 現在利用可能な ab initio メソッドは限界に達しているようです。位相問題に対する一般的な解決策は依然として不明です。

数学的に言えば、構造因子の振幅と位相の任意の組み合わせを逆フーリエ変換することができます。 ただし、物理的および化学的要件 (原子に似た電子密度分布を持つなど) により、一連の振幅と一致する位相の可能な組み合わせにルールが課されます。深層学習の進歩により、おそらく現在の ab initio 手法よりもさらに深く、この関係を調査できるようになります。

ここで、コペンハーゲン大学の研究者らは、結晶学における位相問題を解決することを目的として、何百万もの人工結晶構造とそれに対応する回折データを使用してデータ駆動型のアプローチを採用しました。

研究によると、この深層学習ベースの非経験的構造解法手法は、直接法で必要なデータのみを使用して、最小格子面距離 (dmin) = 2.0 Å のみの解像度で 10% ~ 20% 実行できることが示されています。 。

ニューラルネットワークの設計とトレーニング

構築された人工ニューラルネットワークはPhAIと呼ばれ、構造因子振幅|F|を受け取り、対応する位相値ϕを出力します。 PhAIのアーキテクチャを以下の図に示します。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

図: PhAI ニューラル ネットワーク手法は位相問題を解決します。 (出典: 論文) 結晶構造における構造因子の数は単位胞サイズに依存します。コンピューティング リソースに応じて、入力データのサイズに制限が設けられます。入力構造因子の振幅は、

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

1 の反射に従うミラー指数 (h、k、l) に基づいて選択されます。
つまり、構造は原子分解能で約 10 Å の単位格子寸法に制限されます。さらに、最も一般的な中心対称空間群 P21/c が選択されました。中心対称性により、可能な位相値は 0 または π ラジアンに制限されます。
  1. 주로 유기 분자를 포함하는 인공 결정 구조를 이용한 신경망 훈련 연구. 약 49,000,000개의 구조가 생성되었으며, 그 중 94.29%는 유기 결정 구조, 5.66%는 금속-유기 결정 구조, 0.05%는 무기 결정 구조였습니다.
  2. 신경망에 대한 입력은 진폭과 위상으로 구성되며, 이는 컨벌루션 입력 블록에 의해 처리되고 일련의 컨벌루션 블록(Conv3D)에 추가 및 공급된 다음 일련의 다층 퍼셉트론(MLP) 블록으로 구성됩니다. 선형 분류기(Phase Classifier)에서 예측된 위상은 Nc번 네트워크를 통해 순환됩니다. 훈련 데이터는 GDB-13 데이터베이스의 금속 원자와 유기 분자를 단위 셀에 삽입하여 생성되었습니다. 결과 구조는 샘플링된 온도 요인, 분해능 및 무결성에서 실제 위상 및 구조 요인 진폭을 계산할 수 있는 훈련 데이터로 구성됩니다.
    실제 구조적 문제를 해결하세요
  3. 훈련된 신경망은 적당한 계산 요구 사항을 갖춘 표준 컴퓨터에서 실행됩니다. 이는 hkl 지수 목록과 해당 구조 인자 진폭을 입력으로 받아들입니다. 다른 입력 정보는 필요하지 않으며 구조의 단위 셀 매개변수도 필요하지 않습니다. 이는 다른 모든 현대 ab initio 방법과 근본적으로 다릅니다. 네트워크는 즉석에서 위상 값을 예측하고 출력할 수 있습니다.
  4. 연구원들은 실제 결정 구조에서 계산된 회절 데이터를 사용하여 신경망의 성능을 테스트했습니다. 총 2387개의 테스트 케이스가 획득되었습니다. 수집된 모든 구조에 대해 1.0~2.0Å 범위의 다중 데이터 해상도 값이 고려되었습니다. 비교를 위해 위상 정보를 검색하기 위해 전하 플립 방법도 사용되었습니다.

    結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

    그림: 위상과 실제 전자 밀도 맵 사이의 상관 계수 r의 히스토그램.
    (출처: 논문)

훈련된 신경망은 잘 작동합니다. 해당 회절 데이터의 해상도가 좋으면 테스트된 모든 구조(N = 2387)를 해결할 수 있으며 저해상도의 구조를 더 잘 해결할 수 있습니다. 데이터 뛰어난 성능. 신경망은 무기 구조에 대해 거의 훈련되지 않지만 이러한 구조를 완벽하게 해결할 수 있습니다.

전하 반전 방법은 고해상도 데이터를 처리할 때 잘 작동하지만 데이터 해상도가 감소함에 따라 합리적으로 정확한 솔루션을 생성하는 능력이 점차 감소하지만 여전히 1.6Å의 해상도에서 약 32픽셀을 해결합니다. 구조. 전하 뒤집기로 식별된 구조의 수는 추가 실험과 임계값 뒤집기와 같은 입력 매개변수 변경을 통해 개선될 수 있습니다.

PhAI 접근 방식에서 이 메타 최적화는 훈련 중에 수행되며 사용자가 수행할 필요가 없습니다. 이러한 결과는 원자 분해능 데이터가 처음부터 위상을 계산하는 데 필요하다는 결정학의 일반적인 개념이 깨질 수 있음을 시사합니다. PhAI에는 10~20%의 원자 분해능 데이터만 필요합니다.

이 결과는 ab initio 방법에는 원자 분해능이 필요하지 않으며 딥 러닝 기반 구조 결정을 위한 새로운 길을 열어준다는 것을 명확하게 보여줍니다.

이 딥 러닝 접근 방식의 과제 는 신경망을 확장하는 것입니다. 즉, 더 큰 단위 셀에 대한 회절 데이터에는 훈련 중에 많은 양의 입력 및 출력 데이터와 계산 비용이 필요합니다. 향후에는 이 방법을 일반적인 경우로 확장하기 위한 추가 연구가 필요하다.

以上が結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。