結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載-AI-php.cn

ホームページ

テクノロジー周辺機器

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

王林

Aug 08, 2024 pm 09:22 PM

理論

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

編集者 | KX

今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。

デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するために、数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練されたディープラーニングニューラルネットワークを使用して、正確な電子密度マップを生成できることを開発しました。

研究によると、この深層学習ベースの非経験的構造解析手法は、わずか 2 オングストロームの解像度で位相問題を解決できます。これは、原子解像度で利用可能なデータのわずか 10% ～ 20% に相当しますが、従来の非経験的構造解析手法では、位相問題を解決できます。通常、この方法では原子レベルの分解能が必要です。

関連研究は「PhAI: 結晶相問題を解決するための深層学習アプローチ」と題され、8月1日付けの「Science」誌に掲載されました。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

論文リンク: https://www.science.org/doi/10.1126/science.adn2777

結晶学は、自然科学の中核となる分析手法の 1 つです。 X 線結晶構造解析は、結晶の 3 次元構造についての独自の見解を提供します。

電子密度マップを再構成するには、回折反射の複雑な構造因子 $F$ が十分にわかっていなければなりません。従来の実験では、振幅 $|F|$ のみが取得され、位相 $phi$ は失われます。これは結晶相の問題です。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

図: 標準的な結晶構造決定のフローチャート。 (出典: 論文)

大きな進歩は 1950 年代と 1960 年代に起こり、Karle と Hauptmann** が位相問題を解決するためのいわゆる直接法を開発しました。ただし、直接法では原子分解能の回折データが必要です。ただし、原子分解能の要件は経験的な観察です。

近年、伝統的な直接法はデュアルスペース法によって補完されています。 現在利用可能な ab initio メソッドは限界に達しているようです。位相問題に対する一般的な解決策は依然として不明です。

数学的に言えば、構造因子の振幅と位相の任意の組み合わせを逆フーリエ変換することができます。 ただし、物理的および化学的要件 (原子に似た電子密度分布を持つなど) により、一連の振幅と一致する位相の可能な組み合わせにルールが課されます。深層学習の進歩により、おそらく現在の ab initio 手法よりもさらに深く、この関係を調査できるようになります。

ここで、コペンハーゲン大学の研究者らは、結晶学における位相問題を解決することを目的として、何百万もの人工結晶構造とそれに対応する回折データを使用してデータ駆動型のアプローチを採用しました。

研究によると、この深層学習ベースの非経験的構造解法手法は、直接法で必要なデータのみを使用して、最小格子面距離 (dmin) = 2.0 Å のみの解像度で 10% ～ 20% 実行できることが示されています。。

ニューラルネットワークの設計とトレーニング

構築された人工ニューラルネットワークはPhAIと呼ばれ、構造因子振幅|F|を受け取り、対応する位相値ϕを出力します。 PhAIのアーキテクチャを以下の図に示します。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

図: PhAI ニューラルネットワーク手法は位相問題を解決します。 (出典: 論文) 結晶構造における構造因子の数は単位胞サイズに依存します。コンピューティングリソースに応じて、入力データのサイズに制限が設けられます。入力構造因子の振幅は、

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載

1 の反射に従うミラー指数 (h、k、l) に基づいて選択されます。
つまり、構造は原子分解能で約 10 Å の単位格子寸法に制限されます。さらに、最も一般的な中心対称空間群 P21/c が選択されました。中心対称性により、可能な位相値は 0 または π ラジアンに制限されます。

주로 유기 분자를 포함하는 인공 결정 구조를 이용한 신경망 훈련 연구. 약 49,000,000개의 구조가 생성되었으며, 그 중 94.29%는 유기 결정 구조, 5.66%는 금속-유기 결정 구조, 0.05%는 무기 결정 구조였습니다.
신경망에 대한 입력은 진폭과 위상으로 구성되며, 이는 컨벌루션 입력 블록에 의해 처리되고 일련의 컨벌루션 블록(Conv3D)에 추가 및 공급된 다음 일련의 다층 퍼셉트론(MLP) 블록으로 구성됩니다. 선형 분류기(Phase Classifier)에서 예측된 위상은 Nc번 네트워크를 통해 순환됩니다. 훈련 데이터는 GDB-13 데이터베이스의 금속 원자와 유기 분자를 단위 셀에 삽입하여 생성되었습니다. 결과 구조는 샘플링된 온도 요인, 분해능 및 무결성에서 실제 위상 및 구조 요인 진폭을 계산할 수 있는 훈련 데이터로 구성됩니다.
실제 구조적 문제를 해결하세요
훈련된 신경망은 적당한 계산 요구 사항을 갖춘 표준 컴퓨터에서 실행됩니다. 이는 hkl 지수 목록과 해당 구조 인자 진폭을 입력으로 받아들입니다. 다른 입력 정보는 필요하지 않으며 구조의 단위 셀 매개변수도 필요하지 않습니다. 이는 다른 모든 현대 ab initio 방법과 근본적으로 다릅니다. 네트워크는 즉석에서 위상 값을 예측하고 출력할 수 있습니다.
연구원들은 실제 결정 구조에서 계산된 회절 데이터를 사용하여 신경망의 성능을 테스트했습니다. 총 2387개의 테스트 케이스가 획득되었습니다. 수집된 모든 구조에 대해 1.0~2.0Å 범위의 다중 데이터 해상도 값이 고려되었습니다. 비교를 위해 위상 정보를 검색하기 위해 전하 플립 방법도 사용되었습니다.
그림: 위상과 실제 전자 밀도 맵 사이의 상관 계수 r의 히스토그램.
(출처: 논문)

훈련된 신경망은 잘 작동합니다. 해당 회절 데이터의 해상도가 좋으면 테스트된 모든 구조(N = 2387)를 해결할 수 있으며 저해상도의 구조를 더 잘 해결할 수 있습니다. 데이터 뛰어난 성능. 신경망은 무기 구조에 대해 거의 훈련되지 않지만 이러한 구조를 완벽하게 해결할 수 있습니다.

전하 반전 방법은 고해상도 데이터를 처리할 때 잘 작동하지만 데이터 해상도가 감소함에 따라 합리적으로 정확한 솔루션을 생성하는 능력이 점차 감소하지만 여전히 1.6Å의 해상도에서 약 32픽셀을 해결합니다. 구조. 전하 뒤집기로 식별된 구조의 수는 추가 실험과 임계값 뒤집기와 같은 입력 매개변수 변경을 통해 개선될 수 있습니다.

PhAI 접근 방식에서 이 메타 최적화는 훈련 중에 수행되며 사용자가 수행할 필요가 없습니다. 이러한 결과는 원자 분해능 데이터가 처음부터 위상을 계산하는 데 필요하다는 결정학의 일반적인 개념이 깨질 수 있음을 시사합니다. PhAI에는 10~20%의 원자 분해능 데이터만 필요합니다.

이 결과는 ab initio 방법에는 원자 분해능이 필요하지 않으며 딥 러닝 기반 구조 결정을 위한 새로운 길을 열어준다는 것을 명확하게 보여줍니다.

이 딥 러닝 접근 방식의 과제 는 신경망을 확장하는 것입니다. 즉, 더 큰 단위 셀에 대한 회절 데이터에는 훈련 중에 많은 양의 입력 및 출력 데이터와 계산 비용이 필요합니다. 향후에는 이 방법을 일반적인 경우로 확장하기 위한 추가 연구가 필요하다.

以上が結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

ヨーロッパのAI大陸行動計画：GigaFactories、Data Labs、Green AIApr 10, 2025 am 11:21 AM

ヨーロッパの野心的なAI大陸行動計画は、人工知能のグローバルリーダーとしてEUを確立することを目指しています。重要な要素は、AI GigaFactoriesのネットワークの作成であり、それぞれが約100,000の高度なAIチップを収容しています。

Microsoftの簡単なエージェントストーリーは、より多くのファンを作成するのに十分ですか？Apr 10, 2025 am 11:20 AM

AIエージェントアプリケーションに対するMicrosoftの統一アプローチ：企業の明確な勝利新しいAIエージェント機能に関するマイクロソフトの最近の発表は、その明確で統一されたプレゼンテーションに感銘を受けました。 TEで行き詰まった多くのハイテクアナウンスとは異なり

従業員へのAI戦略の販売：Shopify CEOのマニフェストApr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

IBMは、完全なAI統合でZ17メインフレームを起動しますApr 10, 2025 am 11:18 AM

IBMのZ17メインフレーム：AIを強化した事業運営の統合先月、IBMのニューヨーク本社で、Z17の機能のプレビューを受け取りました。 Z16の成功に基づいて構築（2022年に開始され、持続的な収益の成長の実証

5 chatgptプロンプトは他の人に依存して停止し、自分を完全に信頼するApr 10, 2025 am 11:17 AM

揺るぎない自信のロックを解除し、外部検証の必要性を排除します！これらの5つのCHATGPTプロンプトは、完全な自立と自己認識の変革的な変化に向けて導きます。ブラケットをコピー、貼り付け、カスタマイズするだけです

AIはあなたの心に危険なほど似ていますApr 10, 2025 am 11:16 AM

人工知能のセキュリティおよび研究会社であるAnthropicによる最近の[研究]は、これらの複雑なプロセスについての真実を明らかにし始め、私たち自身の認知領域に不穏に似た複雑さを示しています。自然知能と人工知能は、私たちが思っているよりも似ているかもしれません。内部スヌーピング：人類の解釈可能性研究人類によって行われた研究からの新しい発見は、AIの内部コンピューティングをリバースエンジニアリングすることを目的とする機械的解釈可能性の分野の大きな進歩を表しています。AIが何をするかを観察するだけでなく、人工ニューロンレベルでそれがどのように行うかを理解します。誰かが特定のオブジェクトを見たり、特定のアイデアについて考えたりしたときに、どのニューロンが発射するかを描くことによって脳を理解しようとすることを想像してください。 a

Dragonwingは、QualcommのEdge Momentumを紹介していますApr 10, 2025 am 11:14 AM

Qualcomm's DragonWing：企業とインフラストラクチャへの戦略的な飛躍 Qualcommは、新しいDragonwingブランドで世界的に企業やインフラ市場をターゲットにして、モバイルを超えてリーチを積極的に拡大しています。これは単なるレブランではありません

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ドリームウィーバー CS6

ビジュアル Web 開発ツール

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。