ホームページ >テクノロジー周辺機器 >AI >元素の周期表全体に共通し、AI が材料の構造と特性を瞬時に予測します
材料の特性は、原子の配置によって決まります。しかし、そのような配置を得る既存の方法は、多くの要素に対して費用がかかりすぎるか、効果がありません。
現在、カリフォルニア大学サンディエゴ校ナノ工学部の研究者らは、既存か新規かを問わず、あらゆる材料の構造とダイナミクスをほぼ瞬時に特徴的に予測できる人工知能アルゴリズムを開発しました。 M3GNet として知られるこのアルゴリズムは、matterverse.ai データベースの開発に使用されました。このデータベースには、機械学習アルゴリズムによって特性が予測される 3,100 万を超える未合成の材料が含まれています。 Matterverse.ai は、優れた特性を持つ新しい技術材料の発見を促進します。
研究のタイトルは「周期表の普遍的なグラフディープラーニング原子間ポテンシャル」で、2022年11月28日に「Nature Computational Science」に掲載されました。 。
論文リンク: https://www.nature.com/articles/s43588-022-00349-3
大規模な材料研究では、原子間の多体相互作用の観点からポテンシャル エネルギー面 (PES) を記述するために、効率的で線形スケールの原子間ポテンシャル (IAP) が必要です。ただし、今日のほとんどの IAP は、狭い範囲の化学物質、通常は 1 つの元素、または多くても 4 ~ 5 つの元素向けにカスタマイズされています。 最近、PES の機械学習が、IAP 開発に対する特に有望なアプローチとして浮上しています。しかし、周期表全体およびすべての種類の結晶にわたって普遍的に適用できる IAP を実証した研究はありません。 過去 10 年にわたり、効率的で信頼性の高い電子構造コードと高スループットの自動化フレームワークの出現により、計算材料データの大規模な連合データベースが開発されました。構造緩和中に大量の PES データ、つまり中間構造とそれに対応するエネルギー、力、応力が蓄積されてきましたが、これらのデータにはあまり注目されていません。 「タンパク質と同様に、その特性を予測するには材料の構造を理解する必要があります。」とこの研究の筆頭著者である Shyue Ping Ong 氏は述べています。 "我々に必要なのは材料の AlphaFold です。"
AlphaFold は、タンパク質の構造を予測するために Google DeepMind によって開発された人工知能アルゴリズムです。同等の物質を構築するために、オング氏と彼のチームは、グラフ ニューラル ネットワークと多体相互作用を組み合わせて、周期表のすべての要素にわたって普遍的であり、高精度で動作する深層学習アーキテクチャを構築しました。数学グラフは結晶と分子を自然に表現したもので、ノードとエッジはそれぞれ原子と原子間の結合を表します。従来のマテリアル グラフ ニューラル ネットワーク モデルは、一般的な材料特性の予測には非常に効果的であることが証明されていますが、物理的な制約がないため、IAP としての使用には適していません。
研究者らは、マルチボディ相互作用を明示的に組み込んだマテリアル グラフ アーキテクチャを開発しました。モデル開発は従来の IAP からインスピレーションを受けており、この作業では、三体インタラクション (M3GNet) の統合に焦点が当てられます。
# 図 1: 多体グラフのポテンシャルと主要な計算ブロックの概略図。 (出典: 論文)IAP データセットのベンチマーク
最初のベンチマークとして、研究者らは Ong らを選択しました。面心立方晶(fcc)ニッケル、fcc銅、体心立方晶(bcc)リチウム、bccモリブデン、ダイヤモンドシリコン、ダイヤモンドゲルマニウムの元素エネルギーと力の多様なDFTデータセットを以前に生成しました。
表 1: 単一要素データセットにおける M3GNet モデルと既存モデル EAM、MEAM、NNP、MTP 間の誤差比較。 (出典: 論文)
表 1 からわかるように、M3GNet IAP は従来のマルチボディの可能性よりも大幅に優れており、パフォーマンスもローカル環境に基づく ML-IAP に匹敵します。 ML-IAP は M3GNet IAP よりわずかに小さいエネルギーおよび力誤差を実現できますが、ML-IAP に複数の元素を追加すると、複合爆発回帰の数が多くの場合に生じるため、多元素化学を処理する柔軟性が大幅に低下することに注意してください。係数と対応するデータ要件。対照的に、M3GNet アーキテクチャは、各アトム (ノード) の要素情報を学習可能な埋め込みベクトルとして表現します。このようなフレームワークは、多成分化学に簡単に拡張できます。
他の GNN と同様に、M3GNet フレームワークは、結合構築のカットオフ半径を増やすことなく、長距離相互作用をキャプチャできます。同時に、以前の GNN モデルとは異なり、M3GNet アーキテクチャは結合数の変化に応じてエネルギー、力、応力の継続的な変化を維持します。これは IAP の重要な要件です。
周期表のユニバーサル IAP
周期表全体の IAP を開発するために、チームは世界最大の DFT 結晶構造を使用しました。リラクゼーションに関するオープン データベースの一部 (マテリアル プロジェクト)。
図 2: MPF.2021.2.8 データセットの分布。 (出典: 論文)
原則として、IAP はエネルギーのみ、またはエネルギーと力の組み合わせをトレーニングできます。実際には、エネルギーのみでトレーニングされた M3GNet IAP (M3GNet-E) は、力や応力の予測において妥当な精度を達成できず、平均絶対誤差 (MAE) がデータの平均絶対偏差よりもさらに大きくなります。エネルギー力 (M3GNet-EF) とエネルギー力ストレス (M3GNet-EFS) でトレーニングされた M3GNet モデルは、比較的同様のエネルギーと力 MAE を取得しましたが、M3GNet-EFS のストレス MAE は M3GNet-EF モデルの約半分でした。
構造緩和や NpT 分子動力学シミュレーションなど、格子変化を伴うアプリケーションの場合、正確な応力予測が必要です。この調査結果は、実用的な IAP を取得するには、3 つのプロパティ (エネルギー、力、圧力) をすべてモデルのトレーニングに含めることが重要であることを示しています。最終的な M3GNet-EFS IAP (以下、M3GNet モデルと呼びます) は、平均エネルギー、力、および圧力試験 MAE がそれぞれ 0.072eVÅ-1 および 0.41GPa で、原子あたり平均 0.035eV を達成しました。
図 3: DFT 計算と比較したテスト データセットのモデル予測。
テスト データでは、DFT 予測とモデル予測の間の線形フィットの高い線形性と R2 値からわかるように、モデル予測と DFT グラウンド トゥルースはよく一致しています。モデル誤差の累積分布は、データの 50% のエネルギー誤差、力誤差、応力誤差がそれぞれ原子あたり 0.01 eV、0.033 eVÅ-1、0.042 GPa 未満であることを示しています。 M3GNet によって計算されたデバイ温度は精度が低く、これは M3GNet のせん断弾性率の予測が比較的不十分であることが原因と考えられますが、体積弾性率の予測は妥当です。
M3GNet IAP は、最終的な DFT 構造が事前に不明なマテリアル ディスカバリ ワークフローをシミュレートするために適用されます。 M3GNet 緩和は、3,140 個の材料のテスト データセットからの初期構造に対して実行されました。 M3GNet 緩和構造のエネルギー計算では、原子あたり 0.035 eV の MAE が得られ、材料の 80% の誤差は原子あたり 0.028 eV 未満でした。 M3GNet を使用した緩和構造の誤差分布は、既知の DFT 最終構造の誤差分布に近く、正しい構造を取得するのに M3GNet が正確に役立つ可能性があることを示しています。一般的に、M3GNet の緩和はすぐに収束します。
# 図 4: M3GNet を使用した緩和結晶構造。 (出典: 論文)
新物質発見
M3GNet はあらゆる結晶構造を正確かつ迅速に緩和できますエネルギーを予測できるため、大規模な材料発見に最適です。 研究者らは、開始点として 31,664,858 個の候補構造を生成し、M3GNet IAP を使用して構造を緩和し、材料プロジェクトの凸包 (Ehull-m) までの符号付きエネルギー距離を計算しました。1,849,096 個の材料の Ehull-m は原子あたり 0.01 eV 未満でした。 。
材料発見における M3GNet のパフォーマンスのさらなる評価として、研究者らは、0.001 eV/原子未満 (Ehull- dft ≤ 0) の約 180 万個の Ehull-m 材料から DFT 安定材料の 1000 個の構造を均一にサンプリングして発見率を計算しました。 )。発見率は、Ehull-m しきい値である原子あたり約 0.5 eV までは 1.0 に近い値を維持し、最も厳しいしきい値である原子あたり 0.001 eV では、0.31 という適度に高い値を維持します。
図 5: 1000 構造の均一サンプルの Ehull-m 閾値の関数としての DFT 安定性比。 (出典: 論文)
このマテリアル セットについて、研究者らは、M3GNet 事前緩和ありとなしの DFT 緩和時間コストも比較しました。結果は、M3GNet 事前緩和がない場合、DFT 緩和時間コストは M3GNet 事前緩和の約 3 倍であることを示しています。
図 6: M3GNet 事前緩和を使用した DFT 加速。 (出典: 論文)
現在、matterverse.ai にある 3,100 万のマテリアルのうち、100 万以上が潜在的に安定していると予想されます。 Ong 氏と彼のチームは、マテリアルの数だけでなく、以前に開発した多重忠実度のアプローチを使用して、少量のデータ量に対する高価値の属性を含め、ML が予測できる属性の数も大幅に拡大する予定です。
M3GNet IAP は、構造緩和に加えて、材料動的シミュレーションや性能予測にも広範なアプリケーションを提供します。
「たとえば、私たちはリチウムイオン電池の電極または電解質におけるリチウムイオンの拡散速度に興味を持ちます。拡散が速いほど、電池の充電または放電が速くなります。」オングさんは言いました。 「私たちは、M3GNet IAP を使用して材料のリチウム伝導率を高精度に予測できることを実証しました。私たちは、M3GNet アーキテクチャが、新しい材料の化学と構造を探索する能力を大幅に拡大できる革新的なツールであると確信しています。」
M3GNet の使用を促進するために、チームはこのフレームワークをオープン ソース Python コードとして Github にリリースしました。 M3GNet IAP をツールとして商用材料シミュレーション パッケージに統合する計画があります。
以上が元素の周期表全体に共通し、AI が材料の構造と特性を瞬時に予測しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。