ホームページ  >  記事  >  テクノロジー周辺機器  >  AI4Science の基礎: 幾何学グラフ ニューラル ネットワーク、最も包括的なレビューがここにあります。中国人民大学ヒルハウスはテンセントAIラボ、清華大学、スタンフォード大学などと共同でリリースした。

AI4Science の基礎: 幾何学グラフ ニューラル ネットワーク、最も包括的なレビューがここにあります。中国人民大学ヒルハウスはテンセントAIラボ、清華大学、スタンフォード大学などと共同でリリースした。

王林
王林転載
2024-03-07 21:10:13811ブラウズ

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

編集者 | XS

Nature は、タンパク質合成技術 Chroma と結晶材料設計手法 GNoME という 2 つの重要な研究結果を 2023 年 11 月に発表しました。どちらの研究でも、科学データを処理するツールとしてグラフ ニューラル ネットワークを採用しました。

実際、グラフ ニューラル ネットワーク、特に幾何学的グラフ ニューラル ネットワークは、常に科学知能 (AI for Science) 研究にとって重要なツールです。これは、科学分野における粒子、分子、タンパク質、結晶などの物理システムを特別なデータ構造、つまり幾何学グラフにモデル化できるためです。

一般的なトポロジー図とは異なり、物理システムをより適切に説明するために、幾何学図は不可欠な空間情報を追加し、平行移動、回転、反転の物理的対称性を満たす必要があります。物理システムのモデリングにおける幾何学グラフ ニューラル ネットワークの優位性を考慮して、近年さまざまな手法が登場し、論文数は増え続けています。

最近、中国人民大学とヒルハウスは、テンセント AI ラボ、清華大学、スタンフォード大学、その他の機関と協力して、レビュー論文「幾何学グラフ ニューラル ネットワークの調査: データ構造、モデル」を発表しました。およびアプリケーション"。このレビューでは、群理論や対称性などの理論的知識の簡単な紹介に基づいて、データ構造やモデルから多数の科学的応用に至るまで、関連する幾何学グラフ ニューラル ネットワークの文献を体系的にレビューします。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

紙のリンク: https://arxiv.org/abs/2403.00485

GitHub リンク: https:/ /github.com/RUC-GLAD/GGNN4Science

このレビューでは、著者は 300 以上の参考文献を調査し、3 つの異なる幾何学グラフ ニューラル ネットワーク モデルを要約し、粒子指向の関連する合計 23 モデルを紹介しました。分子、タンパク質などのさまざまな科学データに基づいてさまざまなタスクに対応する手法を確立し、50 を超える関連する評価データセットが収集されています。最後に、幾何学グラフの基本モデル、大規模な言語モデルとの組み合わせなど、将来の研究の方向性を展望しています。

以下は各章の簡単な紹介です。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

#幾何グラフのデータ構造

幾何グラフは、隣接行列、ノード特性、ノードの幾何情報(座標など)から構成されます。ユークリッド空間では、幾何学的図形は通常、並進、回転、鏡映の物理的対称性を示します。これらの変換を記述するには、通常、ユークリッド群、並進群、直交群、順列群などの群が使用されます。直観的には、移動、平行移動、回転、反転の 4 つの操作を特定の順序で組み合わせたものとして理解できます。

AI for Science の多くの分野にとって、幾何学グラフは、小分子、タンパク質、結晶、物理点群などを含む多くの物理システムを表現するために使用できる強力で汎用性の高い表現方法です。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

幾何グラフ ニューラル ネットワーク モデル

実際の問題における解決目標の対称性の要件に従って、この記事では幾何学的グラフを使用します。グラフ ニューラル ネットワーク ネットワークは、不変 (不変) モデル、等変 (等変) モデル、Transformer アーキテクチャからインスピレーションを得た Geometric Graph Transformer の 3 つのカテゴリに分類されます。球面調和の高度に制御可能なモデルについて。上記のルールに従って、この記事では、近年よく知られている幾何グラフ ニューラル ネットワーク モデルを収集し、分類します。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

ここでは、不変モデル (SchNet[1])、スカラー化手法モデル (EGNN[2])、および代表的な高次スケーラブル モデルを簡単に紹介します。各ブランチの作業 操作モデル間の相関と差異 (TFN[3])。 3 つすべてがメッセージ パッシング メカニズムを使用していることがわかりますが、後の 2 つは等変モデルであり、追加の幾何学的メッセージ パッシングが導入されています。

不変モデルは主にノード自体の特性 (原子の種類、質量、電荷など) と原子間の不変特性 (距離、角度 [4]、二面角 [5] など) を使用します。 ]) など。メッセージの計算が実行され、その後伝播されます。

これに加えて、スカラー化法では、ノード間の座標差を通じて幾何情報を追加導入し、不変情報を幾何情報の重みとして線形結合することで等分散性の導入を実現します。

高次の制御可能なモデルは、高次の球面調和関数とウィグナー D 行列を使用して、システムの幾何学的情報を表現します。この方法では、量子力学のクレブシュ ゴルダン係数を使用して、既約表現の次数を制御します。幾何学的メッセージパッシングプロセスを実現します。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

#幾何グラフ ニューラル ネットワークは、この種の設計によって保証される対称性によって精度が大幅に向上し、生成タスクでも威力を発揮します。

次の図は、QM9、PDBBind の 3 つのデータセットに対する幾何学的グラフ ニューラル ネットワークと従来のモデルを使用した、分子特性予測、タンパク質とリガンドのドッキング、抗体設計 (生成) の 3 つのタスクの結果です。幾何学グラフ ニューラル ネットワークの利点がはっきりとわかります。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

科学的応用

科学的応用に関しては、このレビューでは物理学 (粒子)、生化学 (小分子、タンパク質) を取り上げます。結晶などの他のアプリケーション シナリオと同様に、タスク定義と確保するために必要な対称性のタイプから始まり、各タスクで一般的に使用されるデータ セットとこのタイプのタスクでの古典的なモデル設計のアイデアが紹介されます。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

上の表は、さまざまな分野における一般的なタスクと古典的なモデルを示しています。その中で、単一のインスタンスと複数のインスタンス (複数の参加が必要な化学反応など) に応じて、分子)、記事は別です。小分子-小分子、小分子-タンパク質、タンパク質-タンパク質の 3 つの領域が区別されます。

現場でのモデル設計と実験開発をより容易にするために、この記事では、単一インスタンスと複数インスタンスに基づいた 2 種類のタスクの共通データ セットとベンチマーク (ベンチマーク) を数え、さまざまなデータのサンプルを記録しています。タスクの量と種類。

次の表は、一般的な単一インスタンス タスクのデータ セットをまとめたものです。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

#次の表は、一般的なマルチインスタンス タスク データ セットをまとめたものです。

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

将来の見通し

この記事では、出発点として役立つことを期待して、いくつかの側面について予備的な見通しを示します。

1. 幾何グラフ基本モデル

さまざまなタスクや分野で統一された基本モデルを使用する利点は、GPT シリーズ モデルの大幅な進歩に反映されています。このアイデアを幾何学グラフ ニューラル ネットワークの設計に導入するために、タスク空間、データ空間、モデル空間で合理的な設計をどのように実行するかは、依然として興味深い未解決の問題です。

2. モデルのトレーニングと実際の実験検証の効率的なサイクル

科学データの取得には費用と時間がかかり、評価は独立したデータセットでのみ行われます。現実世界からのフィードバックを直接反映することはできません。 GNoME (グラフ ネットワークのトレーニング、密度汎関数理論の計算、材料の発見と合成のための自動ラボを含むエンドツーエンドのパイプラインを統合する) と同様の、効率的なモデルと現実の反復実験パラダイムを実現する方法の重要性は、今後ますます高まっていくでしょう。日。

3. 大規模言語モデル (LLM) との統合

大規模言語モデル (LLM) には、さまざまな分野をカバーする豊富な知識があることが広く証明されています。分子特性の予測や薬剤設計などの特定のタスクに LLM を利用する研究はいくつかありますが、それらはプリミティブまたは分子グラフ上でのみ機能します。これらを幾何学グラフ ニューラル ネットワークと有機的に組み合わせて、3D 構造情報を処理し、3D 構造の予測や生成を実行できるようにする方法は、依然として非常に困難です。

4. 等分散制約の緩和

データ効率とモデルの汎化能力を高めるために等分散が重要であることは間違いありませんが、強すぎることに注意する価値があります。等分散制約はモデルに対して制限が強すぎる場合があり、パフォーマンスに悪影響を与える可能性があります。したがって、設計されたモデルの等分散性と適応性のバランスをどのように取るかは非常に興味深い問題です。この分野の探求は、モデルの動作についての理解を深めるだけでなく、より幅広い適用性を備えた、より堅牢で一般的なソリューションの開発への道を開くことにもなります。

参考文献

[1] Schütt K、Kindermans P J、Sauceda Felix H E、他 Schnet: 量子相互作用をモデル化するための連続フィルター畳み込みニューラル ネットワーク[ J ]. 神経情報処理システムの進歩、2017、30.

[2] Satorras V G、Hoogeboom E、Welling M. E (n) 等変グラフ ニューラル ネットワーク[C]//機械学習に関する国際会議。 PMLR、2021: 9323-9332.

[3] Thomas N、Smidt T、Kearnes S、他。テンソル フィールド ネットワーク: 3 次元点群の回転および平行移動等価ニューラル ネットワーク[J]。 arXiv プレプリント arXiv:1802.08219、2018.

[4] Gaseiger J、Groß J、Günnemann S. 分子グラフのための方向性メッセージ パッシング[C]//学習表現に関する国際会議。 2019.

[5] Gaseiger J、Becker F、Günnemann S. Gemnet: 分子のユニバーサル方向グラフ ニューラル ネットワーク[J]。 Advances in Neural Information Processing Systems、2021、34: 6790-6802.

[6] Merchant A、Batzner S、Schoenholz S S、他。材料発見のための深層学習のスケーリング[J]。自然、2023、624(7990): 80-85.

以上がAI4Science の基礎: 幾何学グラフ ニューラル ネットワーク、最も包括的なレビューがここにあります。中国人民大学ヒルハウスはテンセントAIラボ、清華大学、スタンフォード大学などと共同でリリースした。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はjiqizhixin.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。