清華大学チームが知識誘導グラフ Transformer 事前トレーニングフレームワーク: 分子表現学習を改善する方法を提案-AI-php.cn

ホームページ

テクノロジー周辺機器

清華大学チームが知識誘導グラフ Transformer 事前トレーニングフレームワーク: 分子表現学習を改善する方法を提案

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Nov 23, 2023 pm 06:17 PM

はじめる

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

編集者 | Ziluo

創薬分野において分子特性の予測を容易にするためには、効果的な分子特徴表現を学ぶことが非常に重要です。最近では、自己教師あり学習手法を使用してグラフニューラルネットワーク (GNN) を事前トレーニングすることで、データ不足という課題を克服しています。しかし、自己教師あり学習に基づく現在の方法には、2 つの主な問題があります。それは、明確な自己教師あり学習戦略の欠如と GNN

の機能が限られていることです。最近、清華大学と西湖大学の研究チームは、と Zhijiang Laboratory は、大幅に強化された分子表現学習を通じて改善され、一般化可能で堅牢な学習を提供する自己教師あり学習フレームワークである、知識誘導型グラフトランスフォーマー (KPGT) の事前トレーニングを提案します。 KPGT フレームワークには、分子グラフ用に特別に設計されたグラフ Transformer と、分子の構造的および意味論的な知識を完全に捕捉するための知識に基づく事前トレーニング戦略が統合されています。

63 のデータセットに対する広範な計算テストを通じて、KPGT はさまざまな分野での分子特性の予測において優れたパフォーマンスを実証しました。さらに、創薬における KPGT の実際の適用可能性は、2 つの抗腫瘍標的の潜在的な阻害剤を同定することによって検証されました。全体として、KPGT は、AI 支援による創薬プロセスを推進するための強力で便利なツールを提供できます。

この研究は「分子表現学習を改善するための知識誘導型事前トレーニングフレームワーク」というタイトルで、2023年11月21日に「Nature Communications」に掲載されました。

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

分子の特性を実験的に決定するには多大な時間とリソースが必要であり、望ましい特性を持つ分子を同定することは創薬における最も重要な課題の 1 つです。近年、分子特性の予測において人工知能ベースの手法がますます重要な役割を果たしています。分子特性を予測するための人工知能ベースの方法の主な課題の 1 つは、分子の特性評価です。

近年、分子特性を予測するための潜在的に有用なツールとして、深層学習ベースの方法が登場しています。主な理由は、単純な入力から変換する機能を備えているためです。データから効果的な特徴を自動的に抽出する優れた機能を備えています。特に、リカレントニューラルネットワーク (RNN)、畳み込みニューラルネットワーク (CNN)、グラフニューラルネットワーク (GNN) などのさまざまなニューラルネットワークアーキテクチャは、単純化された分子入力からライン入力システムに至るまで、さまざまな形式での分子データのモデリングに優れています ( SMILES) を分子画像と分子図に変換します。ただし、マーカー分子の入手可能性が限られていることと化学空間が広大であるため、特に分布外のデータサンプルを扱う場合には、その予測性能が制限されます。

自然言語処理とコンピュータービジョンの分野における自己教師あり学習手法の目覚ましい成果により、これらの手法は GNN の事前トレーニングに適用され、分子の表現学習を改善し、それによって下流の分子分野で成功を収めています。大幅な進歩が見られました

研究者らは、分子の特性を定量的に記述する追加の知識を自己教師あり学習フレームワークに導入することで、これらの課題に効果的に対処できると仮説を立てています。分子には、分子記述子やフィンガープリントなどの多くの定量的特性があり、現在確立されている計算ツールで簡単に取得できます。この追加の知識を統合すると、豊富な分子意味情報を自己教師あり学習に導入できるため、意味的に豊富な分子表現の取得が大幅に強化されます。

一般に、既存の自己教師あり学習手法は、コアモデルとして GNN に依存しています。ただし、GNN のモデル容量は限られています。さらに、GNN は原子間の長距離相互作用を捕捉するのが難しい場合があります。そして、Transformer ベースのモデルは、革新的なモデルになりました。これは、パラメータ数の増加と長距離相互作用を捕捉する機能を特徴としており、分子の構造特性を包括的にシミュレートするための有望なアプローチを提供します

自己教師あり学習フレームワーク KPGT

この研究では、研究者らは KPGT と呼ばれる自己教師あり学習フレームワークを導入しました。これは、分子表現学習を強化して下流の分子特性予測タスクを促進することを目的としています。 KPGT フレームワークは、Line Graph Transformer (LiGhT) と呼ばれるバックボーンモデルと、知識に基づいた事前トレーニングポリシーの 2 つの主要コンポーネントで構成されます。 KPGT フレームワークは、分子グラフ構造を正確にモデル化するために特別に設計された大容量 LiGhT モデルを組み合わせ、知識に基づいた事前トレーニング戦略を利用して分子構造と意味論的な知識を捕捉します。 200 万分子の LiGhT は、知識に基づいた事前トレーニング戦略を通じて事前トレーニングされました

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法書き直された内容: 図: KPGT の概要。 (出典: 論文)

KPGT は、分子特性の予測においてベースライン手法を上回ります。いくつかのベースライン手法と比較して、KPGT は 63 のデータセットで大幅な改善を達成しました。

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

図: 分子特性の予測における KPGT とベースライン手法の比較評価。 (出典: 論文)

さらに、KPGT を使用して 2 つの抗腫瘍標的、造血前駆体キナーゼ 1 (HPK1) と線維芽細胞成長因子受容体 (FGFR1) の潜在的な阻害剤を同定することに成功したことにより、実用的適用可能性が実証されました。 KPGTの。

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

図: KPGT を使用した HPK1 阻害剤の同定。 (出典: 論文)

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

#図: KPGT を使用した FGFR1 阻害剤の同定。 (出典: 論文)

研究の限界

効果的な分子特性予測における KPGT の利点にもかかわらず、依然としていくつかの限界があります。

まず第一に、追加の知識の統合が、提案された方法の最も重要な特徴です。 KPGT で使用される 200 の分子記述子と 512 の RDKFP に加えて、他のさまざまなタイプの追加情報知識を組み込む可能性があります。
さらに、さらなる研究により、三次元 (3D) 分子立体構造を事前トレーニングプロセスに組み込むことができ、モデルが分子に関する重要な 3D 情報を取得できるようになり、表現学習が強化される可能性があります。能力。
KPGT は現在、約 1 億個のパラメーターと 200 万個の分子の事前トレーニングを備えたバックボーンモデルを採用していますが、より大規模な事前トレーニングを探索することで、分子表現の学習に関する洞察が得られる可能性があります。利点。

全体として、KPGT は効果的な分子表現学習のための強力な自己教師あり学習フレームワークを提供し、それによって人工知能支援創薬の分野を前進させます。

論文リンク: https://www.nature.com/articles/s41467-023-43214-1

以上が清華大学チームが知識誘導グラフ Transformer 事前トレーニングフレームワーク: 分子表現学習を改善する方法を提案の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は机器之心で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

踊りましょう：私たちの人間のニューラルネットを微調整するための構造化された動きApr 27, 2025 am 11:09 AM

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク（C. elegansのものと同様）を広く研究してきました。ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにしますApr 27, 2025 am 11:08 AM

GoogleのGemini Advanced：Horizonの新しいサブスクリプションティア現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。ただし、Android Authorityのレポートは、今後の変更を示唆しています。最新のGoogle p

データ分析の加速がAIの隠されたボトルネックをどのように解決しているかApr 27, 2025 am 11:07 AM

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます：データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます！Apr 27, 2025 am 09:47 AM

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

建物のエージェントにGoogle ADKを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:42 AM

Googleのエージェント開発キット（ADK）のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

効果的な問題解決のためにLLMを介したSLMの使用 - 分析VidhyaApr 27, 2025 am 09:27 AM

まとめ： Small Language Model（SLM）は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル（LLM）よりも優れています。特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能（AI）および最近では生成AIも例外ではありません

コンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:26 AM

コンピュータービジョンのためのGoogleGeminiの力を活用：包括的なガイド大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。このガイドの利用方法については、

Gemini 2.0 Flash vs O4-Mini：GoogleはOpenaiよりもうまくやることができますか？Apr 27, 2025 am 09:20 AM

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、