ホームページ  >  記事  >  テクノロジー周辺機器  >  Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します

Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します

王林
王林オリジナル
2024-07-02 15:23:21989ブラウズ

Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します

Editor | Radish Skin

新しい人工知能アプリケーションは、研究者が医薬品開発能力を向上させるのに役立ちます。

このプロジェクトは TopoFormer と呼ばれ、ミシガン州立大学数学学部の Guowei Wei 教授が率いる学際的なチームによって開発されました。

TopoFormer は、分子の 3 次元情報を、一般的な AI ベースの薬物相互作用モデルで使用できるデータに変換し、これらのモデルの薬物有効性を予測する能力を拡張します。

「人工知能を使えば、創薬をより速く、より効率的に、より安価に行うことができます」と、生化学・分子生物学科と電気・コンピュータ工学科の教員でもあるウェイ氏は語った。

ウェイ教授は、米国では薬の開発には約10年かかり、約20億ドルの費用がかかると説明しました。その時間の約半分は薬剤の治験に費やされ、残りの半分は試験する新しい治療法候補の発見に費やされます。

TopoFormer は開発時間を短縮する可能性があります。このようにして、医薬品開発コストを削減し、それによって下流の消費者にとっての医薬品価格を下げることができます。

この研究は「タンパク質-リガンド相互作用予測のためのマルチスケールトポロジー対応の構造から配列への変換」というタイトルで、2024年6月24日に「Nature Machine Intelligence」に掲載されました。

Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します

研究者はコンピューター モデルを使用して医薬品開発を支援できますが、問題には多くの変数があるため、多くの制限があります。
「私たちの体内には 20,000 を超えるタンパク質が存在します。」とウェイ氏は言いました。「病気が発生すると、その一部または 1 つが標的になります。したがって、最初のステップは、これらのタンパク質のどれか 1 つが影響を受けることを理解することです。」病気によって。これらのタンパク質は、病気の影響を予防、軽減、または打ち消すことができる分子の発見を望んでいる研究者によってもターゲットにされています。
「目標があるとき、私はその特定の目標に向けて潜在的な薬を多数見つけようとします」とウェイ氏は語った。
科学者は、薬がどのタンパク質を標的にすべきかを知ると、そのタンパク質と潜在的な薬の分子配列を従来のコンピューターモデルに入力できるようになります。これらのモデルは、薬物と標的がどのように相互作用するかを予測し、開発と臨床試験でどの薬物をテストするかをガイドします。
これらのモデルは、薬物とタンパク質の化学組成のみに基づいて一部の相互作用を予測できますが、分子の形状や 3 次元または 3D 構造から生じる重要な相互作用も無視します。
1960年代に化学者によって発見されたイブプロフェンはその一例です。同じ化学配列を持ちますが、わずかに異なる 3D 構造を持つ 2 つの異なるイブプロフェン分子があります。痛みに関連するタンパク質に結合して頭痛を解消できるのは、たった 1 つの配置だけです。
Guowei Wei 氏は次のように述べています:「現在の深層学習モデルでは、薬物やタンパク質がどのように作用するかを予測する際にその形状を説明できません。」
Transformer アーキテクチャでは、クロスドメインの逐次データ分析にアテンション メカニズムを活用する新しいテクノロジーが導入されています。これに触発されて、Wei のチームは、Persistent Topological Hyperdigraph Laplacian (PTHL) と Transformer フレームワークを統合したトポロジカル Transformer モデル TopoFormer を開発しました。
タンパク質とリガンドの配列を処理する従来のトランスフォーマーとは異なり、TopoFormer は 3D タンパク質 - リガンド複合体を入力します。 PTHL を介してこれらの複合体をトポロジカル不変量とホモトピック形状のシーケンスに変換し、それによってそれらの物理的、化学的、生物学的相互作用を複数のスケールで捕捉します。
多様なデータセットで事前トレーニングされた TopoFormer は、分子配列では明らかではない立体化学効果を含む、複雑な分子相互作用を理解することができます。特定のデータセットを微調整すると、複合体内の詳細な相互作用と、データセット全体と比較したその特性をキャプチャできるため、下流の深層学習アプリケーションを強化できます。

Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します図: TopoFormer モデル全体の概略図。 (出典: 論文)

  1. 分析に焦点を当てるために、研究者は 20 Å、より正確には 12 Å のカットオフを使用して、設定距離内の再集合体と近くのタンパク質原子を特定します。
  2. その後、TopoFormer は、マルチスケール解析に PTHL を使用して、トポロジカル配列埋め込みモジュールを通じて 3D 分子構造をトポロジカル配列に変換します。このプロセスでは、さまざまな物理的、化学的、生物学的相互作用がベクター配列に埋め込まれます。
  3. TopoFormer は、自己教師あり事前トレーニングにラベルのないタンパク質-リガンド複合体を使用し、トポロジカル シーケンスを再構築するために Transformer エンコーダー/デコーダーを使用します。この段階では、出力埋め込みと入力埋め込みを比較して精度を測定することにより、ラベル付きデータがない場合のタンパク質-リガンドのダイナミクスを理解するためのモデルを準備します。
  4. 事前トレーニング後、TopoFormer はラベル付き複合体の教師あり微調整段階に入ります。ここでは、最初の埋め込みベクトルが、スコアリング、ランキング、ドッキング、スクリーニングなどの下流タスクの重要な特徴となります。各タスクには、予測モジュールに専用のヘッダーがあります。
  5. 精度を確保しバイアスを低減するために、TopoFormer は、異なるシードで初期化された複数のトポロジ変換深層学習モデルを統合し、シーケンスベースのモデルで補完します。
  6. 最終的な出力はこれらのさまざまな予測のコンセンサスであり、TopoFormer はトポロジカルな洞察と深層学習の両方を活用して、タンパク質とリガンドの相互作用を分析するための包括的なモデルになります。

    Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します

    イラスト: スコアリングおよびランキングタスクにおける TopoFormer のパフォーマンス。 (出典: 論文)

このアプローチにより、さまざまな次元の有向ハイパーエッジを使用して、単純なペア接続を超えた複雑な相互作用をモデル化できます。さらに、これらのエッジの方向は、電気陰性度やイオン化エネルギーなどの物理的および化学的特性を組み合わせて、従来の方法よりも微妙な表現を提供します。研究者らは、有向ハイパーエッジで 2 つの B7C2H9 異性体を区別することでこの能力を実証し、この方法が元素配置を効果的に区別できることを実証しました。

タンパク質-リガンド複合体を研究する場合、研究者はトポロジカル超有向グラフを初期表現として採用し、PTHL理論でさらに強化して幾何学的およびトポロジカルな特性を分析します。

研究者らは、ゼロ次元のホッホ・ラプラシアン演算子が明確に定義された量子系のハミルトニアンの運動エネルギー演算子にリンクされている分子構造などの物理系からインスピレーションを得て、トポロジカル・スーパーへの離散アナロジーをグラフに拡張しました。ラプラシアン行列のこれらの固有値は、物理システムのエネルギー スペクトルに似た、トポロジカル オブジェクトの特性についての洞察を提供します。

従来の永続的相同性と比較して、PTHL メソッドは、単体複合体を超えた広範囲の構造を分析することで大きな進歩を遂げています。永続的なラプラシアン演算子の非調和スペクトルを通じて、Betti 数やホモトピック形状進化などの基本的な相同性情報と幾何学的な洞察を取得します。

分析結果は、従来の相同性と比較して、より包括的な特徴付けを提供することを示しています。ラプラシアン演算子のゼロ固有値の多重度 (ベティ数に相当) は、この方法にバーコード情報が含まれていることを確認し、タンパク質-リガンド複合体を理解するための強力なフレームワークを提供します。

Nature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測します

イラスト: ドッキングおよびスクリーニングタスクにおける TopoFormer のパフォーマンス。 (出典: 論文)

共有結合力、イオン力、ファンデルワールス力など、タンパク質-リガンド複合体における複雑な原子相互作用を捉えるために、研究者らは PTHL を使用してマルチスケール解析を実行しました。このアプローチでは、フィルタリング パラメーターに基づいてトポロジカル シーケンスを展開することで、スケール間の相互作用を調べることができます。これにより、Transformer モデルが結合親和性などのプロパティに各スケールが置く重みを特定するのに役立ちます。

水素結合、ファンデルワールス力、πスタッキングなどの元素相互作用は、タンパク質-リガンド複合体の安定性と特異性の基礎です。これらの相互作用を元素レベルで分析するために、研究者らはトポロジカルシーケンス埋め込みにおける元素固有の分析を導入しました。

このメソッドは、タンパク質とリガンドの共通の重元素に基づいてサブハイパーグラフを構築し、複合体内の相互作用をコード化する元素固有のラプラシアン行列を生成します。このテクノロジーは、タンパク質とリガンドの相互作用における複雑なダイナミクスに対する Transformer モデルの理解を強化する詳細な物理的および化学的特徴を抽出します。

結論

要約すると、TopoFormer は、ある形式の情報を読み取り、それを別の形式に変換するように訓練されています。この場合、タンパク質と薬物がその形状に基づいてどのように相互作用するかについての 3 次元情報を取得し、それを現在のモデルが理解できる 1 次元情報に再構築します。

新しいモデルは、何万ものタンパク質と薬物の相互作用でトレーニングされており、2 つの分子間の各相互作用はコードまたは「単語」として記録されます。これらの単語をつなぎ合わせて薬物とタンパク質の複合体の説明を形成し、その形状の記録を作成します。

「こうすることで、たくさんの単語が文章のようにつながったものになります。」とウェイは言いました。

新しい薬物相互作用を予測する他のモデルは、これらの文を読み取り、より多くのコンテキストを提供できます。新薬が本だとしたら、TopoFormer は大まかなストーリーのアイデアを完全なプロットに変換し、すぐに書くことができます。

論文リンク: https://www.nature.com/articles/s42256-024-00855-1

関連レポート: https://phys.org/news/2024-06-drug-discovery-ai-3d -typic.html

以上がNature サブジャーナルに掲載されたトポロジカル Transformer モデルは、医薬品開発を支援するマルチスケールのタンパク質-リガンド相互作用を予測しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。