検索
ホームページテクノロジー周辺機器AI配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

編集者 | 大根の皮

タンパク質は、病原体と戦うための確立されたツールであり、実験的テストのために潜在的な治療法を絞り込むために使用されます。高品質のタンパク質構造が必要であり、タンパク質は完全または部分的に硬いとみなされることがよくあります。

ベルリン自由大学の研究者らは、タンパク質-リガンド複合体の完全に柔軟な全原子構造を配列情報から直接予測できる人工知能システムを開発しました。

古典的なドッキング方法は依然として優れていますが、これは標的タンパク質の結晶構造にも依存します。柔軟な全原子構造の予測に加えて、予測信頼度メトリック (plDDT) を使用して、正確な予測を選択し、強い結合剤と弱い結合剤を区別することができます。

この研究は「Umolによる配列情報からのタンパク質-リガンド複合体の構造予測」と題され、2024年5月28日に「Nature Communications」に掲載されました。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

タンパク質とタンパク質の標的接触は、新薬の評価や既知の物質の再配置において重要な問題です。既存の接触方法には限界があります。高品質のタンパク質構造が必要であること、正確な接触姿勢を決定することが難しいこと、構造安定性などの他の要素を反映することが難しい結合能力 (親和性) 評価に基づいていることがほとんどです。しかし、既存の接触方法は、高品質のタンパク質構造、正確な接触ポーズ、およびマルチベースの親和性評価の必要性によって制限されています。したがって、新しいリガンドの探索は、タンパク質の構築と構造評価を組み合わせたアプローチによって制限されます。

この分野では機械学習が適用されていますが、既知のターゲット領域でのパフォーマンスはスコアリング関数に基づく古典的な手法をまだ超えていません。さらに、予測されたタンパク質構造は、リガンドドッキングに直接使用するのには適さないことがよくあります。

さらに、評価セット内の構造が類似性ではなく放出時間に基づいて分割された場合、バイアスが導入され、特にトレーニングでは見られない受容体構造に直面した場合、パフォーマンスは半減します。

タンパク質の柔軟性は、結合状態に到達し、ドッキングを成功させるために重要です。RoseTTAFold All-Atom はタンパク質を予測する際にリガンドに結合できますが、PoseBusters テスト セットでの成功率はわずか 42% であり、目に見えないタンパク質の場合は非常に困難です。タンパク質の挙動は不明であり、タンパク質-リガンド複合体構造予測の課題がまだ完全に解決されていないことを示しています。

ベルリン自由大学のチームは、AlphaFold2 の EvoFormer を拡張することで、配列情報に基づいてタンパク質-リガンド複合体の構造を予測できる AI 手法を開発しました。このネットワークは RFAA に似ていますが、3D 軌跡が含まれておらず、テンプレート構造または追加の結晶学的リガンド データが入力としてまたはトレーニング中に使用される点が異なります。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

イラスト:ウモルの概要。 (出典: 論文)

タンパク質配列から開始して、代替タンパク質ターゲット (ポケット) とリガンドを SMILES が作成し、多重配列アラインメント (MSA) と結合マトリックスを作成します。これから、ネットワーク内にフィーチャが生成され、3D 構造が生成されます。最終的なタンパク質-リガンド複合体構造を生成するために構造情報は必要ないため、タンパク質やリガンドの柔軟性に制限はありません。

Umol は、PoseBusters テスト セットにポケット情報を含めた場合、それぞれ 45%、42% と、最も近い RoseTTAFold All-Atom および NeuralPlexer1 の 24% と比較して、より高い成功率 (SR、リガンド RMSD ≤ 2 Å) を達成します。これは、タンパク質-リガンド構造予測において最もパフォーマンスの高い方法です。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

イラスト: 予測精度。 (出典:論文)

Umol からポケット情報を削除し、RFAA からテンプレート情報を削除すると、SR はそれぞれ 18% と 8% に低下します。 AF 予測で DiffDock を使用する場合、精度は 21% ですが、高精度のインターフェイス予測 (ポケット RMSD

2 Å 成功閾値をわずかに超える多くのリガンドポーズは同等である可能性があり、より柔軟なスコアリングシステムが必要である可能性があることを示唆しています。 Umol の成功率は、2.35 Å のしきい値で AutoDock Vina を上回ります。天然のタンパク質構造がスコアリングに使用されない場合、たとえ小さなアライメントエラーであっても問題になる可能性があります。

共フォールディングされたタンパク質-リガンド複合体は、薬物の再配置を促進する可能性があります。特に、研究者らは、リガンドの予測された IDDT (plDDT) を使用して正確なドッキングポーズを選択できる一方、タンパク質ポケットの pIDDT は正確な界面を選択するのに適していることを発見しました。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

イラスト: 信頼性の指標と精度。 (出典: 論文)

リガンド plDDT も高親和性リガンドを低親和性リガンドから分離し、Umol および Umol ポケットの不確実性の予測の一部が弱い結合剤である可能性があることを示唆しています。これは、Umol の能力をさらに実証し、タンパク質とリガンドの相互作用の重要な側面が理解されているようであることを強調しています。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

イラスト: BindingDB の予測。 (出典: 論文)

ポケット情報なしで 18% の精度にもかかわらず、ネットワークは依然として強いバインダーと弱いバインダーをある程度区別できます。これは、未知の複合体に注釈を付けるのに特に役立ち、チームは 336 個のタンパク質 - リガンド構造を非常に高い信頼性で提示しました (リガンド plDDT > 85)。これらの構造は合理的であるように見え、L-plDDT スコアは高いですが、依然として実験的に検証する必要があることに注意してください。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

図: Umol-pocket を使用して、PoseBusters テスト セット (n=428) の予測されたさまざまな特徴とリガンド RMSD (LRMSD) の間の関係を分析します。 (出典: 論文)

研究者らは、モデルの予測性能と「同じタンパク質またはリガンドに関連する異なる特徴」との間に明確な関係を発見できませんでした。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

イラスト: 最も難しい 5 つの構造。 (出典: 論文)

しかし、Umol-pocket は、他の方法では予測が困難な 5 ケース中 3 ケースで正確でした。訓練されたネットワークを反転することにより、新しいリガンド結合タンパク質またはタンパク質結合リガンドを設計できます。もう 1 つのオプションは、転移学習を使用して、同じ目的の生成拡散モデルを作成することです。この場合、リガンドまたはタンパク質 plDDT を最大化して、高親和性バインダーを作成することができます。

PDBbind の現在のバージョンには、2019 年に PDB から処理されたデータが含まれています。それ以来、追加のタンパク質-リガンド複合体が提出されており、より高い精度が達成できる可能性があることが示唆されています。

しかし、意味のあるタンパク質-リガンドドッキング結果を得るためにどの程度の精度が必要かは現時点では不明です。タンパク質構造予測の高精度は、低分子や RNA などの他の分子が関与するタスクでは達成できません。

タンパク質の共進化情報がないと、構造予測の精度が急速に低下します。小分子や RNA については同様の情報源がないため、原子の表現に頼らざるを得ません。

表: PDBBind 2020 バージョンの PoseBuster ベンチマーク セットの成功率 (RMSD≤2Å のリガンドの割合) を配列同一性 (seqid) で割ったもの。 (出典: 論文)

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

研究者らは、ポケット情報は非常に効果的であり、ポケット情報がないと深層学習手法は過学習になりやすいと考えています。この発見は、PoseBusters テスト セット内の多くの分子にはトレーニング データ セット内の非常に類似した類似体が含まれているものの、この類似性はモデルの成功とは相関しないという観察をさらに裏付けます。

配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。

イラスト: いくつかのテスト。 (出典: 論文)

Vina や Gold などの構造ベースのドッキング手法では、同程度の過学習は観察されません。それらは原子スコア関数に基づいており、したがってタンパク質の相同性に同程度に依存していないため、これは予想されます。

ディープ ラーニング手法はトレーニング セットで大幅に高いパフォーマンスを示し、タンパク質の相同性がタンパク質とリガンドのドッキングにおいて重要な役割を果たしていることが示されています。テスト セットでの RFAA のパフォーマンスはトレーニング セットでのパフォーマンスよりも高く、これはトレーニング セットとテスト セットの間でデータ漏洩の可能性があることを示しています。

結論として、タンパク質とリガンドの相互作用の複雑さを完全に理解するにはまだ長い道のりがありますが、深層学習を使用して複合体全体の構造を予測することで、科学者は解決策に近づくことができる可能性があります。

Umol: https://github.com/patrickbryant1/Umol

紙のリンク: https://www.nature.com/articles/s41467-024-48837-6

以上が配列情報を使用してタンパク質-リガンド複合体の構造を直接予測することで、RoseTTAFold シリーズの成功率を上回ります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
LLMSでのツール呼び出しLLMSでのツール呼び出しApr 14, 2025 am 11:28 AM

大規模な言語モデル(LLM)は人気が急増しており、ツールコール機能は単純なテキスト生成を超えて機能を劇的に拡大しています。 これで、LLMSは動的なUI作成や自律的なaなどの複雑な自動化タスクを処理できます。

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか? ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

AIに関する国連入力:勝者、敗者、および機会AIに関する国連入力:勝者、敗者、および機会Apr 14, 2025 am 11:25 AM

「歴史は、技術の進歩が経済成長を促進する一方で、それ自体が公平な所得分布を確保したり、包括的な人間開発を促進したりしないことを示しています」とUNCTADの事務総長であるRebeca Grynspanは前文で書いています。

生成AIを介した交渉スキルを学ぶ生成AIを介した交渉スキルを学ぶApr 14, 2025 am 11:23 AM

簡単な、Generative AIを交渉の家庭教師およびスパーリングパートナーとして使用してください。 それについて話しましょう。 革新的なAIブレークスルーのこの分析は、最新のAIに関する私の進行中のフォーブス列のカバレッジの一部であり、特定と説明を含む

テッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますテッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますApr 14, 2025 am 11:22 AM

バンクーバーで開催されたTED2025会議は、昨日4月11日の第36版を締めくくりました。サム・アルトマン、エリック・シュミット、パーマー・ラッキーを含む60か国以上の80人の講演者が登場しました。テッドのテーマ「人類が再考された」は、仕立てられたものでした

ジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているApr 14, 2025 am 11:21 AM

ジョセフ・スティグリッツは、2001年にノーベル経済賞を受賞した経済学者であり、2001年にノーベル経済賞を受賞しています。スティグリッツは、AIが既存の不平等を悪化させ、いくつかの支配的な企業の手に統合した力を悪化させ、最終的に経済を損なうと仮定しています。

グラフデータベースとは何ですか?グラフデータベースとは何ですか?Apr 14, 2025 am 11:19 AM

グラフデータベース:関係を通じてデータ管理に革命をもたらす データが拡大し、その特性がさまざまなフィールドで進化するにつれて、グラフデータベースは、相互接続されたデータを管理するための変換ソリューションとして浮上しています。伝統とは異なり

LLMルーティング:戦略、テクニック、およびPythonの実装LLMルーティング:戦略、テクニック、およびPythonの実装Apr 14, 2025 am 11:14 AM

大規模な言語モデル(LLM)ルーティング:インテリジェントタスク分布によるパフォーマンスの最適 LLMSの急速に進化する風景は、それぞれが独自の長所と短所を備えた多様なモデルを提供します。 創造的なコンテンツGenに優れている人もいます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)