1. 背景の紹介
まず、創薬に関連する背景について説明します。
#1. 背景の紹介
##薬物創薬分野は近年非常に注目を集めており、特に医薬品の研究開発を含む製薬会社の創薬業務を支援するための AI の使用が注目されています。医薬品の研究開発プロセスは非常に長いサイクルであり、通常、ある種の臨床疾患に対する最初の医薬品の研究開発プロセスには数十億の資金と10年以上の時間がかかります。主に以下の段階に分かれます。
# (1) 疾患標的の研究と疾患コアタンパク質の確認。
# (2) 臨床試験の前に、薬物の毒性、有効性、服用方法などの研究を含め、薬物の有効性を検証します。
(3) 臨床試験。
# (4) FDA の承認と認証。
#つまり、従来の医薬品の研究開発プロセスのサイクルは非常に長いものです。さらに、10,000 を超える薬剤の初期承認のうち、5 つの薬剤が臨床試験段階に入り、最終的に 1 つの薬剤のみが販売を承認されました。このような背景から、製薬企業が候補薬の中から有効な薬をより迅速に選択できるように支援し、臨床試験段階で薬の影響や役割、有効性などを迅速に事前調査する方法が注目の研究テーマとなっています。 AI、特にディープ ニューラル ネットワーク技術により、医薬品開発プロセスが大幅に加速されます。
2. 提起された質問
上の図に示すように、薬物相互作用は、薬物 d1 (アベキシクリブ) と薬物 d2 (ダブラフェニブ) などの薬物相互作用の結果を記述する DDI マトリックスとして要約できます。血清濃度の低下)。この研究には、572 の薬剤 (d) と 65 の反応結果 (y、血清濃度の低下など) を含む 37,264 件の DDI データが含まれていました。そして、このデータに基づいて、ドラッグ ナレッジ グラフ (DKG) が構築されました。ノードは薬物であり、エッジは薬物間の関係です。 DKG トリプルは、{D: 薬物、R: 薬物間関係、T: 尾部エンティティ} です。
#上記のデータに加えて、マルチモーダル モデルには薬剤の異種特徴 (HF、異種特徴) も組み込まれています: {ターゲット: ターゲット、部分構造:組成・化学構造、酵素:enzyme}、対象となる情報がタンパク質であるなど、それぞれの特徴の次元が異なります。最後に、DDI マトリックス、DKG、および HF がモデリングのために同じ確率分布に融合されます。
2. MDNN モデルの紹介
次に、ヘテロジニアス マルチモーダル MDNN のフレームワークを紹介します。モデル。
#1. MDNN 全体のフレームワーク
# これはモデルは MDNN と呼ばれます. 基本データは主に DDI マトリックスとヘテロジニアス データの 2 つの部分に分かれています. モデル フレームワークは主に次の 3 つの部分で構成されます:
# #(1) DKG 部分に基づく: 主に医薬品そのものの成分(有効成分、毒性成分)、医薬品間の関係などの情報を医薬品ナレッジグラフを構築して表現します。
(2) HF 部分に基づく: 標的、酵素、分子などの異種の特性データを統合して薬物自体を記述します。構造、基本的な機能情報。
(3) マルチモーダル融合ニューラル ネットワーク: DKG と HF の 2 つの特徴データを効果的に融合し、統合を実行します。モデリング。
2. DKG モジュール構築
DKG に基づいた構築プロセスを紹介します。
#上の図は、医薬品ナレッジ グラフの主な内容を示しています。左の図はDDI マトリックス: マトリックスには約 600 の薬物が含まれており、これらの薬物の組成と作用情報はデータベース (DrugBank、つまり「薬物バンク」) に保管されています。右の図は、酵素、キャリア、ターゲットなどの異質な基本的特徴など、「ドラッグバンク」内の医薬品情報の例を示しています。その中で、比較的重要な4つの特徴が挙げられます。医薬品DB05812を例にとると、ターゲットに加えて、酵素と分子構造に加えて、キャリアとトランスポーターもあります。ただし、これら 2 種類のデータは比較的まばらであり、他の特徴ほど多くの次元を持っていません。現在のデータセットにおける区別はありません。したがって、これら 2 つのデータは当面は使用されません。使用される主なデータは、 ターゲット、酵素、分子構造です。
#
上の図に示すように、ナレッジ グラフは主にノードとエッジで構成されます。ノードは医薬品と成分、エッジは関係です。この例においてトリプレットによって表示される関係は、毒性成分関係、すなわち、ノード薬物「DB05812」とノード成分「P02768」との間に毒性成分関係がある。 「ドラッグバンク」から取得した薬物成分関係トリプルを基に、572種類の薬物を含むDKGナレッジグラフが形成され、トリプルの辺(関係)を意味関係と呼び、関係タイプは合計157種類あります。構成要素 尾部エンティティ ノードは 1043 種類あります。各 DKG は、タスクの要件に応じて「ドラッグ バンク」から対応する情報を抽出して構築できるため、DKG は「ドラッグ バンク」ナレッジ グラフのサブグラフに相当します。
DKG に基づいて、2 種類の情報が要約されます。上図はセマンティクスを示しています。構築の関係情報モデル。有毒成分に基づいて、まず薬物 (d) と前の層の関係 (r) の内積を計算し、それを現在の層の重み (W1) で合計して π 関数、つまり薬物のエッジ情報とノード情報は、π 関数 によって合計され、次に、π 関数と前の層コンポーネント (t) の重み付き合計を実行して e を取得します。つまり、エッジ情報が取得されます。
#同様に、グラフの位相構造情報モデルの構成を上図に示します。 。毒性成分に加えて、薬物には他の複数の成分関係も含まれる場合があり、同じ薬物の複数の関係 (エッジ、つまり e) とそれらに対応する重み W2 を接続して、最終的に各薬物に対応する E を取得できます。上記の方法により、DKG エッジと位相構造情報が効果的に融合されて表現されます。
3. HF モジュールの構造
上記のサイド情報と DDI 情報に加えて、以下に示すように、 , 薬物には非常に豊富なマルチモーダル情報も含まれています: 同じ薬物が複数の標的に作用することができます。さまざまな薬物も異なる分子構造を持ち、対応する分子特性を表しています。薬物はさまざまな酵素の作用下で反応します。異なる標的と組み合わせると、 。これら 3 種類の情報がベクトル化され、単純な Jaccard 類似度によって薬物間の類似性が測定され、対応する類似度行列が取得されます。
#ファイナルフュージョン 三人類似性行列により各薬物に対応する E'、つまり薬物の異性体特性に基づく情報が得られます。この特徴ベクトルの次元も小さく、1162 のターゲット、583 の構造、および 202 の酵素に関する情報が含まれています。 #4. マルチモデル融合レイヤー
次に、softmax 関数を使用して出力層を取得します。
モデル全体のフレームワークは上図のようになり、複雑なフレームワーク構造ではありませんが、比較的効果的に薬剤情報を組み合わせています。
3. MDNN モデルの効果
次に、モデルの効果を共有します。
#上の図は、現在より一般的に使用されているアルゴリズムである MDNN との比較結果を示しています。アルゴリズム Acc、AUC、F1、AUPR、精度、リコール、その他の評価指標において最先端の結果を達成しています。 (上記のアルゴリズムは GNN アルゴリズムには組み込まれていません。)
##上の図は、 DKGのMDNN融合、HKと非融合の効果の違い。どちらかの方法を単独で使用するよりも、融合の結果が優れていることが簡単にわかります。
# マルチモーダルパラメータ調整、つまりパラメータ感度の分析については、次のようになります。ニューラルネットワーク層数 l、ノード数 Ns の場合の各種評価指標をそれぞれ上図に示します。 およびその他のパラメータが変化し、それに応じて変動します。
#さらに、マルチタスク分析も実施しました。トレーニング セット内の薬物とテスト セット内の薬物間の DDI を予測するには、タスク B の予測モデルもトレーニング セットを通じて構築されますが、テスト セット内の薬物間の DDI を予測します。トレーニング セットとテスト セットの薬物が厳密に分離されている場合、モデルの予測効果は大幅に減少します。
#医薬品研究開発の分野では、DDI の研究だけでなく、いかに効果的に医薬品を発見/スクリーニングするかなど、解決すべき課題がまだ多くあります。 。
4. まとめ最後に、今回共有した内容をまとめると、MDNN アルゴリズム自体は複雑ではありません。重要な作業は、マルチモーダル データと構造情報の使用です:
(2) DDI の予測問題を改善;
(3) 既存手法との比較、MDNN は機能するデータセット上で最適です。
#しかし、実際のアプリケーションでは、MDNN モデルには、方法論やデータの改善など、さらなる最適化と改善が必要な領域がまだ多くあります。 #5. Q&A セッション
#Q1: 「ドラッグ バンク」データ セットは公開データ セットですか?
A1: この研究のナレッジ グラフ データ セットは公開されており、元のデータ セット「Drug Bank」も公開データ セットです。しかし、各研究分野の医薬品によっては構築されるナレッジグラフデータセットも異なり、統一された普遍的なナレッジグラフは存在しません。
A2: バイオ医薬品に加えて、電子商取引分野には多くのアプリケーションがあります。たとえば、User-Item クラスのデータ セットでは、User は職業、年齢、買い物タグなどの多くのマルチモーダル情報を持ちます。Item 製品にも多くの情報があり、それらの間には多くの関係があります。ショッピング、評価、お気に入り、クリックなどの行動。ドメイン データが異質な形式に準拠している場合は、これらの方法を分析に使用することができますが、難しいのは、特定のドメインでナレッジ グラフを構築することです。 Q2: ナレッジグラフやマルチモーダルフュージョンなどの共有研究手法は、製薬分野以外ではどのような応用が可能ですか?プロテインとか免疫力とか?
以上が薬物相互作用予測タスクにおけるマルチモーダル DNN モデルの適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

メモ帳++7.3.1
使いやすく無料のコードエディター

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター
