薬物相互作用予測タスクにおけるマルチモーダル DNN モデルの適用-AI-php.cn

ホームページ

テクノロジー周辺機器

薬物相互作用予測タスクにおけるマルチモーダル DNN モデルの適用

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 31, 2023 am 11:01 AM

aidnnモデル

多模态 DNN 模型在药物相互作用预测任务中的应用

1. 背景の紹介

まず、創薬に関連する背景について説明します。

#1. 背景の紹介

多模态 DNN 模型在药物相互作用预测任务中的应用

##薬物創薬分野は近年非常に注目を集めており、特に医薬品の研究開発を含む製薬会社の創薬業務を支援するための AI の使用が注目されています。医薬品の研究開発プロセスは非常に長いサイクルであり、通常、ある種の臨床疾患に対する最初の医薬品の研究開発プロセスには数十億の資金と10年以上の時間がかかります。主に以下の段階に分かれます。

# (1) 疾患標的の研究と疾患コアタンパク質の確認。

# (2) 臨床試験の前に、薬物の毒性、有効性、服用方法などの研究を含め、薬物の有効性を検証します。

(3) 臨床試験。

# (4) FDA の承認と認証。

#つまり、従来の医薬品の研究開発プロセスのサイクルは非常に長いものです。さらに、10,000 を超える薬剤の初期承認のうち、5 つの薬剤が臨床試験段階に入り、最終的に 1 つの薬剤のみが販売を承認されました。このような背景から、製薬企業が候補薬の中から有効な薬をより迅速に選択できるように支援し、臨床試験段階で薬の影響や役割、有効性などを迅速に事前調査する方法が注目の研究テーマとなっています。 AI、特にディープニューラルネットワーク技術により、医薬品開発プロセスが大幅に加速されます。

多模态 DNN 模型在药物相互作用预测任务中的应用

本日共有される内容は薬剤スクリーニングに関するものではなく、主に候補薬剤の副作用と有効性に焦点を当てています。主な研究目的は、薬物の毒性を軽減し、薬物の有効性を向上させることです。

上図に示すように、DDI (Drug-Drug Interaction) は薬物間の相互作用を指します。研究薬と既存薬とのクロス分析を行い、研究薬の身体への影響などの副作用を実験により事前に発見・分類します。わかりやすい例で言えば、「薬は毒によって３つに分かれる」という場合、薬の毒性は主にどこに反映されるのでしょうか？多くの場合、これはある薬物が他の薬物と組み合わされること、つまり 2 つ以上の薬物間の化学的相互作用によって発生します。右下の写真は 3 種類の薬剤を示していますが、イトラコナゾールは腫瘍関連薬であり、アベマシクリブと混合すると、肝不全、肝不全、腎不全などの重篤な副作用を引き起こします。患者は深刻な結果を招く可能性があります。アベシクリブとダブラフェニブを併用すると血清濃度が低下し、他の疾患を引き起こす可能性があります。そのため、新薬の開発過程では膨大な数の試験が必要ですが、生身の人間を使って試験することは不可能で、マウスなどの動物でしか試験できません。

本日共有される内容は、マルチモーダルニューラルネットワークを使用して、既存の (開発中および既知を含む) 薬剤成分、アレルギーなどに基づいて薬剤 DDI を事前に予測するというものです。

2. 提起された質問

多模态 DNN 模型在药物相互作用预测任务中的应用

上の図に示すように、薬物相互作用は、薬物 d1 (アベキシクリブ) と薬物 d2 (ダブラフェニブ) などの薬物相互作用の結果を記述する DDI マトリックスとして要約できます。血清濃度の低下）。この研究には、572 の薬剤 (d) と 65 の反応結果 (y、血清濃度の低下など) を含む 37,264 件の DDI データが含まれていました。そして、このデータに基づいて、ドラッグナレッジグラフ (DKG) が構築されました。ノードは薬物であり、エッジは薬物間の関係です。 DKG トリプルは、{D: 薬物、R: 薬物間関係、T: 尾部エンティティ} です。

#上記のデータに加えて、マルチモーダルモデルには薬剤の異種特徴 (HF、異種特徴) も組み込まれています: {ターゲット: ターゲット、部分構造：組成・化学構造、酵素：enzyme｝、対象となる情報がタンパク質であるなど、それぞれの特徴の次元が異なります。最後に、DDI マトリックス、DKG、および HF がモデリングのために同じ確率分布に融合されます。

2. MDNN モデルの紹介

次に、ヘテロジニアスマルチモーダル MDNN のフレームワークを紹介します。モデル。

#1. MDNN 全体のフレームワーク

多模态 DNN 模型在药物相互作用预测任务中的应用

# これはモデルは MDNN と呼ばれます. 基本データは主に DDI マトリックスとヘテロジニアスデータの 2 つの部分に分かれています. モデルフレームワークは主に次の 3 つの部分で構成されます:

# #(1) DKG 部分に基づく: 主に医薬品そのものの成分(有効成分、毒性成分)、医薬品間の関係などの情報を医薬品ナレッジグラフを構築して表現します。

(2) HF 部分に基づく: 標的、酵素、分子などの異種の特性データを統合して薬物自体を記述します。構造、基本的な機能情報。

(3) マルチモーダル融合ニューラルネットワーク: DKG と HF の 2 つの特徴データを効果的に融合し、統合を実行します。モデリング。

2. DKG モジュール構築

DKG に基づいた構築プロセスを紹介します。

多模态 DNN 模型在药物相互作用预测任务中的应用

#上の図は、医薬品ナレッジグラフの主な内容を示しています。左の図はDDI マトリックス: マトリックスには約 600 の薬物が含まれており、これらの薬物の組成と作用情報はデータベース (DrugBank、つまり「薬物バンク」) に保管されています。右の図は、酵素、キャリア、ターゲットなどの異質な基本的特徴など、「ドラッグバンク」内の医薬品情報の例を示しています。その中で、比較的重要な4つの特徴が挙げられます。医薬品DB05812を例にとると、ターゲットに加えて、酵素と分子構造に加えて、キャリアとトランスポーターもあります。ただし、これら 2 種類のデータは比較的まばらであり、他の特徴ほど多くの次元を持っていません。現在のデータセットにおける区別はありません。したがって、これら 2 つのデータは当面は使用されません。使用される主なデータは、ターゲット、酵素、分子構造です。

上の図に示すように、ナレッジグラフは主にノードとエッジで構成されます。ノードは医薬品と成分、エッジは関係です。この例においてトリプレットによって表示される関係は、毒性成分関係、すなわち、ノード薬物「ＤＢ０５８１２」とノード成分「Ｐ０２７６８」との間に毒性成分関係がある。「ドラッグバンク」から取得した薬物成分関係トリプルを基に、572種類の薬物を含むDKGナレッジグラフが形成され、トリプルの辺(関係)を意味関係と呼び、関係タイプは合計157種類あります。構成要素尾部エンティティノードは 1043 種類あります。各 DKG は、タスクの要件に応じて「ドラッグバンク」から対応する情報を抽出して構築できるため、DKG は「ドラッグバンク」ナレッジグラフのサブグラフに相当します。

多模态 DNN 模型在药物相互作用预测任务中的应用

DKG に基づいて、2 種類の情報が要約されます。上図はセマンティクスを示しています。構築の関係情報モデル。有毒成分に基づいて、まず薬物 (d) と前の層の関係 (r) の内積を計算し、それを現在の層の重み (W1) で合計して π 関数、つまり薬物のエッジ情報とノード情報は、π 関数によって合計され、次に、π 関数と前の層コンポーネント (t) の重み付き合計を実行して e を取得します。つまり、エッジ情報が取得されます。

多模态 DNN 模型在药物相互作用预测任务中的应用

#同様に、グラフの位相構造情報モデルの構成を上図に示します。。毒性成分に加えて、薬物には他の複数の成分関係も含まれる場合があり、同じ薬物の複数の関係 (エッジ、つまり e) とそれらに対応する重み W2 を接続して、最終的に各薬物に対応する E を取得できます。上記の方法により、DKG エッジと位相構造情報が効果的に融合されて表現されます。

3. HF モジュールの構造

上記のサイド情報と DDI 情報に加えて、以下に示すように、 , 薬物には非常に豊富なマルチモーダル情報も含まれています: 同じ薬物が複数の標的に作用することができます。さまざまな薬物も異なる分子構造を持ち、対応する分子特性を表しています。薬物はさまざまな酵素の作用下で反応します。異なる標的と組み合わせると、。これら 3 種類の情報がベクトル化され、単純な Jaccard 類似度によって薬物間の類似性が測定され、対応する類似度行列が取得されます。

多模态 DNN 模型在药物相互作用预测任务中的应用

#ファイナルフュージョン三人類似性行列により各薬物に対応する E'、つまり薬物の異性体特性に基づく情報が得られます。この特徴ベクトルの次元も小さく、1162 のターゲット、583 の構造、および 202 の酵素に関する情報が含まれています。 #4. マルチモデル融合レイヤー

多模态 DNN 模型在药物相互作用预测任务中的应用

##上図に示すように、各薬物の DKG 結果 E と HF 結果 E' が最終的にスプライスされ、融合層を介して融合されて次の結果が得られます。

次に、softmax 関数を使用して出力層を取得します。

多模态 DNN 模型在药物相互作用预测任务中的应用

モデル全体のフレームワークは上図のようになり、複雑なフレームワーク構造ではありませんが、比較的効果的に薬剤情報を組み合わせています。

3. MDNN モデルの効果

次に、モデルの効果を共有します。

多模态 DNN 模型在药物相互作用预测任务中的应用

#上の図は、現在より一般的に使用されているアルゴリズムである MDNN との比較結果を示しています。アルゴリズム Acc、AUC、F1、AUPR、精度、リコール、その他の評価指標において最先端の結果を達成しています。 (上記のアルゴリズムは GNN アルゴリズムには組み込まれていません。)

多模态 DNN 模型在药物相互作用预测任务中的应用

##上の図は、 DKGのMDNN融合、HKと非融合の効果の違い。どちらかの方法を単独で使用するよりも、融合の結果が優れていることが簡単にわかります。

多模态 DNN 模型在药物相互作用预测任务中的应用

# マルチモーダルパラメータ調整、つまりパラメータ感度の分析については、次のようになります。ニューラルネットワーク層数 l、ノード数 Ns_{の場合の各種評価指標をそれぞれ上図に示します。} およびその他のパラメータが変化し、それに応じて変動します。

多模态 DNN 模型在药物相互作用预测任务中的应用

#さらに、マルチタスク分析も実施しました。トレーニングセット内の薬物とテストセット内の薬物間の DDI を予測するには、タスク B の予測モデルもトレーニングセットを通じて構築されますが、テストセット内の薬物間の DDI を予測します。トレーニングセットとテストセットの薬物が厳密に分離されている場合、モデルの予測効果は大幅に減少します。

#医薬品研究開発の分野では、DDI の研究だけでなく、いかに効果的に医薬品を発見/スクリーニングするかなど、解決すべき課題がまだ多くあります。。

4. まとめ

最後に、今回共有した内容をまとめると、MDNN アルゴリズム自体は複雑ではありません。重要な作業は、マルチモーダルデータと構造情報の使用です:

多模态 DNN 模型在药物相互作用预测任务中的应用

(1) に基づいて医薬品を構築する薬物効果ナレッジグラフは、薬物自体の特性 (標的、分子構造、酵素) に基づいてマルチモーダルなデータ特徴を構築し、最終的にこれら 2 つの特徴を統合して MDNN モデルを構築します。

(2) DDI の予測問題を改善;

(3) 既存手法との比較、MDNN は機能するデータセット上で最適です。

#しかし、実際のアプリケーションでは、MDNN モデルには、方法論やデータの改善など、さらなる最適化と改善が必要な領域がまだ多くあります。 #5. Q&A セッション

#Q1: 「ドラッグバンク」データセットは公開データセットですか?

A1: この研究のナレッジグラフデータセットは公開されており、元のデータセット「Drug Bank」も公開データセットです。しかし、各研究分野の医薬品によっては構築されるナレッジグラフデータセットも異なり、統一された普遍的なナレッジグラフは存在しません。

Q2: ナレッジグラフやマルチモーダルフュージョンなどの共有研究手法は、製薬分野以外ではどのような応用が可能ですか?プロテインとか免疫力とか？

A2: バイオ医薬品に加えて、電子商取引分野には多くのアプリケーションがあります。たとえば、User-Item クラスのデータセットでは、User は職業、年齢、買い物タグなどの多くのマルチモーダル情報を持ちます。Item 製品にも多くの情報があり、それらの間には多くの関係があります。ショッピング、評価、お気に入り、クリックなどの行動。ドメインデータが異質な形式に準拠している場合は、これらの方法を分析に使用することができますが、難しいのは、特定のドメインでナレッジグラフを構築することです。

以上が薬物相互作用予測タスクにおけるマルチモーダル DNN モデルの適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

AIインデックス2025を読む：AIはあなたの友人、敵、または副操縦士ですか？Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう：認知（何が起こっているのかを理解する）、感謝（利益を見る）、受け入れ（顔の課題）、責任（責任を見つける）。認知：人工知能はどこにでもあり、急速に発展しています私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

AVバイト：Meta＆＃039; s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景：進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用：チャットボットは本当に気にすることができますか？Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想：私たちはAIとの関係において本当に繁栄していますか？この質問は、MIT Media Labの「AI（AHA）で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2：マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。その能力t

Dagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証：ダグスターと大きな期待でチェックを自動化するデータ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか？Apr 11, 2025 am 11:42 AM

MainFrames：AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。