Rumah  >  Artikel  >  Peranti teknologi  >  Aplikasi model DNN multimodal dalam tugas ramalan interaksi dadah

Aplikasi model DNN multimodal dalam tugas ramalan interaksi dadah

WBOY
WBOYke hadapan
2023-05-31 11:01:31987semak imbas

多模态 DNN 模型在药物相互作用预测任务中的应用

1. Pengenalan latar belakang

Pertama sekali, izinkan saya berkongsi dengan anda latar belakang penemuan dadah yang berkaitan.

1. Pengenalan latar belakang

多模态 DNN 模型在药物相互作用预测任务中的应用

Dadah Bidang penemuan sangat hangat sejak beberapa tahun kebelakangan ini, terutamanya penggunaan AI untuk membantu syarikat farmaseutikal dalam kerja penemuan ubat mereka, termasuk penyelidikan dan pembangunan ubat. Proses penyelidikan dan pembangunan ubat mempunyai kitaran yang sangat panjang Biasanya, proses penyelidikan dan pembangunan ubat pertama untuk jenis penyakit klinikal tertentu memerlukan berbilion dana dan lebih daripada sepuluh tahun. Ia terutamanya dibahagikan kepada peringkat berikut:

(1) Penyelidikan mengenai sasaran penyakit dan pengenalpastian protein teras penyakit.

(2) Sahkan keberkesanan ubat sebelum ujian klinikal: termasuk penyelidikan tentang ketoksikan ubat, keberkesanan, dos, dsb.

(3) Ujian klinikal.

(4) Kelulusan dan pensijilan FDA.

Jadi kitaran proses pembangunan ubat tradisional adalah sangat panjang. Di samping itu, dari pengiktirafan awal lebih daripada 10,000 ubat, 5 ubat memasuki peringkat percubaan klinikal, dan akhirnya hanya 1 ubat yang diluluskan untuk pemasaran. Dalam konteks ini, cara membantu syarikat farmaseutikal memilih ubat yang berkesan daripada ubat calon dengan lebih cepat, dan cara menyiasat terlebih dahulu kesan, peranan, keberkesanan, dsb. ubat dalam fasa ujian klinikal telah menjadi topik penyelidikan yang hangat , di mana AI, terutamanya teknologi rangkaian saraf dalam, boleh mempercepatkan proses penyelidikan dan pembangunan dadah.

多模态 DNN 模型在药物相互作用预测任务中的应用

Kandungan yang dikongsi hari ini tidak melibatkan pemeriksaan dadah terutamanya tertumpu kepada kesan sampingan dan keberkesanan ubat calon. Tujuan penyelidikan utama adalah Mengurangkan ketoksikan dadah dan meningkatkan keberkesanan ubat.

Seperti yang ditunjukkan dalam gambar di atas, DDI (Drug-Drug Interaction) merujuk kepada interaksi antara dadah. Menjalankan analisis silang antara ubat penyelidikan dan ubat sedia ada untuk menemui kesan sampingan ubat penyelidikan, seperti kesannya pada badan, dsb., dan menemui dan mengelaskannya terlebih dahulu melalui eksperimen. Untuk contoh mudah, "ubat dibahagikan kepada tiga bahagian oleh racun". Dalam banyak kes, ia berlaku apabila ubat digabungkan dengan ubat lain, interaksi kimia antara dua atau lebih ubat. Gambar di sudut kanan bawah menunjukkan tiga ubat Itraconazole adalah ubat yang berkaitan dengan tumor Jika ia dicampur dengan abemaciclib, ia akan menyebabkan kesan sampingan yang serius, seperti kegagalan hati, hati dan buah pinggang pesakit boleh membawa akibat yang serius. Jika abeciclib dan dabrafenib dicampur, ia akan menyebabkan penurunan kepekatan serum dan menyebabkan penyakit lain. Oleh itu, sejumlah besar ujian diperlukan dalam proses membangunkan ubat baru, tetapi adalah mustahil untuk menggunakan orang sebenar untuk menguji, dan hanya boleh diuji dengan tikus atau haiwan lain.

Kandungan yang dikongsi hari ini adalah untuk menggunakan rangkaian saraf pelbagai mod untuk meramalkan DDI ubat terlebih dahulu berdasarkan bahan sedia ada (termasuk dalam pembangunan dan diketahui), alahan, dsb.

2. Soalan

多模态 DNN 模型在药物相互作用预测任务中的应用

Seperti yang ditunjukkan dalam rajah di atas, interaksi ubat boleh diringkaskan sebagai matriks DDI, yang menerangkan hasil interaksi ubat, seperti ubat d1 (abexiclib) dan d2 (dabrafenib) Akan menyebabkan y1 ( kepekatan serum menurun). Kajian ini termasuk 37,264 data DDI, melibatkan 572 ubat (d) dan 65 keputusan tindak balas (y, seperti penurunan kepekatan serum, dll.). Dan berdasarkan data ini, Graf Pengetahuan Dadah (DKG) telah dibina: nod adalah ubat dan tepi adalah hubungan antara ubat. Tiga kali ganda DKG ialah {D: dadah, R: hubungan antara dadah, T: entiti ekor}.

Selain data di atas, model multimodal juga menggabungkan ciri heterogen dadah (HF, Ciri Heterogen): {Sasaran: sasaran, substruktur: Komposisi/struktur kimia, enzim: enzim}, dimensi setiap ciri adalah berbeza, contohnya, maklumat sasaran ialah protein. Akhir sekali, matriks DDI, DKG dan HF digabungkan pada taburan kebarangkalian yang sama untuk pemodelan.

2 Pengenalan kepada model MDNN

Rangka kerja model MDNN multi-modal heterogen akan diperkenalkan seterusnya .

1. Rangka kerja keseluruhan MDNN

多模态 DNN 模型在药物相互作用预测任务中的应用

Model ini dirujuk sebagai MDNN Data asas terbahagi kepada dua bahagian: Matriks DDI dan data heterogen Kerangka model terutamanya terdiri daripada tiga bahagian berikut:

(1) Berdasarkan bahagian DKG: Terutamanya dengan membina graf pengetahuan dadah untuk menyatakan maklumat tentang komponen dadah itu sendiri (bahan aktif, bahan toksik), hubungan antara ubat, dsb.

(2) Berdasarkan bahagian HF: Terangkan ubat itu sendiri dengan menyepadukan data ciri heterogen seperti sasaran, enzim dan molekul struktur.

(3) Rangkaian neural gabungan pelbagai mod: Gabungkan kedua-dua bahagian data ciri DKG dan HF dengan berkesan, dan lakukan gabungan data Pemodelan bersatu.

2. Pembinaan modul DKG

Berikut akan memperkenalkan proses pembinaan berdasarkan DKG.

多模态 DNN 模型在药物相互作用预测任务中的应用

Gambar di atas menunjukkan kandungan utama graf pengetahuan dadah, dan gambar kiri ialah matriks DDI Matriks mengandungi hampir 600 ubat, dan maklumat komposisi dan tindakan ubat-ubatan ini disimpan dalam pangkalan data (DrugBank). Gambar di sebelah kanan menunjukkan contoh maklumat dadah dalam "Bank Dadah", seperti enzim, pembawa, sasaran dan ciri-ciri asas heterogen lain Empat daripadanya adalah agak penting dengan mengambil ubat DB05812 sebagai contoh, sebagai tambahan kepada sasaran , Selain enzim dan struktur molekul, terdapat juga pembawa dan pengangkut Walau bagaimanapun, kedua-dua jenis data ini agak jarang dan tidak mempunyai banyak dimensi seperti ciri-ciri lain. kedua-dua data ini tidak digunakan buat masa ini. Data utama yang digunakan ialah sasaran, enzim, dan struktur molekul.

多模态 DNN 模型在药物相互作用预测任务中的应用

Seperti yang ditunjukkan dalam rajah di atas, graf pengetahuan terutamanya terdiri daripada nod dan tepi, di mana nod adalah ubat dan ramuan, dan tepi adalah hubungan. Hubungan yang ditunjukkan oleh triplet dalam contoh ialah hubungan komponen toksik, iaitu, terdapat hubungan komponen toksik antara ubat nod "DB05812" dan komponen nod "P02768". Berdasarkan tiga kali ganda hubungan ramuan dadah yang diperolehi daripada "Bank Dadah", graf pengetahuan DKG terbentuk, yang mengandungi 572 jenis ubat Tepi (hubungan) tiga dipanggil hubungan semantik secara keseluruhannya. Bahan-bahan Terdapat 1043 jenis nod entiti ekor. Setiap DKG boleh mengekstrak maklumat yang sepadan daripada "Bank Dadah" mengikut keperluan tugas dan membinanya, jadi DKG adalah bersamaan dengan subgraf dalam graf pengetahuan "Bank Dadah".

多模态 DNN 模型在药物相互作用预测任务中的应用

Berdasarkan DKG, dua jenis maklumat diringkaskan Rajah di atas menunjukkan semantik model maklumat perhubungan pembinaan. Berdasarkan komponen toksik, mula-mula hitung produk dalam ubat (d) dan hubungan (r) dalam lapisan sebelumnya, dan jumlahkannya melalui berat lapisan semasa (W1) untuk mendapatkan fungsi π maklumat tepi dan nod dadah dijumlahkan bersama melalui fungsi π, dan kemudian melakukan penjumlahan wajaran fungsi π dan komponen lapisan sebelumnya (t) untuk mendapatkan e, iaitu maklumat tepi diperoleh.

多模态 DNN 模型在药物相互作用预测任务中的应用

Begitu juga, rajah di atas menunjukkan pembinaan model maklumat struktur topologi graf . Selain komponen toksik, ubat juga mungkin mengandungi berbilang hubungan komponen lain (tepi, iaitu e) ubat yang sama dan berat sepadannya W2 boleh disambungkan untuk akhirnya memperoleh E yang sepadan dengan setiap ubat. Melalui kaedah di atas, tepi DKG dan maklumat struktur topologi digabungkan dan diwakili dengan berkesan.

3. Pembinaan modul HF

Seperti yang ditunjukkan di bawah, sebagai tambahan kepada maklumat sampingan dan maklumat DDI yang dinyatakan di atas , Terdapat juga maklumat multi-modal yang sangat kaya dalam ubat-ubatan: ubat yang sama boleh bertindak pada pelbagai sasaran juga mempunyai struktur molekul yang berbeza, yang mewakili sifat molekul mereka yang sepadan akan bertindak balas di bawah tindakan enzim yang berbeza . Ketiga-tiga jenis maklumat ini divektorkan, dan kemudian persamaan antara ubat-ubatan diukur melalui persamaan Jaccard mudah untuk mendapatkan matriks persamaan yang sepadan.

多模态 DNN 模型在药物相互作用预测任务中的应用

多模态 DNN 模型在药物相互作用预测任务中的应用

Final Fusion Ketiga-tiga matriks persamaan memperoleh E' yang sepadan dengan setiap ubat, iaitu maklumat berdasarkan ciri-ciri isomer ubat diperolehi. Dimensi vektor ciri ini juga kecil, termasuk maklumat mengenai 1162 sasaran, 583 struktur dan 202 enzim.

4 Lapisan gabungan berbilang model

多模态 DNN 模型在药物相互作用预测任务中的应用

Seperti yang ditunjukkan dalam rajah di atas, keputusan DKG E dan HF E' setiap ubat akhirnya disambung dan dicantum melalui lapisan gabungan untuk mendapatkan:

多模态 DNN 模型在药物相互作用预测任务中的应用

Kemudian gunakan fungsi softmax untuk mendapatkan lapisan output:

多模态 DNN 模型在药物相互作用预测任务中的应用

多模态 DNN 模型在药物相互作用预测任务中的应用

Keseluruhan rangka kerja model adalah seperti yang ditunjukkan di atas Struktur rangka kerja tidak rumit, tetapi ia menggabungkan maklumat ubat dengan agak berkesan.

3. Kesan model MDNN

Seterusnya, saya akan berkongsi kesan model dengan anda.

多模态 DNN 模型在药物相互作用预测任务中的应用

Rajah di atas menunjukkan hasil perbandingan dengan algoritma yang lebih biasa digunakan pada masa ini, MDNN algoritma Ia telah mencapai keputusan terkini dalam Acc, AUC, F1, AUPR, Precision, Recall dan penunjuk penilaian lain. (Algoritma di atas tidak dimasukkan ke dalam algoritma GNN.)

多模态 DNN 模型在药物相互作用预测任务中的应用

Rajah di atas menunjukkan Gabungan MDNN DKG, Perbezaan antara kesan HK dan tiada gabungan. Adalah mudah untuk melihat bahawa hasil gabungan adalah lebih baik daripada menggunakan salah satu kaedah sahaja.

多模态 DNN 模型在药物相互作用预测任务中的应用

Analisis pelarasan parameter pelbagai mod, iaitu, kepekaan parameter adalah seperti yang ditunjukkan dalam rajah di atas, masing-masing menunjukkan pelbagai penunjuk penilaian apabila parameter seperti bilangan lapisan rangkaian neural l dan bilangan nod Ns turun naik yang sepadan.

多模态 DNN 模型在药物相互作用预测任务中的应用

Selain itu, analisis berbilang tugas telah dilakukan, dan tugas Model ramalan telah dibina melalui set latihan Untuk meramalkan DDI antara ubat dalam set latihan dan ubat dalam set ujian, model ramalan tugas B juga dibina melalui set latihan, tetapi meramalkan DDI antara ubat dalam set ujian. Jika set latihan dan ubat set ujian dipisahkan dengan ketat, kesan ramalan model akan berkurangan dengan ketara.

Masih banyak masalah yang perlu diselesaikan dalam bidang penyelidikan dan pembangunan dadah: bagaimana untuk menemui/menyaring ubat dengan berkesan dan bukannya hanya mengkaji DDI.

4 Ringkasan

Akhir sekali, untuk meringkaskan kandungan yang dikongsi kali ini, algoritma MDNN itu sendiri tidak rumit. . kesan Graf pengetahuan membina ciri data berbilang modal berdasarkan ciri-ciri ubat itu sendiri (sasaran, struktur molekul, enzim), dan akhirnya menyepadukan kedua-dua ciri ini untuk membina model MDNN.

(2) Memperbaiki masalah ramalan DDI

多模态 DNN 模型在药物相互作用预测任务中的应用

(3) Perbandingan dengan kaedah sedia ada, MDNN berfungsi; terbaik pada set data.

Tetapi dalam aplikasi praktikal, model MDNN masih mempunyai banyak bidang yang memerlukan pengoptimuman dan penambahbaikan lanjut, seperti metodologi yang lebih baik atau data yang lebih baik.

5. Sesi Soal Jawab

S1: Adakah set data "Bank Dadah" adalah set data awam?

J1: Set data graf pengetahuan kajian ini adalah awam, dan set data asal "Bank Dadah" juga merupakan set data awam. Walau bagaimanapun, bergantung kepada ubat dalam setiap bidang penyelidikan, set data graf pengetahuan yang dibina juga akan berbeza, dan tiada graf pengetahuan bersatu dan universal.

S2: Apakah aplikasi kaedah penyelidikan yang dikongsi seperti graf pengetahuan, gabungan pelbagai mod, dsb. di luar bidang farmaseutikal? Seperti protein, imuniti, dan lain-lain?

A2: Selain biofarmaseutikal, terdapat banyak aplikasi dalam bidang e-dagang. Sebagai contoh, dalam set data kelas Item Pengguna, Pengguna mempunyai banyak maklumat berbilang modal, seperti pekerjaan, umur, tag beli-belah, dsb. Produk item juga mempunyai banyak maklumat dan terdapat banyak hubungan antara mereka, seperti membeli-belah, penilaian, kegemaran, klik, dsb. Tingkah laku. Jika data domain mematuhi bentuk heterogen, anda boleh cuba menggunakan kaedah ini untuk analisis Kesukarannya terletak pada membina graf pengetahuan dalam domain tertentu.

Atas ialah kandungan terperinci Aplikasi model DNN multimodal dalam tugas ramalan interaksi dadah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam