Rumah >Peranti teknologi >AI >'Pengetahuan sedia ada AI+fizik', Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

'Pengetahuan sedia ada AI+fizik', Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

WBOY
WBOYasal
2024-06-14 11:40:361044semak imbas

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

Editor | Para saintis telah mencari cara yang cekap untuk meramalkan kesesuaian antara "kunci" dan "kunci" atau interaksi protein-ligan ini.

Walau bagaimanapun, kaedah tradisional yang dipacu oleh data sering jatuh ke dalam "pembelajaran hafalan", menghafal data latihan ligan dan protein dan bukannya benar-benar mempelajari interaksi antara mereka.

Baru-baru ini, pasukan penyelidik dari Universiti Zhejiang dan Akademi Sains China mencadangkan kaedah pemarkahan baharu yang dipanggil EquiScore, yang menggunakan rangkaian neural graf heterogen untuk menyepadukan pengetahuan sedia ada fizikal dan mencirikan interaksi protein-ligan dalam ruang transformasi persamaan .

EquiScore dilatih pada set data baharu yang dibina menggunakan pelbagai strategi penambahan data dan skim penghapusan lebihan yang ketat.

Pada dua set ujian luaran yang besar, EquiScore mula menonjol berbanding 21 kaedah lain. Apabila EquiScore digunakan dengan kaedah dok yang berbeza, ia boleh meningkatkan keupayaan penyaringan kaedah dok ini dengan berkesan. EquiScore juga menunjukkan prestasi yang baik dalam tugas menafkahkan aktiviti siri bahan yang serupa dari segi struktur, menunjukkan potensinya untuk membimbing pengoptimuman kompaun plumbum.

Akhirnya, tahap kebolehtafsiran berbeza EquiScore telah dikaji, yang mungkin memberikan lebih banyak cerapan untuk reka bentuk ubat berasaskan struktur.

Kajian itu bertajuk "

Pemarkahan interaksi protein–ligan generik dengan menyepadukan pengetahuan sedia ada fizikal dan pemodelan penambahan data

" dan telah diterbitkan dalam "Nature Machine Intelligence" pada 6 Jun 2024.

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal AlamPautan kertas:

https://www.nature.com/articles/s42256-024-00849-z
Kaedah pemarkahan berdasarkan pembelajaran mesin

Genomics juga didatangkan cabaran untuk menterjemahkan pengetahuan baharu kepada ubat baharu. Dalam beberapa tahun kebelakangan ini, algoritma lipatan protein terus membuat penemuan, dan bidang biologi struktur telah mencapai kemajuan yang besar. Dan projek bercita-cita tinggi sedang cuba mencari ubat atau probe yang sepadan untuk semua protein dalam tubuh manusia. Walaupun kemajuan besar telah dicapai dalam bidang ini, membangunkan kaedah pemarkahan yang lebih tepat dalam senario aplikasi dunia sebenar kekal sebagai cabaran terbuka.

Dengan ledakan data interaksi protein-ligan eksperimen, kaedah pemarkahan berasaskan pembelajaran mesin telah mencapai kemajuan yang besar.

Peningkatan kapasiti model pembelajaran mesin membolehkan mereka mengingati keseluruhan set data latihan. Pada masa yang sama, isu kebocoran data antara data latihan dan data ujian membawa kepada penilaian yang terlalu optimistik terhadap keupayaan model ini

Selain kualiti set data, satu lagi faktor utama yang mempengaruhi prestasi kaedah pemarkahan berasaskan pembelajaran mesin ialah penyepaduan berkesan maklumat terdahulu Fizikal yang berkaitan pada interaksi ligan-protein.

Seni bina EquiScore

Penyelidikan ini terutamanya meningkatkan keupayaan generalisasi kaedah pemarkahan pembelajaran mendalam untuk sasaran yang tidak diketahui dari dua aspek.

Mula-mula, penyelidik membina set data baharu yang dipanggil PDBscreen menggunakan pelbagai strategi penambahan data. Contohnya, menggunakan pose pengikatan ligan yang hampir dengan asli untuk menguatkan saiz sampel positif, dan menggunakan umpan yang sangat memperdaya yang dihasilkan untuk menguatkan saiz sampel negatif.

Kedua, dengan memperkenalkan jenis nod dan tepi baharu serta mekanisme perhatian yang menyedari maklumat, graf heterogen yang boleh menyepadukan maklumat terdahulu tentang interaksi antara molekul fizikal dicadangkan.

Ilustrasi: Saluran paip untuk membina set data skrin PDB. (Sumber: kertas) Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

EquiScore ialah model klasifikasi binari yang menilai potensi pengikatan antara protein dan ligan dengan memasukkan peta isomorfik yang dibina daripada kawasan poket protein dan ligan.

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam
Ilustrasi: Seni bina keseluruhan EquiScore. Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam
Dalam langkah pertama, para penyelidik mereka bentuk skema pembinaan graf heterogen. Selain mengabstraksikan atom sedia ada ke dalam nod, nod maya ditambah untuk setiap cincin aromatik berdasarkan pengetahuan terdahulu pakar untuk mewakili sistem aromatik dengan lebih baik. Untuk membina tepi, tepi berasaskan jarak geometri (
E
geometrik) dan tepi berasaskan struktur melalui ikatan kimia (

Estruktur) diwujudkan antara nod.

Para penyelidik juga menambah kelas tepi berdasarkan komponen interaksi protein-ligan empirikal (IFP) yang dikira ProLIF kepada Estruktur untuk memasukkan pengetahuan fizikal priori tentang interaksi antara molekul. Dalam langkah kedua, lapisan benam digunakan untuk mendapatkan perwakilan terpendam bagi setiap jenis tepi dan nod pada graf heterogen. Skim ini boleh memperkenalkan nod dan tepi baharu yang lain dengan makna fizikal yang jelas, dan boleh disepadukan dengan lancar dengan modul pembelajaran perwakilan seterusnya.

Untuk menggunakan sepenuhnya bias induktif maklumat daripada nod dan tepi yang berbeza sambil memastikan varians model yang sama, lapisan EquiScore terdiri daripada tiga sub-modul: modul perhatian sedar maklumat, modul kemas kini nod dan modul kemas kini tepi.

Modul perhatian sedar maklumat boleh mentafsir interaksi daripada maklumat yang berbeza, termasuk (1) maklumat geometri setara, (2) maklumat struktur kimia, dan (3) komponen interaksi empirikal protein-ligan.

Penilaian Prestasi Model

Para penyelidik menilai prestasi model EquiScore yang dihasilkan.

Dalam senario saringan maya (VS), EquiScore secara konsisten mencapai kedudukan teratas berbanding 21 kaedah pemarkahan sedia ada untuk protein yang tidak kelihatan pada dua set data luaran, DEKOIS2.0 dan DUD-E.

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

Ilustrasi: Penilaian 22 kaedah pemarkahan pada DEKOIS2.0. (Sumber: kertas)

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

Ilustrasi: Penilaian 22 kaedah pemarkahan DUD-E dari segi AUROC, BEDROC dan EF. (Sumber: kertas)

Dalam senario pengoptimuman utama, EquiScore hanya menunjukkan keupayaan ranking yang lebih rendah berbanding FEP+ antara lapan kaedah berbeza. Memandangkan pengiraan FEP+ memerlukan kos pengiraan yang jauh lebih tinggi, EquiScore menunjukkan kelebihan yang lebih seimbang antara kelajuan dan ketepatan.

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

Ilustrasi: Perbandingan prestasi pose dok pemarkahan semula EquiScore yang dihasilkan oleh kaedah dok berbeza pada DEKOIS2.0. (Sumber: kertas)

Tambahan pula, didapati bahawa EquiScore mempamerkan keupayaan penjaringan yang kukuh apabila digunakan pada pose yang dijana oleh kaedah dok yang berbeza, dan menggunakan pengiraan EquiScore boleh meningkatkan prestasi VS untuk semua kaedah penilaian.

Pengetahuan sedia ada AI+fizik, Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam

Ilustrasi: Menjelaskan EquiScore dengan menggambarkan pengagihan perhatian. (Sumber: kertas)

Akhirnya, penyelidik menganalisis kebolehtafsiran model dan mendapati model itu boleh menangkap interaksi antara molekul utama, membuktikan rasionaliti model dan memberikan petunjuk berguna untuk reka bentuk ubat rasional.

Ramalan teguh interaksi protein-ligan akan memberikan peluang berharga untuk memahami biologi protein dan menentukan kesannya terhadap terapi ubat masa depan. EquiScore akan menyumbang kepada pemahaman yang lebih baik tentang kesihatan dan penyakit manusia serta memudahkan penemuan ubat baharu.

Atas ialah kandungan terperinci 'Pengetahuan sedia ada AI+fizik', Universiti Zhejiang dan Akademi Sains China kaedah pemarkahan interaksi protein-ligan am yang diterbitkan dalam sub-jurnal Alam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn