Rumah >Peranti teknologi >AI >Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

王林
王林asal
2024-07-02 15:23:211116semak imbas

Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

Editor |. Kulit Lobak

Aplikasi kecerdasan buatan baharu akan membantu penyelidik meningkatkan keupayaan pembangunan dadah mereka.

Projek ini dipanggil TopoFormer dan dibangunkan oleh pasukan antara disiplin yang diketuai oleh Profesor Guowei Wei dari Jabatan Matematik di Michigan State University.

TopoFormer mengubah maklumat tiga dimensi molekul kepada data yang boleh digunakan oleh model interaksi ubat berasaskan AI biasa, memperluaskan keupayaan model ini untuk meramal keberkesanan ubat.

"Dengan kecerdasan buatan, anda boleh menjadikan pembangunan ubat lebih cepat, lebih cekap dan lebih murah," kata Wei, yang juga di fakulti Jabatan Biokimia dan Biologi Molekul dan Jabatan Kejuruteraan Elektrik dan Komputer.

Profesor Wei menjelaskan bahawa di Amerika Syarikat, membangunkan ubat mengambil masa kira-kira sepuluh tahun dan menelan belanja kira-kira $2 bilion. Percubaan dadah mengambil masa kira-kira separuh daripada masa, manakala separuh lagi dibelanjakan untuk mencari calon rawatan baharu untuk diuji.

TopoFormer berpotensi untuk memendekkan masa pembangunan. Dengan cara ini, kos pembangunan ubat dapat dikurangkan, seterusnya menurunkan harga ubat untuk pengguna hiliran.

Kajian itu bertajuk "Pengubah struktur-ke-jujukan berbilang topologi yang didayakan untuk ramalan interaksi protein-ligan" dan diterbitkan dalam "Nature Machine Intelligence" pada 24 Jun 2024.

Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

Walaupun penyelidik boleh menggunakan model komputer untuk membantu pembangunan dadah, terdapat banyak batasan disebabkan oleh banyak pembolehubah dalam masalah tersebut.
"Terdapat lebih daripada 20,000 protein dalam badan kita," kata Wei "Apabila penyakit berlaku, sebahagian atau salah satu daripadanya menjadi sasaran
Langkah pertama, adalah untuk memahami mana atau salah satu daripada protein ini oleh penyakit yang mana. Protein ini juga disasarkan oleh penyelidik yang berharap untuk mencari molekul yang boleh menghalang, mengurangkan atau mengatasi kesan penyakit.
"Apabila saya mempunyai matlamat, saya cuba mencari sejumlah besar ubat yang berpotensi untuk matlamat khusus itu," kata Wei.
Apabila saintis mengetahui protein mana yang perlu disasarkan oleh ubat, mereka boleh menyuapkan protein dan jujukan molekul ubat yang berpotensi ke dalam model komputer tradisional. Model ini boleh meramalkan cara ubat dan sasaran akan berinteraksi, membimbing pembangunan dan ubat yang hendak diuji dalam ujian klinikal.
Walaupun model ini boleh meramalkan beberapa interaksi berdasarkan komposisi kimia ubat dan protein semata-mata, mereka juga mengabaikan interaksi penting yang datang daripada bentuk dan struktur tiga dimensi atau 3D molekul.
Ibuprofen, yang ditemui oleh ahli kimia pada tahun 1960-an, adalah contohnya. Terdapat dua molekul ibuprofen berbeza yang mempunyai jujukan kimia yang sama tetapi struktur 3D yang berbeza sedikit. Hanya satu susunan boleh mengikat protein yang berkaitan dengan kesakitan dan menghilangkan sakit kepala.
Guowei Wei berkata: "Model pembelajaran mendalam semasa tidak dapat menerangkan bentuk ubat atau protein apabila meramalkan cara ia berfungsi bersama
Seni bina Transformer memperkenalkan teknologi baharu yang memanfaatkan mekanisme perhatian untuk analisis data jujukan merentas domain. Diilhamkan oleh ini, pasukan Wei membangunkan model Transformer topologi, TopoFormer, menyepadukan Persistent Topological Hyperdigraph Laplacian (PTHL) dengan rangka kerja Transformer.
Tidak seperti Transformer tradisional yang mengendalikan urutan protein dan ligan, TopoFormer memasukkan kompleks ligan protein 3D. Ia menukarkan kompleks ini kepada jujukan invarian topologi dan bentuk homotopik melalui PTHL, dengan itu menangkap interaksi fizikal, kimia dan biologinya pada pelbagai skala.
Pra-dilatih mengenai set data yang pelbagai, TopoFormer dapat memahami interaksi molekul yang kompleks, termasuk kesan stereokimia yang tidak jelas dalam jujukan molekul. Penalaan halus pada set data tertentu boleh menangkap interaksi terperinci dalam kompleks dan ciri-cirinya berbanding keseluruhan set data, dengan itu mempertingkatkan aplikasi pembelajaran mendalam hiliran.

Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

Ilustrasi: Gambar rajah skematik keseluruhan model TopoFormer. (Sumber: kertas)
  1. Untuk memfokuskan analisis, penyelidik menggunakan potongan 20 Å atau, lebih tepat lagi, 12 Å untuk mengenal pasti reassortant dan atom protein berdekatan dalam jarak yang ditetapkan.
  2. Kemudian, TopoFormer menukar struktur molekul 3D kepada jujukan topologi melalui modul benam jujukan topologi, menggunakan PTHL untuk analisis berbilang skala. Proses ini membenamkan pelbagai interaksi fizikal, kimia dan biologi ke dalam jujukan vektor.
  3. TopoFormer menggunakan kompleks protein-ligan yang tidak berlabel untuk pra-latihan yang diselia sendiri dan penyahkod pengekod Transformer untuk membina semula jujukan topologi. Peringkat ini menyediakan model untuk memahami dinamik protein-ligan tanpa ketiadaan data berlabel dengan mengukur ketepatan dengan membandingkan pemasukan output dan input.
  4. Selepas pra-latihan, TopoFormer memasuki peringkat penyeliaan halus kompleks berlabel, di mana vektor pembenaman awal menjadi ciri utama untuk tugas hiliran seperti pemarkahan, pemeringkatan, dok dan penyaringan. Setiap tugas mempunyai pengepala khusus dalam modul peramal.
  5. Untuk memastikan ketepatan dan mengurangkan berat sebelah, TopoFormer menyepadukan berbilang model pembelajaran mendalam transformasi topologi yang dimulakan dengan benih yang berbeza dan melengkapkannya dengan model berasaskan jujukan.
  6. Keluaran akhir ialah konsensus ramalan berbeza ini, menjadikan TopoFormer model komprehensif untuk menganalisis interaksi protein-ligan, memanfaatkan kedua-dua cerapan topologi dan pembelajaran mendalam.

    Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

    Ilustrasi: Prestasi TopoFormer dalam tugasan pemarkahan dan penarafan. (Sumber: Kertas)

Pendekatan ini membenarkan penggunaan hyperedges terarah pelbagai dimensi untuk memodelkan interaksi kompleks melangkaui sambungan berpasangan mudah. Tambahan pula, orientasi tepi ini menggabungkan sifat fizikal dan kimia, seperti keelektronegatifan dan tenaga pengionan, untuk memberikan perwakilan yang lebih bernuansa daripada kaedah tradisional. Para penyelidik menunjukkan keupayaan ini dengan membezakan dua isomer B7C2H9 dengan hyperedges terarah, menunjukkan keupayaan kaedah untuk membezakan secara berkesan antara konfigurasi unsur.

Apabila mengkaji kompleks protein-ligan, penyelidik menggunakan graf hiperarah topologi sebagai perwakilan awal dan mempertingkatkannya lagi dengan teori PTHL untuk menganalisis ciri geometri dan topologinya.

Melukis inspirasi daripada sistem fizikal seperti struktur molekul, di mana pengendali Hoch Laplacian dimensi sifar dikaitkan dengan pengendali tenaga kinetik Hamiltonian sistem kuantum yang jelas, penyelidik memanjangkan analogi diskret kepada super topologi kepada graf. Nilai eigen dari matriks Laplacian ini memberikan gambaran tentang sifat objek topologi, sama dengan spektrum tenaga sistem fizikal.

Berbanding dengan homologi berterusan tradisional, kaedah PTHL menandakan kemajuan besar dengan menganalisis rangkaian struktur yang lebih luas melangkaui kompleks simpleks. Ia menangkap maklumat homologi asas dan cerapan geometri, termasuk nombor Betti dan evolusi bentuk homotopik, melalui spektrum anharmonik pengendali Laplacian yang berterusan.

Hasil analisis menunjukkan bahawa ia memberikan pencirian yang lebih komprehensif berbanding homologi tradisional. Kepelbagaian nilai eigen sifar pengendali Laplacian (bersamaan dengan nombor Betti) mengesahkan bahawa kaedah ini mengandungi maklumat pengekodan bar, menyediakan rangka kerja yang kuat untuk memahami kompleks protein-ligan.

Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah

Ilustrasi: Prestasi TopoFormer dalam tugasan dok dan saringan. (Sumber: Kertas)

Untuk menangkap interaksi atom kompleks dalam kompleks protein-ligan, termasuk daya kovalen, ionik dan van der Waals, para penyelidik menggunakan PTHL untuk melakukan analisis berbilang skala. Pendekatan ini membolehkan pemeriksaan interaksi skala silang dengan mengubah jujukan topologi berdasarkan parameter penapisan, dengan itu membantu model Transformer mengenal pasti berat yang diletakkan setiap skala pada sifat seperti pertalian mengikat.

Interaksi unsur, termasuk ikatan hidrogen, daya van der Waals, dan susunan π, adalah asas untuk kestabilan dan kekhususan kompleks protein-ligan. Untuk menganalisis interaksi ini pada peringkat unsur, penyelidik memperkenalkan analisis khusus unsur dalam pembenaman jujukan topologi.

Kaedah ini membina sub-hipergraf berdasarkan unsur berat biasa dalam protein dan ligan, menjana interaksi pengekodan matriks Laplacian khusus unsur dalam kompleks. Teknologi ini mengekstrak ciri fizikal dan kimia terperinci yang meningkatkan pemahaman model Transformer tentang dinamik kompleks dalam interaksi protein-ligan.

Kesimpulan

Untuk meringkaskan, TopoFormer dilatih untuk membaca satu bentuk maklumat dan menukarnya kepada yang lain. Dalam kes ini, ia memerlukan maklumat tiga dimensi tentang cara protein dan ubat berinteraksi berdasarkan bentuknya dan membina semulanya menjadi maklumat satu dimensi yang boleh difahami oleh model semasa.

Model baharu ini dilatih mengenai puluhan ribu interaksi protein-ubat, di mana setiap interaksi antara dua molekul direkodkan sebagai sekeping kod atau "perkataan." Kata-kata ini dirangkai bersama untuk membentuk perihalan kompleks dadah-protein, mencipta rekod bentuknya.

"Dengan cara ini, anda mempunyai banyak perkataan yang dirangkai seperti ayat."

Model lain yang meramalkan interaksi ubat baharu boleh membaca ayat ini dan memberikannya lebih banyak konteks. Jika ubat baharu adalah sebuah buku, TopoFormer boleh menukar idea cerita kasar kepada plot yang lengkap, sedia untuk ditulis.

Pautan kertas: https://www.nature.com/articles/s42256-024-00855-1

Laporan berkaitan: https://phys.org/news/2024-06-drug-discovery-ai-3d -typical.html

Atas ialah kandungan terperinci Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn