Rumah > Artikel > Peranti teknologi > Sub-jurnal alam semula jadi, rangka kerja AI am pasukan Universiti Peking menjalankan ramalan struktur komprehensif untuk dok protein-protein, merapatkan jurang antara percubaan dan pengiraan
Editor |.
Pasukan penyelidik dari Universiti Peking, Makmal Changping dan Universiti Harvard mencadangkan ColabDock, rangka kerja umum yang menggunakan model ramalan struktur pembelajaran mendalam untuk menyepadukan kekangan eksperimen pelbagai bentuk dan sumber tanpa latihan semula berskala besar atau penalaan halus.
ColabDock mengatasi prestasi HADDOCK dan ClusPro menggunakan AlphaFold2 sebagai model ramalan struktur, bukan sahaja dalam ramalan struktur kompleks dengan sisa simulasi dan kekangan permukaan, tetapi juga dalam ramalan struktur dengan gangguan anjakan kimia NMR dan pelabelan kovalen dengan cara ini.
Selain itu, ia boleh membantu ramalan antara muka antibodi-antigen dengan mensimulasikan had imbasan antara muka.
Kajian itu bertajuk "
Ramalan struktur bersepadu dok protein–protein dengan sekatan percubaan menggunakan ColabDock" dan diterbitkan dalam "Nature Machine Intelligence" pada 5 Ogos 2024.
Pelabuhan protein menyediakan maklumat struktur penting untuk memahami mekanisme biologi. Walaupun model dalam telah berkembang pesat dalam ramalan struktur protein, kebanyakan model melakukan ramalan dalam cara dok bebas, yang mungkin membawa kepada ketidakkonsistenan antara kekangan eksperimen dan struktur yang diramalkan.
Untuk menyelesaikan masalah ini, pasukan penyelidik dari Universiti Peking, Makmal Changping dan institusi lain mencadangkan rangka kerja umum untuk ramalan konformasi kompleks terkurung - ColabDock, yang merupakan dok protein-protein am yang dipandu oleh kerangka kekangan eksperimen yang jarang.
Melalui perambatan balik kecerunan, kaedah ini menyepadukan prior yang dikekang secara eksperimen dan landskap tenaga model ramalan struktur protein dipacu data, secara automatik mencari konformasi yang memuaskan kedua-duanya sambil bertolak ansur dengan konflik atau kekaburan dalam kekangan.
ColabDock boleh memanfaatkan pelbagai bentuk dan sumber kekangan percubaan tanpa latihan semula atau penalaan yang lebih mendalam.
Ilustrasi: Aliran kerja ColabDock. (Sumber: kertas)
Dalam fasa penjanaan, ColabDock menggunakan ColabDesign, rangka kerja reka bentuk protein yang dibangunkan berdasarkan AlphaFold2. Profil jujukan input dioptimumkan dalam ruang logit untuk membimbing model ramalan struktur untuk menjana struktur kompleks berdasarkan kekangan dan templat percubaan yang diberikan sambil memaksimumkan ukuran pLDDT dan pAE.
Dalam fasa ramalan, struktur diramal berdasarkan struktur kompleks yang dihasilkan dan templat yang diberikan. Untuk setiap sasaran, ColabDock melakukan berbilang larian dan menghasilkan konformasi yang berbeza. Konformasi akhir telah dipilih oleh algoritma mesin vektor sokongan peringkat (SVM).
Prestasi mantapSebagai bukti konsep, para penyelidik menggunakan AlphaFold2 sebagai model ramalan struktur dalam ColabDock. Sudah tentu, model pembelajaran mendalam dipacu data lain juga boleh digunakan di sini, seperti RoseTTAFold2 dan AF-Multimer.
Para penyelidik menguji ColabDock pada set data sintetik dan beberapa jenis kekangan eksperimen, termasuk gangguan anjakan kimia NMR (CSP), pelabelan kovalen (CL) dan pengimbasan mutasi dalam simulasi (DMS).
Ilustrasi: Prestasi ColabDock pada set pengesahan. (Sumber: Kertas)
ColabDock menilai dua jenis kekangan, iaitu kekangan 1v1 dan MvN. Yang pertama berada pada tahap sisa-sisa dan contohnya termasuk kekangan daripada XL-MS. Yang terakhir adalah pada tahap antara muka dan relevan untuk eksperimen NMR dan CL.
Hasil ujian pada set data sintetik menunjukkan bahawa ColabDock mencapai prestasi yang memuaskan. Tambahan pula, seperti yang dijangkakan, prestasi ColabDock bertambah baik apabila bilangan kekangan meningkat.
Walaupun dengan sedikit kekangan, ColabDock mengatasi prestasi AF-Multimer pada set data penanda aras dan tetapan bingkai yang sama, dan menumpu kepada konformasi yang lebih sedikit apabila lebih banyak kekangan disediakan, menunjukkan penggunaan maklumat tambahan yang berkesan.
Ilustrasi: Membandingkan ColabDock, HADDOCK dan ClusPro pada set penanda aras. (Sumber: kertas)
Berbanding dengan HADDOCK dan ClusPro, ColabDock berprestasi lebih baik apabila kualiti kekangan lebih tinggi. Pada kedua-dua set data percubaan, ColabDock masih mengatasi prestasi HADDOCK dan ClusPro tanpa mengira bilangan dan kualiti kekangan yang diberikan.
Ilustrasi: Prestasi dan analisis kekangan ColabDock pada set CSP. (Sumber: kertas)
Akhir sekali, para penyelidik menilai prestasi kaedah dok yang berbeza pada set data antibodi-antigen. ColabDock meramalkan bahagian yang lebih tinggi bagi struktur kualiti sederhana atau lebih tinggi daripada HADDOCK dan ClusPro.
Ilustrasi: Perbandingan ColabDock, HADDOCK dan ClusPro pada set penanda aras antibodi-antigen. (Sumber: kertas)
Ini menunjukkan bahawa ColabDock mempunyai potensi nilai aplikasi dalam reka bentuk antibodi. Selain itu, ColabDock masih menunjukkan prestasi yang setanding atau lebih baik daripada AF-Multimer pada set data tidak berat sebelah yang baru dikeluarkan.
Keterbatasan dan Kesimpulan
ColabDock juga mempunyai beberapa batasan. Pada masa ini, ColabDock hanya boleh menerima jarak yang lebih kecil daripada 22 Å, yang ditentukan oleh had atas peta jarak dalam AlphaFold2. Had ini menjadikan model terpakai kepada hanya subset kecil reagen XL-MS.
Tanpa pengoptimuman berasaskan serpihan, ColabDock hanya boleh memproses kompleks kurang daripada 1,200 sisa pada unit pemprosesan grafik (GPU) NVIDIA A100 kerana memori yang terhad.
Selain itu, kaedah ini boleh memakan masa yang lama, terutamanya untuk kompleks protein yang besar. Menggunakan versi format titik terapung bfloat16 AlphaFold2 dijangka dapat membantu menjimatkan memori dan mempercepatkan pengiraan.
Saya percaya bahawa pada masa hadapan, selepas penyelidik secara berulang mengoptimumkannya, sebagai rangka kerja bersatu, ColabDock akan dapat membantu merapatkan jurang antara sains protein eksperimen dan pengiraan.
Pautan kertas:https://www.nature.com/articles/s42256-024-00873-z
Atas ialah kandungan terperinci Sub-jurnal alam semula jadi, rangka kerja AI am pasukan Universiti Peking menjalankan ramalan struktur komprehensif untuk dok protein-protein, merapatkan jurang antara percubaan dan pengiraan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!