Rumah >Peranti teknologi >AI >Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam
1.
Spektrometri jisim ialah teknologi analisis proteom arus perdana yang digunakan untuk mengenal pasti dan mengira protein dalam sistem biologi yang kompleks.
Teknologi spektrometri jisim tandem (MS/MS)Penyahkod carian pancaran yang meramalkan peptida terbaik untuk setiap spektrum MS/MS.
Casanovo melakukan penjujukan peptida de novo menggunakan seni bina Transformer. (Sumber: kertas)
Mempunyai sejumlah besar data latihan berkualiti tinggi Menggunakan seni bina Transformer
Seni bina Transformer ialah
amat sesuai untuk menukar panjang pembolehubah Unsur-unsur urutan diletakkan dalam konteks dan dengan itu mempunyai kejayaan besar dalam pemodelan bahasa semula jadi. Berbanding dengan rangkaian saraf berulang, seni bina Transformer mampu mempelajari kebergantungan jarak jauh antara elemen jujukan dan boleh diselaraskan untuk latihan yang cekap.
Aplikasi CasanovoCasanovo mengekod puncak spektrum jisim ke dalam jujukan, mengambil kesempatan daripada seni bina Transformer dan pembangunan pesat model bahasa besar untuk menambah baik penjujukan peptida de novo spektrum MS/MS.
Senario aplikasi:Paleoproteomics
Perubatan forensikCasanovo belum namun meneroka penggunaan penjujukan antibodi. Walau bagaimanapun, kajian oleh kumpulan Denis Beslic di BAM di Jerman menjalankan perbandingan sistematik enam alat penjujukan de novo, termasuk Casanovo, mengenai isu penjujukan antibodi.
Grafik: Pengingatan keseluruhan dan ketepatan
Novor, pNovo 3, DeepNovo, SMSNet, PointNovo dan Casanovo untuk enzim berbeza pada IgG1-Human-HC.Pautan berkaitan:
https://academic.oup.com/bib/article/24/1/bbac542/6955273?login=false
Keputusan:
Casanovo dengan ketara mengatasi kaedah bersaing pada semua metrik yang dipertimbangkan. Perlu diingat bahawa perbandingan ini menggunakan versi penyahkodan rakus Casanovo dan dilatih hanya pada 2 juta spektrum.
Penilaian:
Pasukan Casanovo menanda aras Casanovo merentas sembilan spesies. Graf di bawah menunjukkan bahawa versi terkini Casanovo yang dilatih dengan 30 juta spektrum menghasilkan prestasi penjujukan antibodi yang lebih baik.
Grafik: Casanovo mengatasi model seperti PointNovo, DeepNovo dan Novor pada sembilan penanda aras spesies. (Sumber: kertas)Pada masa hadapan, terdapat banyak peluang untuk memperhalusi model Casanovo untuk aplikasi tertentu. Analisis penyelidik terhadap model bukan enzim menunjukkan bahawa bias enzimatik Casanovo boleh diselaraskan dengan menggunakan data latihan yang agak sedikit.
Jadi, dalam jangka pendek, pasukan merancang untuk melatih varian Casanovo yang berfungsi pada pelbagai enzim litik yang berbeza. Perisian Casanovo memudahkan penalaan halus ini, jadi mana-mana pengguna yang berminat untuk menyesuaikan model kepada persediaan percubaan tertentu seharusnya boleh berbuat demikian.
Dalam jangka panjang, model ideal mengambil sebagai spektrum input bersama-sama dengan metadata yang berkaitan (seperti enzim pencernaan, tenaga perlanggaran dan jenis instrumen) dan meramalkan dengan tepat pelbagai jenis persediaan percubaan.
Potensi kaedah pembelajaran mendalam untuk meningkatkan keupayaan penjujukan de novo kini diiktiraf secara meluas. Semasa kertas ini disemak, sekurang-kurangnya enam kaedah penjujukan de novo pembelajaran mendalam lain telah diterbitkan, termasuk GraphNovo, PepNet, Denovo-GCN, Spectralis, π-HelixNovo, dan NovoB. Jelas sekali, bidang ini akan mendapat manfaat daripada penanda aras yang komprehensif dan ketat bagi bidang alat yang semakin berkembang ini.
Sehubungan itu, salah satu kesesakan utama dalam bidang pada peringkat ini ialah kekurangan kaedah penilaian keyakinan yang ketat untuk penjujukan de novo.
Dalam analisis metaproteomik, penyelidik memadankan ramalan Casanovo dengan pangkalan data sasaran dan peptida umpan yang sepadan, tetapi pendekatan ini mengabaikan keupayaan penjujukan de novo untuk menetapkan peptida kepada profil eksotik.
Oleh itu, persoalan terbuka ialah sama ada Casanovo mengatasi prosedur carian pangkalan data standard dari segi kuasa statistik untuk mengesan peptida bagi set data pemerolehan bergantung kepada data tertentu.
Para penyelidik mengatakan bahawa latihan dengan set latihan yang cukup besar mungkin dapat menamatkan dominasi carian pangkalan data dalam bidang analisis data spektrometri jisim tandem DDA.
Pautan kertas: https://www.nature.com/articles/s41467-024-49731-x
Atas ialah kandungan terperinci Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!