Rumah  >  Artikel  >  Peranti teknologi  >  Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam

Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam

王林
王林asal
2024-08-12 16:06:201107semak imbas

Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam

Editor |. Kaedah yang bergantung pada pangkalan data jujukan peptida yang diketahui tidak dapat mengesan peptida yang tidak dijangka dan mungkin tidak praktikal atau tidak boleh digunakan dalam beberapa kes. Oleh itu, keupayaan untuk menetapkan urutan peptida ke dalam MS/MS tanpa maklumat terdahulu (iaitu penjujukan peptida de novo) adalah amat berharga untuk tugas seperti penjujukan antibodi, imunopeptidomik dan metaproteomik.

Walaupun banyak kaedah telah dibangunkan untuk menyelesaikan masalah ini, ia tetap menjadi cabaran terbuka, sebahagiannya disebabkan oleh kesukaran untuk memodelkan struktur data MS/MS yang tidak teratur.

Di sini, penyelidik di University of Washington menerangkan Casanovo, model pembelajaran mesin yang menggunakan seni bina rangkaian neural Transformer untuk menukar jujukan puncak dalam MS/MS kepada jujukan asid amino yang membentuk peptida yang terhasil.

Pasukan melatih model Casanovo pada 30 juta spektrum berlabel dan menunjukkan bahawa model itu mengatasi beberapa kaedah terkini pada set data penanda aras merentas spesies.

Pasukan ini juga membangunkan versi Casanovo yang diperhalusi untuk peptida bukan enzim. Alat ini menambah baik analisis imunopeptidomik dan eksperimen metaproteomik dan membolehkan saintis menyelidiki lebih mendalam ke dalam proteom gelap.

Kajian itu bertajuk "Terjemahan urutan-ke-jujukan daripada spektrum jisim kepada peptida dengan model pengubah" dan diterbitkan dalam "Komunikasi Alam Semulajadi" pada 31 Julai 2024.

1.

Spektrometri jisimPrestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam ialah teknologi analisis proteom arus perdana yang digunakan untuk mengenal pasti dan mengira protein dalam sistem biologi yang kompleks.

Teknologi spektrometri jisim tandem (MS/MS)
    menghasilkan data yang kompleks, dan menukar spektrum ini kepada jujukan asid amino protein adalah mencabar.
  1. Pembelajaran mendalam
  2. telah menjadi pilihan pertama untuk penjujukan peptida de novo, tetapi batasannya termasuk: sebilangan kecil spektrum MS/MS beranotasi, kesukaran dalam pengekodan data MS/MS resolusi tinggi, rangkaian saraf yang kompleks dan langkah-langkah pasca pemprosesan . .
  3. Dalam penyelidikan terkini, Casanovo telah membuat penambahbaikan, termasuk:
  4. Perluasan set latihan menggunakan 669 juta spektrum dalam MassIVE-KB spectral library.
  5. Kawalan FDR yang ketat, mencari data pada 1% FDR, mengekalkan hanya 100 PSM untuk setiap prekursor unik, untuk sejumlah 30 juta PSM berkualiti tinggi.
  6. Penyahkod carian pancaran yang meramalkan peptida terbaik untuk setiap spektrum MS/MS.

    • ## Casanovo: Penjujukan peptida de novo menggunakan seni bina Transformer
    • Rajah 1:

      Casanovo melakukan penjujukan peptida de novo menggunakan seni bina Transformer. (Sumber: kertas) Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam

    • Prestasi cemerlang Casanovo dikaitkan dengan dua aspek:

Mempunyai sejumlah besar data latihan berkualiti tinggi Menggunakan seni bina Transformer

Seni bina Transformer ialah

amat sesuai untuk menukar panjang pembolehubah Unsur-unsur urutan diletakkan dalam konteks dan dengan itu mempunyai kejayaan besar dalam pemodelan bahasa semula jadi. Berbanding dengan rangkaian saraf berulang, seni bina Transformer mampu mempelajari kebergantungan jarak jauh antara elemen jujukan dan boleh diselaraskan untuk latihan yang cekap.

Aplikasi Casanovo

Casanovo mengekod puncak spektrum jisim ke dalam jujukan, mengambil kesempatan daripada seni bina Transformer dan pembangunan pesat model bahasa besar untuk menambah baik penjujukan peptida de novo spektrum MS/MS.

Senario aplikasi:

Paleoproteomics

Perubatan forensik
  • Astrobiologi
  • Pengesanan peptida
  • piawaian
  • carian pangkalan data
  • pemprosesan pangkalan data
  • Penjujukan antibodi

Casanovo belum namun meneroka penggunaan penjujukan antibodi. Walau bagaimanapun, kajian oleh kumpulan Denis Beslic di BAM di Jerman menjalankan perbandingan sistematik enam alat penjujukan de novo, termasuk Casanovo, mengenai isu penjujukan antibodi.

Grafik: Pengingatan keseluruhan dan ketepatan Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam

Novor, pNovo 3, DeepNovo, SMSNet, PointNovo dan Casanovo untuk enzim berbeza pada IgG1-Human-HC.

Pautan berkaitan:

https://academic.oup.com/bib/article/24/1/bbac542/6955273?login=false
Keputusan:

Casanovo dengan ketara mengatasi kaedah bersaing pada semua metrik yang dipertimbangkan. Perlu diingat bahawa perbandingan ini menggunakan versi penyahkodan rakus Casanovo dan dilatih hanya pada 2 juta spektrum.

Penilaian:

Pasukan Casanovo menanda aras Casanovo merentas sembilan spesies. Graf di bawah menunjukkan bahawa versi terkini Casanovo yang dilatih dengan 30 juta spektrum menghasilkan prestasi penjujukan antibodi yang lebih baik.

Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam

Grafik: Casanovo mengatasi model seperti PointNovo, DeepNovo dan Novor pada sembilan penanda aras spesies. (Sumber: kertas)

Pada masa hadapan, terdapat banyak peluang untuk memperhalusi model Casanovo untuk aplikasi tertentu. Analisis penyelidik terhadap model bukan enzim menunjukkan bahawa bias enzimatik Casanovo boleh diselaraskan dengan menggunakan data latihan yang agak sedikit.

Jadi, dalam jangka pendek, pasukan merancang untuk melatih varian Casanovo yang berfungsi pada pelbagai enzim litik yang berbeza. Perisian Casanovo memudahkan penalaan halus ini, jadi mana-mana pengguna yang berminat untuk menyesuaikan model kepada persediaan percubaan tertentu seharusnya boleh berbuat demikian.

Dalam jangka panjang, model ideal mengambil sebagai spektrum input bersama-sama dengan metadata yang berkaitan (seperti enzim pencernaan, tenaga perlanggaran dan jenis instrumen) dan meramalkan dengan tepat pelbagai jenis persediaan percubaan.

Potensi kaedah pembelajaran mendalam untuk meningkatkan keupayaan penjujukan de novo kini diiktiraf secara meluas. Semasa kertas ini disemak, sekurang-kurangnya enam kaedah penjujukan de novo pembelajaran mendalam lain telah diterbitkan, termasuk GraphNovo, PepNet, Denovo-GCN, Spectralis, π-HelixNovo, dan NovoB. Jelas sekali, bidang ini akan mendapat manfaat daripada penanda aras yang komprehensif dan ketat bagi bidang alat yang semakin berkembang ini.

Sehubungan itu, salah satu kesesakan utama dalam bidang pada peringkat ini ialah kekurangan kaedah penilaian keyakinan yang ketat untuk penjujukan de novo.

Dalam analisis metaproteomik, penyelidik memadankan ramalan Casanovo dengan pangkalan data sasaran dan peptida umpan yang sepadan, tetapi pendekatan ini mengabaikan keupayaan penjujukan de novo untuk menetapkan peptida kepada profil eksotik.

Oleh itu, persoalan terbuka ialah sama ada Casanovo mengatasi prosedur carian pangkalan data standard dari segi kuasa statistik untuk mengesan peptida bagi set data pemerolehan bergantung kepada data tertentu.

Para penyelidik mengatakan bahawa latihan dengan set latihan yang cukup besar mungkin dapat menamatkan dominasi carian pangkalan data dalam bidang analisis data spektrometri jisim tandem DDA.

Pautan kertas: https://www.nature.com/articles/s41467-024-49731-x

Atas ialah kandungan terperinci Prestasi SOTA, Universiti Washington membangunkan model Transformer untuk menukar spektrum jisim kepada jujukan peptida, diterbitkan dalam sub-jurnal Alam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn