Rumah  >  Artikel  >  Peranti teknologi  >  Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

WBOY
WBOYasal
2024-08-06 08:31:22416semak imbas

Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

Editor |. Kulit lobak

Glikosilasi protein ialah pengubahsuaian selepas terjemahan protein oleh kumpulan gula, yang memainkan peranan penting dalam pelbagai fungsi fisiologi dan patologi sel.

Glycoproteomics ialah kajian glikosilasi protein dalam proteom, menggunakan kromatografi cecair ditambah dengan teknologi spektrometri jisim tandem (MS/MS) untuk mendapatkan maklumat gabungan tentang tapak glikosilasi, tahap glikosilasi dan struktur gula.

Walau bagaimanapun, kaedah carian pangkalan data semasa untuk glikoproteomik sering mengalami kesukaran untuk menentukan struktur glycan disebabkan oleh kejadian terhad ion penentu struktur. Walaupun kaedah carian spektrum boleh mengeksploitasi intensiti pemecahan untuk memudahkan pengenalpastian struktur glikopeptida, kesukaran dalam pembinaan perpustakaan spektrum menghalang penggunaannya.

Dalam kajian terkini, penyelidik dari Universiti Fudan mencadangkan DeepGP, rangka kerja pembelajaran mendalam hibrid berdasarkan Transformer dan rangkaian saraf graf, untuk meramalkan spektrum MS/MS dan masa pengekalan (RT) glikopeptida.

Dua modul rangkaian saraf graf digunakan untuk menangkap struktur gula bercabang dan masing-masing meramal kekuatan ion gula. Selain itu, strategi pra-latihan telah dilaksanakan untuk mengurangkan kekurangan data glikoproteomik.

Kajian ini bertajuk "Ramalan pembelajaran mendalam tentang spektrum jisim tandem glikopeptida kuasa glikoproteomik" dan diterbitkan dalam "Kepintaran Mesin Alam" pada 30 Julai 2024.

Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

Pengubahsuaian pasca translasi (PTM) protein dengan ketara meningkatkan kerumitan proteom. Sebagai salah satu PTM yang paling penting, glikosilasi menjejaskan lebih daripada 50% protein mamalia dan memainkan peranan penting dalam banyak proses fisiologi dan patologi.

Semasa proses glikosilasi, molekul gula dilekatkan pada rantai sampingan sisa asid amino tertentu, mengakibatkan kepelbagaian struktur, mengakibatkan kepelbagaian isomer glikopeptida dan meningkatkan kesukaran pengecaman.

Kromatografi cecair spektrometri jisim tandem (LC-MS/MS) ialah teknik utama untuk mengenal pasti glikopeptida oleh ion serpihan dan berat molekul digabungkan dengan RT. Nisbah jisim kepada cas (m/z) sahaja tidak mencukupi untuk menentukan struktur gula, jadi saintis menggunakan kaedah padanan spektrum untuk meningkatkan sensitiviti pengenalan. Walau bagaimanapun, membina perpustakaan spektrum MS/MS glikopeptida adalah mahal dan kompleks.

Dalam beberapa tahun kebelakangan ini, pembelajaran mendalam telah mencapai kemajuan dalam ramalan spektrum MS/MS peptida. Walau bagaimanapun, bilangan set data glikopeptidomik semasa yang agak kecil dan kekurangan protokol piawai untuk menjana data spektrometri jisim glikopeptida mengehadkan ketersediaan data yang sesuai untuk latihan model pembelajaran mendalam.

Untuk tujuan ini, penyelidik dari Universiti Fudan mencadangkan DeepGP, rangka kerja hibrid hujung ke hujung berasaskan pembelajaran mendalam untuk spektrum MS/MS N-glikopeptida lengkap dan ramalan RT. Rangka kerja pembelajaran mendalam terdiri daripada modul Transformer terlatih dan dua modul rangkaian saraf graf (GNN).

Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

Ilustrasi: seni bina model dan ramalan spektrum MS/MS glikopeptida. Model DeepGP kedudukan Keadaan cas prekursor

    Gula struktur dibenamkan melalui GNN untuk menukar glikopeptida kepada graf:
  • Nod: Monosaccharide

      Ilustrasi: Membezakan komposisi glycan yang serupa pada set data sintetik berdasarkan DeepGP. (Sumber: Kertas)
    1. Dua modul GNN menangkap struktur gula dan meramalkan keamatan ion gula
    2. Penyelidik menilai tiga seni bina GNN, termasuk rangkaian konvolusi graf (GCN), rangkaian isomorfisme graf (GIN) dan rangkaian perhatian graf (GAT) untuk interkalasi gula dan ramalan keamatan ion B/Y.
    3. GCN menggunakan operasi lilitan untuk mendapatkan perwakilan nod dan melaksanakan protokol penghantaran mesej untuk mengagregat perwakilan nod bersebelahan GIN berprestasi baik dalam ujian isomorfisme graf yang menggabungkan mekanisme perhatian untuk membolehkan model memfokus pada bahagian input yang paling relevan; .
    4. Keputusan eksperimen menunjukkan bahawa GCN berprestasi terbaik dalam tugas pembenaman gula, manakala GIN berprestasi baik dalam tugas ramalan keamatan ion B/Y, jadi GCN dan GIN dipilih untuk analisis yang sepadan.
    5. Ilustrasi: Prestasi DeepGP dalam ramalan MS/MS. (Sumber: kertas)
  • Strategi pra-latihan untuk mengurangkan kekurangan data glikoproteomik

    • DeepGP menggunakan sejumlah besar data bahasa semula jadi yang tidak berlabel untuk pra-latihan, serupa dengan model seperti BERT. Pra-latihan membolehkan model mempunyai pangkalan pengetahuan sebelum latihan formal, dengan itu meningkatkan prestasinya dalam menangani data beranotasi berskala kecil.

      Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

      Ujian pada pelbagai set data biologi

    Para penyelidik menunjukkan ketepatan tinggi DeepGP dalam ramalan MS/MS dan RT menggunakan set data sampel tetikus dan manusia.

    Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam

    Ilustrasi: DeepGP digabungkan dengan pGlyco3 (kaedah carian glikopeptida) untuk pengenalpastian glikopeptida. (Sumber: Kertas)

    Penanda aras komprehensif DeepGP pada set data sintetik dan biologi mengesahkan keberkesanannya dalam membezakan glycans serupa. DeepGP digabungkan dengan carian pangkalan data meningkatkan sensitiviti pengesanan glikopeptida.

    Pautan kertas:
    https://www.nature.com/articles/s42256-024-00875-x

Atas ialah kandungan terperinci Kaedah baharu glikoproteomik, Fudan membangunkan rangka kerja hujung-ke-hujung hibrid berdasarkan Transformer dan GNN, diterbitkan dalam sub-jurnal Alam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn