Rumah >Peranti teknologi >AI >Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore

Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore

王林
王林asal
2024-07-19 14:55:29627semak imbas

Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore

Editor |. Kulit lobak

Metilasi DNA memainkan peranan penting dalam pelbagai proses biologi, termasuk pembezaan sel, penuaan dan perkembangan kanser. Metilasi yang paling penting dalam mamalia ialah 5-methylcytosine, yang berlaku terutamanya dalam konteks dinukleotida CpG. Kaedah penjujukan seperti

Penjujukan bisulfit genom keseluruhan boleh berjaya mengesan pengubahsuaian DNA 5-metilcytosine. Walau bagaimanapun, mereka mengalami kelemahan serius panjang bacaan pendek, yang mungkin memperkenalkan bias amplifikasi.

Penyelidik di Singapura A*STAR telah membangunkan algoritma pembelajaran mendalam Rockfish yang meningkatkan dengan ketara tahap bacaan 5-methylcytosine dengan menggunakan Oxford Nanopore Sequencing (ONT) keupayaan pengesanan pirimidin.

Kajian itu bertajuk "Rockfish: Model berasaskan transformer untuk ramalan 5-metilcytosine yang tepat daripada penjujukan nanopori" dan diterbitkan dalam "Nature Communications" pada 3 Julai 2024.

Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore

Memandangkan keperluan untuk kaedah ramalan tahap bacaan yang sangat tepat, penyelidik berusaha untuk membangunkan kaedah pembelajaran mendalam baharu yang terkini menggunakan Transformers seni bina moden. Kaedah mereka, Rockfish, bergantung pada isyarat nanopore mentah, jujukan nukleobase, dan maklumat penjajaran untuk mengesan pengubahsuaian 5mC.

Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore

Ilustrasi: Gambaran keseluruhan seni bina Rockfish. (Sumber: Kertas)

Para penyelidik melatih model menggunakan set data manusia dan tetikus berkualiti tinggi dan mengujinya pada berbilang set data R9.4.1 dan R10.4.1, termasuk:

  1. Jujukan dalaman R9.4.1 H1 set data asli sel stem embrio (H1ESc)
  2. R9.4.1 dan R10.4.1 tetikus neonatal (C57BL/6 neonatal)
  3. Beberapa set data kanser manusia dan darah yang tersedia secara terbuka

Memandangkan kedua-dua R9.0.4 dan R9.04.1 NA12878 serta set data tetikus neonatal digunakan untuk penilaian, para penyelidik menunjukkan versi telaga untuk membezakannya. Set data yang selebihnya telah disusun menggunakan hanya versi telaga R9.4.1. .

Ramalan peringkat baca Ramalan peringkat tapak

    Korelasi peringkat tapak dengan WGBS
  • Liputan panggilan
  • Masa pelaksanaan

Penggunaan sumber Penilaian sumber

    (Sumber: Kertas)
  1. Ketepatan asas tunggal dan metrik F1 dipertingkatkan sehingga 5 mata peratusan pada set data R.9.4.1 dan sehingga 0.82 mata peratusan pada set data R10.4.1.
  2. Selain itu, Rockfish mempamerkan korelasi yang tinggi dengan penjujukan bisulfit genom keseluruhan, memerlukan kedalaman bacaan yang lebih rendah, dan cekap dari segi pengiraan dengan keyakinan yang lebih tinggi di kawasan yang penting dari segi biologi seperti promoter yang kaya dengan CpG.
  3. Prestasi cemerlangnya dalam sampel manusia dan tetikus menyerlahkan kepelbagaiannya dalam mengkaji metilasi 5-metilcytosine dalam organisma dan penyakit yang berbeza. Akhir sekali, seni bina yang boleh disesuaikan memastikan keserasian dengan versi baru liang dan kimia dan jenis pengubahsuaian.
  4. Ilustrasi: Analisis korelasi antara alatan berasaskan ONT dan WGBS. (Sumber: Kertas)

    Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore

  5. Walau bagaimanapun, Rockfish pada masa ini tidak dapat membezakan antara metilasi 5mC dan 5hmC, kerana kekurangan set data kawalan berkualiti tinggi untuk jenis pengubahsuaian lain. Masih terdapat ruang untuk penambahbaikan dalam kecekapan pengiraan model, dan kecekapan dijangka akan dipertingkatkan melalui pengoptimuman seni bina dan kejuruteraan pada masa hadapan.

Rockfish menunjukkan keupayaan untuk mengekstrak maklumat metilasi daripada isyarat mentah ONT, dengan model kecilnya berprestasi lebih baik dan mengambil masa larian yang lebih pendek pada semua set data, menunjukkan faedah data tambahan dan penyulingan pengetahuan.

Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore Pengubahsuaian 5mC berkaitan dengan pelbagai fenomena biologi, seperti peraturan transkrip, penyakit, penuaan, dll. Oleh itu, adalah penting untuk memahami secara mendalam peranan metilasi DNA melalui pengesanan resolusi asas tunggal, yang mungkin membantu dalam pencegahan penyakit dan pemilihan strategi rawatan awal. Seni bina Rockfish menjadikannya mudah berskala untuk mengesan pelbagai jenis pengubahsuaian DNA dan RNA.

Pautan kertas: https://www.nature.com/articles/s41467-024-49847-0

Atas ialah kandungan terperinci Kaedah berasaskan Transformer baharu dengan tepat meramalkan metilasi DNA daripada penjujukan nanopore. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn