Heim >Technologie-Peripheriegeräte >KI >Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus

Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus

王林
王林Original
2024-07-19 14:55:29622Durchsuche

Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus

Herausgeber |. Rettichschale

DNA-Methylierung spielt eine wichtige Rolle bei verschiedenen biologischen Prozessen, einschließlich Zelldifferenzierung, Alterung und Krebsentstehung. Die wichtigste Methylierung bei Säugetieren ist 5-Methylcytosin, die hauptsächlich im Zusammenhang mit CpG-Dinukleotiden auftritt. Sequenzierungsmethoden wie die

Whole-genome bisulfit sequencing können 5-Methylcytosin-DNA-Modifikationen erfolgreich nachweisen. Allerdings haben sie den gravierenden Nachteil kurzer Leselängen, die zu einer Verstärkungsverzerrung führen können.

Forscher von Singapore A*STAR haben einen Deep-Learning-Algorithmus Rockfish entwickelt, der den Lesepegel von 5-Methylcytosin mithilfe der Pyrimidin-Nachweisfunktion Oxford Nanopore Sequencing (ONT) deutlich verbessert.

Die Studie trug den Titel „Rockfish: Ein transformatorbasiertes Modell zur genauen 5-Methylcytosin-Vorhersage aus Nanoporensequenzierung“ und wurde am 3. Juli 2024 in „Nature Communications“ veröffentlicht.

Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus

Angesichts des Bedarfs an einer hochpräzisen Methode zur Vorhersage des Leseniveaus machten sich Forscher daran, eine neue, hochmoderne Deep-Learning-Methode unter Verwendung moderner Architekturtransformatoren zu entwickeln. Ihre Methode, Rockfish, basiert auf rohen Nanoporensignalen, Nukleobasensequenzen und Ausrichtungsinformationen, um 5mC-Modifikationen zu erkennen.

Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus

Abbildung: Überblick über die Rockfish-Architektur. (Quelle: Papier)

Die Forscher trainierten das Modell mithilfe hochwertiger Mensch- und Maus-Datensätze und testeten es an mehreren R9.4.1- und R10.4.1-Datensätzen, darunter:

  1. Intern sequenziertes R9.4.1 H1 Nativer Datensatz mit embryonalen Stammzellen (H1ESc). Zur Auswertung wurden NA12878- sowie neonatale Mausdatensätze verwendet, die Forscher wiesen auf die Well-Versionen hin, um sie zu unterscheiden. Die übrigen Datensätze wurden nur mit der Bohrlochversion R9.4.1 sequenziert.
  2. Umfangreiche Auswertung von Rockfish-Modellen und Vergleiche mit den folgenden Tools:

Megalodon Remora, Megalodon Rerio und Nanopolish für R9.4.1-Datensatz

Remora für R10.4.1-Datensatz

Der Vergleich umfasst:
  • Vorhersage auf Leseebene
Vorhersage auf Site-Ebene

Korrelation auf Site-Ebene mit WGBS

Anrufabdeckung
  1. Ausführungszeit
  2. Ressourcennutzung
  3. Abbildung: Auswertung auf Leseebene. (Quelle: Paper)
  4. Einzelbasisgenauigkeit und F1-Metrik verbesserten sich um bis zu 5 Prozentpunkte beim R.9.4.1-Datensatz und um bis zu 0,82 Prozentpunkte beim R10.4.1-Datensatz.
  5. Darüber hinaus weist Rockfish eine hohe Korrelation mit der Bisulfitsequenzierung des gesamten Genoms auf, erfordert eine geringere Lesetiefe und ist rechnerisch effizienter mit höherer Sicherheit in biologisch wichtigen Regionen wie CpG-reichen Promotoren.

    Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus Seine hervorragende Leistung in menschlichen und Mausproben unterstreicht seine Vielseitigkeit bei der Untersuchung der 5-Methylcytosin-Methylierung in verschiedenen Organismen und Krankheiten. Schließlich gewährleistet seine anpassungsfähige Architektur die Kompatibilität mit neuen Versionen von Poren, Chemikalien und Modifikationstypen.

Abbildung: Korrelationsanalyse zwischen ONT-basierten Tools und WGBS. (Quelle: Paper)

Trotzdem ist Rockfish derzeit nicht in der Lage, zwischen 5mC- und 5hmC-Methylierung zu unterscheiden, da es an hochwertigen Kontrolldatensätzen für andere Arten von Modifikationen mangelt. Die Recheneffizienz des Modells kann noch verbessert werden, und es wird erwartet, dass die Effizienz in Zukunft durch Optimierung der Architektur und Technik verbessert wird.

Neue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus

Rockfish demonstrierte die Fähigkeit, Methylierungsinformationen aus ONT-Rohsignalen zu extrahieren, wobei sein kleines Modell eine bessere Leistung erbrachte und bei allen Datensätzen kürzere Laufzeiten benötigte, was die Vorteile zusätzlicher Daten und Wissensdestillation demonstrierte.

5mC-Modifikation hängt mit einer Vielzahl biologischer Phänomene zusammen, wie z. B. Transkriptionsregulation, Krankheit, Alterung usw. Daher ist es von entscheidender Bedeutung, die Rolle der DNA-Methylierung durch den Nachweis mit Einzelbasenauflösung genau zu verstehen, was hilfreich sein kann die Prävention von Krankheiten. Frühzeitige Diagnose und Auswahl der Behandlungsstrategie. Die Architektur von Rockfish macht es leicht skalierbar, um verschiedene Arten von DNA- und RNA-Modifikationen zu erkennen.

Papierlink: https://www.nature.com/articles/s41467-024-49847-0

Das obige ist der detaillierte Inhalt vonNeue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn