Maison  >  Article  >  Périphériques technologiques  >  Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanopores

Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanopores

王林
王林original
2024-07-19 14:55:29572parcourir

Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanopores

Éditeur | La peau de radis

La méthylation de l'ADN joue un rôle important dans divers processus biologiques, notamment la différenciation cellulaire, le vieillissement et le développement du cancer. La méthylation la plus importante chez les mammifères est la 5-méthylcytosine, qui se produit principalement dans le contexte des dinucléotides CpG. Les méthodes de séquençage telles que le

Séquençage au bisulfite du génome entier peuvent détecter avec succès les modifications de l'ADN de la 5-méthylcytosine. Cependant, ils souffrent du sérieux inconvénient de courtes longueurs de lecture, qui peuvent introduire un biais d’amplification.

Des chercheurs de Singapour A*STAR ont développé un algorithme d'apprentissage profond Rockfish qui améliore considérablement le niveau de lecture de la 5-méthylcytosine en utilisant le Oxford Nanopore Sequencing (ONT) la capacité de détection de la pyrimidine.

L'étude s'intitulait « Rockfish : A transformer-based model for precise 5-methylcytosine retention from nanopore sequencing » et a été publiée dans « Nature Communications » le 3 juillet 2024.

Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanopores

Compte tenu de la nécessité d'une méthode de prédiction du niveau de lecture très précise, les chercheurs ont entrepris de développer une nouvelle méthode d'apprentissage en profondeur de pointe utilisant des transformateurs d'architecture moderne. Leur méthode, Rockfish, s'appuie sur le signal brut des nanopores, la séquence de nucléobases et les informations d'alignement pour détecter les modifications de 5 mC.

Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanopores

Illustration : Présentation de l'architecture du Rockfish. (Source : article)

Les chercheurs ont entraîné le modèle à l'aide d'ensembles de données humaines et murines de haute qualité et l'ont testé sur plusieurs ensembles de données R9.4.1 et R10.4.1, notamment :

  1. R9.4.1 H1 séquencé en interne Ensemble de données natif de cellules souches embryonnaires (H1ESc)
  2. Données néonatales R9.4.1 et R10.4.1 de souris (C57BL/6 néonatales)
  3. Certains ensembles de données sur le cancer et le sang humains accessibles au public

Étant donné que R9.4.1 et R10.4.1 NA12878 ainsi que des ensembles de données de souris néonatales ont été utilisés pour l'évaluation, les chercheurs ont souligné les versions de puits pour les distinguer. Les ensembles de données restants ont été séquencés en utilisant uniquement la version de puits R9.4.1.

Évaluation approfondie des modèles Rockfish et comparaisons avec les outils suivants :

  • Megalodon Remora, Megalodon Rerio et Nanopolish pour l'ensemble de données R9.4.1
  • Remora pour l'ensemble de données R10.4.1

La comparaison comprend :

    Prévision au niveau de la lecture
  1. Prévision au niveau du site
  2. Corrélation au niveau du site avec WGBS
  3. Couverture des appels
  4. Temps d'exécution
  5. Utilisation des ressources
  6. Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanoporesIllustration : évaluation au niveau de la lecture. (Source : Papier)

Précision de base unique et métrique F1 améliorées jusqu'à 5 points de pourcentage sur l'ensemble de données R.9.4.1 et jusqu'à 0,82 points de pourcentage sur l'ensemble de données R10.4.1.

De plus, Rockfish présente une forte corrélation avec le séquençage du bisulfite du génome entier, nécessite une profondeur de lecture plus faible et est efficace sur le plan informatique avec une plus grande confiance dans les régions biologiquement importantes telles que les promoteurs riches en CpG.

Ses excellentes performances dans les échantillons humains et murins mettent en évidence sa polyvalence dans l’étude de la méthylation de la 5-méthylcytosine dans différents organismes et maladies. Enfin, son architecture adaptable garantit la compatibilité avec les nouvelles versions de pores, de produits chimiques et de types de modifications.

Une nouvelle méthode basée sur un transformateur prédit avec précision la méthylation de l’ADN à partir du séquençage des nanopores

Illustration : Analyse de corrélation entre les outils basés sur ONT et WGBS. (Source : Paper)

Malgré cela, Rockfish est actuellement incapable de faire la distinction entre la méthylation de 5 mC et de 5 hmC, en raison du manque d'ensembles de données de contrôle de haute qualité pour d'autres types de modifications. Il y a encore place à l’amélioration de l’efficacité informatique du modèle, et l’efficacité devrait être améliorée grâce à l’optimisation de l’architecture et de l’ingénierie à l’avenir.

Rockfish a démontré sa capacité à extraire des informations de méthylation à partir de signaux bruts ONT, avec son petit modèle plus performant et prenant des temps d'exécution plus courts sur tous les ensembles de données, démontrant les avantages de données supplémentaires et de distillation de connaissances.

La modification de 5mC est liée à une variété de phénomènes biologiques, tels que la régulation transcriptionnelle, la maladie, le vieillissement, etc. Par conséquent, il est crucial de comprendre en profondeur le rôle de la méthylation de l'ADN grâce à la détection par résolution d'une seule base, ce qui peut aider à la prévention des maladies. Diagnostic précoce et sélection de la stratégie de traitement. L'architecture de Rockfish le rend facilement évolutif pour détecter divers types de modifications de l'ADN et de l'ARN.

Lien papier : https://www.nature.com/articles/s41467-024-49847-0

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn