Maison >Périphériques technologiques >IA >Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies d'apprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies d'apprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

PHPz
PHPzoriginal
2024-09-03 22:01:32525parcourir

Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies dapprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

La recherche sur le séquençage de cellules uniques a marqué le début d'une percée

Modifier | Peau de radis

Cellule unique le séquençage est devenu un outil puissant pour démêler la complexité cellulaire de maladies complexes. Cependant, son coût élevé limite son application à grande échelle dans la recherche biomédicale.

Les méthodes traditionnelles de déconvolution cellulaire peuvent déduire les proportions des types de cellules à partir de données de séquençage en masse moins chères, mais ne peuvent pas fournir la résolution fine requise pour l'analyse d'une seule cellule.

Pour relever ce défi, des chercheurs de l'Université McGill au Canada ont développé « scSemiProfiler », qui combine des modèles génératifs profonds avec des stratégies d'apprentissage actif pour créer un cadre informatique innovant.

scSemiProfiler est très précis et capable de déduire des profils unicellulaires dans de grandes populations. Il peut être étroitement intégré à de véritables données d’analyse unicellulaire pour prendre en charge l’analyse cellulaire fine.

La recherche s'intitule « scSemiProfiler : Advancing large-scale single-cell Studies through semi-profiling with deep générative models and active learning » et a été publiée dans le magazine « Nature Communications » le 16 juillet 2024.

Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies dapprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

La technologie de séquençage unicellulaire et ses limites

La technologie de séquençage unicellulaire a considérablement changé la recherche biologique, révélant les différences subtiles entre les cellules et favorisant la découverte de biomarqueurs et le développement de stratégies de traitement personnalisées. Cependant, le coût élevé du séquençage d’une seule cellule (par exemple, le coût du séquençage de 20 000 cellules est estimé à 6 000 $ en 2023) limite ses recherches à grande échelle.

Méthodes de déconvolution

Pour réduire les coûts, il existe de nombreuses méthodes de déconvolution qui peuvent résoudre les populations cellulaires dans des données mixtes, notamment :

  • CIBERSORTx
  • Bisque
  • DWLS
  • MuSiC
  • NNLS
  • EPIC
  • Scaden
  • TAPE

Ces méthodes établissent un équilibre entre économie et résolution des données, mais présentent toujours des limites en termes de résolution et de précision et ne peuvent pas réaliser une analyse au niveau d'une seule cellule.

Analyse de résolution unicellulaire

L'analyse de résolution unicellulaire est essentielle pour une compréhension approfondie de la complexité de la maladie et de sa réponse au traitement. Il peut effectuer les analyses suivantes :

  • UMAP
  • Analyse des modèles d'activation des voies
  • Découverte de biomarqueurs
  • Enrichissement fonctionnel des gènes
  • Interaction cellule-cellule
  • Analyse de trajectoire pseudo-temporelle

Combinée à la technologie d'apprentissage automatique, elle permet de décoder l'hétérogénéité cellulaire et les changements dynamiques.

scSemiProfiler

Pour relever les défis ci-dessus et fournir une méthode rentable de séquençage unicellulaire à grande échelle, une équipe de recherche de l'Université McGill a lancé le Cellule Semi-profileur (scSemiProfiler). Cet outil informatique générateur de profondeur est conçu pour augmenter considérablement la précision et la profondeur de l’analyse monocellulaire.

Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies dapprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

Illustration : Présentation de la méthode scSemiProfiler (Source : papier)

Aperçu
scSemiProfiler est une solution plus économique et plus évolutive options de séquençage unicellulaire pour faciliter l’analyse avancée d’une seule cellule avec une plus grande accessibilité.

Méthodes
Cet outil combine efficacement des techniques d'apprentissage actif avec des algorithmes de réseaux neuronaux génératifs profonds, dans le but de fournir des données de résolution unicellulaire à un prix plus abordable. scSemiProfiler vise à atteindre simultanément deux objectifs fondamentaux dans le processus semi-profilé :

Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies dapprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

Illustration : Comparaison globale du semi-profilé et du profil réel sur l'ensemble de données COVID-19. (Source : article)
  1. Le module d'apprentissage actif de scSemiProfiler intègre des informations provenant de modèles d'apprentissage en profondeur et de grandes quantités de données pour sélectionner intelligemment les échantillons les plus informatifs pour le séquençage réel d'une seule cellule.
  2. Le composant de modèle génératif profond de scSemiProfiler fusionne efficacement les données unicellulaires d'un échantillon représentatif avec des données de séquençage en masse pour cette population, extrapolant informatiquement les données unicellulaires pour les échantillons non représentatifs restants.

    Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies dapprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

    1. Illustration : Analyse comparative des profils semi-profilés et réels dans l'ensemble de données iMGL. (Source : article)
  3. Cette méthode de réseau neuronal profond peut « déconvolutionner » les données de lots cibles en mesures précises au niveau d'une seule cellule, plus en détail. Par conséquent, scSemiProfiler n’a besoin que de budgétiser le séquençage par lots et le séquençage représentatif d’une seule cellule pour générer des données unicellulaires pour tous les échantillons de l’étude.
  4. À ce jour, scSemiProfiler est le premier produit de ce type conçu spécifiquement pour une décomposition informatique aussi complexe au niveau d'une seule cellule à partir de grandes quantités de données de séquençage.

    Des modèles génératifs profonds à plus haute résolution, plus économiques, combinés à des stratégies dapprentissage actif pour faire progresser la recherche sur une seule cellule à grande échelle

    Illustration : L’apprentissage actif démontre sa capacité à analyser sélectivement les échantillons les plus informatifs au niveau d’une seule cellule. (Source : article)

Grâce à une évaluation complète sur une variété d'ensembles de données, scSemiProfiler génère systématiquement des données unicellulaires semi-profilées qui sont étroitement corrélées aux ensembles de données unicellulaires réels et reflètent avec précision les résultats des tâches en aval. .

ScSemiProfiler contribue donc à améliorer l'acquisition de données unicellulaires pour les études à grande échelle, y compris les études de cohortes de maladies et bien plus encore.

En réduisant le coût de la recherche unicellulaire à grande échelle, scSemiProfiler devrait faciliter l'application de la technologie unicellulaire dans un large éventail de recherches biomédicales. Cette avancée élargira la portée et améliorera la profondeur de la recherche biologique.

Lien papier :
https://www.nature.com/articles/s41467-024-50150-1

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn