Maison >Périphériques technologiques >IA >En générant 394 760 représentations de protéines, l'équipe de Harvard développe un modèle d'IA pour comprendre pleinement le contexte des protéines
Comprendre la fonction des protéines et développer des thérapies moléculaires nécessite d'identifier les types de cellules dans lesquelles les protéines jouent un rôle et d'analyser les interactions entre protéines.
Cependant, la modélisation des interactions protéiques dans des contextes biologiques reste un défi pour les algorithmes existants.
Dans la dernière étude, des chercheurs de la Harvard Medical School ont développé PINNACLE, une méthode d'apprentissage profond géométrique permettant de générer des représentations protéiques contextuelles.
PINNACLE exploite des atlas multi-organes unicellulaires pour apprendre sur les réseaux d'interactions protéiques contextualisés, générant 394 760 représentations protéiques à partir de 156 contextes de types de cellules dans 24 tissus.
L'étude s'intitulait « Modèles d'IA contextuels pour la biologie des protéines unicellulaires » et a été publiée dans « Nature Methods » le 22 juillet 2024.
Fonction et réseau des protéinesFonction des protéines dépendante du contexte
Réseau d'expression génique et de protéines unicellulaires
PINNACLE MODEL
Illustration : Aperçu de PINNACLE. (Source : article)
2. Représentation contextuelle des protéines
PINNACLE est formé sur un réseau PPI contextuel intégré, complété par un réseau qui capture les interactions cellulaires et les hiérarchies tissulaires, pour générer des représentations protéiques personnalisées pour les types de cellules.
3. Représentation multi-échelle
Contrairement aux modèles sans contexte, PINNACLE génère plusieurs représentations pour chaque protéine, en fonction de son contexte de type cellulaire. De plus, PINNACLE génère un contexte de type cellulaire et des représentations au niveau des tissus.
4. Apprentissage multi-échelle
PINNACLE apprend la topologie des protéines, des types de cellules et des tissus en optimisant un espace de représentation latente unifié.
5. Modèles contextuels
PINNACLE intègre des données spécifiques au contexte dans un modèle unique et transfère les connaissances entre les données sur les protéines, les types de cellules et les tissus.
6. Espace d'intégration
Pour injecter des informations cellulaires et tissulaires dans l'espace d'intégration, PINNACLE emploie une attention particulière aux protéines, au type de cellule et au niveau des tissus.
7. Cartographie des interactions physiques
Les paires de protéines en interaction physique sont étroitement intégrées dans l'espace d'intégration.
8. Environnement de type cellulaire
Les protéines sont intégrées à proximité de leur environnement de type cellulaire.
9. Propagation du réseau neuronal graphique
PINNACLE propage les informations entre les protéines, les types de cellules et les tissus en utilisant un mécanisme d'attention personnalisé pour chaque nœud et type de bord.
Illustration : Enrichissement des régions incorporées aux protéines PINNACLE. (Source : article) Les tâches de pré-entraînement au niveau des protéines prennent en compte la prédiction de lien auto-supervisée des interactions protéiques et la classification des types cellulaires des nœuds protéiques. Ces tâches permettent à PINNACLE de façonner un espace d'intégration qui encapsule la topologie des réseaux d'interaction protéique contextuels et l'identité du type cellulaire des protéines. Les tâches de pré-entraînement de type cellulaire et spécifiques aux tissus deCe qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!