Maison >Périphériques technologiques >IA >30 fois plus élevé que les méthodes traditionnelles, le modèle d'apprentissage profond Transformer de l'équipe de l'Académie chinoise des sciences prédit les sites d'interaction sucre-protéine
Les saccharides sont les substances organiques les plus abondantes dans la nature et sont vitales à la vie. Comprendre comment les glucides régulent les protéines au cours des processus physiologiques et pathologiques peut offrir la possibilité de répondre à des questions biologiques clés et de développer de nouveaux traitements.
Cependant, la diversité et la complexité des molécules de sucre posent un défi pour identifier expérimentalement les sites de liaison et d'interaction sucre-protéine.
Ici, une équipe de l'Académie chinoise des sciences a développé DeepGlycanSite, un modèle d'apprentissage profond capable de prédire avec précision les sites de liaison du sucre sur une structure protéique donnée.
DeepGlycanSite intègre les caractéristiques géométriques et évolutives des protéines dans un réseau neuronal à graphe équivariant profond avec une architecture Transformer. Ses performances dépassent considérablement les méthodes avancées précédentes et peuvent prédire efficacement les sites de liaison de diverses molécules de sucre.
Combiné à des études de mutagenèse, DeepGlycanSite révèle le site de reconnaissance de la guanosine-5'-bisphosphate d'importants récepteurs couplés aux protéines G.
Ces résultats démontrent la valeur de DeepGlycanSite pour la prédiction du site de liaison du sucre et peuvent fournir des informations sur les mécanismes moléculaires derrière la régulation du sucre des protéines d'importance thérapeutique.
L'étude s'intitulait « Prédiction très précise du site de liaison des glucides avec DeepGlycanSite » et a été publiée dans « Nature Communications » le 17 juin 2024.
Le sucre est omniprésent à la surface des cellules de tous les organismes. Il interagit avec une variété de familles de protéines telles que les lectines, les anticorps, les enzymes et les transporteurs pour réguler des processus biologiques clés tels que la réponse immunitaire, la différenciation cellulaire et le développement neuronal. Comprendre le mécanisme d’interaction entre les glucides et les protéines constitue la base du développement de médicaments à base de glucides.
Cependant, la diversité et la complexité des structures glucidiques, en particulier la variabilité de leurs sites de liaison avec les protéines, posent des défis à l'acquisition de données expérimentales et à la conception de médicaments.
Illustration : La complexité des molécules de sucre et la diversité des sites de liaison des sucres. (Source : article)
Dans le passé, les méthodes traditionnelles de prédiction des sites de liaison n'étaient pas adaptées aux molécules de sucre présentant des structures complexes et des changements de taille importants. Ceci, combiné à la rareté des données structurelles complexes sucre-protéine à haute résolution, limite les performances des modèles prédictifs.
Ces dernières années, avec le développement rapide de la Protein Data Bank (PDB) et des ressources ouvertes en glycomique, la communauté universitaire a accumulé des données structurelles sur plus de 19 000 de ces complexes. L’augmentation de ces données de haute qualité permet d’utiliser la technologie de l’IA pour développer des modèles précis de prédiction des sites de liaison du sucre, ce qui devrait accélérer le processus de découverte et d’optimisation des médicaments à base de sucre.
Dans la dernière recherche, l'équipe de l'Académie chinoise des sciences a introduit DeepGlycanSite, un modèle de réseau neuronal à graphique équivariant profond (EGNN) qui peut prédire avec précision les sites de liaison du sucre avec les structures protéiques cibles.
Illustration : Présentation de DeepGlycanSite. (Source : article)
L'équipe a exploité des caractéristiques géométriques, telles que l'orientation et la distance à l'intérieur et entre les résidus, ainsi que des informations évolutives pour présenter les protéines sous forme de représentations graphiques au niveau des résidus dans DeepGlycanSite. Combiné avec des blocs Transformer avec un mécanisme d'auto-attention pour améliorer l'extraction de fonctionnalités et la découverte de relations complexes.
Les chercheurs ont comparé DeepGlycanSite aux méthodes informatiques de pointe actuelles sur un ensemble de tests indépendants impliquant plus d'une centaine de protéines uniques liant le sucre.
Les résultats montrent que le coefficient de corrélation de Matthews (MCC) moyen de DeepGlycanSite (0,625) est plus de 30 fois supérieur à celui de StackCBPred (0,018) et dépasse de loin les autres méthodes de prédiction basées sur des séquences.
Les méthodes traditionnelles de liaison des ligands peuvent exclure les sites de liaison des molécules de sucre simples en raison de leur hydrophobie ou de leur petite taille, tandis que DeepGlycanSite peut identifier efficacement ces sites.
Illustration : Comparaison des performances du modèle dans la prédiction de différents sites de liaison du sucre. (Source : article)
De plus, DeepGlycanSite fonctionne également bien dans la prédiction de plusieurs sites de liaison du sucre sur les protéines, ce qui est d'une grande valeur pour comprendre comment les glycoconjugués multivalents affectent les interactions sucre-protéine et la régulation des processus biologiques. Par exemple, les glycoconjugués multivalents sont conçus comme des outils chimiques et des médicaments candidats pour influencer l’interaction entre les molécules de sucre et les lectines.
Différent des méthodes traditionnelles qui utilisent uniquement la séquence protéique ou les informations structurelles, DeepGlycanSite prend pleinement en compte les informations géométriques et les caractéristiques évolutives de la protéine, qui peuvent être le facteur clé de ses excellentes performances.
De plus, étant donné la structure chimique d'une molécule de sucre recherchée, DeepGlycanSite peut prédire son site de liaison spécifique.
Illustration : Interrogez la prédiction de sites de liaison spécifiques des sucres. (Source : article)
Les chercheurs ont exploré l'application de DeepGlycanSite aux récepteurs couplés aux protéines G (GPCR) fonctionnellement importants. En utilisant la structure protéique et la structure chimique des glucides prédites par AlphaFold2, DeepGlycanSite a détecté avec succès le site de liaison spécifique du GDP-Fuc sur le P2Y14 humain.
Bien que la qualité des chaînes latérales prédites d'AlphaFold2 doive être améliorée, DeepGlycanSite s'appuie moins sur la précision de la structure des protéines et est capable d'utiliser les structures protéiques prédites pour fournir des informations sur les interactions sucre-protéine.
En résumé, la validation de DeepGlycanSite dans des ensembles de tests indépendants et des études de cas in vitro montre qu'il s'agit d'un outil efficace pour la prédiction du site de liaison du sucre. Les chercheurs peuvent utiliser DeepGlycanSite pour prédire les poches de liaison au sucre sur les protéines cibles, faisant ainsi progresser la compréhension des interactions sucre-protéine.
Les saccharides jouent un rôle clé dans les fonctions biologiques. DeepGlycanSite aide non seulement à analyser les fonctions biologiques des molécules de sucre et des protéines liant le sucre, mais fournit également un outil puissant pour le développement de médicaments à base de sucre.
Lien papier :https://www.nature.com/articles/s41467-024-49516-2
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!