Maison >Périphériques technologiques >IA >Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBoriginal: 2024-06-29 05:16:50784parcourir

Éditeur | Radis Skin

Dans le développement de médicaments, il est crucial de déterminer l'affinité de liaison et l'effet fonctionnel des ligands de petites molécules sur les protéines. Les méthodes informatiques actuelles peuvent prédire ces propriétés d’interaction protéine-ligand, mais sans structures protéiques à haute résolution, la précision est souvent perdue et les effets fonctionnels ne peuvent être prédits.

Des chercheurs de l'Université Monash et de l'Université Griffith ont développé PSICHIC (PhySIcoCHhemICal graph neural network), un cadre qui combine des contraintes physicochimiques pour décoder les empreintes digitales d'interaction directement à partir des données de séquence. Cela permet à PSICHIC de décoder les mécanismes à l’origine des interactions protéine-ligand, atteignant ainsi une précision et une interprétabilité de pointe.

Formé sur les mêmes paires protéine-ligand sans données structurelles, PSICHIC fonctionne à égalité, voire dépasse, les principales méthodes basées sur la structure dans les prédictions d'affinité de liaison.

Les empreintes digitales interprétables de PSICHIC identifient les résidus protéiques et les atomes de ligand impliqués dans les interactions et aident à révéler les déterminants de la sélectivité des interactions protéine-ligand.

La recherche s'intitulait « Réseau neuronal de graphes physicochimiques pour l'apprentissage des empreintes digitales d'interaction protéine-ligand à partir de données de séquence » et a été publiée dans « Nature Machine Intelligence » le 17 juin 2024.

Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

Défis liés à la prédiction de l'affinité protéine-ligand

Dans la découverte de médicaments, il est important de déterminer l'affinité de liaison et l'effet fonctionnel des ligands à petites molécules sur les protéines, car l'interaction sélective du ligand avec une protéine spécifique détermine l'effet attendu. effet du médicament.

Cependant, bien que les méthodes informatiques actuelles soient capables de prédire les propriétés d’interaction protéine-ligand, sans structures protéiques à haute résolution, la précision de la prédiction est souvent réduite et il existe également des difficultés à prédire les effets fonctionnels.

Bien que les méthodes basées sur les séquences soient plus avantageuses en termes de coût et de ressources (par exemple, aucun processus coûteux de détermination de structure expérimentale n'est requis), ces méthodes sont généralement confrontées au problème de degrés de liberté excessifs dans la correspondance de modèles, ce qui conduit facilement à un surajustement et capacités de généralisation limitées, créant ainsi un écart de performance par rapport aux méthodes basées sur la structure ou les composites.

Physical Chemistry Graph Neural Network

Une équipe de recherche de l'Université Monash et de l'Université Griffith a développé PSICHIC (Physical Chemistry Graph Neural Network), une méthode pour décoder directement les protéines-ligands à partir de données de séquence selon les principes physiques et chimiques des empreintes digitales d'interaction corporelle. méthode. Contrairement aux modèles précédents basés sur des séquences, PSICHIC intègre spécifiquement des contraintes physico-chimiques pour atteindre une précision et une interprétabilité de pointe.

En tant que méthode basée sur des séquences 2D, PSICHIC génère et impose ces contraintes sur un tracé 2D en appliquant un algorithme de clustering, permettant à PSICHIC de s'adapter principalement aux modèles rationnels sous-jacents qui déterminent les interactions protéine-ligand pendant l'entraînement.

Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

Validation et comparaison des performances

Après un entraînement sur les mêmes paires protéine-ligand sans données structurelles, PSICHIC rivalise ou même surpasse les méthodes de pointe basées sur la structure et les complexes dans les prédictions d'affinité de liaison.

Les résultats expérimentaux sur les ensembles de données PDBBind v2016 et PDBBind v2020 montrent que PSICHIC surpasse les autres méthodes basées sur des séquences, telles que TransCPI, MolTrans et DrugBAN, sur plusieurs indicateurs.

Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

Graphique : Résumé des statistiques de performances pour les prédictions d'affinité de liaison protéine-ligand sur les benchmarks PDBBind v2016 et PDBBind v2020. (Source : article)

Plus précisément, PSICHIC montre une erreur de prédiction plus faible et un indice de corrélation plus élevé, notamment en termes de précision de prédiction et de capacité de généralisation. PSICHIC atteint une précision allant jusqu'à 0,96 dans la prédiction des effets fonctionnels.

De plus, PSICHIC excelle dans l'identification des sites de liaison et des groupes fonctionnels clés du ligand. Dans l'analyse de plusieurs structures complexes protéine-ligand (telles que PDB 6K1S et 6OXV), PSICHIC a pu localiser avec précision d'importants résidus de liaison et des groupes fonctionnels de ligands, ce qui a validé sa capacité à décoder directement les protéines dans les données de séquence. ligands pour interagir les uns avec les autres. Cette capacité se reflète particulièrement dans sa capacité à prédire les sites de liaison protéine-ligand et les résidus clés à partir des données de séquence.

Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

1. Empreinte digitale interprétable de PSICHIC

Illustration : Dépistage virtuel par empreintes digitales interactives. (Source : article)

Fait intéressant, les empreintes digitales interprétables de PSICHIC montrent qu'il obtient la capacité de décoder le mécanisme sous-jacent des interactions protéine-ligand à partir des seules données de séquence, en identifiant les résidus protéiques du site de liaison et les atomes de ligand impliqués. Cela est vrai même lors d'un entraînement uniquement sur des données de séquence avec des étiquettes d'affinité de liaison et aucune information d'interaction.

Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.

Illustration : Analyse de sélectivité à l’aide d’empreintes digitales d’interaction. (Source : article) Les chercheurs ont utilisé PSICHIC pour sélectionner avec succès un nouvel agoniste du récepteur de l'adénosine A1 (la similarité de Tanimoto avec l'agoniste A1R connu le plus proche est de 0,2) et ont analysé les différences entre les sous-types de sélectivité du récepteur de l'adénosine.
Valeur
Les empreintes digitales des interactions protéine-ligand décrivent les caractéristiques des interactions spécifiques qui se produisent entre les ligands et les résidus protéiques. Traditionnellement, ces empreintes digitales sont dérivées de complexes protéine-ligand 3D, un processus coûteux qui, selon cet article, est sensible à la qualité de la résolution structurelle.
En revanche, PSICHIC utilise uniquement des données de séquence, offrant une approche unique pour obtenir des empreintes digitales d’interaction interprétables. En intégrant des contraintes, PSICHIC présente des capacités émergentes qui lui permettent de révéler les mécanismes d'interaction protéine-ligand et de prédire efficacement les propriétés d'interaction. PSYCHIC élimine le besoin de données 3D, ouvrant la voie à un apprentissage robuste sur des bases de données de séquences à grande échelle.
En guise de preuve de concept, l'équipe a démontré que PSICHIC peut sélectionner efficacement les candidats médicaments et effectuer des analyses de sélectivité. PSICHIC ne nécessite que des données de séquence pour fonctionner et a le potentiel de devenir un outil universellement utile dans la découverte de médicaments. Les chercheurs s'attendent à ce qu'il joue un rôle dans la conception de novo du ligand, dans lequel les empreintes digitales interprétables du PSICHIC peuvent être intégrées pour optimiser les structures moléculaires.
Perspectives futures
Actuellement, PSICHIC se limite à analyser les interactions protéine-ligand de protéines uniques. Les plans futurs incluent l'extension de son analyse aux complexes protéiques, tels que les GPCR complexés avec des protéines G hétérotrimériques, ce qui pourrait faciliter des études complètes de la dynamique protéine-ligand directement à partir des données de séquence.
De plus, les puissantes capacités d’apprentissage de PSICHIC à partir des données de séquence ouvrent la voie à l’exploration d’interactions complexes telles que la régulation allostérique, aidant à comprendre comment les ligands allostériques régulent les ligands orthostériques au sein des cibles protéiques.
L'équipe a mis ses données, son code et ses modèles d'optimisation à la disposition de la communauté scientifique au sens large. PSICHIC a prouvé sa robustesse et son efficacité dans divers domaines d'application, présente un large potentiel de développement futur et devrait avoir un impact significatif sur le domaine du criblage virtuel de composés et de la conception de thérapies innovantes à petites molécules.
Lien papier : https://www.nature.com/articles/s42256-024-00847-1
Rapports associés : https://phys.org/news/2024-06-ai-tool-rapid-effective-drug .html

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

html for 算法数据库 https 虚拟化

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Le « travail sincère » de Google, versions open source 9B et 27B de Gemma2, axées sur l'efficacité et l'économie !Article suivant：Le « travail sincère » de Google, versions open source 9B et 27B de Gemma2, axées sur l'efficacité et l'économie !

Articles Liés

Voir plus