Maison >Périphériques technologiques >IA >Sous-journal Nature, avec un taux de précision de 96 %, l'IA prédit les interactions protéine-ligand à partir de séquences
Dans le développement de médicaments, il est crucial de déterminer l'affinité de liaison et l'effet fonctionnel des ligands de petites molécules sur les protéines. Les méthodes informatiques actuelles peuvent prédire ces propriétés d’interaction protéine-ligand, mais sans structures protéiques à haute résolution, la précision est souvent perdue et les effets fonctionnels ne peuvent être prédits.
Des chercheurs de l'Université Monash et de l'Université Griffith ont développé PSICHIC (PhySIcoCHhemICal Graph Neural Network), un cadre qui combine des contraintes physicochimiques directement à partir de séquences de données décodant les empreintes digitales d'interaction. Cela permet à PSICHIC de décoder les mécanismes à l’origine des interactions protéine-ligand, atteignant ainsi une précision et une interprétabilité de pointe.
Formé sur les mêmes paires protéine-ligand sans données structurelles, PSICHIC a obtenu des résultats comparables, voire dépassés, aux principales méthodes basées sur la structure dans les prédictions d'affinité de liaison. L'empreinte interprétable de
PSICHIC identifie les résidus protéiques et les atomes de ligand impliqués dans l'interaction et aide à révéler les déterminants de la sélectivité des interactions protéine-ligand.
L'étude s'intitulait « Réseau neuronal à graphes physicochimiques pour l'apprentissage des empreintes digitales d'interaction protéine-ligand à partir de données de séquence » et a été publiée dans « Nature Machine Intelligence » le 17 juin 2024.
Défi de prédiction de l'affinité protéine-ligandDans le processus de découverte de médicaments, comprendre l'affinité de liaison et les effets fonctionnels des ligands à petites molécules sur les protéines est essentiel, car l'interaction sélective du ligand avec une protéine spécifique détermine l'effet attendu. du médicament.
Cependant, bien que les méthodes informatiques actuelles soient capables de prédire les propriétés d'interaction protéine-ligand, en l'absence de structures protéiques à haute résolution, la précision de la prédiction diminue souvent et il existe également des difficultés à prédire les effets fonctionnels.
Bien que les méthodes basées sur les séquences présentent plus d'avantages en termes de coût et de ressources (par exemple, elles ne nécessitent pas de processus coûteux de détermination de structure expérimentale), ces méthodes sont souvent confrontées au problème de degrés de liberté excessifs dans la correspondance de modèles, ce qui peut facilement conduire à un surajustement. et des capacités de généralisation limitées, créant ainsi un écart de performance par rapport aux méthodes basées sur la structure ou les composites.
Physical Chemistry Graph Neural Network
Une équipe de recherche de l'Université Monash et de l'Université Griffith a développé PSICHIC (Physical Chemistry Graph Neural Network), une méthode pour décoder directement les protéines-ligands à partir de données de séquence selon les principes physiques et chimiques des empreintes digitales d'interaction corporelle. méthode. Contrairement aux modèles précédents basés sur des séquences, PSICHIC intègre de manière unique des contraintes physico-chimiques pour atteindre une précision et une interprétabilité de pointe.
En tant que méthode basée sur des séquences 2D, PSICHIC génère et impose ces contraintes sur un tracé 2D en appliquant un algorithme de clustering, permettant à PSICHIC de s'adapter principalement aux modèles rationnels sous-jacents qui déterminent les interactions protéine-ligand pendant l'entraînement.
Illustration : Présentation de PSICHIC(Source : article)
Validation et comparaison des performances
Après un entraînement sur les mêmes paires protéine-ligand sans données structurelles, PSICHIC surpasse dans les prédictions d'affinité de liaison. -Les méthodes basées sur la structure artistique et les méthodes composites les rivalisent, voire les surpassent.
Les résultats expérimentaux sur les ensembles de données PDBBind v2016 et PDBBind v2020 montrent que PSICHIC surpasse les autres méthodes basées sur des séquences, telles que TransCPI, MolTrans et DrugBAN, sur plusieurs indicateurs.
Illustration :Résumé statistique des performances des prédictions d'affinité de liaison protéine-ligand sur les benchmarks PDBBind v2016 et PDBBind v2020. (Source : article)
Plus précisément :
Aussi :
Fait intéressant, les empreintes digitales interprétables de PSICHIC montrent qu'il obtient la capacité de décoder le mécanisme sous-jacent des interactions protéine-ligand à partir des seules données de séquence, en identifiant les résidus protéiques des sites de liaison et les capacités atomiques des ligands impliqués, même lorsqu'ils sont formés uniquement sur données de séquence avec des étiquettes d’affinité de liaison et aucune information d’interaction.
ValeurPerspectives futures
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!