Maison  >  Article  >  Périphériques technologiques  >  L'Université de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

L'Université de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

WBOY
WBOYavant
2023-12-14 20:04:20502parcourir

Les réactions chimiques sont à la base de la conception de médicaments et de la recherche en chimie organique. Il existe un besoin croissant dans la communauté des chercheurs d’un cadre d’apprentissage profond à grande échelle capable de capturer efficacement les règles fondamentales des réactions chimiques.

Récemment, une équipe de recherche de l'Université de Pékin et de Wangshi Intelligence a proposé une nouvelle méthode pour combler le fossé entre le pré-entraînement moléculaire basé sur des réactions et les tâches de génération.

Inspirés par les mécanismes de la chimie organique, des chercheurs ont développé un nouveau cadre de pré-formation qui lui permet d'incorporer des biais inductifs dans les modèles. Ce cadre proposé permet d'obtenir des résultats de pointe lors de l'exécution de tâches difficiles en aval. En tirant parti des connaissances en chimie, le cadre surmonte les limites des modèles de génération moléculaire actuels qui reposent sur un petit nombre de modèles de réaction. Grâce à des expériences approfondies, le modèle a généré des structures de type médicament synthétisables de haute qualité

Dans l’ensemble, cette recherche constitue une étape importante vers un cadre d’apprentissage profond à grande échelle pour une variété d’applications basées sur des réactions.

L'étude s'intitulait « Combler l'écart entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules avec un modèle unifié » et a été publiée dans « Nature Machine Intelligence » le 5 décembre 2023.

LUniversité de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

Lien papier : https://www.nature.com/articles/s42256-023-00764-9

Les modèles d'apprentissage profond ont été largement utilisés dans de nombreux domaines de recherche scientifique. Le cadre de pré-formation joue un rôle positif dans l'intégration transparente de nouvelles tâches et peut accélérer le processus de modélisation, en particulier lorsque les données étiquetées sont limitées.

La conception de médicaments et la recherche en chimie organique reposent sur les réactions chimiques. Actuellement, la recherche et l’application de l’exploration de données ont permis d’utiliser des modèles d’apprentissage profond dans les réactions chimiques. Sur la base de ces données, de nombreuses études basées sur les données ont porté sur l'apprentissage des représentations de réactions chimiques.

L'apprentissage des représentations fait référence à l'apprentissage automatique de fonctionnalités utiles à partir des données, puis à leur utilisation pour diverses tâches en aval. Les méthodes existantes ignorent les théories fondamentales de la chimie organique, ce qui limite leurs performances.

Génération de molécules basée sur des réactions chimiques

En plus de la tâche de classification des réactions, la génération de molécules basée sur des réactions chimiques est également une application importante. Dans les premières études, des stratégies de génération de molécules par étapes basées sur des modèles étaient souvent adoptées.

Ces méthodes basées sur des modèles reposaient fortement sur des éléments de base et des réactions prédéfinis, ce qui réduisait l'espace chimique accessible. Une tendance similaire se retrouve dans le domaine de la prédiction des produits de réaction, où les méthodes basées sur des modèles ne peuvent pas être extrapolées à des réactions complexes ; ce problème peut être résolu en utilisant des méthodes sans modèle ;

Dans les tâches de génération de molécules basées sur des réactions, les méthodes sans modèle présentent également des avantages de généralisation par rapport aux méthodes basées sur un modèle. Cependant, les méthodes existantes de génération de molécules sans modèle ne peuvent générer que des molécules basées sur des bibliothèques de réactifs prédéfinies. En plus de cela, pour l’étape d’optimisation du composé principal ou de l’optimisation du plomb dans la conception de médicaments, il est plus avantageux d’utiliser des réactions chimiques comme outils d’édition pour modifier une structure donnée. La bibliothèque chimique résultante se concentrera sur un sous-ensemble d’espace chimique pouvant être synthétisé avec moins d’étapes de réaction.

Un nouveau cadre d'apprentissage profond complet pour les réactions chimiques

Ici, les chercheurs proposent un nouveau cadre d'apprentissage profond complet pour les réactions chimiques, appelé Uni-RXN. Il vise à résoudre deux tâches fondamentales : l’apprentissage des représentations auto-supervisé et la modélisation générative conditionnelle.

LUniversité de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

Spectacle : Composition et méthode Uni-RXN. (Cité de : article)

Différent des méthodes existantes, les chercheurs ont proposé un ensemble de tâches auto-supervisées spécifiquement conçues pour les réactions chimiques. Ces tâches comprennent la prédiction du centre de réaction, l’appariement des réactifs primaires et des sous-réactifs, ainsi que l’appariement réactif-produit. Dans une évaluation approfondie de tâches de réaction difficiles, la méthode Uni-RXN surpasse l’état de l’art, démontrant sa capacité à capturer efficacement les connaissances du domaine des réactions chimiques. Les résultats prometteurs obtenus ouvrent la voie à des applications aval généralisées

En capturant efficacement les règles chimiques, Uni-RXN est parfaitement adapté aux tâches de génération. Contrairement aux méthodes traditionnelles qui reposent sur la sélection de fragments dans une bibliothèque de réactifs prédéfinis, Uni-RXN prend les structures moléculaires comme conditions d'entrée et génère des représentations des réactifs correspondants tout en maintenant l'invariance de permutation au sein de la réaction. Tirant parti de la puissance du package de recherche de similarité de vecteurs denses, Uni-RXN permet une récupération efficace des réactifs à partir de grandes bibliothèques de réactifs et de réactifs. Par la suite, un modèle de prédiction de réaction est utilisé pour générer des résultats de produits.

Comparé aux méthodes basées sur des modèles qui n'explorent qu'un sous-ensemble limité de l'espace chimique, Uni-RXN présente des performances supérieures pour générer une gamme plus large de structures de type médicament synthétisables. Cette fonctionnalité le rend particulièrement adapté au dénombrement des bibliothèques virtuelles et s'appuie sur une analyse statistique complète et des études de cas.

La méthode Uni-RXN présente de nombreux avantages et peut générer des représentations riches pour la tâche difficile de classification des réactions chimiques. Comparé à d'autres modèles de base, Uni-RXN atteint une précision de 58,7 % avec seulement 4 points de données par classe. Contenu réécrit : La précision de la classification des réactions chimiques est présentée dans le tableau 1. (Source : article)

Le modèle de transformateur peut être utilisé pour différencier les données de réaction chimique optimisées et non optimisées. De plus, l'encodeur peut également être facilement appliqué à la génération de conditions structurellesLUniversité de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

Le contenu qui doit être réécrit est le suivant : Le graphique montre les performances de récupération et le poids d'attention d'Uni-RXN. (Source : Article) LUniversité de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

Les résultats mettent en évidence les propriétés favorables des molécules générées par le modèle proposé, qui les rendent bien adaptées aux tâches de découverte de médicaments. Ce modèle peut générer plus de molécules ayant des propriétés et une capacité de synthèse semblables à celles d'un médicament

Illustration : Processus et performances Uni-RXNGen. (Source : article) LUniversité de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !

Combiné à des méthodes de criblage virtuel telles que l'amarrage moléculaire, ce modèle généré peut permettre une recherche efficace sur les relations structure-activité. L’énorme espace chimique de type drogue synthétique généré par ce modèle peut améliorer le véritable taux positif de réutilisation de médicaments ou de recherche de molécules ciblées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer