Maison > Article > Périphériques technologiques > Forum Zhongguancun 2023 | Quand l'IA rencontre la recherche scientifique, les scientifiques ont quelque chose à dire
Le 10 août 2018, l'Université de Pékin a organisé une discussion au sein de l'école et a proposé pour la première fois le concept d'IA pour la science (intelligence scientifique). L'Institut d'intelligence scientifique de Pékin a été créé l'année dernière et est la première institution de recherche au monde sur le thème « L'IA pour la science ». En fait, la communauté universitaire a mené plus tôt des recherches scientifiques pertinentes et a accumulé certains résultats. Le 30 mai, lors du Forum Zhongguancun 2023 « Forum de recherche scientifique axé sur l'intelligence artificielle », un certain nombre d'experts nationaux et étrangers ont mené des discussions et des échanges approfondis sur des sujets tels que l'importance de l'IA pour la science, les résultats de la recherche et la formation des talents, et L'accent sera mis sur le rôle de l'intelligence artificielle dans la science et la technologie. Les progrès et les percées de la recherche dans les sciences de la vie, la science des matériaux et d'autres domaines seront partagés afin d'exploiter davantage le potentiel de l'intelligence artificielle dans la recherche scientifique.
Pourquoi est-ce important
Laissez le système de recherche scientifique passer du mode atelier au mode "Android"
Ces dernières années, l'IA pour la science a formé un consensus parmi les principales institutions de recherche internationales, et les pays sont de plus en plus attentifs à l'énorme potentiel de l'IA pour la science. La raison pour laquelle ce concept est populaire parmi les institutions de recherche scientifique commence par le goulot d'étranglement de la recherche scientifique.
"Il existe deux manières de faire de la recherche scientifique, l'une basée sur les données et l'autre basée sur les principes de base." E Weinan, académicien de l'Académie chinoise des sciences et directeur de l'Institut d'intelligence scientifique de Pékin, a détaillé les difficultés de celles-ci. deux modèles : « Le goulot d'étranglement de la collecte de données est inefficace et manque de méthodes efficaces d'analyse des données. Quant à la conduite par des principes de base, Paul Dirac, l'un des fondateurs de la mécanique quantique, a déclaré il y a cent ans que la tâche de rechercher Les principes de base ont été pratiquement complétés, mais ils doivent être résolus avec des principes de base. Les problèmes pratiques sont moins efficaces car les problèmes mathématiques exprimant les principes sous-jacents sont trop difficiles.
Cela signifie que des problèmes simples tels que la mécanique des structures, l'ingénierie mécanique, l'aérospatiale et l'ingénierie électronique peuvent être résolus, tandis que des problèmes complexes tels que les propriétés et la conception des matériaux, les médicaments et les catalyseurs ne peuvent être résolus que par l'expérience, les essais et erreur. La séparation de la théorie et de l’application.
Quelle est la frontière entre les problèmes simples et complexes ? E Weinan estime : « C'est le nombre de degrés de liberté (dimension), ce qui signifie qu'à mesure que le nombre de dimensions augmente, l'indice de complexité du problème augmente. C'est ce que l'IA peut nous aider à résoudre. L'IA fournit des modèles basés sur les données. Les nouveaux outils peuvent améliorer la fiabilité et l'efficacité des modèles fondés sur des principes fondamentaux, et peuvent également combiner des modèles fondés sur les données et fondés sur des principes fondamentaux. »
Les quatre outils de base de la recherche scientifique sont les principes de base et les méthodes d'analyse des données, les expériences, la littérature et la puissance de calcul.
Du point de vue de la construction de nouvelles infrastructures de recherche scientifique, « La méthode de fonctionnement spécifique de notre recherche scientifique reste la méthode de l'atelier des petits agriculteurs, comme mener des expériences, acheter tout l'équipement et le faire nous-mêmes du début à la fin. Ce cycle est très long et "faible", a déclaré E. Weinan. Avec l'IA, nous favoriserons la construction de la prochaine génération d'outils, la transition du modèle d'atelier passé au modèle Android, la construction d'une grande plateforme de recherche scientifique, une plate-forme open source pour les principes de base, une base de connaissances pour la littérature et une base de connaissances pour les expériences Plusieurs centres expérimentaux et une plate-forme cloud expérimentale pour la puissance de calcul, plusieurs centres de puissance de calcul et une plate-forme cloud de puissance de calcul pour la puissance de calcul.
Quel est le résultat
Base de connaissances littéraires basée sur un grand modèle de langage + base de données vectorielles
Le consensus est là, et les outils sont très attendus. Selon les statistiques de la National Science Foundation, les chercheurs consacrent 51 % de tout leur temps de recherche scientifique à la recherche et à la digestion d'informations scientifiques et technologiques, 8 % à la planification et à la réflexion, 32 % à la recherche expérimentale et 9 % aux résumés écrits. La méthode de récupération de la recherche scientifique passera des étapes de vérification consultative, de rotation des mains et de recherche sur Internet à l'étape de récupération conversationnelle.
« Cependant, la récupération via de grands modèles de langage conversationnel présente des limites, telles que des illusions et des biais, des décalages de données et des limitations de cache », a conclu Meng Zhuofei, vice-président de Moqi Technology.
Sur la base de ces problèmes, l'Institut d'intelligence scientifique de Pékin, le Centre d'information sur les réseaux informatiques de l'Académie chinoise des sciences et Moqi Technology ont publié conjointement Science Navigator V1.0, une base de connaissances littéraires basée sur de grands modèles + vecteurs moteurs de recherche. La base de connaissances comprend la couche utilisateur représentée par les chercheurs scientifiques, la couche modèle représentée par GPT4, etc., la couche intermédiaire composée d'une base de données vectorielle + moteur de recherche et la couche de données supportée par la littérature et le matériel pédagogique. La couche modèle est en charge de l'Institut d'intelligence scientifique de Pékin, la couche intermédiaire est en charge de la technologie Moqi et la couche de données est en charge du Centre d'information sur les réseaux informatiques de l'Académie chinoise des sciences.
Meng Zhuofei a présenté que ScienceNavigator V1.0 prend en charge le traitement de reconnaissance multimodale de texte, d'images, de tableaux et de formules. Les chercheurs scientifiques peuvent utiliser divers modèles grands et petits tels que Wen Xinyiyan et LLM pour obtenir les meilleurs résultats en matière de problèmes. analyse. Un lot de près d'un million d'articles dans les domaines de la chimie, des matériaux, de l'IA et d'autres domaines a été inclus et sera étendu à des centaines de millions de documents dans les disciplines naturelles et humaines à l'avenir.
Comment intégrer verticalement :
Établir un système de collaboration + promouvoir l'IA pour la science en classe
L'IA pour la science signifie une intégration interdisciplinaire et à grande échelle. Son développement rapide déclenchera la reconstruction des modèles de recherche scientifique. Il existe encore de nombreux défis et problèmes en termes de talents, de mécanismes, d'écologie, d'interdisciplinarité et d'autres aspects. Le système de recherche scientifique intégré dans la nouvelle ère nécessite un travail d’équipe.
Le Dr Huang Tiejun est président de l'Institut de recherche sur l'intelligence artificielle Zhiyuan de Pékin. Il a plus de 30 ans d'expérience en recherche scientifique. Sa compréhension la plus profonde est la collaboration. « Indépendamment de l'application, de la recherche et du développement ou de la théorie de base, la manière de former un système collaboratif est particulièrement importante. Concernant l'application de l'IA dans le domaine scientifique, nous devons réfléchir à la manière de mieux coopérer et d'obtenir des résultats avec une plus grande efficacité. Par exemple, il existe plus de 60 types de particules élémentaires, il existe plus de 100 types d'atomes et les nombres couramment utilisés sont relativement clairs. Si l'organisation est bonne, vous pouvez parcourir l'intégralité du tableau périodique des éléments et construire progressivement. l'ensemble du système modèle de base de la physique, de la chimie et de la vie, et tout le monde peut y faire de la recherche, du développement et des applications. L'efficacité sera beaucoup plus élevée.
Lei Lei, assistant du doyen de l'École de science et d'ingénierie des matériaux de l'Université de Pékin, responsable de l'enseignement du premier cycle et des cycles supérieurs, a souligné le développement des talents : « Cette année, notre université a lancé une série de cours sur l'IA pour la science des matériaux, invitant experts concernés de notre école et d'autres collèges de l'Université de Pékin. Venez en classe, nous espérons promouvoir le concept de l'IA pour la science dans la classe dès que possible, afin que les étudiants puissent rompre avec la façon de penser, les outils et l'utilisation originaux. de nouveaux outils dès que possible.Les nouveaux outils peuvent en effet contribuer à accélérer les progrès de la science expérimentale, et l'évaluation des étudiants et des enseignants a été très bonne.Certains étudiants et enseignants ont avancé de nouvelles suggestions, comme le contenu pertinent. pas assez riche et des documents de référence plus techniques sont nécessaires
.
▲Micro Classe
IA pour la scienceScience des matériaux
"Les matériaux sont le moteur de presque toutes les technologies", a déclaré David Srolovitz, membre de la National Academy of Engineering des États-Unis et doyen de la faculté d'ingénierie de l'Université de Hong Kong. L'énergie potentielle interatomique basée sur l'intelligence artificielle permet des simulations atomiques à grande échelle avec une précision proche de la QM. L'application spécialisée du DP (Data Processing) révèle les propriétés cristallines parfaites et défectueuses des métaux et alliages structurels, le DP est donc le seul moyen de comprendre les propriétés de nombreux défauts. »
IA pour la scienceSciences de la vie
Xu Jinbo, professeur invité émérite de l'Université Tsinghua et professeur du Toyota Computing Technology Institute à Chicago, États-Unis : « Les protéines sont la base matérielle de la vie et le principal vecteur des activités vitales. La technologie de l'IA est adaptée à la conception de protéines de novo dans diverses applications. " "IA pour la science
Dynamique atomique Robert Carr, académicien de l'Académie nationale des sciences et professeur du Département de chimie à l'Université de Princeton : « Sans apport empirique, la modélisation par l'IA de processus moléculaires complexes à partir de la théorie quantique de base peut avoir de bonnes/excellentes capacités prédictives. expérience dans des situations où cette approche est importante en chimie, en science des matériaux et en biologie lors de la modélisation de réactions chimiques. Avec des modèles de mécanique quantique de référence plus précis, il devrait être possible d'améliorer systématiquement la précision. "
Wei Wei, journaliste du Beijing Business DailyCe qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!