


De nouveaux « scientifiques de l'IA » combinent théorie et données pour découvrir des équations scientifiques
Les scientifiques visent à découvrir des formules significatives qui décrivent avec précision les données expérimentales. Les modèles mathématiques de phénomènes naturels peuvent être créés manuellement sur la base des connaissances du domaine, ou ils peuvent être créés automatiquement à partir de grands ensembles de données à l'aide d'algorithmes d'apprentissage automatique. La communauté universitaire a étudié le problème de la fusion des connaissances préalables pertinentes et des modèles fonctionnels pertinents, et estime que trouver un modèle cohérent avec les connaissances préalables des axiomes logiques généraux est un problème non résolu.
Des chercheurs de l'équipe de recherche d'IBM et de l'équipe Samsung AI ont développé une méthode "AI-Descartes" qui combine le raisonnement logique et la régression symbolique pour mener une analyse fondée sur des principes de modèles de phénomènes naturels à partir de connaissances axiomatiques et de données expérimentales.
L'étude s'intitule « Combining data and theory for derivable scientific Discovery with AI-Descartes » et a été publiée dans « Nature Communications » le 12 avril 2023.
Les réseaux de neurones artificiels (NN) et la régression statistique sont souvent utilisés pour découvrir automatiquement des modèles et des relations dans les données. NN renvoie un modèle de « boîte noire », dans lequel les fonctions sous-jacentes sont généralement utilisées uniquement à des fins de prédiction. Dans la régression standard, la forme fonctionnelle est prédéterminée, donc la découverte de modèles revient à un ajustement de paramètres. Dans la régression symbolique (SR), la forme fonctionnelle n'est pas prédéterminée mais se compose d'opérateurs (par exemple +, -, × et ÷) d'une liste donnée et est calculée à partir des données.
Les modèles SR sont généralement plus « interprétables » que les modèles NN et nécessitent moins de données. Par conséquent, pour découvrir symboliquement les lois naturelles à partir de données expérimentales, la SR peut être plus efficace que la NN ou la régression de forme fixe. L'intégration de NN et SR a fait l'objet de recherches récentes sur l'IA neurosymbolique. Un défi majeur en RS consiste à identifier des modèles scientifiquement significatifs parmi les nombreux modèles qui correspondent aux données. Les scientifiques définissent une fonction significative comme une fonction qui équilibre précision et complexité. Cependant, de nombreuses expressions de ce type existent pour un ensemble de données donné, et toutes ne sont pas cohérentes avec la théorie de base connue.
Une autre approche consiste à commencer par une théorie de base connue, mais il n'existe actuellement aucun outil d'inférence pratique capable de générer des théorèmes cohérents avec des données expérimentales à partir d'un ensemble connu d'axiomes. Les prouveurs automatiques de théorèmes (ATP) sont les outils de raisonnement les plus largement utilisés pour prouver des conjectures pour une théorie logique donnée. La complexité informatique est un défi majeur pour l'ATP ; pour certains types de logique, prouver des conjectures est indécidable.
De plus, dériver des modèles à partir de théories logiques à l'aide d'outils de raisonnement formel est particulièrement difficile lorsque des opérateurs arithmétiques et de calcul sont impliqués. Des techniques d’apprentissage automatique ont été utilisées pour améliorer les performances de l’ATP, par exemple en utilisant l’apprentissage par renforcement pour guider le processus de recherche.
Les modèles dérivés doivent non seulement être empiriquement précis, mais ils doivent également être prédictifs et perspicaces.
Des chercheurs de l'équipe de recherche IBM et de l'équipe Samsung AI ont tenté d'obtenir un tel modèle en combinant une nouvelle méthode SR basée sur l'optimisation mathématique avec un système d'inférence. Cela a abouti à un système de découverte de bout en bout « AI-Descartes » qui extrait des formules à partir de données via SR et fournit ensuite une preuve de la dérivabilité de la formule à partir d'un ensemble d'axiomes, ou fournit une preuve d'incohérence. Lorsqu'il est prouvé qu'un modèle n'est pas dérivable, les chercheurs proposent de nouvelles mesures qui indiquent à quel point la formule est proche d'une formule dérivable et utilisent leur système d'inférence pour calculer les valeurs de ces mesures.
Illustration : Présentation du système. (Source : Papier)
Dans les premiers travaux combinant apprentissage automatique et inférence, les scientifiques ont utilisé des descriptions basées sur la logique pour limiter la sortie des architectures neuronales GAN qui généraient des images. Il existe également des équipes qui combinent des outils d'apprentissage automatique et des moteurs d'inférence pour rechercher des formes fonctionnelles satisfaisant des contraintes prédéfinies. Il s'agit d'augmenter l'ensemble de données initial avec de nouveaux points, améliorant ainsi l'efficacité de la méthode d'apprentissage et la précision du modèle final. Certaines équipes exploitent également leurs connaissances antérieures pour créer des points de données supplémentaires. Cependant, ces études ne considèrent que les contraintes sur la forme fonctionnelle à apprendre et n'incluent pas d'axiomes théoriques généraux (contraintes logiques décrivant d'autres lois et variables non mesurées impliquées dans le phénomène).
Cristina Cornelio, auteur principal de l'article et chercheuse scientifique chez Samsung AI, a déclaré que l'IA-Descartes offre certains avantages par rapport aux autres systèmes, mais que sa caractéristique la plus remarquable est ses capacités de raisonnement logique. S'il existe plusieurs équations candidates qui correspondent bien aux données, le système identifie quelle équation correspond le mieux à la théorie scientifique de base. La capacité de raisonner distingue également le système des programmes « d'IA générative » comme ChatGPT, dont les grands modèles de langage ont des capacités logiques limitées et perturbent parfois les mathématiques de base.
« Dans notre travail, nous combinons les méthodes fondées sur les premiers principes avec les méthodes basées sur les données, plus courantes à l'ère de l'apprentissage automatique, qui sont utilisées par les scientifiques depuis des siècles pour tirer des enseignements des théories de base existantes. » Cette combinaison permet nous d'exploiter les deux méthodes et de créer des modèles plus précis et plus significatifs pour un large éventail d'applications. Le monde pouvait être décrit par quelques lois physiques fondamentales et cette inférence logique jouait un rôle clé dans la découverte scientifique.
Les chercheurs de cette équipe ont démontré que la combinaison du raisonnement logique avec la régression symbolique est d'une grande valeur pour obtenir des modèles symboliques significatifs de phénomènes physiques car ils sont cohérents avec la théorie de base et dans une bonne généralisation dans les domaines de manière significative ; plus grande que les données expérimentales. La combinaison de la régression et de l'inférence produit de meilleurs modèles que la RS ou l'inférence logique seule.
L'amélioration ou le remplacement de composants individuels du système et l'introduction de nouveaux modules, tels que le raisonnement abductif ou la conception expérimentale, élargiront les fonctionnalités de l'ensemble du système. Une intégration plus approfondie de l’inférence et de la régression peut aider à synthétiser des modèles basés sur des données et des principes premiers et conduire à une révolution dans le processus de découverte scientifique. La découverte de modèles cohérents avec les connaissances antérieures accélérera la découverte scientifique et transcendera les paradigmes de découverte existants.
L'équipe a utilisé des modèles pour dériver la troisième loi de Kepler sur le mouvement planétaire, la loi relativiste de dilatation du temps d'Einstein et la théorie de l'adsorption de Langmuir ; la recherche montre que lorsque le raisonnement logique est utilisé pour distinguer des données comportant des erreurs similaires lors de la formulation d'une formule candidate, le modèle peut découvrir des modèles dominants à partir d'un petit nombre de points de données.
"Dans ce travail, nous avons besoin d'experts humains pour écrire de manière formelle et lisible par ordinateur quels sont les axiomes de la théorie de fond, et si l'humain en oublie ou se trompe. Sans non plus, le système ne fonctionnera pas », a déclaré Tyler Josephson, professeur adjoint de chimie, de biochimie et de génie environnemental à l'UMBC. « À l'avenir, nous espérons également automatiser cette partie du travail afin de pouvoir explorer davantage de domaines scientifiques. et l'ingénierie."
En fin de compte, l'équipe espère que son IA-Descartes pourra inspirer une nouvelle approche scientifique productive, tout comme les vrais scientifiques. "L'un des aspects les plus passionnants de notre travail est le potentiel de progrès significatifs dans la recherche scientifique", a déclaré Cornelio.
Lien papier :
https://www.nature.com/articles/s41467-023-37236-yRapports associés : https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Explorer le fonctionnement interne des modèles de langue avec Gemma Scope Comprendre les complexités des modèles de langue IA est un défi important. La sortie de Google de Gemma Scope, une boîte à outils complète, offre aux chercheurs un moyen puissant de plonger

Déverrouiller le succès de l'entreprise: un guide pour devenir un analyste de Business Intelligence Imaginez transformer les données brutes en informations exploitables qui stimulent la croissance organisationnelle. C'est le pouvoir d'un analyste de Business Intelligence (BI) - un rôle crucial dans GU

Instruction ALTER TABLE de SQL: Ajout de colonnes dynamiquement à votre base de données Dans la gestion des données, l'adaptabilité de SQL est cruciale. Besoin d'ajuster votre structure de base de données à la volée? L'énoncé de la table alter est votre solution. Ce guide détaille l'ajout de Colu

Introduction Imaginez un bureau animé où deux professionnels collaborent sur un projet critique. L'analyste commercial se concentre sur les objectifs de l'entreprise, l'identification des domaines d'amélioration et la garantie d'alignement stratégique sur les tendances du marché. Simulé

Excel Counting and Analysis: Explication détaillée du nombre et des fonctions de compte Le comptage et l'analyse des données précises sont essentiels dans Excel, en particulier lorsque vous travaillez avec de grands ensembles de données. Excel fournit une variété de fonctions pour y parvenir, les fonctions Count et Count sont des outils clés pour compter le nombre de cellules dans différentes conditions. Bien que les deux fonctions soient utilisées pour compter les cellules, leurs cibles de conception sont ciblées sur différents types de données. Faisons des détails spécifiques du comptage et des fonctions de coude, mettons en évidence leurs caractéristiques et différences uniques et apprenez à les appliquer dans l'analyse des données. Aperçu des points clés Comprendre le nombre et le cou

La révolution de l'IA de Google Chrome: une expérience de navigation personnalisée et efficace L'intelligence artificielle (IA) transforme rapidement notre vie quotidienne, et Google Chrome mène la charge dans l'arène de navigation Web. Cet article explore les exciti

Réinventuation d'impact: le quadruple bas Pendant trop longtemps, la conversation a été dominée par une vision étroite de l’impact de l’IA, principalement axée sur le résultat du profit. Cependant, une approche plus holistique reconnaît l'interconnexion de BU

Les choses évoluent régulièrement vers ce point. L'investissement affluant dans les prestataires de services quantiques et les startups montre que l'industrie comprend son importance. Et un nombre croissant de cas d'utilisation réels émergent pour démontrer sa valeur


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

mPDF
mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Navigateur d'examen sécurisé
Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

ZendStudio 13.5.1 Mac
Puissant environnement de développement intégré PHP

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Dreamweaver Mac
Outils de développement Web visuel