Maison >Périphériques technologiques >IA >Une intelligence artificielle capable d'apprendre les modèles de langage humain
Le langage humain est notoirement complexe, et les linguistes croient depuis longtemps qu’il serait impossible d’apprendre aux machines à analyser la parole et la structure des mots comme le font les humains.
Mais des chercheurs de l'Université McGill, du MIT et de l'Université Cornell ont déjà fait un pas dans cette direction. Ils ont développé un système d’intelligence artificielle (IA) capable d’apprendre par lui-même les règles et les modèles du langage humain.
Le modèle apprend automatiquement des modèles de langage de haut niveau qui peuvent être appliqués à différentes langues, ce qui lui permet d'obtenir de meilleurs résultats.
Lorsqu'on lui donne des mots et des exemples de la façon dont ces mots changent pour exprimer différentes fonctions grammaticales dans une langue, telles que le temps, la casse ou le genre, ce modèle d'apprentissage automatique propose des règles qui expliquent pourquoi ces mots changent ainsi. se produire.
Des chercheurs ont développé un système d'intelligence artificielle capable d'apprendre par elle-même les règles et les modèles du langage humain. Crédit : MIT Jose-Luis Olivares
Par exemple, il pourrait savoir que la lettre « a » doit être ajoutée à la fin du mot pour que la forme masculine en serbo-croate devienne féminine.
Les chercheurs affirment que le système pourrait être utilisé pour tester les théories du langage et étudier les similitudes subtiles dans la manière dont différentes langues convertissent les mots. "Nous voulions voir si nous pouvions imiter les connaissances et le raisonnement que les humains apportent à cette tâche", a déclaré le co-auteur Adam Albright, professeur de linguistique au MIT.
"Ce qui est passionnant dans ce travail, c'est qu'il montre comment nous pouvons construire des algorithmes qui peuvent généraliser à partir de très petits échantillons de données linguistiques, plus comme les scientifiques humains et les enfants", a déclaré l'auteur principal Timothy, professeur adjoint au département O'Donnell, Ph.D. en linguistique de l'Université McGill, Mila – Chaire Canada de CIFAR AI à l'Institut d'intelligence artificielle du Québec.
La construction et l'évaluation de modèles et de théories scientifiques automatisés et basés sur des données constituent un défi de longue date en intelligence artificielle.
Nous proposons un cadre pour synthétiser algorithmiquement des modèles d'une partie fondamentale du langage humain : la morphophonologie, le système de construction de formes de mots à partir de sons. Nous combinons l'inférence bayésienne avec la synthèse et la représentation de programmes inspirés de la théorie du langage et des modèles cognitifs d'apprentissage et de découverte.
À travers 70 ensembles de données provenant de 58 langues différentes, notre système synthétise des modèles interprétables par l'homme des aspects fondamentaux de la phonologie morphologique pour chaque langue, se rapprochant parfois des modèles proposés par des linguistes humains. L'inférence conjointe sur les 70 ensembles de données synthétise automatiquement un méta-modèle codant des tendances de type multilingue interprétables.
Enfin, le même algorithme capture une petite quantité de dynamiques d'apprentissage, acquérant de nouvelles règles phonétiques morphologiques à partir d'un ou de quelques exemples seulement.
Ces résultats illustrent la voie vers un support machine plus puissant pour la découverte de modèles interprétables en linguistique et dans d'autres domaines scientifiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!