Maison >Périphériques technologiques >IA >L'apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

L'apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBoriginal: 2024-06-22 02:06:40486parcourir

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

La rubrique AIxiv est une rubrique où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com

L'auteur de cet article, Xiao Zhenzhong, est doctorant à l'Institut Max Planck pour les systèmes intelligents et à l'Université de Tübingen en Allemagne, et Robert Bamler est doctorant à l'Université de Tübingen, professeur d'apprentissage automatique à l'université, Bernhard Schölkopf est directeur de l'Institut Max Planck pour les systèmes intelligents et Liu Weiyang est chercheur au sein du projet commun de l'Institut Max Planck de Cambridge.

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Adresse papier : https://arxiv.org/abs/2406.04344

Dans les scénarios d'apprentissage automatique traditionnels tels que les problèmes de classification et de régression, à partir des données de formation Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

, nous apprenons un modèle de fonction Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

en optimisant les paramètres Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Pour décrire avec précision la relation entre Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

dans l'ensemble d'entraînement et l'ensemble de test. Parmi eux, Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

est une fonction basée sur des valeurs numériques. Ses paramètres Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

sont généralement des vecteurs numériques ou des matrices dans un espace continu. L'algorithme d'optimisation met à jour Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

de manière itérative en calculant le gradient numérique pour obtenir l'effet d'apprentissage.

Au lieu d'utiliser des valeurs numériques, pouvons-nous utiliser le langage naturel pour représenter un modèle ? Comment effectuer l'inférence et l'entraînement sur ce modèle non numérique basé sur le langage naturel ?

Verbalized Machine Learning (VML ; Verbalized Machine Learning) répond à ces questions et propose un nouveau paradigme d'apprentissage automatique basé sur le langage naturel. VML traite le grand modèle de langage (LLM) comme un approximateur de fonction universel Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

dans l'espace du langage naturel, et les données Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

et les paramètres Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

sont tous deux des chaînes dans l'espace du langage naturel. Lors de l'inférence, nous pouvons soumettre les données d'entrée Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

et les paramètres Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

donnés au LLM, et la réponse du LLM est la réponse à l'inférence Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Pour les tâches et données arbitraires Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

, comment obtenons-nous Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

? Dans l'apprentissage automatique traditionnel basé sur des valeurs numériques, nous mettons à jour les paramètres du modèle existant dans le sens d'une perte décroissante en calculant le gradient de la fonction de perte, obtenant ainsi la fonction d'optimisation de Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

où

sont respectivement le taux d'apprentissage et la fonction de perte.

Dans le cadre de VML, puisque les données Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

et les paramètres Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

sont tous deux des chaînes et que LLM est considéré comme un moteur d'inférence de boîte noire, nous ne pouvons pas optimiser Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

via des calculs numériques. Mais puisque nous avons utilisé LLM comme fonction d’approximation générale dans l’espace du langage naturel pour approximer les fonctions du modèle, et que l’optimiseur de Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

est également une fonction, pourquoi n’utilisons-nous pas également LLM pour l’approcher ? Par conséquent, la fonction d'optimisation verbale Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

peut être écrite sous la forme

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

, où

sont les données d'entraînement et les résultats de prédiction du modèle d'un lot de Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

, et

sont les paramètres de la fonction d'optimisation (il en va de même pour le langage naturel).

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Figure 1 : Algorithme de formation de VML.

中 Figure 2 : Exemples de modèles en langage naturel de modèles et d'optimiseurs en VML.

La figure 1 montre l'algorithme complet de VML. On peut voir qu'il s'agit fondamentalement de la même chose que l'algorithme d'apprentissage automatique traditionnel. La seule différence est que les données et les paramètres sont des chaînes dans l'espace du langage naturel, et que le modèle
et l'optimiseur

effectuent tous deux une inférence dans l'espace du langage naturel. LLM. La figure 2 montre des exemples de modèles spécifiques du modèle

et de l'optimiseur Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

dans la tâche de régression. Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Par rapport à l'apprentissage automatique traditionnel, les avantages de VML incluent : (1) Vous pouvez ajouter un biais inductif au modèle avec une simple description en langage naturel (2) Puisqu'il n'est pas nécessaire de prédéfinir la famille de fonctions de ; le modèle (famille de fonctions), l'optimiseur
peut sélectionner automatiquement la famille de fonctions du modèle pendant le processus de formation ; (3) La fonction d'optimisation fournira une explication en langage naturel pour chaque mise à jour des paramètres du modèle, ainsi que la description et le raisonnement de les modèles sont également en langage naturel et explicables.

Affichage experimental

Régression de polynomiale

La figure 3, le paramètre initial du modèle est la définition de la régression linéaire. Au cours de la première étape de l'optimisation, l'optimiseur a déclaré avoir constaté que

avait une plage de valeurs plus large que

, et qu'elles semblaient être positivement corrélées, il a donc décidé de mettre à jour le modèle vers un modèle de régression linéaire simple.

Dans la deuxième étape de l'optimisation, l'optimiseur a déclaré que les mauvaises performances du modèle actuel lui ont fait réaliser que l'hypothèse du modèle linéaire était trop simple, et il a constaté qu'il y avait une relation non linéaire entre Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

, il a donc décidé de changer le modèle mis à jour en fonction quadratique.

Dans la troisième étape de l'optimisation, l'attention de l'optimiseur passe de la sélection de la famille de fonctions à la modification des paramètres de la fonction quadratique. Le modèle final apprend un résultat très proche de la fonction réelle.在 Figure 3 : L'enregistrement du processus de formation de VML dans la mission de régression multi-split.

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Classification plane bidimensionnelle non linéaire

Comme le montre la figure 4, les paramètres initiaux du modèle

sont la définition de la classification bidimensionnelle plane bidimensionnelle, et le La phrase « limite de décision » est utilisée. C'est un cercle » et ajoute un biais inductif. Dans la première étape de l'optimisation, l'optimiseur indique qu'il met à jour le modèle vers une équation de cercle basée sur l'a priori fourni. Dans les étapes d'optimisation suivantes, l'optimiseur ajuste le centre et le rayon de l'équation du cercle en fonction des données d'entraînement. Jusqu'à l'étape 41, l'optimiseur indiquait que le modèle actuel semblait bien correspondre, il a donc arrêté de mettre à jour le modèle.

En même temps, nous pouvons également voir que VML peut également apprendre un bon modèle basé sur des arbres de décision sans ajouter de biais inductif, mais la perte d'entraînement fluctue davantage en comparaison.

^{Figure 4 : Enregistrement du processus de formation de VML dans la tâche de classification plane bidimensionnelle non linéaire.}

Classification binaire des images médicales

Si le grand modèle accepte les entrées multimodales, telles que des images et du texte, alors VML peut également être utilisé pour les tâches d'image. Dans cette expérience, nous avons utilisé les ensembles de données GPT-4o et PneumoniaMNIST pour effectuer une tâche de détection de pneumonie à rayons X.

Comme le montre la figure 5, nous avons initialisé deux modèles. Les paramètres initiaux des modèles Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

sont tous deux définis comme la deuxième classification des images, mais l'un d'eux a ajouté une phrase « L'entrée est une image radiographique utilisée. pour la détection de la pneumonie." de biais inductif a priori. Après cinquante étapes de formation, les deux modèles ont atteint une précision d'environ 75 %, le modèle avec a priori étant légèrement plus précis.

En regardant attentivement les paramètres du modèle après l'étape 50, nous pouvons voir que la description du modèle avec biais inductif contient de nombreux mots médicaux liés à la pneumonie, tels que « infection » et « inflammation » mais pas la description du modèle avec inductif ; le biais décrit uniquement les caractéristiques des radiographies pulmonaires, telles que la « transparence » et la « symétrie ».

En même temps, les descriptions apprises par ces modèles peuvent être vérifiées par des médecins ayant des connaissances professionnelles. De tels modèles d’apprentissage automatique interprétables et vérifiables par l’homme sont précieux dans les scénarios médicaux critiques pour la sécurité.

Lapprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

^{Figure 5 : enregistrement de formation VML sur la classification binaire des images PneumoniaMNIST.}

Conclusion

Cet article présente un nouveau paradigme d'apprentissage automatique Verbalized Machine Learning (VML; Verbalized Machine Learning) basé sur de grands modèles de langage, et en régression Il démontre l'efficacité et l'interprétabilité de VML sur les tâches de classification.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

字符串 function 算法线性回归 https gpt

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Battez GPT-4o ! Le nouveau roi Claude 3.5 Sonnet est là, disponible directement gratuitementArticle suivant：Battez GPT-4o ! Le nouveau roi Claude 3.5 Sonnet est là, disponible directement gratuitement

Articles Liés

Voir plus