Maison  >  Article  >  Périphériques technologiques  >  L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

WBOY
WBOYoriginal
2024-06-22 02:06:40356parcourir
L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive
La rubrique AIxiv est une rubrique où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com

L'auteur de cet article, Xiao Zhenzhong, est doctorant à l'Institut Max Planck pour les systèmes intelligents et à l'Université de Tübingen en Allemagne, et Robert Bamler est doctorant à l'Université de Tübingen, professeur d'apprentissage automatique à l'université, Bernhard Schölkopf est directeur de l'Institut Max Planck pour les systèmes intelligents et Liu Weiyang est chercheur au sein du projet commun de l'Institut Max Planck de Cambridge.

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Adresse papier : https://arxiv.org/abs/2406.04344

Dans les scénarios d'apprentissage automatique traditionnels tels que les problèmes de classification et de régression, à partir des données de formationL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive, nous apprenons un modèle de fonctionL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive en optimisant les paramètresL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive Pour décrire avec précision la relation entre L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive et L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive dans l'ensemble d'entraînement et l'ensemble de test. Parmi eux, L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive est une fonction basée sur des valeurs numériques. Ses paramètres L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont généralement des vecteurs numériques ou des matrices dans un espace continu. L'algorithme d'optimisation met à jour L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive de manière itérative en calculant le gradient numérique pour obtenir l'effet d'apprentissage.

Au lieu d'utiliser des valeurs numériques, pouvons-nous utiliser le langage naturel pour représenter un modèle ? Comment effectuer l'inférence et l'entraînement sur ce modèle non numérique basé sur le langage naturel ?

Verbalized Machine Learning (VML ; Verbalized Machine Learning) répond à ces questions et propose un nouveau paradigme d'apprentissage automatique basé sur le langage naturel. VML traite le grand modèle de langage (LLM) comme un approximateur de fonction universelL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive dans l'espace du langage naturel, et les donnéesL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive et les paramètresL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont tous deux des chaînes dans l'espace du langage naturel. Lors de l'inférence, nous pouvons soumettre les données d'entrée L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive et les paramètres L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive donnés au LLM, et la réponse du LLM est la réponse à l'inférence L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive.

Pour les tâches et données arbitraires L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive, comment obtenons-nous L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive ? Dans l'apprentissage automatique traditionnel basé sur des valeurs numériques, nous mettons à jour les paramètres du modèle existant dans le sens d'une perte décroissante en calculant le gradient de la fonction de perte, obtenant ainsi la fonction d'optimisation de L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive :

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive et L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont respectivement le taux d'apprentissage et la fonction de perte.

Dans le cadre de VML, puisque les données L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive et les paramètres L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont tous deux des chaînes et que LLM est considéré comme un moteur d'inférence de boîte noire, nous ne pouvons pas optimiser L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive via des calculs numériques. Mais puisque nous avons utilisé LLM comme fonction d’approximation générale dans l’espace du langage naturel pour approximer les fonctions du modèle, et que l’optimiseur de L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arriveL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive est également une fonction, pourquoi n’utilisons-nous pas également LLM pour l’approcher ? Par conséquent, la fonction d'optimisation verbale L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive peut être écrite sous la forme

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

, où L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont les données d'entraînement et les résultats de prédiction du modèle d'un lot de L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive, et L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont les paramètres de la fonction d'optimisation (il en va de même pour le langage naturel).

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Figure 1 : Algorithme de formation de VML.
中 Figure 2 : Exemples de modèles en langage naturel de modèles et d'optimiseurs en VML.
La figure 1 montre l'algorithme complet de VML. On peut voir qu'il s'agit fondamentalement de la même chose que l'algorithme d'apprentissage automatique traditionnel. La seule différence est que les données et les paramètres sont des chaînes dans l'espace du langage naturel, et que le modèle
et l'optimiseur
effectuent tous deux une inférence dans l'espace du langage naturel. LLM. La figure 2 montre des exemples de modèles spécifiques du modèle
et de l'optimiseur L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive dans la tâche de régression. L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arriveL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arriveL’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive
Par rapport à l'apprentissage automatique traditionnel, les avantages de VML incluent : (1) Vous pouvez ajouter un biais inductif au modèle avec une simple description en langage naturel (2) Puisqu'il n'est pas nécessaire de prédéfinir la famille de fonctions de ; le modèle (famille de fonctions), l'optimiseur
peut sélectionner automatiquement la famille de fonctions du modèle pendant le processus de formation ; (3) La fonction d'optimisation fournira une explication en langage naturel pour chaque mise à jour des paramètres du modèle, ainsi que la description et le raisonnement de les modèles sont également en langage naturel et explicables.
L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Affichage experimental

Régression de polynomiale

La figure 3, le paramètre initial
du modèle est la définition de la régression linéaire. Au cours de la première étape de l'optimisation, l'optimiseur a déclaré avoir constaté que
avait une plage de valeurs plus large que
, et qu'elles semblaient être positivement corrélées, il a donc décidé de mettre à jour le modèle vers un modèle de régression linéaire simple.

Dans la deuxième étape de l'optimisation, l'optimiseur a déclaré que les mauvaises performances du modèle actuel lui ont fait réaliser que l'hypothèse du modèle linéaire était trop simple, et il a constaté qu'il y avait une relation non linéaire entre L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive et L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive, il a donc décidé de changer le modèle mis à jour en fonction quadratique.

Dans la troisième étape de l'optimisation, l'attention de l'optimiseur passe de la sélection de la famille de fonctions à la modification des paramètres de la fonction quadratique. Le modèle final apprend un résultat très proche de la fonction réelle.在 Figure 3 : L'enregistrement du processus de formation de VML dans la mission de régression multi-split.

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

Classification plane bidimensionnelle non linéaire

Comme le montre la figure 4, les paramètres initiaux du modèle
sont la définition de la classification bidimensionnelle plane bidimensionnelle, et le La phrase « limite de décision » est utilisée. C'est un cercle » et ajoute un biais inductif. Dans la première étape de l'optimisation, l'optimiseur indique qu'il met à jour le modèle vers une équation de cercle basée sur l'a priori fourni. Dans les étapes d'optimisation suivantes, l'optimiseur ajuste le centre et le rayon de l'équation du cercle en fonction des données d'entraînement. Jusqu'à l'étape 41, l'optimiseur indiquait que le modèle actuel semblait bien correspondre, il a donc arrêté de mettre à jour le modèle.

En même temps, nous pouvons également voir que VML peut également apprendre un bon modèle basé sur des arbres de décision sans ajouter de biais inductif, mais la perte d'entraînement fluctue davantage en comparaison.
L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive
                                                                                                                                                                                                                            Figure 4 : Enregistrement du processus de formation de VML dans la tâche de classification plane bidimensionnelle non linéaire.

Classification binaire des images médicales

Si le grand modèle accepte les entrées multimodales, telles que des images et du texte, alors VML peut également être utilisé pour les tâches d'image. Dans cette expérience, nous avons utilisé les ensembles de données GPT-4o et PneumoniaMNIST pour effectuer une tâche de détection de pneumonie à rayons X.

Comme le montre la figure 5, nous avons initialisé deux modèles. Les paramètres initiaux des modèles L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive sont tous deux définis comme la deuxième classification des images, mais l'un d'eux a ajouté une phrase « L'entrée est une image radiographique utilisée. pour la détection de la pneumonie." de biais inductif a priori. Après cinquante étapes de formation, les deux modèles ont atteint une précision d'environ 75 %, le modèle avec a priori étant légèrement plus précis.

En regardant attentivement les paramètres du modèle après l'étape 50, nous pouvons voir que la description du modèle avec biais inductif contient de nombreux mots médicaux liés à la pneumonie, tels que « infection » et « inflammation » mais pas la description du modèle avec inductif ; le biais décrit uniquement les caractéristiques des radiographies pulmonaires, telles que la « transparence » et la « symétrie ».

En même temps, les descriptions apprises par ces modèles peuvent être vérifiées par des médecins ayant des connaissances professionnelles. De tels modèles d’apprentissage automatique interprétables et vérifiables par l’homme sont précieux dans les scénarios médicaux critiques pour la sécurité.

L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive

                                                                                                                                                                                                                                    Figure 5 : enregistrement de formation VML sur la classification binaire des images PneumoniaMNIST. L’apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive
Conclusion

Cet article présente un nouveau paradigme d'apprentissage automatique Verbalized Machine Learning (VML; Verbalized Machine Learning) basé sur de grands modèles de langage, et en régression Il démontre l'efficacité et l'interprétabilité de VML sur les tâches de classification.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn