Maison  >  Article  >  Périphériques technologiques  >  Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

王林
王林avant
2023-05-04 14:13:06974parcourir

"Tu peux aller dans le hall, tu peux aller à la cuisine", c'est un compliment à l'épouse idéale et bienveillante, et je le dirai probablement aux robots de Google à l'avenir.

Avez-vous déjà vu un robot doté d'un grand modèle de langage et capable d'apprendre tout seul ? Vous ne savez pas comment faire ? Vous pouvez l'apprendre ! Ce n’est pas grave si vous ne le savez pas maintenant, vous pourrez le faire après un certain temps.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Comparé au "Iron Masked King Kong" extrêmement cool de Boston Dynamics qui escalade des montagnes de couteaux, descend dans des mers de feu et escalade des montagnes et des crêtes comme s'il marchait sur un terrain plat, cette fois " robot d'apprentissage" ressemble plus à un petit assistant attentionné autour de vous. Ce que je dis et ce que vous faites, ce sont les routines générales permettant aux robots d'exécuter des instructions. Les nouvelles recherches de Google permettent cette fois aux robots non seulement de suivre des instructions, mais aussi de le faire eux-mêmes.

C'est la première fois que Google combine un grand modèle de langage avec un robot pour apprendre au robot à faire les mêmes choses que les humains.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Adresse papier : https://arxiv.org/pdf/2204.01691.pdfUtilisation du titre du papier Google : "Faites ce que je peux, pas ce que je dis".

Cela signifie probablement ceci : "Vous êtes déjà un robot mature. Vous pouvez faire ce que je fais. Si vous ne le savez pas, vous pouvez l'apprendre. Si vous ne le connaissez pas, vous pouvez le pratiquer !" Google a nommé ce robot PaLM-SayCan . Dans le reportage du « Washington Post », le journaliste a vu des chercheurs demander à des robots de préparer des hamburgers à partir d'ingrédients de jouets en plastique. Il semble que ce bras robotique sache qu'il doit ajouter du ketchup après avoir mis la viande et avant de mettre la laitue, mais le chef estime actuellement qu'« ajouter du ketchup » signifie mettre toute la bouteille de ketchup dans le burger.

Bien que ce robot chef ne soit pas encore qualifié, Google estime qu'avec la formation d'un grand modèle de langage, ce ne sera qu'une question de temps avant qu'il apprenne à cuisiner des burgers. Le robot peut également reconnaître des canettes de 7-Up et de Coca-Cola, ouvrir des tiroirs et trouver un sac de chips. Grâce aux capacités d'abstraction de PaLM, il peut même comprendre que les bols jaunes, verts et bleus peuvent être comparés respectivement aux déserts, aux jungles et aux océans.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Différent des robots précédents, il y avait des robots qui préparaient des hamburgers, des nouilles frites et des pizzas dans le passé, mais en fait, ils complétaient une combinaison d'instructions claires pour une seule action, telles que « Bouger bras droit trois espaces vers la gauche." , "retourner", etc. L'objectif actuel de Google est de permettre aux robots de comprendre et d'exécuter des commandes telles que "Viens me préparer un hamburger", "J'ai faim, va m'acheter un petit pain" et "Sortez et joue au ballon avec moi". C’est comme parler à quelqu’un.

Par exemple, lorsqu'un chercheur en intelligence artificielle de Google a dit au robot PaLM-SayCan : "Ma boisson s'est renversée, pouvez-vous m'aider ?" appareil photo numérique pour découvrir l'Éponge sur le comptoir, saisissez-la avec le bras électrique et ramenez-la.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Brian Ichter de Google a déclaré : « Il s’agit d’un modèle fondamentalement différent. » Il est l'un des auteurs d'un article récemment publié décrivant les nouvelles avancées réalisées dans ces robots.

De nos jours, les robots ne sont plus une rareté. Des millions de robots travaillent dans des usines à travers le monde, mais ils suivent des instructions spécifiques et se concentrent souvent sur une ou deux tâches seulement. Mais construire un robot capable d’accomplir une série de tâches et d’apprendre en les accomplissant est beaucoup plus compliqué. Depuis des années, les entreprises technologiques, grandes et petites, tentent de construire de tels « robots universels ».

Le grand modèle de langage devenu populaire ces dernières années a permis à Google de trouver l'inspiration pour le développement de « robots universels ». Les grands modèles de langage utilisent de grandes quantités de texte provenant d’Internet pour entraîner les logiciels d’IA à deviner les types de réponses qui pourraient suivre certaines questions ou commentaires.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

De BERT à GPT-3, et plus tard à MT-NLP , à mesure que le nombre de paramètres a augmenté à pas de géant, ces modèles sont devenus si efficaces pour prédire la réponse correcte que traiter un modèle donne souvent l'impression de parler à une personne bien informée. Avec autant de connaissances, ne serait-il pas dommage de discuter avec les autres à longueur de journée ? Si vous pouvez parler, vous pouvez travailler. Des chatbots aux robots assistants, on peut dire que les idées de recherche de Google sont venues naturellement.

Qu'est-ce qu'il y a de si génial dans ce PaLM-SayCan ?

Cette fois, Google AI a collaboré avec le projet Everyday Robot lancé par l'équipe moonshot X de la société mère de Google Alphabet pour proposer une méthode. Autrement dit, les connaissances sont extraites d'un grand modèle de langage (LLM) via une pré-formation, permettant au robot de suivre des instructions textuelles de haut niveau pour accomplir des tâches physiques.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Le projet Everyday Robot dure depuis de nombreuses années, et de nombreux ont collaboré avec les membres de l'équipe Google AI qui ont rejoint Alphabet en 2015 ou 2016. L’idée est de permettre aux robots d’utiliser des caméras et des algorithmes d’apprentissage automatique sophistiqués pour voir et apprendre du monde qui les entoure, sans avoir à leur enseigner toutes les situations potentielles qu’ils pourraient rencontrer. L’idée de Google est la suivante : les modèles Large Language peuvent coder de riches connaissances sémantiques sur le monde, ce qui est utile pour les robots conçus pour effectuer des tâches en langage naturel. Le défaut évident du LLM est « le manque d’expérience du monde réel ». Il peut fonctionner parfaitement en laboratoire mais peut être inutile dans la vie réelle. Par conséquent, les chercheurs recommandent de « fournir une base réelle grâce à des compétences de pré-formation » pour contraindre le modèle à effectuer des actions en langage naturel conformes à l’environnement.

Le robot peut agir comme les « mains et les yeux » du modèle de langage, tandis que le modèle de langage fournit des connaissances sémantiques de haut niveau/une expérience du monde réel sur la tâche . Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Google a utilisé une énorme machine à processeur 6144 pour entraîner PaLM (Pathways Language Model). Les ressources de formation comprennent une vaste collection de documents Web multilingues trouvés sur le site Web GitHub de Microsoft, des livres, des articles Wikipédia, des conversations et du code de programmation. L’agent IA ainsi formé peut expliquer des blagues, compléter des phrases, répondre aux questions et raisonner selon sa propre chaîne de pensée. ​

La question suivante se pose : si cet agent est utilisé dans des robots, comment extraire et utiliser la connaissance d'un grand modèle de langage (LLM) pour accomplir des tâches physiques ? Par exemple, si ma boisson est renversée, GPT-3 dira que vous pouvez utiliser un aspirateur, et LaMDA dira si vous avez besoin que je trouve un nettoyeur pour vous ? (C'est très déroutant)

Les grands modèles de langage ne peuvent pas effectuer cette opération car ils n'interagissent pas avec l'environnement réel. réaction. La capacité de jugement de valeur formée par SayCan, basé sur LLM, grâce au modèle pré-entraîné, peut gérer des instructions dans des environnements complexes et réels. Inspirés par cet exemple, nous avons examiné comment extraire des connaissances LLM pour permettre aux robots de suivre des instructions textuelles de haut niveau. Le robot est doté d'un ensemble de compétences d'apprentissage de comportements « atomiques » capables d'un contrôle visuomoteur de bas niveau. En plus de demander au LLM d'expliquer simplement les instructions, nous pouvons également l'utiliser pour évaluer la probabilité que les compétences d'un individu progressent vers l'exécution d'instructions de haut niveau.

En supposant que chaque compétence a une fonction d'affordance, alors la probabilité de son succès à partir de l'état actuel peut être quantifiée (comme l'apprentissage de la fonction de valeur), et cette valeur peut mesurer la probabilité de la compétence. De cette manière, LLM complète la description de la probabilité de contribution de chaque compétence à l'exécution des instructions. Les chercheurs ont utilisé deux mesures pour évaluer les performances du système :

🎜#

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage (1) Taux de réussite du plan, indiquant si le robot a sélectionné le bon compétence pour l'instruction ;

(2) taux de réussite de l'exécution, indiquant si l'instruction a été exécutée avec succès.

Les données montrent que le taux d'exécution des instructions de PaLM-SayCan est également le plus élevé parmi tous les modèles.

Risque : Que dois-je faire si j'échoue en robotique ?

L'idée est géniale, mais ce travail n'est pas sans risques. Le corpus de formation des grands modèles linguistiques provient d'Internet, et certains modèles linguistiques ont montré des tendances négatives telles que le racisme ou le sexisme, et sont parfois incités à publier des discours haineux ou à mentir. Si ce modèle est utilisé pour entraîner un chatbot, le résultat sera un assistant vocal capable de jurer et de bavarder. Mais que se passerait-il s'il était utilisé pour entraîner un robot doté de mains et de pieds à faire de mauvaises choses ?

De plus, ce qui est plus dangereux que cela, c'est que si le robot ainsi entraîné devient conscient, les choses peuvent devenir incontrôlables (il existe de nombreux films de science-fiction similaires ).

En juillet de cette année, un employé de Google a affirmé que le logiciel est un employé vivant. Le consensus parmi les experts en IA est que ces modèles ne sont pas vivants, mais beaucoup craignent qu’ils ne présentent des biais parce qu’ils sont formés sur de grandes quantités de texte généré par l’homme, non filtré.

Malgré cela, Google continue de travailler dur. Désormais, les chercheurs n'ont plus besoin de coder des instructions techniques spécifiques pour chaque tâche du robot, mais peuvent plus simplement leur parler. dans le langage courant. De plus, le nouveau logiciel peut aider les robots à analyser eux-mêmes des instructions complexes en plusieurs étapes.

Désormais, les robots peuvent interpréter des instructions qu'ils n'ont jamais entendues auparavant et proposer eux-mêmes des réactions et des actions significatives.

Peut-être que pour les robots, une nouvelle porte vient de s'ouvrir, et l'avenir est peut-être encore un long processus. Les techniques d’intelligence artificielle telles que les réseaux neuronaux et l’apprentissage par renforcement sont utilisées depuis des années pour former des robots. Des progrès ont été réalisés, mais les progrès sont encore lents.

Le robot de Google est loin d'être prêt pour une utilisation dans le monde réel. Les chercheurs ont répété à plusieurs reprises que le robot était encore au stade du laboratoire et n'avait pas encore été commercialisé. plan.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer