Maison > Article > Périphériques technologiques > Les deux géants sont optimistes à la fois ! L'intelligence artificielle ajoute un nouveau terme, est-ce la prochaine vague de l'IA ?
Le 18 mai, les stocks de concepts de robots ont déclenché une tendance à la hausse. Au moment de mettre sous presse, Fengli Intelligent et Youde Precision ont atteint leur limite quotidienne de 20 cm, Haozhi Electromechanical, Jiangsu Leili et Green Harmonics ont augmenté de plus de 10. % Southern Seiko, Yuanda Intelligent et Huagong Technology et d'autres ont atteint la limite quotidienne
.
Aux nouvelles, lors de la conférence ITF World 2023 sur les semi-conducteurs, Huang Renxun a déclaré que la prochaine vague d'intelligence artificielle sera l'intelligence incorporée (IA incorporée), c'est-à-dire des systèmes intelligents capables de comprendre, de raisonner et d'interagir avec le monde physique.
De plus, lors de l’assemblée des actionnaires de Tesla le 16 mai, Musk a déclaré que les robots humanoïdes seraient à l’avenir la principale source de valeur à long terme de Tesla. Il a consacré beaucoup d'espace à expliquer les robots et a émis l'hypothèse que la demande pour le robot humanoïde Optimus atteindrait 10 milliards d'unités, dépassant de loin la demande pour les automobiles, et pourrait se chiffrer en dizaines de milliards de dollars.
Favorisé à la fois par les deux géants Tesla et Nvidia, le secteur des robots humanoïdes mérite en effet un regard de haut niveau.
De plus, Pékin a publié plusieurs mesures visant à promouvoir le développement de l'intelligence artificielle générale. Il existe également une expression de l'intelligence incarnée : promouvoir la recherche et l'application de systèmes d'intelligence incarnée et percer les technologies de perception, de cognition et de prise de décision des robots dans des conditions complexes telles que des environnements ouverts, des scénarios généralisés et des tâches continues.
L'Intelligence Artificielle ajoute un nouveau terme
L'« intelligence incorporée » remonte à 1950, lorsque Turing a proposé ce concept pour la première fois dans l'article « Computing Machinery and Intelligence ». Il s'agit d'une sorte d'intelligence artificielle dotée de capacités de prise de décision et d'action autonomes. Elle peut percevoir et comprendre l'environnement comme les humains, et accomplir des tâches grâce à un apprentissage autonome et un comportement adaptatif.
Pour être plus précis, les robots/simulateurs (faisant référence aux environnements virtuels) qui peuvent interagir avec l'environnement et percevoir l'environnement comme les humains, et disposer de capacités indépendantes de planification, de prise de décision, d'action et d'exécution (faisant référence aux environnements virtuels) sont l'ultime forme d’IA. Nous les appelons temporairement des robots intelligents incarnés. Sa mise en œuvre couvre une variété de technologies d'intelligence artificielle, telles que la vision par ordinateur, le traitement du langage naturel et la robotique.
Comme l'a dit Li Feifei, professeur d'informatique à l'Université de Stanford : « Le sens de l'incarnation n'est pas le corps lui-même, mais les besoins et les fonctions globales d'interaction avec l'environnement et de faire des choses dans l'environnement. »
En termes simples, les robots intelligents incarnés peuvent comprendre le langage humain et effectuer les tâches correspondantes. Bien que l'idéal soit grandiose, la réalité est qu'il ne peut que « comprendre le langage humain », et les gens doivent encore s'appuyer fortement sur du code manuscrit pour contrôler les robots.
Dieter Fox, directeur principal de la recherche en robotique chez NVIDIA et professeur à l'Université de Washington, a souligné que l'un des objectifs clés de la recherche en robotique est de construire des robots utiles aux humains dans le monde réel. Mais pour ce faire, ils doivent d’abord être exposés aux humains et apprendre à interagir avec eux.
La prochaine vague d'IA
Les géants investissent dans la piste des robots humanoïdes. Suite au lancement par Tesla du prototype Optimus l'année dernière et au récent cycle de financement A2 mené par OpenAI Venture Fund, fabricant de robots norvégien 1X Technologies, chatGPT contribuera également à améliorer les capacités de perception des robots humanoïdes. et accélérer l’industrialisation.
L'émergence de grands modèles tels que GPT a fourni de nouvelles idées : de nombreux chercheurs ont tenté de combiner de grands modèles de langage multimodaux avec des robots, via un entraînement conjoint d'images, de textes et de données incorporées, et ont introduit l'état de l'art multimodal. la contribution de l'art améliore la compréhension du modèle des objets réels et aide les robots à gérer les tâches de raisonnement incarné.
Les équipes IA de Google et Microsoft sont en première ligne, essayant d'injecter de l'âme dans les robots avec de grands modèles.
Le 8 mars, l'équipe de Google et de l'Université technique de Berlin ont lancé le plus grand modèle de langage visuel de l'histoire - PaLM-E, avec un volume de paramètres allant jusqu'à 562 milliards (le volume de paramètres de GPT-3 est de 175 milliards). En tant que modèle de langage visuel incorporé (VLM) multimodal, PaLM-E peut non seulement comprendre des images, mais également comprendre et générer un langage, et peut exécuter diverses instructions robotiques complexes sans recyclage. Les chercheurs de Google prévoient d'étudier davantage d'applications concrètes de PaLM-E, telles que la domotique ou les robots industriels. Ils espèrent que PaLM-E pourra promouvoir davantage de recherches sur le raisonnement multimodal et l’IA incarnée.
Dans une étude récente, l'équipe Microsoft explore comment étendre ChatGPT développé par OpenA au domaine de la robotique, nous permettant d'utiliser le langage pour contrôler intuitivement plusieurs plates-formes telles que les bras robotiques, les drones et les robots d'assistance à domicile. Les chercheurs ont cité plusieurs exemples de résolution de problèmes robotiques par ChatGPT et ont également introduit l'utilisation de ChatGPT pour résoudre des déploiements de robots complexes dans des domaines tels que les opérations, les opérations aériennes et la navigation.
De toute évidence, Google et Microsoft ont des attentes très similaires à l'égard de l'IA incarnée : les humains n'ont pas besoin d'apprendre des langages de programmation complexes ou les détails des systèmes robotiques pour faire fonctionner les robots. loi". " (le robot termine la tâche), atteignant l'état de "maniable, comme un bras utilisant les doigts".
Ainsi, les grands modèles de langage tels que ChatGPT jouent un rôle crucial dans la réalisation d’une interaction homme-machine pratique dans l’intelligence incarnée.
Si le grand modèle représenté par chatGPT a ouvert une nouvelle ère de l’IA générale, alors l’intelligence artificielle multimodale, incarnée, active et interactive doit être la seule voie à suivre dans cette ère.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!