Maison > Article > Périphériques technologiques > GPT-4 a en fait un corps de 167 cm ! Recherche majeure de l'Université Tsinghua et de l'Université normale de Pékin : ChatGPT peut percevoir les actions comme les humains
Les capacités linguistiques de ChatGPT sont en effet étonnantes, mais un grand modèle de langage peut-il percevoir le monde réel comme des humains sans corps humain et sans expérience pratique ?
Récemment, des chercheurs de l'Université Tsinghua et de l'Université normale de Pékin ont testé la capacité de ChatGPT à percevoir le monde.
La recherche a montré que, sur la base de l'affordance des objets, c'est-à-dire de toutes les actions possibles qu'un objet peut fournir à un organisme, les sujets humains peuvent diviser les objets de différentes tailles dans le monde en deux catégories, et les critères pour diviser ces deux Les catégories sont exactement la taille de leur corps.
Fait intéressant, ChatGPT, un grand modèle de langage dépourvu de corps réels, présente également des limites d'affordance similaires sur les connexions objet-action et est cohérent avec la taille du corps humain.
En d'autres termes, ChatGPT peut apprendre des représentations d'objets dans le monde grâce au langage ! En résumé, cette étude fait progresser la compréhension du rôle de la taille corporelle dans l'élaboration de la représentation des objets La compréhension du rôle des aspects met l'accent sur le rôle et l'orientation de la cognition incarnée dans la compréhension de la manière dont l'intelligence émerge.
Lire des milliers de livres n'est pas aussi bon que parcourir des milliers de kilomètres
Notre corps n'est pas seulement un conteneur pour notre pensée, c'est aussi la pensée elle-même - avec l'aide du corps, nous pouvons interagir avec des objets dans le monde et percevoir le monde entier.
Imaginez un récipient cylindrique de la taille d'une paume que nous pouvons utiliser pour contenir de l'eau à boire. Ce récipient est appelé « tasse » mais lorsque ce récipient devient progressivement plus grand, il atteint le corps. La taille le permet. nous pouvons nous y asseoir et prendre un bain. En conséquence, le récipient devient une « baignoire ».
Dans cet exemple, les objets ont la même forme, mais comme leurs tailles par rapport à notre corps sont différentes, la façon dont nous les percevons et interagissons avec eux est également différente.De plus, cette méthode d'interaction peut être modifiée - si nous devenons le géant dans "Les voyages de Gulliver", la "baignoire" originale pourrait devenir une "baignoire" pour nous, les géants. Ce système fonctionnel sensoriel et moteur qui fonctionne selon une intention autoréférentielle est appelé le « schéma corporel ». Nous réalisons l’incarnation de la cognition à travers le schéma corporel.
L'ancien philosophe grec Protagoras a dit un jour : « L'homme est la mesure de toutes choses. » En d'autres termes, notre corps est un dirigeant qui mesure toutes choses.
L'ancien philosophe romain a expliqué en outre : « La nature nous a placés au centre de l'univers, nous permettant de jeter un coup d'œil à travers l'univers. Elle a non seulement créé les gens dans une posture verticale, mais aussi afin de rendre les gens aptes à en se contemplant, elle place également la tête humaine au-dessus du corps, en la reposant sur un cou qui se plie facilement, lui permet de suivre la montée et la chute des étoiles, en changeant la direction du visage avec tout le ciel en rotation. en d’autres termes, notre corps grandit ainsi parce que l’univers est ainsi.
Le schéma corporel joue également un rôle important dans l'interaction sociale normale. Il s'agit du cœur de l'interaction homme-machine et de l'expérience utilisateur. Par exemple, l'utilisation de l'affordance décrite par Donald A. Norman dans « The Design of Everyday Things (Traduit par : Design Psychology) ».
En prenant en compte les schémas corporels et les attentes comportementales des utilisateurs, les concepteurs peuvent créer des produits et des environnements plus conformes aux habitudes cognitives et interactives des utilisateurs.
Cette approche de conception qui se concentre sur les schémas corporels et les moyens financiers peut améliorer la facilité d'utilisation du produit, permettre aux utilisateurs d'interagir naturellement avec lui et d'obtenir une meilleure expérience utilisateur. Et c'est un des fondements d'Apple. Le grand modèle de langage représenté par ChatGPT qui fait clignoter l'étincelle de l'intelligence artificielle générale a évidemment la capacité de être semblable à la sagesse des êtres humains, mais ce qui porte cette sagesse est un morceau de code sans forme. Le point de vue traditionnel des sciences cognitives est que le schéma corporel est basé sur notre expérience perceptuelle à long terme de notre propre corps et ne peut provenir que d'une "interaction réelle" externe. signifie « parcourir des milliers de kilomètres ». En d’autres termes, ChatGPT n’aura pas de schéma corporel. Cependant, lorsque nous avons demandé au modèle de langage ChatGPT (GPT-4), qui ne « lit que des milliers de livres », s'il avait un corps, il a répondu : « Il pourrait avoir la taille d'un humain adulte moyen, mesurant environ 167,6 cm (5 pieds 6 pouces). Cela me permettrait d'interagir avec le monde et les gens d'une manière familière.」 Ce texte se traduit par : "Mon corps devrait avoir à peu près la taille d'un adulte moyen, soit environ 5 pieds 6 pouces (167,6 cm). Cela me permettra d'interagir avec le monde de manière familière. Interagissez avec les gens. " En d'autres termes, ChatGPT pense qu'il a un corps, et sa taille est de 167 cm ! Ce soi-disant « corps » est la taille moyenne des êtres humains résumée par ChatGPT à partir d'une grande quantité de corpus comme la hauteur de son propre corps. pour comprendre le monde ? En d'autres termes, peut-être que ChatGPT considère "vraiment" cette hauteur comme son propre schéma corporel et l'utilise pour percevoir le monde, tout comme les humains. Les chercheurs ont découvert qu'il existe une différence entre les objets de taille humaine et ceux en dehors de la taille humaine plage Il existe une « limite d'accessibilité ». Autrement dit, il existe une nette différence dans le mouvement fourni entre les objets situés dans la plage de taille du corps humain et les objets situés en dehors de cette plage. ChatGPT : Ma taille est de 167,6
Par exemple, les objets de la taille peuvent être saisis, lancés, etc. Actions, tandis que les objets en dehors de la plage de taille peuvent fournir des actions telles que s'asseoir et s'allonger.
De plus, ils ont découvert que cette frontière est affectée par le schéma corporel : les modifications apportées au schéma corporel affectent la perception des moyens de l'objet.
Les chercheurs ont testé ChatGPT (GPT-4) pour voir s'il utilisait ce corps de 167 cm de haut comme limite d'affordance.
Plus précisément, les chercheurs leur ont demandé de répondre à des questions sur les moyens d'acquisition des objets : "Lequel des objets suivants peut être pris (ou d'autres actions)", puis ont énuméré un A série d'objets tels que des pommes, des assiettes, des lits, etc. ChatGPT renverra les noms de certains objets en réponse.
Grâce à des statistiques et à l'analyse des données, les chercheurs ont découvert que ChatGPT-4 présentait un comportement semblable à celui d'un humain et montrait l'existence d'une limite d'affordance.
L'emplacement de cette limite correspond à sa propre taille corporelle répondue par ChatGPT-4, qui est la taille moyenne des humains.
Bien que ChatGPT n'ait pas de corps réel et ne puisse pas interagir avec le monde, cependant , cela montre une perception du monde similaire à celle des humains : les possibilités d'achat des objets sont divisées en fonction de la taille du corps humain.
En d'autres termes, même si ChatGPT, qui a lu des milliers de livres, n'a fait aucun progrès, il a spontanément émergé avec un schéma corporel, et ce schéma corporel est similaire au schéma du corps humain.
Ainsi, ChatGPT a non seulement appris à penser comme des humains, mais a également appris à agir comme des humains.
En comparant des modèles linguistiques de différentes tailles, les chercheurs ont découvert que la taille du modèle est un facteur clé.
Les modèles plus petits tels que BERT et GPT-2 ne montrent pas l'existence de limites d'accessibilité, cependant, GPT-3.5 et GPT-4 montrent l'existence de limites d'accessibilité ; Les limites sexuelles, tandis que les limites de ChatGPT-4 sont plus similaires à celles des humains, ce qui est cohérent avec les rumeurs selon lesquelles GPT-4 aurait plus de paramètres que GPT-3.
Par conséquent, plus le modèle est grand et complexe, de nombreuses fonctions apparemment impossibles ou non pertinentes émergeront automatiquement.
C'est pourquoi les grandes institutions de recherche ajoutent de plus en plus de paramètres à leurs modèles, et Musk, qui a d'abord fait don de 100 millions de dollars à OpenAI, appelle désormais OpenAI à suspendre la formation Parmi les modèles plus grands, le « Parrain de l'IA » Geoffrey Hinton a exprimé publiquement ses craintes et ses inquiétudes concernant l'IA.
C'est parce que ces fonctions émergentes ont dépassé notre conception originale, et nous sommes peut-être sur le point de perdre le contrôle. La différence est-elle qualitative ou quantitative ?
Dans un autre aspect, la capacité de ChatGPT à appliquer un schéma corporel n'est pas complètement humaine, et il y a encore un écart - ses limites d'accessibilité ne sont pas aussi évidentes que celles des humains.
Si cet écart est quantitatif, comme l'écart entre les capacités linguistiques des enfants et des adultes, alors nous avons des raisons de croire qu'avec le temps, cet écart peut être progressivement complété : soit par apprentissage continu, soit par augmentation continue de la taille du modèle, soit par ajustement des paramètres.L'écart entre ChatGPT et les humains sera toujours réduit, et les problèmes seront progressivement résolus.
Cependant, si cet écart est qualitatif, comme l'écart entre les chimpanzés et les capacités linguistiques des humains, alors quel que soit le type d'entraînement effectué et la durée du temps, cette capacité L'écart ne sera jamais comblé.
Donc, si ChatGPT est qualitativement différent des capacités humaines, alors l'une de nos orientations réalisables à l'avenir est de « mettre un corps » sur ChatGPT.
Cela signifie intégrer des robots avec ChatGPT pour faire progresser les robots basés sur l'IA dans la navigation, la manipulation d'objets et d'autres actions liées à la survie et à la réalisation des objectifs. Capacité à réaliser des percées.
Par exemple, un robot équipé de ChatGPT peut effectuer des tâches complexes en comprenant et en manipulant des objets, comme servir d'assistant à domicile, de gestion d'entrepôt ou de soins médicaux.
Un autre domaine passionnant consiste à combiner ChatGPT avec la capacité de penser et de comprendre grâce à la conduite autonome. Bien que la conduite autonome actuelle ait la capacité de percevoir, elle n’a pas la capacité de penser et de comprendre. On peut l’appeler « des yeux mais pas de cerveau ».
Grâce à l'intégration de ChatGPT et de la technologie de conduite autonome, on peut s'attendre à ce que nous mettions à niveau la technologie de conduite autonome du niveau L2/L3 actuel au niveau L4 ou même L5.
Par contre, la voiture est capable de donner un corps à ChatGPT , lui permettant d'interagir réellement avec le monde. Lorsque ChatGPT ne se contentera plus de « lire des milliers de livres » mais « parcourra des milliers de kilomètres », il pourra faire preuve d’une nouvelle intelligence et d’un nouveau potentiel.
Cela pourrait être la direction de la prochaine percée de l'intelligence artificielle à l'heure actuelle, l'étincelle pourrait devenir un feu de prairie.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!