Maison  >  Article  >  Périphériques technologiques  >  ChatGPT apporte une LUI beaucoup plus grande que AIGC

ChatGPT apporte une LUI beaucoup plus grande que AIGC

王林
王林avant
2023-04-13 10:01:021497parcourir

Si vous pensez que la tendance représentée par ChatGPT fait partie de l'AIGC, ce sera une énorme incompréhension de cette tendance.

ChatGPT en tant que produit démontre un scénario d'application possible d'un grand modèle de langage (LLM), dans lequel la capacité du texte généré par l'IA est particulièrement impressionnante. En raison de cet élan, l'enthousiasme de tous pour cette capacité s'est généralisé aux images, vidéos, musiques et autres contenus générés par l'IA, et ils lui ont donné un nom général appelé AIGC. Cela inclut non seulement des produits comme ChatGPT, mais également une excellente génération d'images comme MidJourney et la série d'outils Stable Diffusion. Quant aux vidéos, à la musique, etc., elles ne sont pas si populaires, mais elles sont également incluses.

Selon la logique générale, si la portée de l'AIGC est plus large que celle de ChatGPT, alors l'AIGC est-il un sur-ensemble des capacités peu claires que représente ChatGPT ?

Ma réponse est non.

ChatGPT Ce type de LLM n'ouvre pas la porte à l'AIGC, mais ouvre la porte à une interface utilisateur en langage naturel (LUI, Language User Interface). LUI est un monde plusieurs ordres de grandeur plus grand que l’AIGC. Comparé à la mer de LUI, l'AIGC est un petit étang.

L'interface entre les humains et les machines est relativement stable et ne change qu'une fois tous les décennies. Et les changements induits par chaque changement sont profonds. Prenons comme exemple l'interface entre nous et les appareils électriques des temps modernes :

était à l'origine BUI (Button User Interface). Pas besoin de chercher, j'ai inventé ce mot, cela signifie utiliser des boutons, des potentiomètres, des interrupteurs, etc. comme interfaces. Cependant, la capacité d'expression de cette interface est trop faible et elle ne peut pas du tout exprimer de boucles, de branches, etc.

Ensuite, vous entrez TUI (Text User Interface), qui consiste à saisir des commandes sur la ligne de commande et l'ordinateur les exécute. Unix et DOS sont cette génération.

est suivi de GUI (interface utilisateur graphique). Cette méthode, née chez Xerox, utilisée dans le Macintosh d'Apple et développée dans Windows de Microsoft, a soudainement dominé toutes les interfaces utilisateur, des ordinateurs aux téléphones mobiles en passant par les tablettes, des années 1980 à nos jours.

Le navigateur, en tant que GIUI (Graphic Internet User Interface), a donné des ailes à Internet et a directement déclenché une époque.

Avec l'avènement des grands modèles de langage, les gens peuvent enfin interagir avec les machines directement en utilisant le langage naturel au lieu de l'interface graphique. Alors pourquoi tout le monde a-t-il préféré utiliser l’interface graphique au lieu d’utiliser directement le langage ? Parce que la technologie n’est pas à la hauteur. La précision de la reconnaissance vocale du paragraphe précédent vient de passer le test, quant à la compréhension du sens sémantique et même de pouvoir y répondre parfaitement, elle est encore loin d'atteindre cette capacité.

Maintenant, les grands modèles de ChatGPT et Baihuahuazheng sont apparus, ce qui abaissera encore le seuil d'utilisation basé sur l'interface graphique déjà pratique pour nous et les ordinateurs. Simplifier quelque chose qui est déjà très simple peut aider beaucoup plus de personnes que d'abaisser le seuil d'une chose complexe (la plupart des gens ne seront toujours pas capables de conduire le Boeing 737 s'il est trois fois moins difficile à utiliser). Ce changement sera lié à tout ce qui concerne la société humaine et à chaque interaction homme-machine. Il changera toutes les industries et la vie de tous.

Par rapport à l'AIGC, bien qu'il existe de nombreux développements passionnants, il s'agit d'un progrès partiel dans l'histoire de ce développement technologique. Elle ne s’applique que dans le domaine de la production de contenus, qui est un domaine partiel. Son développement nécessite encore une période d'exploration plus longue. On ne sait pas encore si la voie des grands modèles de langage peut être appliquée aux images, aux vidéos, aux sons et à d’autres domaines, et on ne sait pas encore où se situera la prochaine avancée majeure. Par conséquent, je pense que le concept d’AIGC est plus grand que l’essence, et qu’il n’est pas la même chose que LLM et LUI.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer