Maison >Périphériques technologiques >IA >Avec la bénédiction de ChatGPT, les grands modèles de prise de décision se rapprochent de l'AGI

Avec la bénédiction de ChatGPT, les grands modèles de prise de décision se rapprochent de l'AGI

王林
王林avant
2023-04-12 18:19:091472parcourir

En moins d’un an, ChatGPT et GPT-4 ont été publiés l’un après l’autre, rafraîchissant constamment la compréhension de l’IA.

Les nouvelles technologies ont apporté des changements et ont également déclenché des discussions sur la question de savoir si l'IA remplacerait les humains. Le PDG d'OpenAI, Sam Altman, a également exprimé publiquement certaines inquiétudes quant aux puissantes capacités de la technologie de l'intelligence artificielle.

Récemment, Wang Jun, professeur au Département d'informatique de l'University College London (UCL), a admis dans une interview avec AI Technology Review que bien que ChatGPT ait de fortes capacités linguistiques et de conversation, il n'est pas capable de prendre des décisions systématiques. , comme le contrôle des machines et la collaboration de groupe, la planification dynamique, etc., et ce sont les éléments les plus révolutionnaires de la vague technologique de l'IA.

Wang Jun, professeur d'informatique à l'University College London (UCL), Turing Fellow de l'Alan Turing Institute. Ses principales recherches portent sur les systèmes d'information intelligents, notamment l'apprentissage automatique, l'apprentissage par renforcement, le multi-agent, l'exploration de données, la publicité informatique, les systèmes de recommandation, etc. Google Scholar a été cité plus de 16 000 fois, a publié plus de 120 articles universitaires et a été cité à plusieurs reprises. A remporté le prix du meilleur article.

ChatGPT 加持,决策大模型距离 AGI 更进一步

Wang Jun

En avril 2022, le Shanghai Digital Brain Research Institute a été officiellement créé et Enigma Tech (nom chinois « Enigma Technology ») a été incubé et créé en interne. Wang Jun a été le co-fondateur de Shanghai Digital. Brain Research Institute, doyen et scientifique en chef de Puzzle Technology ; au cours du second semestre, l'Institut des sciences mathématiques a développé le premier modèle de prise de décision multi-agents à grande échelle au monde, qui intègre CV, PNL, apprentissage par renforcement et multi-agents, et s'engage à aider les entreprises à résoudre des problèmes de prise de décision multi-scénarios.

Wang Jun estime que l'émergence de ChatGPT a résolu le problème de l'abaissement du seuil de formation des grands modèles dans le passé. En combinant le traitement du langage naturel avec de grands modèles de prise de décision, ChatGPT peut apporter non seulement le chat, mais également l'AIGC. (AI Generated Content, production de contenu), explorez davantage AIGA (AI Generated Actions, Decision Generation), afin que les capacités de réflexion et de prise de décision du modèle puissent être appliquées à des scénarios spécifiques, aidant véritablement les entreprises et les personnes à résoudre les problèmes de prise de décision. , et libérer les humains vers des activités plus créatives.

1. En train de conduire à « l'intelligence » dans l'exploration intelligente multi-agents

IA, elle est indissociable de la recherche ultime des questions de définition.

Wang Jun divise le chemin vers l'intelligence en deux étapes. La première étape consiste à clarifier la différence entre les systèmes biologiques (les systèmes vivants (les personnes appartiennent à des systèmes biologiques)) et les systèmes non biologiques.

En 2013, le biophysicien Jeremy England a proposé une théorie révolutionnaire de « l'adaptation basée sur la dissipation », qui attribuait l'origine de la vie au résultat inévitable de la thermodynamique. Les systèmes sans molécules sont métaboliquement consommés par des réactions chimiques dans certaines conditions pour favoriser la consommation d'énergie. consommation continue d'énergie et augmentation de "l'entropie".

Dans la théorie de l'augmentation et de la diminution de l'entropie, le processus de passage du corps vital du désordre à l'ordre continue d'absorber de l'énergie et la diminution de l'entropie pense que l'IA est générée par les humains, elle absorbe donc également de l'énergie pour aider les humains à terminer le processus. mission de réduction de l'entropie. Résoudre Le point clé de la question fondamentale est de savoir comment définir l'intelligence et la quantité d'énergie que l'IA doit absorber pour atteindre un certain niveau d'intelligence.

Lors de l'utilisation de l'IA pour la classification et la reconnaissance d'images, la précision de l'algorithme de classification peut atteindre 98 %. Grâce à la classification, l'IA peut nous aider à transformer l'organisation désordonnée du contenu des images en images ordonnées et régulières. L'incertitude dans le système est réduite et l'entropie est réduite. La réduction de l'entropie nécessite également un calcul, qui détermine la puissance de calcul de l'algorithme. La puissance de calcul est une manifestation de l'énergie consommée.

La deuxième étape vers l'intelligence, estime Wang Jun, consiste à distinguer la conscience des systèmes biologiques et les systèmes dits d'IA. À l'heure actuelle, l'intelligence artificielle existe en tant qu'outil. Les algorithmes ne peuvent que juger de l'excellence du travail de l'IA. La machine elle-même ne pense pas. Comment faire en sorte que la machine atteigne enfin la même capacité de réflexion que les humains nécessite d'abord de comprendre les différents phénomènes du cerveau humain. et une meilleure compréhension des problèmes de sensibilisation à l’IA.

Pour Wang Jun, la conscience est une manifestation importante de l'intelligence. Les mammifères peuvent détecter la conscience, percevoir la conscience et former des sentiments subjectifs en même temps, lorsque plusieurs individus interagissent avec l'environnement, il doit y avoir une autre personne consciente en plus d'un seul individu ; L'individu et l'environnement influencent et résonnent, permettant l'expression de sentiments subjectifs.

À cet égard, Wang Jun et son équipe ont proposé que dans la recherche sur l'IA, l'interaction multi-agents (Multi-Agent) doit être utilisée pour induire la conscience.

Prenons l'exemple des grands modèles. La tâche croisée est définie artificiellement et est limitée à une tâche spécifique donnée. Il est difficile de produire une IA plus intelligente en concevant l'algorithme que la machine doit exécuter, ainsi que la réflexion et la décision du modèle. les capacités de fabrication ne peuvent pas être améliorées.

Wang Jun a déclaré à AI Technology Review : « Lorsque vous faites avancer plusieurs choses en même temps, une grande idée est nécessaire pour vous guider. Sinon, il est évident qu'il manque toujours une loi inhérente. modèles de machines vers un chemin critique plus « intelligent ».

En mai 2022, DeepMind a lancé « GATO », un agent polyvalent qui combine CV et PNL. Il peut jouer à des jeux Atari, produire des sous-titres d'images, empiler des blocs avec des bras robotiques, discuter avec des gens, etc., et peut également créer des sous-titres. décisions basées sur le contexte. Qu'il s'agisse de produire du texte, des couples d'articulations, des pressions sur des boutons ou d'autres jetons (mot à mot), ce travail a suscité de nombreuses discussions à l'époque. Wang Jun est également l'un des adeptes.

En fait, à partir de 2021, Wang Jun et son équipe ont commencé à réfléchir à la possibilité de créer un modèle de prise de décision capable de mettre en œuvre des tâches croisées et d'imbriquer CV, PNL, apprentissage par renforcement et multi-agents dans une décision unifiée. fabrication de modèle. L'émergence de « GATO » a permis à Wang Jun de voir le vaste espace explorable des grands modèles. « Cela suffit à prouver que c'est la tendance générale qu'un seul modèle résolve des tâches dans plusieurs domaines. Il suffit de partir de la signification de la taille du modèle. L'essence est d'atteindre un certain niveau de cognition grâce à une interaction continue avec l'environnement grâce à l'apprentissage par renforcement dans l'ensemble de données. Le point technique le plus important est de réduire la complexité de l’apprentissage par renforcement et de l’interaction avec l’environnement.

Les données originales jouent un rôle clé dans ce lien.

Construisez un modèle pré-entraîné en entraînant les données originales générées par d'autres tâches ou algorithmes interagissant avec l'environnement. Ce modèle peut être rapidement appliqué face à de nouvelles tâches, maximisant ainsi la valeur des règles, des relations et des données. À mesure que l'ensemble de données de pré-formation continue de s'étendre, le modèle s'agrandit également jusqu'à ce qu'il puisse couvrir toutes les tâches.

Le résultat final est que les méthodes pour résoudre le problème sont rassemblées et que plusieurs directions sont convergées et unifiées en un multi-agent qui peut être planifié et généralisé à travers les tâches. Les agents multi-agents doivent souvent tenir compte de la relation d'équilibre, c'est-à-dire que tout en atteignant leurs propres objectifs, l'autre partie peut également atteindre ses objectifs et se restreindre mutuellement pour maintenir un équilibre stable.

Dans des scénarios d'application pratiques, le multi-agent peut également aider les gens à résoudre de nombreux problèmes pratiques, tels que la recherche, la recommandation et même la publicité sur Internet. Il s'agit essentiellement d'un processus de prise de décision pour aider les utilisateurs à trouver le contenu dont ils ont besoin, et ce contenu. est conforme aux préférences de l'utilisateur, "ce qui vous est recommandé, est en fait une décision.".

L’avantage du multi-agent est qu’il peut faire jouer pleinement ses capacités cross-tâches.

En fait, dès 2017, Wang Jun et son élève Zhang Weinan (professeur à l'Université Jiao Tong de Shanghai) ont lancé des tentatives croisées pour ajouter l'apprentissage par renforcement au traitement du langage naturel (PNL).

Lorsque le traitement du langage naturel utilisait GAN pour générer du texte dans le passé, en raison des données discontinues dans l'index de mots et le vecteur de mots pendant le processus de conversion, les paramètres de réglage fin ne fonctionnaient souvent pas seulement à cause de cela, car le modèle discriminant de Le GAN n'a généré que des données dans leur ensemble, mais le texte est généralement généré mot par mot, ce qui rend difficile le contrôle des détails.

À cette fin, ils ont proposé le modèle SeqGAN, qui a résolu le problème de l'application du GAN à des données discrètes en s'appuyant sur des stratégies d'apprentissage par renforcement. C'était également l'un des premiers articles à utiliser l'apprentissage par renforcement pour former un modèle de langage génératif, réalisant du texte. génération en naturel Il a un large éventail d'applications dans différents domaines tels que le traitement du langage et la recherche d'informations.

ChatGPT 加持,决策大模型距离 AGI 更进一步Adresse papier : https://arxiv.org/pdf/1609.05473.pdf

"L'apprentissage par renforcement et la prise de décision sont essentiellement liés. Grâce à l'apprentissage par renforcement, certains problèmes de prise de décision peuvent être résolus chez Wang." Le point de vue de Jun, La prise de décision est un problème de recherche à long terme.La proposition de modèles de prise de décision multi-agents à grande échelle peut constituer des avantages uniques dans certains domaines spécifiques après la généralisation.La plupart des problèmes de l'IA peuvent être résolus à l'aide de grands outils. modèles de prise de décision à grande échelle.

2. AIGA va plus loin que AIGC

ChatGPT n'a pas encore passé la pression Après la sortie du grand modèle multimodal pré-entraîné GPT-4 le 15 mars, un autre changement perturbateur a éclaté.

Dans ce concours d'intelligence artificielle générale, ChatGPT et GPT-4 ne sont pas les points finaux. L'objectif principal du concours est la révolution industrielle et l'innovation les plus précieuses sous la vague.

Pendant cette période, Wang Jun a également maintenu une communication étroite avec des amis préoccupés par les capitaux boursiers.

De l'avis de Wang Jun, certains des problèmes rencontrés dans le cercle universitaire ne sont pas assez audacieux et sont soumis à des contraintes de ressources, et la réflexion sur les problèmes sera limitée par certains facteurs. Dans le monde industriel, les grands modèles de prise de décision peuvent avoir des scénarios d'application plus riches. Que ce soit dans les industries traditionnelles, les recommandations de recherche sur Internet, l'Internet industriel, etc., toutes sortes de décisions sont nécessaires.

Avec cette idée en tête, Wang Jun a commencé à envisager la possibilité d'intégrer des modèles de prise de décision à grande échelle dans l'industrie, le monde universitaire et la recherche.

Après une période de préparation d'un an, le Shanghai Digital Brain Research Institute a été officiellement créé en avril 2022, et Enigma Tech (« Enigma Technology ») a été incubée et créée en interne. Elle est principalement responsable de la mise en œuvre des résultats de la recherche scientifique du numérique. Brain Research Institute dans l’industrie et fournit une plate-forme de recherche numérique. L’institut propose des scénarios réels et des données commerciales réelles. Wang Jun est co-fondateur et doyen de l'Institut de recherche mathématique, et est le scientifique en chef de Puzzle Technology.

Lorsque de grands modèles entrent dans des scénarios d'application réels, les entreprises sont souvent confrontées à deux problèmes majeurs : le modèle n'est pas à large spectre et le seuil d'entrée est élevé.

La méthode classique d'apprentissage automatique adopte un modèle personnalisé. Une fois que l'entreprise a émis une tâche, elle définit d'abord le problème, collecte les données pour la formation et teste le modèle. Une fois la tâche secondaire émise, le modèle doit collecter et définir le modèle. problème, collecter des données pour la formation et modéliser à nouveau oblige souvent les entreprises à gaspiller beaucoup de ressources financières et humaines lors du déploiement, et ce n'est pas à large spectre. Dans le même temps, l'utilisation de grands modèles nécessite des capacités techniques extrêmement élevées de la part des ingénieurs et une certaine expérience en optimisation, et le seuil de participation des entreprises est élevé.

Wang Jun estime que ChatGPT, combiné à de grands modèles de prise de décision, peut résoudre efficacement des problèmes à faible seuil et à large spectre.

Dans cette réflexion, Wang Jun a dirigé l'équipe de technologie des puzzles pour proposer le grand modèle DB (AIGA direction model, AIGA : AI Generated Actions, Decision Generation. Son premier DB1 est le premier grand modèle de prise de décision multimodale au monde). GATO lancé par DeepMind peut entièrement prendre en charge plusieurs agents et gérer plus d'un millier de tâches de prise de décision simultanément.

ChatGPT 加持,决策大模型距离 AGI 更进一步

Performance de DB1 dans les tâches de collaboration des véhicules

En combinant ChatGPT avec un grand modèle de prise de décision, ChatGPT apporte non seulement le chat, mais explore également AIGA sur la base de l'AIGC, permettant ainsi la capacité de réflexion et de décision du modèle. Les capacités de création sont appliquées à des scénarios spécifiques. Les interactions qui en résultent interagissent avec l'environnement de scénarios spécifiques. Les petites données accomplissent de grandes tâches, qui peuvent être directement orientées vers des scénarios industriels réels, des boucles fermées de tâches sont réalisées pour réaliser un robot. collaboration, dynamique des équipements et autonomie de l’entreprise. Planification, développement de logiciels et autres applications plus larges.

Et puis aider véritablement les entreprises et les individus à résoudre les problèmes de prise de décision, en libérant les humains vers des activités plus créatives. "En fin de compte, cela apportera une grande promotion au progrès de l'ensemble de la race humaine. Dans ce cas, nous pouvons engendrer une véritable AGI (Intelligence Générale Artificielle)."

Actuellement, la structure de base du Digital Brain Research Institute est achevée, et l'entreprise Le contenu couvre tout, des algorithmes et systèmes aux projets d'ingénierie spécifiques, et peut être appliqué à plusieurs scénarios tels que les systèmes de recommandation, la prédiction des pannes, la conduite autonome, la conception du marché, les scénarios de jeu, l'optimisation EDA, etc. pour résoudre des problèmes pratiques dans opérations de l’entreprise.

Pour Wang Jun, quittant le laboratoire et créant le Digital Brain Research Institute, ses sentiments et son état sont complètement différents : il est impossible de considérer tous les facteurs ensemble dans la recherche. Pour résoudre ce problème, il faut d'abord simplifier d'autres choses, et le. réel Une fois le problème résolu, passez au suivant ; et la mise en œuvre d'une recherche est plus susceptible d'être un ensemble de problèmes multiples, ce qui nécessite que chaque problème soit résolu un par un, et que les méthodes pour résoudre le problème soient être appliqué uniformément.

En juillet de l'année dernière, AI Technology Review a eu l'honneur d'avoir une discussion approfondie avec le doyen Wang Jun. À cette époque, il a déclaré que l'objectif de l'Institut de mathématiques était de promouvoir la recherche sur l'intelligence décisionnelle et la recherche sur l'IA. , et faire la recherche la meilleure et la plus fondamentale en Chine.

En seulement un an, l'émergence de modèles tels que Stable Diffusion, ChatGPT et GPT-4 a surpris Wang Jun de réaliser les progrès révolutionnaires de la technologie de l'IA, et lui a également donné un objectif plus concret pour l'Institut de mathématiques, appliquer à grande échelle. modèles de prise de décision à des scénarios spécifiques pour résoudre des problèmes d’importance pratique.

Du milieu universitaire à l'industrie, le Digital Brain Research Institute ne s'est pas développé depuis longtemps, et son prototype reflète également l'orientation de l'exploration et de l'exploration de Wang Jun sur la voie de l'intelligence artificielle. "Nous voulons simplement suivre notre propre chemin. Comment pouvons-nous combiner l'industrie, le monde universitaire et la recherche pour créer une nouvelle voie et poser des questions qui n'ont jamais été posées auparavant

3. Dialogue avec Wang Jun

Un grand modèle." de prise de décision pour la mise en place de l'Institut de Mathématiques

AI Technology Review : Présentation des travaux et des progrès réalisés par l'Institut de mathématiques au cours de l'année écoulée sur les modèles de prise de décision multi-agents à grande échelle.

Wang Jun : J'ai commencé à planifier un nouveau sujet l'été dernier. Nous avons senti que les grands modèles n'étaient pas seulement présents dans la PNL et le CV, mais jouaient également un rôle important dans la prise de décision. À cette époque, le travail de DeepMind « GATO » était à l'essai. combiner diverses tâches dans un grand modèle et l'apprendre dans Transform nous a inspiré, nous avons donc décidé d'explorer en fonction de cela et avons créé un grand modèle de prise de décision, comprenant des données vidéo, des images et des données en langage naturel, un robot. des données, et même des données du solveur, sont ajoutées, telles que la manière d'effectuer des tâches d'optimisation, d'organiser les calendriers de production, d'optimiser les véhicules, etc. Nous avons créé un grand modèle avec environ 1 milliard ou 1,5 milliard de paramètres. Bien qu'il s'agisse d'une première exploration, cela a également prouvé que le grand modèle n'est pas seulement un traitement du langage naturel, mais qu'il joue également un rôle important dans la prise de décision.

Nous travaillions sur un jeu de football il y a quelque temps et avons trouvé un problème non résolu : la logique de recherche actuelle de l'apprentissage par renforcement, AlphaGo, StarCraft, Dota et autres systèmes de jeu, plus il y a de monde, plus il y aura d'espace de prise de décision être complexe.

À cet égard, nous avons utilisé le football dans la scène du jeu comme point de recherche du problème et avons fait de nombreuses tentatives dans le grand modèle de prise de décision multi-agents, du simple football à 2, au football à 5 ​​personnes, en passant par 11. -personne. Il s'agit d'un scénario relativement vaste et difficile pour l'apprentissage par renforcement. À l'heure actuelle, la nature du problème n'a pas été complètement résolue, ou elle a été très bien résolue, nous avons donc consacré beaucoup de temps à cette question, dans l'espoir d'en résoudre. réalisations.

AI Technology Review : Après la sortie de ChatGPT, quel impact cela aura-t-il sur la recherche de l'Institut de Mathématiques ?

Wang Jun : Notre objectif a toujours été de prendre des décisions, et cela reste le même aujourd'hui. Mais après la sortie de ChatGPT, nous avons été très surpris par ses capacités linguistiques, qui ont complètement dépassé nos attentes et ont également joué un certain rôle dans la promotion des tâches décisionnelles.

Dans le processus d'optimisation de la prise de décision, deux problèmes majeurs doivent être résolus : le large spectre et le seuil bas.

Le grand modèle de prise de décision résout dans une certaine mesure le problème à large spectre du modèle. De nouvelles tâches sont placées dans le grand modèle pour l'itération et le réglage fin. Un grand modèle peut traiter divers problèmes de prise de décision.

Le problème du seuil bas est courant dans les entreprises d'IA. Avant cela, l'utilisation de grands modèles nécessitait une très grande capacité des ingénieurs pour participer au processus de prise de décision concernant le problème. entreprises à participer était très élevé , augmente également le coût de l'utilisation de l'IA.

Afin de résoudre le problème du faible seuil d'utilisation, nous avions précédemment envisagé d'inventer un langage relativement simple qui puisse être plus complexe et rigoureux que le langage naturel, mais plus simple que la vraie programmation, et pouvant être utilisé par n'importe qui. ChatGPT, tout à coup Réalisons que le langage naturel de la machine peut atteindre un niveau de communication normal avec les gens et que le problème du seuil bas est immédiatement résolu. Pour nous, l’impact de ce changement est assez important.

Ce qui est plus intéressant, c'est que ChatGPT possède certaines capacités de raisonnement logique, qui peuvent nous aider à décomposer un problème complexe en plusieurs sous-problèmes. Cette partie du sous-problème nécessitait à l'origine que les professionnels le décomposent manuellement, mais grâce à la compréhension de la sémantique de ChatGPT, après. En obtenant l'exemple, le problème peut être décomposé en problèmes de base, puis les capacités de prise de décision existantes des problèmes de base peuvent être directement appelées via le grand modèle de prise de décision.

ChatGPT abaisse le seuil de prise de décision

Commentaire sur la technologie IA : les modèles de prise de décision multi-agents couvrent de nombreux domaines. Quelles sont les exigences en matière de données ? Après l'avoir combiné avec ChatGPT, existe-t-il des besoins particuliers en matière de données dans un certain domaine ?

Wang Jun : Il y aura des exigences spécifiques.

Les données en langage naturel sont hors ligne et appartiennent à l'apprentissage méthodologique ; la prise de décision nécessite de nombreuses capacités de génération de données et nécessite un simulateur. Par exemple, lorsque nous entraînons un chien robot à marcher, nous ne le laisserons pas se promener les jours de pluie ou dans d'autres environnements pour collecter des données. Au lieu de cela, nous construisons souvent un simulateur très similaire au monde extérieur et utilisons le simulateur pour générer. données, une fois le modèle appris, il est placé dans une scène réelle pour donner des commentaires, puis revient pour apprendre à nouveau, afin qu'il puisse rapidement transférer ses capacités de prise de décision vers des applications réelles. La technologie des grands modèles couvre une variété de scènes, qu'il pleuve, marche dans les escaliers ou marche sur le sable, il n'y a aucun problème.

ChatGPT 加持,决策大模型距离 AGI 更进一步

Le chien mécanique se promène dans différents environnements

La deuxième difficulté est que la formation des données décisionnelles est plus difficile que le traitement du langage naturel. Les données sont constamment générées dans ce processus, où elles sont générées et comment les allouer aux différents modules d'apprentissage selon les besoins d'apprentissage. En tant que solution unifiée au niveau du système, nous avons précédemment développé un ensemble de méthodes d'apprentissage à grande échelle, qui sont principalement utilisées dans cette méthode de formation par apprentissage par renforcement. Cependant, après la sortie de ChatGPT, la méthode de formation basée sur le grand modèle Oracle n'était pas adaptée.

AI Technology Review : Dans des scénarios spécifiques, comment utiliser ChatGPT pour le combiner avec de grands modèles décisionnels ?

Wang Jun : Prenons le cas d'un chien mécanique : au début, nous avons utilisé la méthode classique de contrôle pour dresser le chien mécanique. Son problème est qu'il n'a aucun problème à marcher sur une seule condition environnementale de route, mais il ne le peut pas. marcher les jours de pluie ou de neige. Mais lorsque nous avons ajouté la solution grand modèle, le chien robot a commencé à avoir des capacités d'interaction de base et à raisonner. Envoyez une instruction au chien robot pour envoyer un message, et le modèle décomposera automatiquement la tâche en 1 à 5 étapes de base. Chaque module a une logique correspondante dans la transmission, telle que la planification du chemin d'un point A à un point B.

Étant donné que le chien robot lui-même n'a pas le concept d'aller vers l'est ou l'ouest, seulement des coordonnées, il est nécessaire de combiner et de faire correspondre les instructions interactives avec une sémantique spécifique, nous n'avons pas besoin de convertir les instructions dans un langage de programmation. Il peut interagir directement : après avoir reçu la question, le chien robot va décomposer l'instruction en plusieurs questions différentes. Il va d'abord optimiser une partie du Chat et faire correspondre les actions, les décisions et la sémantique avec le langage naturel généré par ChatGPT.

C'est devenu l'orientation principale de notre prochaine recherche. Nous l'appelons AIGA (AI generate actions). Au début, ChatGPT a apporté l'AIGC. En combinaison avec le grand modèle de prise de décision, nous sommes allés plus loin de la génération de contenu à la création de contenu. générer des actions. Générer des décisions.

La force de l'Institut de Recherche Numérique réside dans les modèles décisionnels à grande échelle, nous insistons donc sur l'orientation des modèles décisionnels à grande échelle. Nous voulons que l'IA non seulement communique, mais, plus important encore, vous aide à optimiser et à optimiser. prendre des décisions. Nous pensons que c'est d'une grande valeur. Une fois ChatGPT combiné avec le grand modèle de prise de décision, l'interaction générée ne se limite plus à sa capacité à répondre aux questions, mais aussi à savoir si elle peut comprendre une construction complexe et complexe. En interagissant avec l'environnement de scénarios spécifiques, ChatGPT peut être combiné. avec le grand modèle de prise de décision pour réaliser la collaboration des robots, la dynamique des appareils, la planification autonome de l'entreprise, le développement de logiciels et d'autres applications plus larges.

Le langage naturel est la base

Revue de la technologie IA : après la formation de données multimodales, lorsque le nombre de paramètres atteint quel niveau, davantage de capacités émergeront : texte, image, voix, vidéo... Quelle modalité est la plus performante ? adapté à la multimodalité ? L’impact du modèle sera-t-il plus important ?

Wang Jun : En termes de données, il y a une certaine limite à la question du « pouvoir peut produire des miracles ». Bien que nous n'ayons pas encore pleinement vu cette limite, je pense que nous ne nous concentrons pas uniquement sur l'apprentissage de la méthode d'entraînement. ChatGPT.

ChatGPT possède de solides compétences linguistiques et de solides compétences conversationnelles, mais ChatGPT comprend-il vraiment ce qu'il absorbe ? Je pense que ce n'est pas compris. Laissez-le jouer à un jeu de devinettes. En apparence, il peut jouer, mais en fait, il ne connaît pas et ne peut pas deviner le nombre dans votre esprit. ChatGPT consiste davantage à mémoriser le contenu logique des données de formation originales. Sa capacité à faire correspondre les informations est très forte, mais sa capacité à vraiment comprendre est très faible.

Comment briser ses limites ? Je pense que nous devons ajouter à la formation la compréhension du monde entier par le modèle. S'il ne construit pas un modèle mathématique pour décrire le monde et n'intègre pas sa compréhension dans le modèle du monde, il n'aura pas une compréhension plus profonde du monde environnant. de. Pour donner un exemple simple, nous donnons à ChatGPT toutes les données sur les capacités humaines de jeu d'échecs inférieures à 2 000 points. Si le modèle imite uniquement les personnes, il ne peut pas imiter une intelligence supérieure à 2 000 points.

ChatGPT 加持,决策大模型距离 AGI 更进一步

L'assistant de création d'IA précédemment réalisé par l'équipe de Wang Jun

Les données sont importantes, mais en même temps, la taille du modèle est également importante, et il doit y avoir différentes méthodes de formation pour l'améliorer.

En multimodalité, le langage naturel est le fondement. Lorsque les gens pensent, le langage est le support de notre pensée. Il construit une description logique relativement claire. Cette description logique peut ne pas être rigoureuse à 100 %, et il existe différentes C'est clair. et floue, mais cela nous suffit pour exprimer des relations logiques très complexes.

Mais en même temps, il faut aussi bien comprendre que les informations sémantiques et les expressions implicites dans le langage naturel sont très importantes, c'est-à-dire qu'elles peuvent exprimer le problème très clairement, mais ce n'est qu'une apparence, et en fin de compte Le l'essentiel est la relation sémantique contenue dans le dialogue. Lorsque d'autres modes multimodaux arrivent, elle peut être transférée à d'autres modalités en faisant correspondre les expressions sémantiques correspondantes.

Sur la base du langage naturel, nous pouvons ajouter d'autres modalités supplémentaires pour participer au modèle.

AI Technology Review : Comment voyez-vous l'impact des données de « retour humain » sur les grands modèles multimodaux ou les grands modèles décisionnels ?

Wang Jun : Certaines données de retour humain sont nécessaires, mais la quantité n'est pas aussi importante que les exigences d'apprentissage supervisé précédentes. Un modèle de base n'a besoin que de quelques démonstrations. Le but est de guider le modèle de base pour s'adapter aux nouveaux. scénarios de tâches. Laissez le modèle de base révéler ses capacités originales. Il s’agit d’une innovation du modèle classique de formation en apprentissage automatique.

Dans le passé, la plupart des entreprises d'IA adoptaient un modèle personnalisé pour l'apprentissage automatique. Lorsque la tâche arrivait, elles définissaient d'abord le problème, collectaient des données pour la formation et testaient le modèle. Une fois la deuxième tâche lancée, elles collectaient et définissaient à nouveau. Le problème, les données collectées pour la formation et les tests de modèles sont non seulement difficiles à reproduire, mais le déploiement consomme également beaucoup de ressources financières et humaines.

L'apprentissage automatique après ChatGPT est d'abord basé sur de grands modèles. Je n'ai pas besoin de savoir quel est le problème spécifique, je peux d'abord construire le modèle, puis le distribuer aux clients ou aux fabricants. n'a pas la capacité de former de grands modèles. L'entreprise déploie puis définit le processus global à l'envers. Son essence est d'activer le grand modèle et de l'appliquer à des tâches spécifiques, puis de définir les tâches et de produire les résultats. Cela réduit considérablement l'impact. de données de « retour humain » sur le modèle et réalise véritablement une IA à large spectre et à bas seuil.

Commentaire sur la technologie IA : Certaines personnes pensent que dans ce cycle de compétition ChatGPT, la puissance de calcul et les modèles ne sont plus aussi importants que lors des deux périodes précédentes, mais les scénarios et les données deviendront la clé de ce cycle.

Wang Jun : Les modèles sont très importants. Les améliorations actuelles des capacités linguistiques de certains grands modèles permettront aux modèles d’avoir la capacité de comprendre les gens, mais ce n’est qu’une apparence. La méthode de formation de base du modèle qui s'appuie uniquement sur quelques mots pour prédire le mot suivant est difficile à produire une plus grande intelligence. Les capacités de réflexion et de prise de décision du modèle ne peuvent pas être améliorées, et ces deux capacités sont les plus fondamentales de l'intelligence artificielle dont vous avez besoin. savoir comment interagir avec l'environnement.

Du point de vue de ce modèle, le modèle doit encore être innové. L'architecture Transform est très bonne, mais cela ne signifie pas que nous pouvons arrêter d'avancer. Nous avons encore besoin de modèles de réseaux neuronaux innovants, créatifs et réfléchis pour émerger. .

La puissance de calcul, les modèles, les données et les scénarios sont tous très importants. Lorsque les données et la puissance de calcul atteignent une certaine hauteur, une nouvelle innovation est nécessaire. Après l'innovation, les variables de données et de puissance de calcul s'accumulent, puis une certaine hauteur. est atteinte et l'innovation, qui est un processus en spirale.

Le scénario est le but En fin de compte, nous devons définir et résoudre les problèmes dans le scénario, et pas seulement laisser la recherche rester au niveau académique. Une fois la scène pilotée, un nouveau modèle ou une nouvelle méthode est utilisé, et les données et la puissance de calcul sont utilisées pour la faire atteindre un autre extrême.

ChatGPT a un très large spectre, mais cela ne signifie pas qu'il peut résoudre tous les problèmes d'IA. À quoi devrions-nous penser dans le prochain scénario et quels problèmes peut-il résoudre ? Le cœur du problème est de rendre les capacités de réflexion et de prise de décision du modèle réellement applicables à des scénarios spécifiques. En même temps, il doit interagir avec l'environnement, les personnes et divers scénarios, et finalement réaliser l'application du modèle à l'environnement. l’ensemble de l’industrie énergétique. Il a apporté une grande promotion au progrès de l’humanité dans son ensemble.

Dans ce cas, nous pouvons donner naissance à de véritables AGI. C'est également l'objectif de l'Institut de Mathématiques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer