Maison  >  Article  >  Périphériques technologiques  >  Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

PHPz
PHPzavant
2023-10-17 14:29:05824parcourir

Récemment, Wall-Facing Intelligence, l'une des principales sociétés nationales de grands modèles d'intelligence artificielle, a fait un autre grand pas en avant. Elle s'est associée au Laboratoire PNL de l'Université Tsinghua pour développer et lancer conjointement le grand modèle "super-héros" -. XAgent.

Grâce au test de tâches, les capacités de traitement de XAgent dans des tâches réellement complexes ont complètement dépassé AutoGPT.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.


Adresse d'affichage du cas : https://x-agent.net/
  • Adresse du blog : https://blog.x-agent.net
  • XAgent Qui est une « personne » ?

XAgent est un nouvel agent d'IA capable de résoudre des tâches complexes de manière autonome. Avec LLM comme noyau, il peut comprendre les instructions humaines, formuler des plans complexes et prendre des mesures de manière autonome.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.Les agents traditionnels sont généralement limités par des règles personnalisées par l'homme et ne peuvent résoudre des problèmes que dans une plage limitée. Ils ressemblent davantage à des « outils » à usage humain qu’à de véritables « agents autonomes » et sont difficiles à résoudre de manière autonome des problèmes complexes.

En revanche, XAgent est doté de la capacité de

planification et prise de décision autonomes, lui permettant de fonctionner de manière indépendante et de découvrir de nouvelles stratégies et solutions sans être lié par des préréglages humains.

Ses capacités ont complètement dépassé AutoGPT, montrant une autonomie incroyable et des capacités de résolution de tâches complexes dans de nombreuses tâches de scène, élevant le niveau d'intelligence des agents IA à un nouveau niveau.

Puis la question revient : comment est-il mis en œuvre ?

Collaboration "cerveau gauche et droit", mécanisme à double cycle

Tout comme les humains ont un "cerveau gauche" et un "cerveau droit", lorsqu'ils traitent des tâches complexes, ils le considèrent généralement sous deux angles : "macro" et « micro ». Il est nécessaire de coordonner et de planifier la situation globale, ainsi que de la considérer au niveau de l'exécution.

Par rapport à AutoGPT, Wallface Intelligence et l'Université Tsinghua ont introduit de manière innovante un "

mécanisme à double boucle

" dans la conception de XAgent :

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Boucle externe : responsable de la situation globale Tâche planification, décomposant les tâches complexes en tâches simples et exploitables.

  • Boucle intérieure : Responsable de l'exécution des tâches locales et concentration sur les détails.
  • Grâce à la coopération du mécanisme à double boucle, XAgent est comme un « super-héros » dans le domaine des grands modèles. Il fait preuve d'un super professionnalisme et de riches compétences lorsqu'il traite différents aspects de tâches complexes. Tout comme "Captain America" ​​​​dans l'univers Marvel, XAgent a à la fois un leadership global et une exécution méticuleuse.
Dans la boucle externe, XAgent fait preuve de leadership en tant que

"PlanAgent". Il divisera les tâches complexes en plusieurs tâches simples et supervisera le processus complet de résolution de problèmes.

Premièrement, il décompose une tâche complexe donnée en « sous-tâches » plus petites et plus faciles à gérer, génère un « plan initial

» et forme une séquence de tâches.

Par la suite, il transmettra chaque sous-tâche à la boucle interne pour solution une par une. Au cours de ce processus, la boucle externe surveillera en permanence la progression et l'état de la tâche, et effectuera une « optimisation itérative

» sur les plans ultérieurs en fonction des commentaires.

Dans la boucle interne, XAgent change rapidement d'identité, démontrant son professionnalisme en tant qu'« exécuteur » efficace (ToolAgent

) pour s'assurer que les sous-tâches délivrées par la boucle externe répondent aux attentes.

Selon la nature de la sous-tâche, il peut récupérer des outils à partir de systèmes externes et résoudre la sous-tâche étape par étape.

Une fois la sous-tâche terminée, elle générera un reflet du processus d'exécution de la sous-tâche en cours et le renverra à la boucle externe pour indiquer si la tâche en cours est terminée et les points d'optimisation potentiels dans l'exécution de la tâche.

Comme le montre la figure, l'utilisateur a soumis le fichier iris.zip à XAgent pour que XAgent analyse les données.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Comme vous pouvez le voir, XAgent décompose d'abord cette tâche en 4 sous-tâches via la boucle externe :

  1. Vérifier et comprendre les données
  2. Vérifier l'environnement Python du système et visualiser les données associées ; Si la bibliothèque d'analyse de données existe ;
  3. Écrire un code d'analyse de données pour traiter et analyser les données ;
  4. Écrire un rapport d'analyse basé sur les résultats de l'exécution du code Python ;

Par la suite, lors de l'exécution de chaque sous-tâche, XAgent utilise habilement la lecture et l'écriture de fichiers, les commandes shell, le notebook python et les pandas correspondants, sci-kit learn, seaborn, matplotlib et d'autres bibliothèques d'analyse de données via la boucle interne, et même effectuer une analyse visuelle des données.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Lors de l'exécution de la même tâche, AutoGPT n'a pas prévu de vérifier l'environnement Python et les bibliothèques associées, mais a directement commencé à écrire du code pour l'exécution, ce qui a entraîné des échecs et des rapports d'erreurs lorsque en utilisant des bibliothèques connexes. Une analyse sophistiquée des données n’a pas non plus été réalisée.

Collaboration homme-machine : un nouveau paradigme d'interaction entre agents

Bien qu'AutoGPT ait dans une certaine mesure dépassé les limites du modèle GPT traditionnel, il présente toujours le phénomène d'erreurs d'exécution telles que des boucles infinies et des erreurs les appels qui nécessitent une intervention manuelle peuvent être résolus.

XAgent a pris en compte les problèmes connexes dès le début de sa conception et a introduit un mécanisme d'interaction spécialement conçu pour améliorer la collaboration homme-machine : il peut interagir avec les utilisateurs de manière autonome et émettre des demandes d'intervention et de guidage de la part des humains.

Pour un agent intelligent, « sa capacité à coopérer avec les humains » est également un indicateur important qui reflète son intelligence.

Tout d'abord, XAgent dispose d'une interface intuitive qui permet aux utilisateurs de remplacer ou de modifier directement les suggestions qu'il fait, combinant efficacement l'efficacité de l'IA avec l'intuition et l'expertise humaines.

Deuxièmement, face à des défis inconnus, XAgent a la capacité de « demander de l'aide aux humains ». Il recherchera des commentaires, des suggestions ou des conseils en temps réel auprès des utilisateurs pour garantir que même dans des domaines incertains, l'agent peut fonctionner. c'est le meilleur.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.Pictures

Ce paradigme d'interaction intègre organiquement l'autonomie de l'IA avec la sagesse humaine, démontrant une nouvelle relation de collaboration entre les humains et XAgent.

Comme le montre l'image, l'utilisateur souhaite que XAgent l'aide à recommander de délicieux restaurants pour faire la fête entre amis, mais aucune information spécifique et détaillée n'est fournie.

À ce stade, XAgent peut se rendre compte que les informations actuellement fournies par l'utilisateur ne suffisent pas pour faire des recommandations, il fait donc une demande aux humains, demandant l'emplacement préféré de l'utilisateur, la fourchette budgétaire, les préférences gustatives, les tabous, etc. , et après avoir obtenu l'utilisateur, les restaurants recommandés sont fournis en fonction des commentaires.

Mais AutoGPT a directement commencé à rechercher des informations sur les restaurants sur Internet pour obtenir des recommandations. Les résultats finaux recommandés étaient au mauvais endroit, ne tenaient pas compte du budget de l'utilisateur et ne répondaient pas à ses besoins.

Langage de communication efficace, appel d'outil super puissant

Indépendamment du mécanisme de fonctionnement à « double cycle » ou de la capacité interactive de « collaboration homme-machine », dans la conception globale de XAgent, Wallface Intelligence et l'équipe Tsinghua se sont concentrées sur fonctionnalités de base de l'intelligence telles que la stabilité, l'efficacité et la sécurité.

Et la méthode de communication structurée est également l'un des facteurs importants dans la construction d'un agent intelligent fort et stable.

XAgent utilise Function Call comme langage de communication interne, ce qui présente les avantages de structuration, de standardisation et d'unification.

  • Structured : L'appel de fonction a un format clair et rigoureux qui indique clairement ce qui est requis, minimisant ainsi les erreurs potentielles.
  • Standardisation : Function Call peut standardiser le processus d'interaction avec des outils externes, fournir un langage commun et permettre aux agents d'avoir la possibilité d'utiliser et d'intégrer plusieurs outils pour résoudre des tâches complexes.
  • Unification : en convertissant tous les liens tels que le résumé des informations, la planification des tâches, l'exécution d'outils, etc. en formulaires d'appel de fonction spécifiques, garantissant que chaque lien est traité de manière unifiée, simplifiant ainsi la conception du système.

De plus, l'invocation d'outils est également l'une des capacités importantes pour évaluer si l'agent IA a la capacité de résoudre des problèmes complexes.

XAgent dispose d'un moteur d'exécution d'outils original ToolServer dans sa conception, qui peut atteindre des capacités d'exécution d'outils plus sécurisées, efficaces et évolutives.

Il fonctionne dans un environnement Docker isolé, garantissant que l'exécution de l'outil ne compromet pas la stabilité ou la sécurité du système principal.

Cette conception apporte de multiples avantages :

  • Sécurité : L'exécution d'outils à l'intérieur d'un conteneur Docker protège le système principal des dommages potentiels.
  • Efficient : Le système peut démarrer, arrêter et redémarrer des nœuds en fonction de la demande et des modèles d'utilisation pour obtenir une utilisation optimale des ressources.
  • Extensible : Gestion pratique du code, débogage et évolutivité.

Les composants clés de ToolServer incluent : ToolServerNode, ToolServerMonitor et ToolServerManager, qui offrent de puissantes fonctionnalités dans les opérations d'exécution, l'inspection des nœuds, la gestion des cycles, etc.

Actuellement, ToolSever de XAgent prend en charge FileSystemEnv, PythonNotoBook, WebEnv, ExecuteShell, RapidAPIEnv, AskHumanforHelp et d'autres outils.

XAgent peut non seulement nous aider à effectuer quelques tâches simples, mais il peut même nous aider à former des modèles.

Par exemple, les utilisateurs espèrent analyser les critiques de films et déterminer la qualité de l'évaluation du film par le public. À ce stade, XAgent téléchargera d'abord l'ensemble de données imdb pour entraîner un modèle BERT et utilisera le modèle BERT entraîné pour prédire les critiques de films.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Libérez le potentiel des grands modèles et dépassez complètement AutoGPT

Après des tests dans une série de tâches, cela peut être vu (comme le montrent les figures a et b ci-dessous), basé sur les performances XAgent de GPT-4, dépasse celles du GPT-4 d'origine dans tous les tests de référence et surpasse AutoGPT dans tous les aspects.

Ces tâches nécessitent une planification du raisonnement de l'agent et la capacité d'utiliser des outils externes, notamment : la capacité de répondre à des questions avec les moteurs de recherche (FreshQA+HotpotQA), la capacité de programmation Python (MBPP), la capacité de raisonnement mathématique (MATH) et l'interactivité. capacité de programmation (InterCode), capacité de raisonnement incarné (ALFWorld), tâches réelles complexes, etc.

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.Figure a : XAgent surpasse complètement AutoGPT dans le traitement de tâches réellement complexes

Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.

Figure b : Il surpasse AutoGPTXAgent et mène GPT-4 dans six tests de référence majeurs d'agent IA

On peut voir que XAgent La conception du système peut libérer pleinement les capacités de base du GPT-4 et obtenir des résultats de tests et une préférence humaine extrêmement élevés (préférence humaine).

Cela montre non seulement que XAgent fonctionne bien dans les tests d'IA traditionnels qui nécessitent une planification d'inférence, mais qu'il a également des performances plus élevées lors du traitement d'instructions réelles complexes

étend les limites des applications et une base technique solide

AI Agent L'émergence de Big Model a permis à l'ensemble du secteur de voir l'orientation importante de la mise en œuvre de la technologie des grands modèles, qui peut réaliser l'exécution de tâches d'un ensemble complet de flux de travail sans avoir besoin d'une exploration rapide et complexe.

En tant que « super-héros » grand modèle au potentiel illimité, XAgent peut devenir un « assistant personnel » pour chaque personne ordinaire. Cela peut nous aider à planifier notre emploi du temps, à organiser des itinéraires et à gérer le temps et l'allocation des ressources dans la vie et au travail.

Il peut également utiliser de manière indépendante une variété d'outils de collecte, de traitement et d'analyse de données pour analyser de manière entièrement automatique des données massives et former des rapports, aidant ainsi les utilisateurs à obtenir efficacement des informations importantes.

De plus, XAgent peut combiner des outils externes avec des algorithmes de planification autonomes pour prendre des décisions basées sur des informations environnementales afin d'obtenir une exécution des tâches plus efficace et plus précise.

L'équipe R&D de XAgent est formée d'un certain nombre d'experts et d'universitaires dans le domaine des grands modèles de Wall-Facing Intelligence et du laboratoire THUNLP de l'Université Tsinghua. Ils s’apparentent plutôt aux « super-héros » des grands modèles.

La raison pour laquelle cette réalisation innovante peut être lancée avec succès est que l'équipe a construit une série de grands modèles Infra innovants de pointe au cours du processus de recherche scientifique à long terme, solidifiant les bases techniques et repoussant les limites de l'innovation et R&D.

Wallface Intelligence s'est associé au laboratoire NLP de l'Université Tsinghua et à la communauté open source OpenBMB pour créer une présentation écologique de grand modèle industrie-université-recherche « Trinity », et a proposé et publié plusieurs cadres et moteurs d'utilisation d'outils de grand modèle :

  • Apprentissage des outils : le paradigme d'apprentissage des outils sur grands modèles intègre les avantages des outils professionnels avec de grands modèles pour obtenir une plus grande précision, efficacité et autonomie dans la résolution de problèmes.
  • BMTools : le moteur d'apprentissage de grands modèles est un entrepôt open source qui permet aux modèles de langage d'utiliser des outils d'extension. Il s'agit également d'une plate-forme d'outils de création et de partage de communauté open source.
  • ToolLLM, un cadre d'apprentissage d'outils de grands modèles, connecte les grands modèles à plus de 16 000 API réelles, permettant aux grands modèles d'effectuer des tâches de commande utilisateur plus complexes en appelant des outils externes.
  • WebCPM, le premier cadre de modèle dans le domaine chinois pour prendre en charge la recherche en ligne, comble le vide dans le domaine des grands modèles nationaux, permettant aux grands modèles de rechercher des réponses sur des pages Web en temps réel comme les humains, améliorant ainsi la réalité. performances temporelles et précision de l’AIGC.

XAgent étend la limite supérieure de la capacité des agents d'IA à effectuer des tâches complexes, nous permettant de voir la tendance de pointe et le potentiel illimité de l'intégration de la technologie des grands modèles dans la production et la vie.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer