Maison >Périphériques technologiques >IA >Kuaishou a open source le système, les modèles et les données des agents !
Les modèles de taille 7B peuvent-ils également jouer avec des agents IA ? Récemment, "KwaiAgents" open source de Kuaishou lui pose des questions sur le ski du week-end. Cela vous aidera non seulement à trouver un lieu, mais tiendra également compte de la météo ce jour-là.
Comme nous le savons tous, les grands modèles de langage (LLM) maîtrisent une grande quantité de connaissances grâce au langage de modélisation et possèdent certaines capacités cognitives et de raisonnement. Cependant, même le GPT-4 le plus puissant produit actuellement de faux contenus lorsqu’il est utilisé seul et ne peut pas interagir avec le monde en temps réel. Les agents IA sont un moyen de résoudre ce problème. En stimulant la capacité des grands modèles à planifier des tâches, à réfléchir et à appeler des outils, les grands modèles peuvent utiliser des outils du monde réel pour améliorer la précision du contenu généré et même avoir la capacité de résoudre des problèmes complexes. problèmes. Cette fois, les « KwaiAgents » développés conjointement par Kuaishou et le Harbin Institute of Technology permettent au « petit » grand modèle de 7B/13B de surpasser l'effet du GPT-3.5, et ces systèmes, modèles, données et évaluations sont tous open source !
Le contenu suivant peut être trouvé sur la page d'accueil Github de "KwaiAgents" :
Les principaux composants du système KAgentSys comprennent un noyau cognitif, un mécanisme de mémoire et une bibliothèque d'outils basés sur de grands modèles pour réaliser une automatisation itérative
Certaines fonctions de KAgentSys seront progressivement mises à niveau et ouvertes. C'est le contenu de ce modèle open source
Afin d'éviter les problèmes de surajustement causés par un seul modèle lors de la formation, le La méthode Meta-Agent Tuning (MAT) proposée par l'équipe améliore la polyvalence des grands modèles en termes de capacités d'agent et améliore l'effet en introduisant davantage de modèles d'invite d'agent dans les données de formation.
Le Meta-Agent Tuning (MAT) est divisé en deux étapes :
KAgentBench a réalisé une utilisation prête à l'emploi grâce à des milliers de données annotées affinées manuellement, permettant à chacun d'utiliser une seule ligne de commandes pour évaluer les différents aspects des capacités des agents d'un grand modèle sous différents modèles.
Dans KAgentBench, comme le montre la figure ci-dessus, nous procéderons à la construction d'entrées pour différents types de capacités. Chaque requête est accompagnée de plusieurs modèles et de plusieurs réponses réelles modifiées par l'homme. Le but de ceci est d’évaluer de manière globale l’exactitude et la généralisation. Après réglage MAT, le tableau ci-dessous montre l'amélioration du modèle 7B-13B dans diverses capacités et a dépassé l'effet de GPT-3.5
L'étude a également mené une évaluation croisée, invitant des annotateurs humains à 200 factuels et les questions urgentes sont annotées, telles que « Quel âge a Andy Lau cette année ? » Les résultats montrent que le modèle après le système KAgentSys et MAT est significativement amélioré (l'exactitude est exprimée en pourcentage et le score moyen sur une échelle de 5 points est entre parenthèses)
pendant un certain temps -tail problèmes et problèmes populaires , généralement les résultats qui reposent uniquement sur les recherches sur le Web ne sont pas idéaux. Par exemple, si vous posez une question longue traîne telle que « De combien de jours Antonella est-elle plus âgée que Messi ? », les résultats de la recherche renverront généralement des ragots à leur sujet sans fournir d'informations clés. KAgentSys peut répondre avec précision à cette question en appelant l'outil de recherche encyclopédique pour obtenir la date de naissance précise, puis en utilisant l'outil de décalage horaire pour calculer la différence d'âge. L'équipe a déclaré que les agents IA sont une voie très prometteuse. À l'avenir, nous continuerons à accumuler des technologies de base et à injecter continuellement une nouvelle vitalité dans l'ensemble de la communauté. Dans le même temps, nous explorerons également activement la combinaison de la technologie des agents et des activités de Kuaishou, et tenterons de mettre en œuvre des applications innovantes plus intéressantes et plus précieuses
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!