Maison >Périphériques technologiques >IA >Plusieurs modèles de conception que les excellents agents doivent apprendre, vous pouvez les apprendre en une seule fois
Bonjour à tous, je m'appelle Laodu.
Hier, j'ai écouté AI Hospital Town partagé par l'Institut de recherche sur l'industrie intelligente de l'Université Tsinghua au sein de l'entreprise.
Photos
C'est un monde virtuel Tous les médecins, infirmières et patients sont des intelligences d'agent pilotées par LLM et peuvent interagir de manière autonome. Ils ont simulé l’ensemble du processus de diagnostic et de traitement et ont atteint une précision de pointe de 93,06 % sur un sous-ensemble de données MedQA couvrant les principales maladies respiratoires.
Un excellent agent intelligent est indissociable d'excellents modèles de conception. Après avoir lu ce cas, j'ai rapidement lu les quatre principaux modèles de conception d'agents récemment publiés par M. Andrew Ng.
Enda Ng est l'un des chercheurs les plus influents au monde dans le domaine de l'intelligence artificielle et de l'apprentissage automatique
Ensuite, je l'ai rapidement compilé et partagé avec tout le monde.
Dans ce mode, les résultats générés pour la première fois par le grand modèle ne sont pas directement émis, mais les résultats sont renvoyés vers le grand modèle pour inspection et évaluation.
Il produira une deuxième version des résultats qui pourrait mieux fonctionner que la première version.
Pour reprendre les mots de Confucius, cela s'appelle "Je m'examine trois fois par jour".
L'invite spécifique écrite dans ce mode peut utiliser plusieurs modes d'inférence que nous avons partagés auparavant, tels que : quelques-shots (Few-shot), chaîne de pensée (CoT), arbre de pensée (ToT), ReAct , etc.
L'objectif principal de ce modèle est de maximiser les capacités de raisonnement des grands modèles sans recourir à des forces externes.
Ce mode permet à l'agent d'utiliser des outils externes pour effectuer des tâches spécifiques.
Pour parler franchement, cela signifie « laisser les affaires professionnelles aux professionnels ».
L'essence du grand modèle est la prédiction de texte, et il n'a pas la capacité de faire de l'arithmétique, de l'exécution de code, etc. Lorsque nous rencontrons ces tâches, nous pouvons laisser le grand modèle générer des équations et des codes, puis appeler la calculatrice et l'interpréteur de code pour les compléter.
L'Agent dans ce mode semble devenir plus puissant avec une aide externe.
Ce mode permet à l'agent de décomposer une tâche complexe en une série de petites tâches simples, puis de les résoudre une par une.
En fait, cela signifie « De combien d'étapes faut-il pour mettre un éléphant au réfrigérateur ? » J'étais confus lorsque j'ai entendu cette question pour la première fois, mais quand j'ai vu l'image ci-dessous, elle est soudainement devenue claire.
Images
Une fois que l'agent du mode précédent a décomposé des tâches complexes, il est naturel que plusieurs agents soient tenus d'accomplir leurs tâches respectives et de collaborer les uns avec les autres. , travaillez ensemble pour accomplir des tâches complexes.
Photos
Nous avons déjà partagé un programmeur d'IA open source, GPT Pilot. Son idée de conception est le modèle multi-agent, qui simule divers rôles de chefs de produit, d'architectes, de programmeurs et de testeurs pour terminer le développement de logiciels. . Tâche.
La ville hospitalière IA présentée au début de l'article possède également ce modèle. Je partagerai également des cas pratiques de ce modèle dans le futur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!