Maison > Article > Périphériques technologiques > 'Minecraft' se transforme en une ville IA et les habitants des PNJ jouent comme de vraies personnes
Veuillez noter que cet homme carré fronça les sourcils, réfléchissant à l'identité des « invités non invités » devant lui.
Il s'est avéré qu'elle se trouvait dans une situation dangereuse. Après avoir réalisé cela, elle a rapidement commencé une recherche mentale pour trouver une stratégie pour résoudre le problème.
Finalement, elle a décidé de fuir les lieux dans un premier temps, puis de demander de l'aide le plus rapidement possible et d'agir immédiatement.
En même temps, la personne d'en face pense aussi la même chose qu'elle...
Il y a une telle scène dans "Minecraft", où tous les personnages sont contrôlés par l'intelligence artificielle.
Chacun d'eux a un cadre identitaire unique. Par exemple, la fille mentionnée précédemment est une coursière de 17 ans mais intelligente et courageuse.
Ils ont la capacité de se souvenir et de penser, et vivent comme des humains dans cette petite ville située dans "Minecraft".
Ce qui les motive, c'est un tout nouveau cadre de jeu de rôle d'IA basé sur le langage LARP conçu pour le monde ouvert.
LA fait référence ici à Language Agent, et LARP est l'abréviation de Live Action Role Playing, qui est un jeu de mots.
En plus d'avoir une complexité cognitive plus élevée que les cadres d'agents traditionnels, le LARP réduit également l'écart entre les agents et les jeux en monde ouvert——
Ces jeux n'ont souvent pas de "normes de passage" spécifiques permettant aux joueurs de librement explorez-le, alors que les agents de jeu traditionnels sont souvent utilisés pour atteindre des objectifs spécifiques.
De plus, l'objectif du GN est de mettre en valeur la simulation et de rendre le comportement de l'agent plus proche de l'humain Pour cela, les chercheurs ont même introduit un mécanisme d'oubli.
Alors, comment le LARP est-il mis en œuvre ? Venez le découvrir bientôt.
La structure du LARP est modulaire, incluant spécifiquement la cognition, la personnalité, la mémoire, la prise de décision et d'autres composants.
Parmi eux, le module de mémoire est composé de trois parties : la mémoire à long terme, la mémoire de travail (à court terme) et le système de traitement de la mémoire.
Au cours du processus, l'environnement et d'autres informations observées par le personnage seront saisis dans le module de traitement de la mémoire sous forme de langage naturel. Après conversion du codage et combinés avec la mémoire à long terme extraite, une mémoire de travail sera créée. être formé ;
Ensuite, la mémoire de travail sera introduite dans le module de prise de décision, qui produit finalement un contenu de prise de décision ou de dialogue.
Une caractéristique du module de prise de décision est qu'il décomposera un grand objectif en sous-tâches et utilisera le modèle de langage pour déterminer l'ordre d'exécution des sous-tâches.
Les décisions prises par le modèle seront exécutées en appelant l'API via le module d'interaction avec l'environnement. Si nécessaire, le module de backtracking sera également appelé pour la reconstruction du code
Après une exécution réussie, les nouvelles compétences du personnage seront mises à jour. stocké et devient une nouvelle mémoire à long terme.
Dans le processus de récupération de la mémoire à long terme, les personnages se poseront des questions basées sur le contenu observé et interrogeront les trois dimensions des énoncés logiques, de la similarité des vecteurs et de la similarité des phrases pour extraire des réponses.
L'énoncé logique est utilisé pour interroger la mémoire sémantique, et les deux derniers sont utilisés pour interroger la mémoire épisodique.
La mémoire sémantique correspond à des concepts généraux et à des connaissances factuelles sur le monde, y compris les règles du jeu et les visions du monde associées ; la mémoire épisodique correspond à des événements spécifiques du jeu, liés à des scènes et des expériences spécifiques.
Le contenu du premier est relativement fixe, tandis que le second continuera à s'accumuler en fonction de l'expérience de l'Agent.
Afin de faire en sorte que l'agent contrôlé par le GN ressemble davantage à une personne réelle, l'équipe de recherche a également délibérément introduit un mécanisme d'oubli qui évolue au fil du temps.
Lorsque le paramètre d'atténuation σ dépasse un certain seuil, la récupération de la mémoire échouera, simulant ainsi le processus d'oubli. La méthode de calcul de σ est définie sur la base des lois de la psychologie :
σ = αλN (1 + βt) - ψ
. λ représente l'importance de la mémoire, N représente le nombre de récupérations, t représente le temps écoulé depuis la dernière récupération, ψ est le taux d'oubli du personnage, α et β sont des paramètres d'échelle
Cette formule a été proposée par le psychologue Wayne Wickelgren et est a Un ajout à la courbe d'oubli d'Ebbinghaus.
En termes de création de personnages, les chercheurs ont pré-entraîné des modèles de base sur des ensembles de données qui reflètent différentes personnalités, et ont utilisé des ensembles de données d'instructions spécialement construits pour un réglage fin supervisé.
Dans le même temps, l'équipe a également conçu plusieurs ensembles de données pour les différentes capacités des personnages et formé un modèle d'adaptation de bas rang, qui a été intégré dynamiquement au modèle de base pour guider le module de prise de décision afin de générer du contenu adapté. la personnalité.
Parallèlement, des modules de vérification des actions et d'identification des conflits sont également mis en place dans LARP pour garantir que le contenu généré par le modèle pour l'agent est contraint par les données de l'environnement de jeu et les spécifications des connaissances préalables.
Actuellement, la page GitHub de LARP a été créée, mais elle est encore en position courte et le code n'a pas encore été publié.
Avec l'approfondissement de la recherche sur de grands modèles, les expériences d'intelligence par agents et par essaims sont désormais devenues l'une des directions les plus populaires de la recherche sur l'IA.
Par exemple, la Stanford AI Town, devenue populaire l'année dernière, et la « AI Game Company » et « AI Werewolf » lancées par l'Université Tsinghua ont toutes permis aux gens de constater les avantages de la collaboration multi-agents.
Pour plus d'informations sur les agents intelligents, le « Top Ten Frontier Technology Reports in 2023 » lancé par le Qubit Think Tank comporte également une introduction détaillée.
Adresse papier : https://arxiv.org/abs/2312.17653
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!