Maison > Article > Périphériques technologiques > En battant 90 % des humains, le premier « modèle de diplomatie de l’IA » de Meta est sur la science ! Internaute : veuillez poursuivre Xiao Zha en justice
Pendant des décennies, la diplomatie a été considérée « un travail que l'IA ne pourra jamais prendre en charge ».
Parce que cela exige que les joueurs maîtrisent et comprennent les perspectives et les motivations des autres, formulent des plans complexes et effectuent des ajustements en temps opportun, puis utilisent le langage pour parvenir à une coopération avec les autres, et enfin les persuadent d'établir des partenariats et des alliances, etc. . L'accent mis sur la communication, la confiance et la trahison rend la diplomatie très différente des « jeux » plus basés sur des règles comme le Go et les échecs.
Cependant, les dernières recherches de Meta montrent : L’IA est susceptible d’être capable de faire le travail des diplomates ! Dans le concours de jeux de diplomatie en ligne organisé d'août à octobre 2022, CICERO
s'est classétop 10% parmi tous les "joueurs". Son score moyen de 25,8% est plus de le double du score moyen de ses 82 adversaires (12,4%).
Ce qui mérite encore plus d'être mentionné, c'est que pendant le jeu lui-même, pas un seul joueur - on a découvert que l'intelligence artificielle jouait au jeu ! Maintenant, ce dernier résultat a également été publié sous la forme d'un article sur la Science. Le lancement de CICERO deviendra sûrement une réalisation majeure dans le domaine du traitement du langage naturel.
Parce que cela indique que l'intelligence artificielle a le potentiel de "coopérer mieux et plus naturellement avec les humains" et représente un grand pas vers l'AGI pour les humains.
Battez 90% des humains, personne n'a trouvé l'implication de l'IA "Diplomacy" est un jeu de stratégie classique à sept joueurs. On peut dire qu'il s'agit d'une combinaison du jeu de société Risk, du jeu de cartes de poker et de la télévision. show Survivor. Il est créé par le célèbre américain Développé dans les années 1950 par la société de jouets Hasbro.
Grâce au « jeu de rôle » des sept grands pays européens au début du 20e siècle, les joueurs doivent instaurer la confiance, négocier et coopérer avec d'autres joueurs et occuper autant de territoire que possible.
Pour éviter d'être arrêtés par les contre-attaques de leurs adversaires, les joueurs communiquent en privé, discutent d'éventuelles actions coordonnées, puis mettent leurs actions sur papier, tenant ou rompant les promesses faites aux autres joueurs.
Un tel jeu plein de tromperies et de tactiques de pouvoir est également considéré par certains joueurs comme un moyen idéal de perdre des amis. On peut l'appeler une « Compétition d'amis » !
Comme mentionné ci-dessus, contrairement à des jeux tels que les échecs et le Go, la diplomatie est un jeu qui concerne davantage les"les gens"
plutôt que lesles "règles"
.Si le modèle ne peut pas reconnaître que quelqu'un peut bluffer, ou identifier avec précision l'agressivité d'un certain mouvement d'un autre joueur, il perdra évidemment la partie très rapidement.
De même, s'il ne parle pas comme une vraie personne, ne fait pas preuve d'empathie, n'établit pas de relations et ne parle pas du jeu, il ne trouvera pas d'autres joueurs disposés à travailler avec lui.
Au cours des dernières décennies, les chercheurs ont construit un « diplomate IA » doté de capacités de communication en langage naturel. Cependant, comme ce défi majeur dépasse largement les capacités de l’IA existante, aucun chercheur n’y est jamais parvenu. Ce n’est qu’avec l’émergence récente du CICERO que ce fait a été complètement renversé.
CICERO est essentiellement un « chatbot » qui peut communiquer avec d'autres acteurs de la diplomatie pour prendre des actions efficaces dans le jeu.
Cicéron était un célèbre homme politique, philosophe et orateur de la Rome antique. Il est né le 3 janvier 106 avant JC. Il était célèbre dans les cercles politiques romains pour son éloquence.
Meta portera le nom de ce modèle d'IA, la signification va de soi.
D'août à octobre 2022, CICERO a participé à un total de 40 parties au concours en ligne « Diplomatie » organisé par webDiplomacy, se classant dans le top 10 % de tous les participants après avoir joué cinq parties ou plus parmi les 19 joueurs qui ont joué ; a participé à plusieurs matchs, Cicéron s'est classé deuxième.
En 40 matchs, le score moyen de CICERO était de 25,8%, soit plus du double du score moyen des 82 autres adversaires (12,4%), et il a pleinement démontré son dialogue stratégique et ses capacités de jeu.
CICERO est basé sur un modèle linguistique de type BART de 2,7 milliards de paramètres, pré-entraîné sur du texte provenant d'Internet et complété par un ensemble de données de plus de 40 000 jeux diplomatiques joués en ligne sur webDiplomacy.net.
Les données incluent également plus de 12 millions de messages générés lorsque les joueurs communiquent entre eux. Le modèle de
CICERO se compose principalement de deux parties, à savoir "Raisonnement stratégique" et "Traitement du langage naturel" .
L'intégration des deux technologies permet à CICERO de raisonner et de formuler des stratégies basées sur les motivations des joueurs, puis d'utiliser le langage naturel pour communiquer, parvenir à un consensus pour atteindre des objectifs communs, former des alliances et coordonner des plans, ce qui se reflète principalement dans "Coopération " Trois aspects : , "négociation" et "coordination".
Par exemple, CICERO peut déduire que plus tard dans le jeu, il aura besoin du soutien d'un joueur particulier, puis développer des stratégies pour gagner les faveurs de cette personne - identifiant même les risques et les opportunités pour ce joueur.
Le module de stratégie basé sur le dialogue aide CICERO à prédire les actions que les autres joueurs pourraient entreprendre et ce que les autres joueurs pensent que CICERO pourrait faire, compte tenu de leurs conversations passées et de l'état du plateau de jeu.
Ainsi, CICERO développera des plans mutuellement bénéfiques pour lui-même et pour les autres participants sur la base de ces prédictions. Ces plans permettent non seulement au CICERO de trouver des opportunités de coopération mutuellement bénéfique, mais également de trouver des mesures efficaces lorsque la coopération est impossible.
Il existe un modèle de dialogue contrôlable dans CICERO, qui est combiné avec des algorithmes de raisonnement stratégique qui contrôlent la génération du dialogue.
Le modèle de conversation contrôlée permet à CICERO de mener des conversations dans le cadre d'un ensemble de plans soigneusement choisis, généralement ceux qui profitent à la fois à CICERO et aux autres joueurs.
Le dialogue de CICERO est profondément ancré dans les conversations de forme libre générées au sein du jeu en cours.
Par exemple, CICERO peut négocier un plan tactique avec un autre joueur, rassurer ses alliés sur ses intentions, discuter de dynamiques stratégiques plus larges dans le jeu, ou même simplement s'engager dans une petite conversation informelle - y compris à peu près tout ce dont un joueur humain pourrait discuter du contenu. .
"Cicéron est si efficace dans l'utilisation du langage naturel pour négocier avec les diplomates qu'ils préfèrent souvent travailler avec Cicéron plutôt qu'avec d'autres participants humains.", a déclaré Meta sur son propre Twitter.
Yan Lecun, vice-président de Meta AI et scientifique en chef de l'intelligence artificielle, estime que "être capable d'effectuer des performances au niveau humain dans un jeu stratégiquement extrêmement complexe comme la diplomatie indique le grand potentiel de la coopération entre l'homme et l'intelligence artificielle".
Bien que CICERO ne puisse jouer que de la diplomatie, la technologie derrière cette réalisation est étroitement liée à de nombreuses applications du monde réel, telles que le contrôle de la génération du langage naturel par la planification et le RL, qui peut atténuer les barrières de communication entre les humains et les modèles d'intelligence artificielle.
Par exemple, les assistants IA d'aujourd'hui ne peuvent effectuer que des questions et réponses simples, comme vous indiquer la météo du jour, etc., mais que se passe-t-il s'ils vous enseignent une nouvelle compétence grâce à des conversations à long terme ?
Ou imaginez un jeu vidéo dans lequel des personnages non-joueurs (PNJ) peuvent planifier et converser librement, tout comme les gens - en comprenant vos motivations et en ajustant le dialogue en conséquence pour vous aider à mener à bien votre quête de conquête d'une ville.
Bien sûr, même Meta elle-même admet que "CICERO n'est pas encore parfait" - à certains moments importants du jeu, CICERO commet souvent des erreurs très scandaleuses.
Par conséquent, Meta a choisi de publier le code de CICERO en open source, dans l'espoir de l'améliorer encore avec l'aide de la communauté des développeurs d'IA.
La sortie du premier « diplomate IA » au monde qui se situe au même niveau que les humains a également suscité de vives discussions parmi les internautes.
De nombreux internautes ont déclaré :
"J'attends vraiment avec impatience le prochain développement de cette recherche."
"Battre des humains peut être considéré comme le jeu le plus humain. C'est tout simplement fascinant. .. "
Bien que CICERO soit nouveau, certaines personnes attendaient avec impatience les perspectives d'application de cette "technologie noire de l'IA" dans la vie réelle :
"Il peut construire une version pour aider "
La "COP28" mentionnée par l'internaute devrait faire référence à la 28e Conférence des Nations Unies sur le climat.
Lors de la 27e Conférence sur le climat qui vient de s'achever, après plusieurs jours d'intenses négociations, les représentants de divers pays ont finalement convenu d'établir un mécanisme de fonds pour compenser les pertes et les dommages causés par le changement climatique.
De plus, le lancement de CICERO a également suscité des inquiétudes parmi de nombreux internautes : "Cela encouragera directement les chercheurs à construire des modèles efficaces en matière de tromperie."
"Mignon et amusant pour tricher et gagner le jeu diplomatique en imitant le comportement humain."
"Je me demande à quoi cela peut servir d'autre ? Nous devons être attentifs au développement de tels outils. . "
"L'intelligence artificielle est très douée pour créer de l'art et ainsi de suite. Mais maintenant, sa capacité de persuasion est "activée"."
"Si vous pouvez convaincre une personne, vous pouvez la contrôler. choix, contrôlant ainsi leur vie"
"Le résultat final sera donc : l'IA asservit les humains par la persuasion!"
Enfin, de nombreux internautes ont également plaisanté :
"Est-ce fiable ? Cicéron a finalement été décapité !"
"S'il vous plaît, donnez Xiao Zha envoyé à La Haye (Cour internationale de Justice) !"
Il y a à peine deux jours, le modèle de langage à grande échelle Galactica lancé par Meta AI a été retiré à la hâte des étagères seulement 3 jours après son lancement parce qu'il présentait des mensonges comme des faits. De nos jours, on peut dire que le lancement de CICERO a une fois de plus provoqué des vagues dans le cercle de la technologie de l'IA.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!