Maison >Tutoriel de jeu mobile >actualités sur les jeux >Comment Shogi AI a-t-il surpassé les joueurs professionnels de Shogi ? Et où vas-tu à partir d'ici ? [CEDEC 2024]
Lors de la conférence des développeurs de jeux CEDEC 2024, une session « Passé, présent et futur de Shogi AI » a été organisée par Tatsuya Sugimura du cabinet juridique Motoyawata Asahi et Urao Yaneu
de Yaneu Design
. Faisons le point sur une session qui a parlé du passé et de l'avenir de l'IA du shogi, qui s'est développée rapidement et surpasse désormais même les joueurs de shogi professionnels.
La fonction d'évaluation et l'algorithme de recherche sont équivalents aux « deux roues d'une voiture » | pour Shogi AI.
, est apparu. Bonanza utilise la « Méthode Bonanza » , qui « recherche des paramètres tels que la fonction d'évaluation utilisée pour juger chaque plateau soit la même que le mouvement réel effectué par un joueur fort » et calcule automatiquement les paramètres à partir des enregistrements de jeu humains. Cela a permis de faire des ajustements. |
● Montée des SNS |
Histoire de l'amélioration de l'IA Shogi vue à travers les notes"Iro Rating" est utilisé pour exprimer la force de Shogi AI. Il s’agit d’un indice conçu à l’origine pour exprimer les compétences aux échecs, et il s’appuie également sur les mathématiques. Selon Shogi Club 24, le site officiel de compétition de shogi en ligne de la Fédération japonaise de shogi, qui est également utilisé par les joueurs professionnels, la limite humaine est d'environ 3 000 à 3 300, et pour les amateurs du premier dan, elle est d'environ 1 000. Cependant, la note de Bonanza en 2005, il était 2360. En 2009, lorsque Bonanza contre Mei Ryuo Watanabe, Ryuo Watanabe a surmonté une situation où il pensait qu'il pourrait être vaincu et gagné, mais la note de Bonanza à cette époque était de 2815. On voit que Ryuo Watanabe, dont la force est proche de la limite humaine, a pu remporter cette victoire. En 2013, "Gikou" était à 3713, soit plus de 400 points de plus que la limite humaine de 3300. Apparemment, une différence de 400 signifie que vous pouvez gagner avec une probabilité de plus de 90 %. Et le vainqueur du Championnat du monde de shogi informatique 2024 "Voulez-vous devenir membre du CSA ?" a un score de 4914, ce qui est bien au-delà de celui des humains. L’important est qu’il s’agit d’une évaluation basée sur un ordinateur portable typique à laquelle il faut environ 5 secondes pour y réfléchir. M. Sugimura a déclaré qu'en utilisant quelque chose comme un superordinateur, il ne serait pas surprenant que ce nombre puisse atteindre environ 7 000. Shogi AI a évolué jusqu'à présent et est utilisé par un large éventail de joueurs, professionnels et amateurs. Il est souvent utilisé de manière à ce que l'IA analyse le shogi que vous avez joué et vérifie quel coup était mauvais, ou qu'elle analyse la situation attendue dans un jeu et considère le meilleur coup pour cette situation. L'avenir de l'IA shogiQuant à l'avenir, ils ont discuté de la manière de développer l'IA shogi la plus puissante au monde. L'IA shogi actuelle peut être grossièrement divisée en « type NNUE » conventionnel qui utilise la recherche αβ, et en « type DL » qui utilise l'apprentissage profond à grande échelle. Et depuis que le code source de Yaneuraou et du dlshogi, qui sont représentatifs de chacun, a été publié, il y a de fortes chances que l'IA shogi la plus puissante au monde soit créée en apportant une amélioration. Alors, que peut-on améliorer à partir de là ? Ce sont les cinq suivants. QuantityFonction d'évaluation améliorée Étant donné que le type NNUE actuel utilise le processeur pour effectuer les calculs, il existe un compromis entre la précision de la fonction d'évaluation et le nombre de scénarios pouvant être recherchés, ce qui rend son ajustement extrêmement difficile. Cependant, les calculs GPU seraient incompatibles avec la recherche αβ. D'autre part, on sait que ResNet, la fonction d'évaluation utilisée dans de nombreux types DL, peut être renforcée en introduisant le mécanisme d'attention du transformateur utilisé dans les modèles de langage tels que ChatGPT, et il est possible d'utiliser les connaissances du domaine de l'apprentissage automatique. C'est ce qu'ils disent.
L'IA shogi de type NNUE recherche plus de 100 millions de positions par seconde sur une machine spécifique au tournoi, mais la précision de l'évaluation des positions n'est pas très élevée, on dit donc qu'elle est relativement plus forte dans les étapes finales que dans les premières étapes. Par conséquent, lors de l’apprentissage de l’IA shogi de type NNUE, il semble y avoir une tendance à mieux se concentrer sur les premières étapes. D'un autre côté, il y a aussi l'idée que puisque les premiers stades, jusqu'au 32ème coup environ, progressent souvent de manière fixe (la meilleure façon de se déplacer basée sur les recherches antérieures), il n'y a aucun problème à omettre l'apprentissage à ce point. De plus, étant donné que les tours qui se balancent ne sont pas considérées comme une tactique efficace dans le tournoi actuel, il semble y avoir un moyen de les omettre.
Comme il existe des limites à la modification manuelle des marques fixes, les meilleures équipes tentent de les générer automatiquement. Cependant, afin de créer des mouvements d'échecs très précis, l'IA du shogi doit fonctionner longtemps dans une partie, ce qui n'est donc pas non plus très efficace. Il semble que les personnes familiarisées avec la théorie des graphes et la recherche dans les arbres de jeu soient capables de générer un grand nombre de pistes.
Le type NNUE est basé sur la section de recherche de l'IA d'échecs Stockfish, mais de la même manière, il est possible qu'il soit renforcé en apportant à l'IA du shogi des idées de recherche qui ont réussi dans d'autres IA. est.
|
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!