Histoire de l'amélioration de l'IA Shogi vue à travers les notes
"Iro Rating" est utilisé pour exprimer la force de Shogi AI. Il s’agit d’un indice conçu à l’origine pour exprimer les compétences aux échecs, et il s’appuie également sur les mathématiques.
Selon Shogi Club 24, le site officiel de compétition de shogi en ligne de la Fédération japonaise de shogi, qui est également utilisé par les joueurs professionnels, la limite humaine est d'environ 3 000 à 3 300, et pour les amateurs du premier dan, elle est d'environ 1 000. Cependant, la note de Bonanza en 2005, il était 2360.
En 2009, lorsque Bonanza contre Mei Ryuo Watanabe, Ryuo Watanabe a surmonté une situation où il pensait qu'il pourrait être vaincu et gagné, mais la note de Bonanza à cette époque était de 2815. On voit que Ryuo Watanabe, dont la force est proche de la limite humaine, a pu remporter cette victoire.
En 2013, "Gikou" était à 3713, soit plus de 400 points de plus que la limite humaine de 3300. Apparemment, une différence de 400 signifie que vous pouvez gagner avec une probabilité de plus de 90 %. Et le vainqueur du Championnat du monde de shogi informatique 2024 "Voulez-vous devenir membre du CSA ?" a un score de 4914, ce qui est bien au-delà de celui des humains.
L’important est qu’il s’agit d’une évaluation basée sur un ordinateur portable typique à laquelle il faut environ 5 secondes pour y réfléchir. M. Sugimura a déclaré qu'en utilisant quelque chose comme un superordinateur, il ne serait pas surprenant que ce nombre puisse atteindre environ 7 000.
Shogi AI a évolué jusqu'à présent et est utilisé par un large éventail de joueurs, professionnels et amateurs. Il est souvent utilisé de manière à ce que l'IA analyse le shogi que vous avez joué et vérifie quel coup était mauvais, ou qu'elle analyse la situation attendue dans un jeu et considère le meilleur coup pour cette situation.
L'avenir de l'IA shogi
Quant à l'avenir, ils ont discuté de la manière de développer l'IA shogi la plus puissante au monde.
L'IA shogi actuelle peut être grossièrement divisée en « type NNUE » conventionnel qui utilise la recherche αβ, et en « type DL » qui utilise l'apprentissage profond à grande échelle.
Et depuis que le code source de Yaneuraou et du dlshogi, qui sont représentatifs de chacun, a été publié, il y a de fortes chances que l'IA shogi la plus puissante au monde soit créée en apportant une amélioration.
Alors, que peut-on améliorer à partir de là ? Ce sont les cinq suivants.
QuantityFonction d'évaluation améliorée
Étant donné que le type NNUE actuel utilise le processeur pour effectuer les calculs, il existe un compromis entre la précision de la fonction d'évaluation et le nombre de scénarios pouvant être recherchés, ce qui rend son ajustement extrêmement difficile. Cependant, les calculs GPU seraient incompatibles avec la recherche αβ.
D'autre part, on sait que ResNet, la fonction d'évaluation utilisée dans de nombreux types DL, peut être renforcée en introduisant le mécanisme d'attention du transformateur utilisé dans les modèles de langage tels que ChatGPT, et il est possible d'utiliser les connaissances du domaine de l'apprentissage automatique. C'est ce qu'ils disent.
| QuantityAjustement des données des enseignants
L'IA shogi de type NNUE recherche plus de 100 millions de positions par seconde sur une machine spécifique au tournoi, mais la précision de l'évaluation des positions n'est pas très élevée, on dit donc qu'elle est relativement plus forte dans les étapes finales que dans les premières étapes. Par conséquent, lors de l’apprentissage de l’IA shogi de type NNUE, il semble y avoir une tendance à mieux se concentrer sur les premières étapes.
D'un autre côté, il y a aussi l'idée que puisque les premiers stades, jusqu'au 32ème coup environ, progressent souvent de manière fixe (la meilleure façon de se déplacer basée sur les recherches antérieures), il n'y a aucun problème à omettre l'apprentissage à ce point.
De plus, étant donné que les tours qui se balancent ne sont pas considérées comme une tactique efficace dans le tournoi actuel, il semble y avoir un moyen de les omettre.
| QuantityGénération automatique de repères fixes
Comme il existe des limites à la modification manuelle des marques fixes, les meilleures équipes tentent de les générer automatiquement. Cependant, afin de créer des mouvements d'échecs très précis, l'IA du shogi doit fonctionner longtemps dans une partie, ce qui n'est donc pas non plus très efficace.
Il semble que les personnes familiarisées avec la théorie des graphes et la recherche dans les arbres de jeu soient capables de générer un grand nombre de pistes.
| QuantityAmélioration de la section de recherche
Le type NNUE est basé sur la section de recherche de l'IA d'échecs Stockfish, mais de la même manière, il est possible qu'il soit renforcé en apportant à l'IA du shogi des idées de recherche qui ont réussi dans d'autres IA. est.
weightRessources informatiques sécurisées
En termes simples, les ressources informatiques sont des ordinateurs. Ces dernières années, il est devenu de plus en plus difficile pour les particuliers de sécuriser les ordinateurs nécessaires à la création de données sur les enseignants, et le nombre de cas où de grandes entreprises sponsorisent les ordinateurs augmente. Il semble que si vous parvenez à créer une grande quantité de données d’entraînement, vous pourriez devenir le plus fort du monde.
Shogi AI a évolué depuis qu'il a été rendu open source par Yaneurao, les développeurs ayant des idées. Même maintenant, il semble qu'il y ait une chance de devenir le plus fort du monde en apportant simplement des modifications à l'une des cinq améliorations introduites cette fois-ci, plutôt qu'à toutes.
Le contenu de la séance est ci-dessus, mais à la fin il y a eu des questions du public. La question est : « Je pense qu'il existe un moyen infaillible de gagner au shogi, qui n'a aucun élément de chance, mais parviendrons-nous un jour à ce point ? »
M. Sugimura dit que Shogi est un "jeu d'information fini et parfait à somme nulle à deux joueurs" , et bien qu'il existe un moyen infaillible de gagner ou un match nul garanti, il y a tellement d'options qu'il est difficile d'atteindre le La réponse était que ce serait difficile et que même si une méthode gagnante était déterminée, il n'y aurait aucun moyen de la sauvegarder sous forme de données.
|
|