用魔法打敗魔法！一個叫板頂級人類棋手的圍棋AI輸給了它的同類-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

用魔法打敗魔法！一個叫板頂級人類棋手的圍棋AI輸給了它的同類

王林

Apr 12, 2023 am 08:40 AM

ai研究

近年來，自我博弈中的密集學習已經在圍棋、西洋棋等一系列遊戲中取得了超人的表現。此外，自我博弈的理想化版本也收斂於納許均衡。納許均衡在博弈論中非常著名，該理論是由博弈論創始人，諾貝爾獎得主約翰· 納許提出，即在一個博弈過程中，無論對方的策略選擇如何，當事人一方都會選擇某個確定的策略，則該策略稱為支配性策略。如果任何一位參與者在其他所有參與者的策略確定的情況下，其選擇的策略是最優的，那麼這個組合就被定義為納許均衡。

先前就有研究表明，自我博弈中看似有效的連續控制策略也可以被對抗策略利用，這表明自我博弈可能並不像之前認為的那樣強大。這就引出一個問題：對抗策略是攻克自我賽局的方法，還是自我賽局策略本身就能力不足？

為了回答這個問題，來自 MIT、 UC 柏克萊等機構的研究者進行了一番研究，他們選擇自我博弈比較擅長的領域進行，即圍棋（Go）。具體而言，他們對公開可用的最強圍棋 AI 系統 KataGo 進行攻擊。針對一個固定的網路（凍結KataGo），他們訓練了一個端到端的對抗策略，僅用了訓練KataGo 時0.3% 的計算，他們就獲得了一個對抗性策略，並用該策略攻擊KataGo，在沒有搜尋的情況下，他們的策略對KataGo 的攻擊達到了99% 的勝率，這與歐洲前100 名圍棋選手實力相當。而當 KataGo 使用足夠的搜尋接近超人的水平時，他們的勝率達到了 50%。至關重要的是，攻擊者（本文指該研究學到的策略）並不能透過學習通用的圍棋策略來獲勝。

這裡我們有必要說一下 KataGo，正如本文所說的，他們在撰寫本文時，KataGo 還是最強大的公開圍棋 AI 系統。在搜尋的祝福下，可以說 KataGo 非常強大，戰勝了本身就是超人類的 ELF OpenGo 和 Leela Zero。現在該研究的攻擊者戰勝 KataGo，可以說是非常厲害了。

用魔法打敗魔法！一個叫板頂級人類棋手的圍棋AI輸給了它的同類

圖 1：對抗策略打敗了 KataGo 受害者。

用魔法打敗魔法！一個叫板頂級人類棋手的圍棋AI輸給了它的同類

#論文網址：https://arxiv.org/pdf/2211.00241.pdf
研究首頁：https://goattack.alignmentfund.org/adversarial-policy-katago?row=0#no_search-board

#有趣的是，研究提出的對抗策略無法戰勝人類玩家，即使是業餘選手也能大幅勝過所提模型。

攻擊方法

KataGo、AlphaZero 等先前的方法通常是訓練智能體自己玩遊戲，遊戲對手是智能體自己。而在 MIT、UC 柏克萊等機構的這項研究中，攻擊者（adversary）和固定受害者（victim）智能體之間進行博弈，利用這種方式訓練攻擊者。該研究希望訓練攻擊者利用與受害者智能體的博弈交互，而不只是模仿博弈對手。這個過程被稱為“victim-play”。

用魔法打敗魔法！一個叫板頂級人類棋手的圍棋AI輸給了它的同類

在常規的自我博弈中，智能體透過從自己的策略網路取樣來建模對手的動作，這種方法的確適用於自我博弈。但在 victim-play 中，從攻擊者的策略網路建模受害者的方法就是錯誤的。為了解決這個問題，研究提出了兩類對抗型 MCTS（A-MCTS），包括：

A-MCTS-S：在A-MCTS-S 中，研究者將攻擊者的搜尋過程設定如下：當受害者移動棋子時，從受害者策略網路中取樣；當輪到攻擊者移動棋子時，從攻擊者策略網路中取樣。
A-MCTS-R：由於A-MCTS-S 低估了受害者的能力，該研究提出了A-MCTS-R，在A-MCTS-R 樹中的每個受害者節點上為受害者執行MCTS。然而，這種變化增加了攻擊者訓練和推理的計算複雜性。

在訓練過程中，該研究針對與 frozen KataGo 受害者的博弈來訓練對抗策略。在沒有搜尋的情況下，攻擊者與 KataGo 受害者的博弈可以實現 >99% 的勝率，這與歐洲前 100 名圍棋選手的實力相當。此外，經過訓練的攻擊者在與受害者智能體博弈的 64 個回合中實現了超過 80% 的勝率，研究者估計其實力與最優秀的人類圍棋棋手相當。

值得注意的是，這些遊戲表明，該研究提出的對抗策略並不是完全在做博弈，而是透過欺騙KataGo 在對攻擊者有利的位置落子，以過早地結束遊戲。事實上，儘管攻擊者能夠利用與最佳人類圍棋選手相當的博弈策略，但它很容易被人類業餘愛好者擊敗。

為了測試攻擊者與人類對弈的水平，該研究讓論文一作 Tony Tong Wang 與攻擊者模型實際對弈了一番。 Wang 在這個研究計畫之前從未學習過圍棋，但他還是以巨大的優勢贏得了攻擊者模型。這表明研究提出的對抗性策略雖然可以擊敗能戰勝人類頂級玩家的 AI 模型，但它無法擊敗人類玩家。這或許可以說明一些 AI 圍棋模型是存在 bug 的。