搜尋
首頁科技週邊人工智慧擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

一個連業餘棋手都打不過的新模型,竟然擊敗了世界最強圍棋AI——KataGo?

沒錯,這會驚掉人下巴的結果來自MIT、UC柏克萊等的最新論文。

研究人員利用對抗攻擊方法,抓住了KataGo的盲點,並基於該技術使一個菜鳥級圍棋程序成功打敗了KataGO。

在沒有搜尋的情況下,這勝率甚至達到了99%。

這麼算下來,圍棋界的食物鏈瞬間變成了:業餘棋手>新AI>頂級圍棋AI?

等等,這個神奇的新AI是怎麼做到又菜又厲害的?

刁鑽的攻擊角度

在介紹新AI之前,讓我們先來了解一下這次被攻擊的主角-KataGo。

KataGo,目前最強大的開源圍棋AI,由哈佛AI研究員開發。

先前,KataGo擊敗了超人類水準的ELF OpenGo和Leela Zero,即使沒有搜尋引擎的情況下,其水準也與歐洲前100名圍棋專業選手相當。

剛拿下三星盃冠軍、實現「三年四冠」的韓國圍棋「第一人」申真諦,就一直用的KataGo進行陪練。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

△圖源:Hangame

面對實力如此強勁的對手,研究人員選擇的方法可以說是四兩撥千斤了。

他們發現,儘管KataGo透過與自己進行數百萬次遊戲來學習圍棋,但這仍然不足以涵蓋所有可能的情況。

於是,這次他們不再選擇自我博弈,而是選擇對抗攻擊方法:

讓攻擊者(adversary)和固定受害者(victim,也就是KataGo)之間進行博弈,利用這種方式訓練攻擊者。

這一步改變讓他們只用訓練KataGo時0.3%的數據,訓練出了一個端到端的對抗策略(adversarial policy)。

具體來說,該對抗策略並不是完全在做博弈,而是透過欺騙KataGo在對攻擊者有利的位置落子,以過早地結束遊戲。

以下圖為例,控制著黑子的攻擊者主要在棋盤的右上角落子,把其他區域留給KataGo,並且還心機的在其他區域下了一些容易被清理的棋子。

論文共同一作Adam Gleave介紹:

這種做法會讓KataGo誤以為自己已經贏了,因為它的地盤(左下)比對手的要大得多。

但左下角的區域並沒有真正貢獻分數,因為那裡仍留有黑子,這意味著它並不完全安全。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

由於KataGo對勝利過於自信——認為如果遊戲結束併計算分數自己就會贏——所以KataGo會主動pass,然後攻擊者也pass,從而結束遊戲,開始計分。 (雙方pass,棋就結束)

但正如Gleave分析的一樣,由於KataGo圍空中的黑子尚有活力,按照圍棋裁判規則並未被判定為“死子”,因此KataGo的圍空中有黑子的地方都不能被計算為有效目數。

因此最後的贏家不是KataGo,而是攻擊者。

這場勝利並不是個例,在沒有搜尋的情況下,該對抗策略對KataGo的攻擊達到了99%的勝率。

當KataGo使用足夠的搜尋接近超人的水平時,他們的勝率達到了50%。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

另外,儘管有這種巧妙的策略,但攻擊者模型本身的圍棋實力卻不強:事實上,人類業餘愛好者都可以輕鬆地擊敗它。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

研究者表示,他們的研究目的是透過攻擊KataGo的一個意想不到的漏洞,證明即使高度成熟的AI系統也會存在嚴重的漏洞。

正如共同一作Gleave所說:

(這項研究)強調了對AI系統進行更好的自動化測試以發現最壞情況下的失敗模式的必要性,而不僅僅是測試一般情況下的性能。

研究團隊

研究團隊來自MIT、UC柏克萊等,論文共同一作為Tony Tong Wang和Adam Gleave。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

Tony Tong Wang,麻省理工學院電腦科學專業博士生,曾有在英偉達、Genesis Therapeutics等公司實習的經驗。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

Adam Gleave,加州大學柏克萊分校人工智慧博士生,碩士和大學部畢業於劍橋大學,主要研究方向是深度學習的穩健性。

擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手

論文的連結附在最後,有興趣的夥伴們可以自取~

論文連結:https://arxiv.org/abs /2211.00241

參考連結:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to -human-amateurs/

以上是擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI技能差距正在減慢供應鏈AI技能差距正在減慢供應鏈Apr 26, 2025 am 11:13 AM

經常使用“ AI-Ready勞動力”一詞,但是在供應鏈行業中確實意味著什麼? 供應鏈管理協會(ASCM)首席執行官安倍·埃什肯納齊(Abe Eshkenazi)表示,它表示能夠評論家的專業人員

一家公司如何悄悄地努力改變AI一家公司如何悄悄地努力改變AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地獲得動力。 本週五在德克薩斯州奧斯汀,Bittensor最終遊戲峰會標誌著一個關鍵時刻,將分散的AI(DEAI)從理論轉變為實際應用。 與閃閃發光的廣告不同

NVIDIA釋放NEMO微服務以簡化AI代理開發NVIDIA釋放NEMO微服務以簡化AI代理開發Apr 26, 2025 am 11:11 AM

企業AI面臨數據集成挑戰 企業AI的應用面臨一項重大挑戰:構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題,允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。 這個新推出的工具包包含五個關鍵微服務: NeMo Customizer 處理大型語言模型的微調,具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制,以保持合規性和適當的

AI為藝術與設計的未來描繪了一幅新圖片AI為藝術與設計的未來描繪了一幅新圖片Apr 26, 2025 am 11:10 AM

AI:藝術與設計的未來畫卷 人工智能(AI)正以前所未有的方式改變藝術與設計領域,其影響已不僅限於業餘愛好者,更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師,例如廣告、社交媒體圖片生成和網頁設計。 然而,專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具,探索新的美學可能性,融合不同的風格,創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務,提出不同的設計元素並提供創意輸入。 AI支持風格遷移,即將一種圖像的風格應用

Zoom如何徹底改變與Agent AI的合作:從會議到里程碑Zoom如何徹底改變與Agent AI的合作:從會議到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其視頻會議平台而聞名,它通過創新使用Agentic AI來引領工作場所革命。 最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。 定義代理AI 黃d

對大學的存在威脅對大學的存在威脅Apr 26, 2025 am 11:08 AM

AI會徹底改變教育嗎? 這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。 正如科技Edvocate的馬修·林奇(Matthew Lynch)所指出的那樣

原型:美國科學家正在國外尋找工作原型:美國科學家正在國外尋找工作Apr 26, 2025 am 11:07 AM

美國科學研究和技術發展或將面臨挑戰,這或許是由於預算削減導致的。據《自然》雜誌報導,2025年1月至3月期間,美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示,75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。 過去幾個月,數百項NIH和NSF的撥款被終止,NIH今年的新撥款減少了約23億美元,下降幅度接近三分之一。洩露的預算提案顯示,特朗普政府正在考慮大幅削減科學機構的預算,削減幅度可能高達50%。 基礎研究領域的動盪也影響了美國的一大優勢:吸引海外人才。 35

所有有關打開AI最新的GPT 4.1家庭的信息 - 分析Vidhya所有有關打開AI最新的GPT 4.1家庭的信息 - 分析VidhyaApr 26, 2025 am 10:19 AM

Openai推出了強大的GPT-4.1系列:一個專為現實世界應用設計的三種高級語言模型家族。 這種巨大的飛躍提供了更快的響應時間,增強的理解和大幅降低了成本

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具