搜尋
首頁科技週邊人工智慧人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

2016年,是人工智慧的崛起之年。

自從AlphaGo完勝圍棋世界冠軍李世石之後,代表圍棋頂尖水準的玩家再也不是人類。

然而,今天金融時報的一篇文章讓圍棋重回人們的視野:人類找到了戰勝AI的方法!

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

蟄伏7年,人類棋手要捲土重來了嗎?

圍棋逆風翻盤,人類戰勝AI?

FT報道稱,來自美國的業餘四段棋手Kellin Pelrine,一舉擊敗了頂級的下棋AI——KataGo。

在15場線下比賽中,Perline在沒有電腦的幫助下,贏得了14場比賽。

而這個讓人類棋手奪回圍棋桂冠的計劃,出自加州研究公司FAR AI的研究人員之手。團隊透過分析AI棋手的弱點加以針對,從而獲得最後的勝利。

FAR AI的執行長Adam Gleave表示:「對我們來說,利用這個系統非常容易。」

Gleave表示,團隊研發的AI在與KataGo進行了100多萬次的對局之後,發現了一個人類玩家可以利用的「bug」。

Pelrine說,他們發現的獲勝策略「對人類來說並不難」,中級玩家可以使用它來擊敗機器。他還使用這種方法擊敗了另一個頂級圍棋系統Leela Zero。

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

Kellin Pelrine

FT寫道,雖然有電腦的幫助,但這場決定性的勝利還是為人類棋手打開了一扇大門。

七年前,人工智慧在這項最複雜的遊戲中遙遙領先人類。

由DeepMind設計的AlphaGo系統,在2016年以4比1擊敗了圍棋世界冠軍李世石。李世石也在慘敗三年後宣布退役,稱AlphaGo是「無法擊敗的」。

而對於人工智慧的這種強勢,Pelrine不以為然。在他看來,棋局中大量的組合和變化,意味著電腦不可能評估棋手所有可能的未來招式。

簡單來說,Pelrine使用的策略是「聲東擊西」。

一方面,Pelrine在棋盤的各個角落落子,迷惑AI;另一方面,Pelrine認準AI棋手的一片領域,逐漸將其四周包圍。

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

Pelrine說,即使包圍即將完成,AI棋手也沒有註意到這一區的危險。他接著說:「但是身為人類,這些漏洞是很容易被發現的。」

#加州大學柏克萊分校電腦科學教授Stuart Russell說,一些最先進的圍棋遊戲機被發現存在弱點,這表明支撐當今最先進AI的深度學習系統存在根本缺陷。

他表示,這些系統只能「理解」他們經歷過的特定情況,並且無法和人類一樣,對策略進行簡單的概括。

能戰勝AI的,只有AI!

不過嚴格來說,研究人員是透過AI打敗了AI,或者說,用AI幫助人類在圍棋中擊敗AI。

作為參考來源的論文,首次發表於2022年11月並在今年1月進行了更新,作者則分別來自於MIT、UC伯克利等機構。在

文中,研究人員訓練了一個具有抗性策略的AI,進而擊敗了最先進的圍棋人工智慧系統KataGo。

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

專案地址:https://goattack.far.ai/adversarial-policy-katago#contents

論文網址:https://arxiv.org/abs/2211.00241

結果顯示,當KataGo不使用搜尋樹時,攻擊者在1000盤棋中取得了100%的勝率,而當KataGo使用足夠多的搜尋時,勝率超過97%。

對此,研究人員強調,對抗性策略AI可以擊敗KataGo,但它卻會被人類業餘愛好者戰勝,同時人類業餘愛好者是打不贏KataGo的。

也就是說,這個AI能夠取勝,並不是因為圍棋下得更好,而是它能誘使KataGo去犯下嚴重的錯誤。

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

攻擊策略

在此之前,像是KataGo和AlphaZero等等這些下棋AI,都透過自我博弈進行訓練的。

但在這項被作者稱為「受害者遊戲」(victim-play)的研究中,攻擊者(adversary)需要透過與一個固定的受害者(victim)進行博弈,來訓練自己的勝利策略(不是模仿對手的下法)。

對此,研究人員引入了兩個不同的對抗性MCTS(A-MCTS)策略來解決這個問題。

  • 範本A-MCTS-S:研究人員設定的搜尋過程為:當受害者下棋時,從受害者的策略網路中取樣;輪到攻擊者時,從攻擊者的策略網路中採樣。
  • 遞歸A-MCTS-R:由於A-MCTS-S低估了受害者的實力,因此研究人員提出了一種新的策略A-MCTS-R。然而,這種變化增加了攻擊者訓練和推理的計算複雜性。

具體來說,在A-MCTS-R中,研究人員會在受害者節點上使用一個新的(遞歸)MCTS搜尋來進行模擬,從而取代A-MCTS-S中的受害者採樣步驟。

雖然這不再是一個完美的受害者模型,但它往往比A-MCTS-S更準確,因為後者會錯誤地假設受害者不進行搜尋。

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

評估結果如下,具體細節可參考原文。

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝

以上是人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業餘四段棋手完勝的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
通過AI和NLG進行財務報告 - 分析Vidhya通過AI和NLG進行財務報告 - 分析VidhyaApr 15, 2025 am 10:35 AM

AI驅動的財務報告:通過自然語言產生革新見解 在當今動態的業務環境中,準確及時的財務分析對於戰略決策至關重要。 傳統財務報告

這款Google DeepMind機器人會在2028年奧運會上演奏嗎?這款Google DeepMind機器人會在2028年奧運會上演奏嗎?Apr 15, 2025 am 10:16 AM

Google DeepMind的乒乓球機器人:體育和機器人技術的新時代 巴黎2024年奧運會可能已經結束,但是由於Google DeepMind,運動和機器人技術的新時代正在興起。 他們的開創性研究(“實現人類水平的競爭

使用Gemini Flash 1.5型號構建食物視覺網絡應用使用Gemini Flash 1.5型號構建食物視覺網絡應用Apr 15, 2025 am 10:15 AM

雙子座閃光燈1.5解鎖效率和可伸縮性:燒瓶食物視覺webapp 在快速發展的AI景觀中,效率和可擴展性至關重要。 開發人員越來越多地尋求高性能模型,以最大程度地減少成本和延遲

使用LlamainDex實施AI代理使用LlamainDex實施AI代理Apr 15, 2025 am 10:11 AM

利用LlamainDex的AI特工的力量:逐步指南 想像一下,一個私人助理了解您的要求並完美地執行它們,無論是快速計算還是檢索最新的市場新聞。本文探索

將.ipynb文件轉換為PDF- Analytics Vidhya的5種方法將.ipynb文件轉換為PDF- Analytics Vidhya的5種方法Apr 15, 2025 am 10:06 AM

Jupyter Notebook (.ipynb) 文件廣泛用於數據分析、科學計算和交互式編碼。雖然這些 Notebook 非常適合開發和與其他數據科學家共享代碼,但有時您需要將其轉換為更普遍易讀的格式,例如 PDF。本指南將引導您逐步了解將 .ipynb 文件轉換為 PDF 的各種方法,以及技巧、最佳實踐和故障排除建議。 目錄 為什麼將 .ipynb 轉換為 PDF? 將 .ipynb 文件轉換為 PDF 的方法 使用 Jupyter Notebook UI 使用 nbconve

LLM量化和用例的綜合指南LLM量化和用例的綜合指南Apr 15, 2025 am 10:02 AM

介紹 大型語言模型(LLM)正在徹底改變自然語言處理,但它們的巨大規模和計算要求限制了部署。 量化是一種縮小模型和降低計算成本的技術,是至關重要的

python的硒綜合指南python的硒綜合指南Apr 15, 2025 am 09:57 AM

介紹 本指南探討了用於Web自動化和測試的Selenium和Python的強大組合。 Selenium可自動化瀏覽器交互,從而顯著提高了大型Web應用程序的測試效率。 本教程重點o

理解互動術語的指南理解互動術語的指南Apr 15, 2025 am 09:56 AM

介紹 交互項納入回歸模型中,以捕獲因變量中兩個或多個自變量的效果。有時,這不僅僅是控制之間的簡單關係

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中