一個連業餘棋手都打不過的新模型,竟然擊敗了世界最強圍棋AI——KataGo?
沒錯,這會驚掉人下巴的結果來自MIT、UC柏克萊等的最新論文。
研究人員利用對抗攻擊方法,抓住了KataGo的盲點,並基於該技術使一個菜鳥級圍棋程序成功打敗了KataGO。
在沒有搜尋的情況下,這勝率甚至達到了99%。
這麼算下來,圍棋界的食物鏈瞬間變成了:業餘棋手>新AI>頂級圍棋AI?
等等,這個神奇的新AI是怎麼做到又菜又厲害的?
刁鑽的攻擊角度
在介紹新AI之前,讓我們先來了解一下這次被攻擊的主角-KataGo。
KataGo,目前最強大的開源圍棋AI,由哈佛AI研究員開發。
先前,KataGo擊敗了超人類水準的ELF OpenGo和Leela Zero,即使沒有搜尋引擎的情況下,其水準也與歐洲前100名圍棋專業選手相當。
剛拿下三星盃冠軍、實現「三年四冠」的韓國圍棋「第一人」申真諦,就一直用的KataGo進行陪練。
△圖源:Hangame
面對實力如此強勁的對手,研究人員選擇的方法可以說是四兩撥千斤了。
他們發現,儘管KataGo透過與自己進行數百萬次遊戲來學習圍棋,但這仍然不足以涵蓋所有可能的情況。
於是,這次他們不再選擇自我博弈,而是選擇對抗攻擊方法:
讓攻擊者(adversary)和固定受害者(victim,也就是KataGo)之間進行博弈,利用這種方式訓練攻擊者。
這一步改變讓他們只用訓練KataGo時0.3%的數據,訓練出了一個端到端的對抗策略(adversarial policy)。
具體來說,該對抗策略並不是完全在做博弈,而是透過欺騙KataGo在對攻擊者有利的位置落子,以過早地結束遊戲。
以下圖為例,控制著黑子的攻擊者主要在棋盤的右上角落子,把其他區域留給KataGo,並且還心機的在其他區域下了一些容易被清理的棋子。
論文共同一作Adam Gleave介紹:
這種做法會讓KataGo誤以為自己已經贏了,因為它的地盤(左下)比對手的要大得多。
但左下角的區域並沒有真正貢獻分數,因為那裡仍留有黑子,這意味著它並不完全安全。
由於KataGo對勝利過於自信——認為如果遊戲結束併計算分數自己就會贏——所以KataGo會主動pass,然後攻擊者也pass,從而結束遊戲,開始計分。 (雙方pass,棋就結束)
但正如Gleave分析的一樣,由於KataGo圍空中的黑子尚有活力,按照圍棋裁判規則並未被判定為“死子”,因此KataGo的圍空中有黑子的地方都不能被計算為有效目數。
因此最後的贏家不是KataGo,而是攻擊者。
這場勝利並不是個例,在沒有搜尋的情況下,該對抗策略對KataGo的攻擊達到了99%的勝率。
當KataGo使用足夠的搜尋接近超人的水平時,他們的勝率達到了50%。
另外,儘管有這種巧妙的策略,但攻擊者模型本身的圍棋實力卻不強:事實上,人類業餘愛好者都可以輕鬆地擊敗它。
研究者表示,他們的研究目的是透過攻擊KataGo的一個意想不到的漏洞,證明即使高度成熟的AI系統也會存在嚴重的漏洞。
正如共同一作Gleave所說:
(這項研究)強調了對AI系統進行更好的自動化測試以發現最壞情況下的失敗模式的必要性,而不僅僅是測試一般情況下的性能。
研究團隊
研究團隊來自MIT、UC柏克萊等,論文共同一作為Tony Tong Wang和Adam Gleave。
Tony Tong Wang,麻省理工學院電腦科學專業博士生,曾有在英偉達、Genesis Therapeutics等公司實習的經驗。
Adam Gleave,加州大學柏克萊分校人工智慧博士生,碩士和大學部畢業於劍橋大學,主要研究方向是深度學習的穩健性。
論文的連結附在最後,有興趣的夥伴們可以自取~
論文連結:https://arxiv.org/abs /2211.00241
參考連結:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to -human-amateurs/
以上是擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手的詳細內容。更多資訊請關注PHP中文網其他相關文章!

ai合并图层的快捷键是“Ctrl+Shift+E”,它的作用是把目前所有处在显示状态的图层合并,在隐藏状态的图层则不作变动。也可以选中要合并的图层,在菜单栏中依次点击“窗口”-“路径查找器”,点击“合并”按钮。

ai橡皮擦擦不掉东西是因为AI是矢量图软件,用橡皮擦不能擦位图的,其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

虽然谷歌早在2020年,就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日,谷歌才首次公布了这台AI超算的技术细节。论文地址:https://arxiv.org/abs/2304.01433相比于TPU v3,TPU v4的性能要高出2.1倍,而在整合4096个芯片之后,超算的性能更是提升了10倍。另外,谷歌还声称,自家芯片要比英伟达A100更快、更节能。与A100对打,速度快1.7倍论文中,谷歌表示,对于规模相当的系统,TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式。转换方法:1、打开Adobe Illustrator软件,依次点击顶部菜单栏的“文件”-“打开”,选择所需的ai文件;2、点击右侧功能面板中的“图层”,点击三杠图标,在弹出的选项中选择“释放到图层(顺序)”;3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”;4、在弹出的“导出”对话框中,将“保存类型”设置为“PSD格式”,点击“导出”即可;

Yann LeCun 这个观点的确有些大胆。 「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。当然,被 Yann LeCun 指出问题的不只是自回归模型。在他看来,当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

ai顶部属性栏不见了的解决办法:1、开启Ai新建画布,进入绘图页面;2、在Ai顶部菜单栏中点击“窗口”;3、在系统弹出的窗口菜单页面中点击“控制”,然后开启“控制”窗口即可显示出属性栏。

引入密集强化学习,用 AI 验证 AI。 自动驾驶汽车 (AV) 技术的快速发展,使得我们正处于交通革命的风口浪尖,其规模是自一个世纪前汽车问世以来从未见过的。自动驾驶技术具有显着提高交通安全性、机动性和可持续性的潜力,因此引起了工业界、政府机构、专业组织和学术机构的共同关注。过去 20 年里,自动驾驶汽车的发展取得了长足的进步,尤其是随着深度学习的出现更是如此。到 2015 年,开始有公司宣布他们将在 2020 之前量产 AV。不过到目前为止,并且没有 level 4 级别的 AV 可以在市场

ai移动不了东西的解决办法:1、打开ai软件,打开空白文档;2、选择矩形工具,在文档中绘制矩形;3、点击选择工具,移动文档中的矩形;4、点击图层按钮,弹出图层面板对话框,解锁图层;5、点击选择工具,移动矩形即可。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Dreamweaver CS6
視覺化網頁開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),