検索
ホームページテクノロジー周辺機器AI深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

アマチュアチェスプレイヤーでも勝てない新型モデルが、実は世界最強の囲碁AI「KataGo」を破った?

はい、この驚くべき結果は、MIT、カリフォルニア大学バークレー校などの最新論文から得られたものです。

研究者らは、敵対的攻撃手法を使用して KataGo の死角を掴み、このテクノロジーに基づいて、新人レベルの囲碁プログラムが KataGO を破ることに成功しました。

検索なしでも、この勝率は 99% に達します。

これを計算すると、囲碁界の食物連鎖は瞬時に次のようになります。アマチュア プレイヤー > 新しい AI > トップの囲碁 AI?

ちょっと待ってください、この魔法のような新しい AI はどのようにして同時に非常に優れたものになるのでしょうか?

狡猾な攻撃角度

新しい AI を紹介する前に、まず今回攻撃された主人公である KataGo について理解しましょう。

KataGo は、現在最も強力なオープンソースの囲碁 AI で、ハーバード大学の AI 研究者によって開発されました。

以前、KataGo は超人レベルの ELF OpenGo と Leela Zero を破り、検索エンジンがなくても、そのレベルはヨーロッパのプロ棋士トップ 100 に匹敵しました。

三星杯で優勝し、「3年間で4冠」を達成した韓国の「ナンバーワン」囲碁棋士、シン・ジンジン氏は、スパーリングにKataGoを使用しています。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

△画像出典:ハンゲーム

これほど強敵を前に、研究者たちが選んだ方法は圧倒的といえる。

彼らは、KataGo が何百万もの対局を行うことで囲碁を学習しましたが、これでは考えられるすべての状況をカバーするにはまだ不十分であることを発見しました。

そこで、今度はセルフゲームを選択するのではなく、対決攻撃方法を選択します:

攻撃者 (敵対者) と固定された被害者 (KataGo とも呼ばれる被害者) を競争させます。ゲームでは、この方法を使用して攻撃者を訓練します。

この変更により、KataGo のトレーニングに使用されるデータのわずか 0.3% を使用して、エンドツーエンドの敵対的ポリシーをトレーニングできるようになりました。

具体的には、この対抗戦略は完全にゲームに関するものではなく、KataGo をだまして攻撃者に有利な位置に誘導することでゲームを途中で終了させます。

たとえば、下の図では、黒石をコントロールする攻撃者は、主に盤の右上隅に石を配置し、その他の領域は KataGo に任せ、また、意図的に他の領域にいくつかの駒を置きます。簡単にクリアできます。

この論文の共著者であるアダム・グリーブ氏は、次のように紹介しています:

このアプローチでは、KataGo が勝ったと誤って思い込ませます。なぜなら、KataGo の領域 (左下) は、その領域 (左下) の方がはるかに大きいからです。対戦相手。

しかし、左下のエリアはまだ黒点があり、完全に安全ではないことを意味するため、実際にはポイントに貢献しません。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

KataGo は勝利を過信しており、ゲームが終了してスコアが計算されれば勝つと考えているため、KataGo は率先してパスを取り、その後、攻撃者もパスし、ゲームが終了し、得点が始まります。 (両者パスしてゲーム終了)

しかし、Gleaveの分析によると、KataGoの周囲の空間にある黒石はまだ生きているため、囲碁審判規則では「死んだ石」とは判定されない。そのため、周囲の空間にあるKataGoの黒石は生きており、黒点のある場所は有効メッシュ数としてカウントできません。

つまり、最終的な勝者は KataGo ではなく、攻撃側です。

この勝利は特別なものではなく、探索を行わない場合、この対策は KataGo に対して 99% の勝率を達成しました。

KataGo が超人レベルに近づくほど十分な検索を使用したとき、勝率は 50% に達しました。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

また、この賢い戦略にも関わらず、攻撃者モデル自体は囲碁ではあまり強くありません。実際、素人の人間には簡単に負けてしまいます。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

研究者らは、研究の目的は、KataGo の予期せぬ脆弱性を攻撃することで、高度に成熟した AI システムにも深刻な脆弱性が存在する可能性があることを証明することであると述べています。

共著者の Gleave 氏は次のように述べています:

(この研究) は、通常の状況下でパフォーマンスをテストするだけでなく、最悪の場合の障害モードを発見するために AI システムの自動テストを改善する必要性を強調しています。

研究チーム

研究チームはMIT、カリフォルニア大学バークレー校などから来ています。論文の共著者はTony Tong WangとAdam Gleaveです。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

MIT のコンピューター サイエンスの博士課程の学生である Tony Tong Wang は、NVIDIA、Genesis Therapeutics などの企業でインターンとして働いた経験があります。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

アダム グリーブは、カリフォルニア大学バークレー校の人工知能の博士課程の学生です。ケンブリッジ大学で修士号と学士号を取得して卒業しました。彼の主な研究方向は次のとおりです。深層学習の堅牢性。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

論文へのリンクは最後に添付されています。興味のある友人はそれを入手してください~

論文へのリンク: https://arxiv .org/abs /2211.00241

参考リンク:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but -人間のアマチュア/

に負ける

以上が深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AIの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
踊りましょう:私たちの人間のニューラルネットを微調整するための構造化された動き踊りましょう:私たちの人間のニューラルネットを微調整するための構造化された動きApr 27, 2025 am 11:09 AM

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク(C. elegansのものと同様)を広く研究してきました。 ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにします新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにしますApr 27, 2025 am 11:08 AM

GoogleのGemini Advanced:Horizo​​nの新しいサブスクリプションティア 現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。 ただし、Android Authorityのレポートは、今後の変更を示唆しています。 最新のGoogle p

データ分析の加速がAIの隠されたボトルネックをどのように解決しているかデータ分析の加速がAIの隠されたボトルネックをどのように解決しているかApr 27, 2025 am 11:07 AM

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます:データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます!MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます!Apr 27, 2025 am 09:47 AM

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

建物のエージェントにGoogle ADKを使用する方法は? - 分析Vidhya建物のエージェントにGoogle ADKを使用する方法は? - 分析VidhyaApr 27, 2025 am 09:42 AM

Googleのエージェント開発キット(ADK)のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

効果的な問題解決のためにLLMを介したSLMの使用 - 分析Vidhya効果的な問題解決のためにLLMを介したSLMの使用 - 分析VidhyaApr 27, 2025 am 09:27 AM

まとめ: Small Language Model(SLM)は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル(LLM)よりも優れています。 特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。 テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能(AI)および最近では生成AIも例外ではありません

コンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は? - 分析VidhyaコンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は? - 分析VidhyaApr 27, 2025 am 09:26 AM

コンピュータービジョンのためのGoogleGeminiの力を活用:包括的なガイド 大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。 このガイドの利用方法については、

Gemini 2.0 Flash vs O4-Mini:GoogleはOpenaiよりもうまくやることができますか?Gemini 2.0 Flash vs O4-Mini:GoogleはOpenaiよりもうまくやることができますか?Apr 27, 2025 am 09:20 AM

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。 数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。