アマチュアチェスプレイヤーでも勝てない新型モデルが、実は世界最強の囲碁AI「KataGo」を破った?
はい、この驚くべき結果は、MIT、カリフォルニア大学バークレー校などの最新論文から得られたものです。
研究者らは、敵対的攻撃手法を使用して KataGo の死角を掴み、このテクノロジーに基づいて、新人レベルの囲碁プログラムが KataGO を破ることに成功しました。
検索なしでも、この勝率は 99% に達します。
これを計算すると、囲碁界の食物連鎖は瞬時に次のようになります。アマチュア プレイヤー > 新しい AI > トップの囲碁 AI?
ちょっと待ってください、この魔法のような新しい AI はどのようにして同時に非常に優れたものになるのでしょうか?
狡猾な攻撃角度
新しい AI を紹介する前に、まず今回攻撃された主人公である KataGo について理解しましょう。
KataGo は、現在最も強力なオープンソースの囲碁 AI で、ハーバード大学の AI 研究者によって開発されました。
以前、KataGo は超人レベルの ELF OpenGo と Leela Zero を破り、検索エンジンがなくても、そのレベルはヨーロッパのプロ棋士トップ 100 に匹敵しました。
三星杯で優勝し、「3年間で4冠」を達成した韓国の「ナンバーワン」囲碁棋士、シン・ジンジン氏は、スパーリングにKataGoを使用しています。
△画像出典:ハンゲーム
これほど強敵を前に、研究者たちが選んだ方法は圧倒的といえる。
彼らは、KataGo が何百万もの対局を行うことで囲碁を学習しましたが、これでは考えられるすべての状況をカバーするにはまだ不十分であることを発見しました。
そこで、今度はセルフゲームを選択するのではなく、対決攻撃方法を選択します:
攻撃者 (敵対者) と固定された被害者 (KataGo とも呼ばれる被害者) を競争させます。ゲームでは、この方法を使用して攻撃者を訓練します。
この変更により、KataGo のトレーニングに使用されるデータのわずか 0.3% を使用して、エンドツーエンドの敵対的ポリシーをトレーニングできるようになりました。
具体的には、この対抗戦略は完全にゲームに関するものではなく、KataGo をだまして攻撃者に有利な位置に誘導することでゲームを途中で終了させます。
たとえば、下の図では、黒石をコントロールする攻撃者は、主に盤の右上隅に石を配置し、その他の領域は KataGo に任せ、また、意図的に他の領域にいくつかの駒を置きます。簡単にクリアできます。
この論文の共著者であるアダム・グリーブ氏は、次のように紹介しています:
このアプローチでは、KataGo が勝ったと誤って思い込ませます。なぜなら、KataGo の領域 (左下) は、その領域 (左下) の方がはるかに大きいからです。対戦相手。
しかし、左下のエリアはまだ黒点があり、完全に安全ではないことを意味するため、実際にはポイントに貢献しません。
KataGo は勝利を過信しており、ゲームが終了してスコアが計算されれば勝つと考えているため、KataGo は率先してパスを取り、その後、攻撃者もパスし、ゲームが終了し、得点が始まります。 (両者パスしてゲーム終了)
しかし、Gleaveの分析によると、KataGoの周囲の空間にある黒石はまだ生きているため、囲碁審判規則では「死んだ石」とは判定されない。そのため、周囲の空間にあるKataGoの黒石は生きており、黒点のある場所は有効メッシュ数としてカウントできません。
つまり、最終的な勝者は KataGo ではなく、攻撃側です。
この勝利は特別なものではなく、探索を行わない場合、この対策は KataGo に対して 99% の勝率を達成しました。
KataGo が超人レベルに近づくほど十分な検索を使用したとき、勝率は 50% に達しました。
また、この賢い戦略にも関わらず、攻撃者モデル自体は囲碁ではあまり強くありません。実際、素人の人間には簡単に負けてしまいます。
研究者らは、研究の目的は、KataGo の予期せぬ脆弱性を攻撃することで、高度に成熟した AI システムにも深刻な脆弱性が存在する可能性があることを証明することであると述べています。
共著者の Gleave 氏は次のように述べています:
(この研究) は、通常の状況下でパフォーマンスをテストするだけでなく、最悪の場合の障害モードを発見するために AI システムの自動テストを改善する必要性を強調しています。
研究チーム
研究チームはMIT、カリフォルニア大学バークレー校などから来ています。論文の共著者はTony Tong WangとAdam Gleaveです。
MIT のコンピューター サイエンスの博士課程の学生である Tony Tong Wang は、NVIDIA、Genesis Therapeutics などの企業でインターンとして働いた経験があります。
アダム グリーブは、カリフォルニア大学バークレー校の人工知能の博士課程の学生です。ケンブリッジ大学で修士号と学士号を取得して卒業しました。彼の主な研究方向は次のとおりです。深層学習の堅牢性。
論文へのリンクは最後に添付されています。興味のある友人はそれを入手してください~
論文へのリンク: https://arxiv .org/abs /2211.00241
参考リンク:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but -人間のアマチュア/
に負ける以上が深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AIの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク(C. elegansのものと同様)を広く研究してきました。 ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

GoogleのGemini Advanced:Horizonの新しいサブスクリプションティア 現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。 ただし、Android Authorityのレポートは、今後の変更を示唆しています。 最新のGoogle p

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます:データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

Googleのエージェント開発キット(ADK)のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

まとめ: Small Language Model(SLM)は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル(LLM)よりも優れています。 特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。 テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能(AI)および最近では生成AIも例外ではありません

コンピュータービジョンのためのGoogleGeminiの力を活用:包括的なガイド 大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。 このガイドの利用方法については、

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。 数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ホットトピック









