検索
ホームページテクノロジー周辺機器AIGoogle Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証

Google DeepMind は Nature を再びリリースし、AI の Alpha シリーズが復活し、数学のレベルは飛躍的に向上しました。

AlphaGeometry、IMO 金メダル選手の幾何学的レベルに達するために人間によるデモンストレーションは必要ありません。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証

#AlphaZero は当時「人知れず囲碁を極める」というゲームを学んだような気がします。

AlphaGeometry は、IMO の難易度の高い幾何定理の証明問題 30 問中 25 問正解しましたが、人間の平均的な金メダルプレイヤーは 25.9 問正解しました。さらに、以前の SOTA 法 (1978 年の呉文君法) では 10 問しか正解できませんでした。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証

IMO 金メダリスト

陈伊婷 (Evan Chen) は、AI によって生成された回答を評価する責任を負い、次のようにコメントしました。

##AlphaGeometry の出力は、信頼性が高く、クリーンであり、印象的です。これまでの AI ソリューションは当たり外れが多く、結果として手動でのレビューが必要になる場合もありました。

AlphaGeometry のソリューションは、マシンによって検証でき、人間によって理解できる検証可能な構造を備えています。学生と同じように、角度や類似の三角形などの古典的な幾何学ルールを使用します。

優れた結果に加えて、この研究には業界の注目を集めている 3 つの重要なポイントがあります。

  • 必要ありません。人間によるデモンストレーション、つまり、AlphaZero の自己学習 Go メソッドを継続して、AI 合成データ トレーニングのみが使用されます。
  • 他の AI 手法と組み合わせた大規模モデル、AlphaGo や OpenAI Q* の噂に似ています。 これまでの多くの方法とは異なり、AlphaGeometry は人間が読める証明を生成でき、モデルとコードは両方ともオープンソースです。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証#チームは、AlphaGeometry が高度な推論能力を実現し、新しい知識を発見するための潜在的なフレームワークを提供すると信じています。

これは、AGI 構築の重要なステップと見なされている、人工知能における定理証明を進めるのに役立つ可能性があります。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証さらに、著者のチームとのコミュニケーションプロセス中に、Qubits は、AlphaGo チャレンジと同様に、AlphaGeometry が本当に IMO 競技会に参加することを許可されるかどうかを尋ねました。人間の囲碁チャンピオンのように。

彼らは、システムの機能を向上させるために熱心に取り組んでおり、AI が幾何学を超えた幅広い数学的問題を解決できるようにする必要があると述べました。

AI は幾何学も補助線を引くことを証明しました

以前、AI システムは幾何学的な問題をうまく解決できず、高品質のトレーニング データが不足していたため行き詰まっていました。

幾何学を学習している人間は、紙とペンを使って画像に関する既存の知識を利用して、新しくより複雑な幾何学的特性と関係を発見できます。

Google チームは、この目的のために 10 億のランダムな幾何学的オブジェクト グラフと、それらの点と線の間のすべての関係を生成し、最終的に 1 億の固有の定理とさまざまな困難の証明を選別しました。これらのデータを最初からトレーニングします。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証システムは、複雑な幾何学的証明を見つけるために相互に連携する 2 つのモジュールで構成されています。

  • 言語モデル、問題を解決するために使用できる幾何学的構造 を予測します (つまり、補助線を追加します)
  • 記号推論エンジン、論理ルールを使用して結論を​​導き出します。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証筆頭著者 Trieu Trinh は、AlphaGeometry の演算プロセスは人間の脳が速いタイプと遅いタイプに分けられるのと似ていると紹介しました。

これは、ノーベル賞受賞者ダニエル・カーネマンのベストセラー本「Thinking Fast and Slow」で広められた「システム 1、システム 2」の概念です。

システム 1 は迅速で直感的なアイデアを提供し、システム 2 はより思慮深く合理的な決定を提供します。

一方で、言語モデルはデータ内のパターンと関係を識別するのが得意で、潜在的に有用な補助構造を迅速に予測できますが、多くの場合、その決定を厳密に推論したり説明したりする能力が欠けています。

一方、記号推論エンジンは形式論理に基づいており、明示的なルールを使用して結論を​​導き出します。これらは合理的で説明可能ですが、特に大規模で複雑な問題を単独で処理する場合、時間がかかり、柔軟性に欠けます。

たとえば、IMO 2015 のコンテストの問題を解く場合、青い部分は AlphaGeometry の言語モデルによって追加された補助構造、緑色の部分は最終証明の簡易バージョンで、合計 109 のステップがあります。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証

この問題を解決する過程で、AlphaGeometry は 2004 年の IMO コンテストの問題で未使用の前提条件も発見し、定理のより広範なバージョンを発見しました。

O が BC の中点であるという条件なしで、P、B、および C が同一線上にあることを証明できます。

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証

さらに、この研究では、人間のスコアが最も低い 3 つの問題についても、AlphaGeometry では非常に長い証明プロセスと多くの追加が必要であることも判明しました。解決する補助構造の。

しかし、比較的簡単な問題では、人間の平均スコアと AI によって生成された証明の長さとの間に有意な相関はありませんでした (p = −0.06)

Google Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証

もう 1 つ

AlphaGeometry と AlphaGo の関係と違いについて、チームとのコミュニケーションの過程で、Google の科学者が Quoc Le はじめに:

これらはすべて非常に複雑な意思決定空間で検索しますが、AlphaGo の方法はより伝統的です(注: ニューラル ネットワークはパターン認識を担当します), AlphaGeometry のニューラル ネットワークは、次にとるべきアクションを提案し、決定空間内で正しい方向に進むように検索アルゴリズムを誘導する責任があります。

この結果は Alpha シリーズにちなんで名付けられており、最初のユニットも Google DeepMind ですが、著者は実際には元 Google Brain メンバーです。

Quoc Le マスターについては説明の必要はありません。筆頭著者の Trieu Trinh 氏と責任著者の Thang Luong 氏は、どちらも Google で 6 ~ 7 年間働いています。Thang Luong 氏自身も高校時代は IMO プレーヤーでした。

二人の中国人作家のうち、何何さんはニューヨーク大学の助教授です。 Wu Yuhuai 氏は以前、Google の大規模数学モデル Minerva の研究に参加していましたが、現在は Google を辞めてマスク氏のチームに加わり、xAI の共同創設者の 1 人になっています。

論文アドレス: https://www.nature.com/articles/s41586-023-06747-5。

参考リンク:
[1]https://www.nature.com/articles/d4186-024-00141 -5.

[2]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry。

以上がGoogle Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaMeta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などAVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用:チャットボットは本当に気にすることができますか?マシンと話すための人的費用:チャットボットは本当に気にすることができますか?Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics Vidhyaラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

Dagsterでデータ品質チェックを自動化しますDagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか?メインフレームはAI時代に役割を果たしていますか?Apr 11, 2025 am 11:42 AM

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境