テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します-AI-php.cn

ホームページ

テクノロジー周辺機器

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Dec 16, 2023 pm 02:15 PM

モデル電車

「正しく使用すれば、AI は 2026 年までに数学研究や他の多くの分野で信頼できる共著者になると私は予測しています。」と数学者のテレンス・タオ氏は以前のブログで述べました。

タオ・ゼシュアンはこう言い、そしてそれを実行しました。

彼は最近、GPT-4、Copilot、Lean などのツールを使用して数学的研究を行っており、AI の助けを借りて論文の隠れたバグも発見しました。

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

最近、テレンスタオ氏は、Lean4 プロジェクトが多項式フライマン-ルザ予想 (PFR) の証明の形式化を正常に完了したと述べました。たったの3日、1週間かかりました。同時に、リーンコンパイラは、予想が標準公理に準拠していることも報告します。これはコンピューターと AI によって証明された大成功であり、非常に興味深いものです。

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

上記の研究の詳細については、興味のある読者は「」を参照してください。 AIを使った陶則軒の正式な証明とは何ですか？」 PFR 予想の過去と現在を 1 つの記事で理解します。

これを見て、慎重な読者はヒントを見つけたかもしれませんマスター・タオは数学的研究を行っているときにリーンについて何度も言及しました。簡単に言うと、リーンは数学者が定理を検証するのに役立つプログラミング言語であり、ユーザーは証明を書いて検証することができます。オリジナルの Lean と比較して、最新の Lean 4 バージョンでは、コンパイラの高速化、エラー処理の改善、外部ツールとの統合の改善など、多くの最適化が行われています。

リーンは数学の分野で広く使用されていますが、ラージモデル (LLM) が普及している今日、この 2 つを組み合わせるより良い方法はあるでしょうか?

オープンプラットフォーム LeanDojo チーム (LeanDojo については、「AI 大型モデルが Tao Zhexuan の問題解決を支援し、数学の定理も証明できますか? ") とカリフォルニア工科大学の研究者は、100% 正確な形式的な数学的証明を提供することを目的として、LLM と人間の対話のために設計されたコラボレーションツールである Lean Copilot を立ち上げました。

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

LeanDojo チームの研究は主に LLM を使用して定理証明を自動化することに焦点を当てていることは注目に値します。 Lean Copilot が LLM に関連していることは驚くべきことではありません。

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

プロジェクトアドレス: https://github.com/lean-dojo/LeanCopilot

対象この研究は、かっこいいと言うのは別として、非常に格好良くて、今でも非常に評価が高いです。

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

リーンで LLM を使用して数学的証明を高速化する

長い間、定理証明は自動化されてきました。多くの困難に直面しているため、数学的証明は伝統的に手動による導出に依存しており、慎重な検証が必要です。現在、AI の進歩に伴い、研究者は人工知能を使用して詳細な調査を実施し始めていますが、この問題は避けられません。つまり、LLM は数学や推論のタスクではあまり信頼できない場合があり、エラーや幻覚が発生しやすいのです。

リーンコパイロットの機能を使用すると、ユーザーは大規模な言語モデルを使用して、リーンでの証明プロセスを自動化し、証明合成の速度を向上させることができます。必要に応じて、ユーザーはシームレスに介入および変更して、マシンインテリジェンスと人間のインテリジェンスのバランスのとれたコラボレーションを実現することもできます。

リーンコパイロットを使用すると、LLM をリーンで使用して、戦略の提案を含む証明の自動化を実現できます。、前提および検索証明

ユーザーは、LeanDojo が提供する組み込みモデルを使用するか、独自のモデルをインポートするかを選択できます。これらのモデルは、ローカル (GPU の有無にかかわらず) またはクラウドで実行できます

#つまり、リーンコパイロットは、LLM を導入してモデルを強化し、最適化する柔軟な方法をユーザーに提供します。 Lean での定理証明のプロセス。

リーンコパイロットの主な機能は次のように要約できます:

LLM は、証明ステップを提案し、証明を検索し、大規模な数学ライブラリから有用な補題を選択することができます。
Lean Copilot は Lean パッケージとして設定でき、Lean VS Code ワークフロー内でシームレスに実行できます。
ユーザーは、LeanDojo の組み込みモデルを使用することも、ローカル (GPU の有無にかかわらず) またはクラウドで実行できる独自のモデルを使用することもできます。
このツールは、Linux、macOS、Windows WSL などのさまざまなプラットフォームで実行されます。

Lean ユーザーが LLM をより利用しやすくするために、Lean Copilot は正のフィードバックループを開始したいと考えています。自動化がより良いデータにつながり、最終的には数学的パフォーマンスにおける LLM のパフォーマンスを向上させることを証明します。。

Copilot の効果デモ

Lean Copilot は、公式チュートリアルに従って設定できます。構成が完了したら、実験を開始できます。プロジェクトの作成者は、参考用に公式の例をいくつか提供しています。

推奨ソリューション。 LeanCopilot をインポートした後、suggest_tactics を使用して推奨ソリューションを生成できます。使用中に、推奨されるソリューションをクリックしてプルーフで使用することもできます (下の画像を参照)

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

プレフィックスを使用できます, たとえば、生成された戦略

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

検索証明を制限するには、simp を使用します。 search_proof を使用して、LLM で生成されたポリシーと aesop (Lean 4 のホワイトボックス自動化プロジェクト) を組み合わせて、複数のポリシー証明を検索します。証明を見つけたら、戦略をクリックしてエディターに挿入できます。

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

# 書き直された内容: 前提条件の選択は重要です。。この戦略の目的は、潜在的に有用な前提のリストを取得することです。現在、Lean Copilot は LeanDojo の検索ツールを使用して、Lean と mathlib4 (つまり、Lean 4 数学ライブラリ) の固定スナップショットからプレミスを選択します。 # LLM を実行できます。定理の証明でも他の推論でも、リーンで LLM を実行できます。任意のモデルをローカルまたはリモートで実行できます (「独自のモデルの持ち込み」を参照)

テレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示します

興味のある読者のために、いくつかの高度な使用法についてもプロジェクトで説明しています。元のプロジェクトにアクセスして詳細を確認できます。

以上がテレンス・タオは大規模モデル証明アシスタントのリーンを使用して自分の好みを示しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

LLMSでのツール呼び出しApr 14, 2025 am 11:28 AM

大規模な言語モデル（LLM）は人気が急増しており、ツールコール機能は単純なテキスト生成を超えて機能を劇的に拡大しています。これで、LLMSは動的なUI作成や自律的なaなどの複雑な自動化タスクを処理できます。

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか？ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

AIに関する国連入力：勝者、敗者、および機会Apr 14, 2025 am 11:25 AM

「歴史は、技術の進歩が経済成長を促進する一方で、それ自体が公平な所得分布を確保したり、包括的な人間開発を促進したりしないことを示しています」とUNCTADの事務総長であるRebeca Grynspanは前文で書いています。

生成AIを介した交渉スキルを学ぶApr 14, 2025 am 11:23 AM

簡単な、Generative AIを交渉の家庭教師およびスパーリングパートナーとして使用してください。それについて話しましょう。革新的なAIブレークスルーのこの分析は、最新のAIに関する私の進行中のフォーブス列のカバレッジの一部であり、特定と説明を含む

テッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますApr 14, 2025 am 11:22 AM

バンクーバーで開催されたTED2025会議は、昨日4月11日の第36版を締めくくりました。サム・アルトマン、エリック・シュミット、パーマー・ラッキーを含む60か国以上の80人の講演者が登場しました。テッドのテーマ「人類が再考された」は、仕立てられたものでした

ジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているApr 14, 2025 am 11:21 AM

ジョセフ・スティグリッツは、2001年にノーベル経済賞を受賞した経済学者であり、2001年にノーベル経済賞を受賞しています。スティグリッツは、AIが既存の不平等を悪化させ、いくつかの支配的な企業の手に統合した力を悪化させ、最終的に経済を損なうと仮定しています。

グラフデータベースとは何ですか？Apr 14, 2025 am 11:19 AM

グラフデータベース：関係を通じてデータ管理に革命をもたらすデータが拡大し、その特性がさまざまなフィールドで進化するにつれて、グラフデータベースは、相互接続されたデータを管理するための変換ソリューションとして浮上しています。伝統とは異なり

LLMルーティング：戦略、テクニック、およびPythonの実装Apr 14, 2025 am 11:14 AM

大規模な言語モデル（LLM）ルーティング：インテリジェントタスク分布によるパフォーマンスの最適 LLMSの急速に進化する風景は、それぞれが独自の長所と短所を備えた多様なモデルを提供します。創造的なコンテンツGenに優れている人もいます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

中国語版、とても使いやすい

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。