GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決-AI-php.cn

ホームページ

テクノロジー周辺機器

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

王林

Apr 04, 2023 am 11:55 AM

ai研究

ヤン・ルカンこの視点は確かに少し大胆です。

「正気の人間であれば、5 年後には自己回帰モデルを使用する人はいないでしょう。」最近、チューリング賞受賞者のヤン・ルカン氏が、討論会に特別な口火を切った。彼が語る自己回帰は、まさに現在人気のある GPT ファミリーモデルが依存している学習パラダイムです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

もちろん、Yann LeCun が指摘したのは自己回帰モデルだけではありません。同氏の見解では、機械学習の分野全体が現在、大きな課題に直面しているという。

この議論のテーマは「大規模言語モデルには意味と理解のための感覚的根拠が必要か?」であり、最近開催された「深層学習の哲学」カンファレンスの一部です。この会議では、人工知能研究における現在の問題、特に深層人工ニューラルネットワークの分野における最近の研究を哲学的な観点から検討しました。その目的は、これらのシステムについて考えている哲学者や科学者を集めて、これらのモデルの機能、限界、人間の認知との関係をより深く理解することです。

討論 PPT によると、Yann LeCun はいつもの鋭いスタイルを続け、「機械学習は最低だ!」「自己回帰生成モデルは最低だ!」と率直に指摘し、最後の話題は自然に「世界モデル」に戻った。。この記事では、ヤン・ルカン氏の核となるアイデアをPPTに基づいて整理します。

#フォローアップビデオ情報については、カンファレンスの公式 Web サイトに注目してください: https://phildeeplearning.github.io/

Yann LeCun の中心的な視点

機械学習は最悪です!

「機械学習は最悪です! (機械学習は最悪です)」 Yann LeCun はこのサブタイトルを PPT の冒頭に付けました。ただし、人間や動物と比較すると、と彼は付け加えた。

機械学習の何が問題なのでしょうか? LeCun は、状況に応じていくつかの項目を列挙しました:

教師あり学習 (SL) には多数のラベル付きサンプルが必要です;
強化学習 (RL) には多数の実験が必要です。

さらに、機械学習に基づく現在の AI システムのほとんどは、非常に愚かな間違いを犯し、推論したり計画したりすることができません。

それに比べて、人間と動物は、次のような多くのことができます。

自分自身の行動の結果を予測できるようになる。
は無限の複数ステップの推論チェーンを実行できます;
は計画のために複雑なタスクを一連のサブタスクに分解できます;

の方が重要です人間や動物には常識があるのに対し、現在の機械が持つ常識は比較的表面的なものであるということです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

自己回帰大規模言語モデルに未来はない

上記の 3 つの学習パラダイムの中で、Yann LeCun は自己監視学習に焦点を当てています。それを拾う。

最初にわかるのは、自己教師あり学習が現在の主流の学習パラダイムになっているということです。ルカン氏の言葉を借りると、「自己教師あり学習が世界を席巻した」ということです。近年、テキストと画像の理解と生成のための大規模モデルのほとんどがこの学習パラダイムを採用しています。

自己教師あり学習では、GPT ファミリに代表される自己回帰大規模言語モデル (AR-LLM) の人気が高まっています。これらのモデルの原理は、上記または以下に基づいて次のトークンを予測することです (ここでのトークンは単語、画像ブロック、または音声クリップにすることができます)。私たちがよく知っている LLaMA (FAIR) や ChatGPT (OpenAI) などのモデルはすべて自己回帰モデルです。

しかし、LeCun 氏の見解では、このタイプのモデルには未来はありません (自己回帰 LLM は運命づけられています)。なぜなら、そのパフォーマンスは驚くべきものですが、事実の誤り、論理的な誤り、矛盾、限られた推論、有害なコンテンツの容易な生成など、多くの問題を解決するのが難しいからです。重要なのは、そのようなモデルは世界の根底にある現実を理解していないということです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

技術的な観点から、任意に生成されたトークンによって正解セットから遠ざかる確率を e とすると、長さ n の答えが得られる確率は次のようになります。最終的には正解になります。つまり、P (正解) = (1-e)^n です。このアルゴリズムによれば、エラーが蓄積され、精度が指数関数的に低下します。もちろん、e を小さくすることでこの問題を (トレーニングを通じて) 軽減できますが、完全に排除することはできません、と Yann LeCun 氏は説明します。彼は、この問題を解決するには、モデルの滑らかさを維持しながら、LLM を自己回帰しないようにする必要があると考えています。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

LeCun は、有望な方向性があると信じています: 世界モデル

GPT クラスモデル現在脚光を浴びている未来がないとしたら、何が未来があるのでしょうか？ LeCun 氏によると、答えは「世界モデル」です。

LeCun 氏は長年にわたり、現在の大規模言語モデルは人間や動物に比べて学習効率が非常に悪いと強調してきました。車を運転したことがない 10 代の若者は 20 時間で学習できますが、運転を学ぶことはできます。最高の自動運転システムには、数百万または数十億のラベル付きデータ、または仮想環境での数百万回の強化学習トライアルが必要です。これだけの努力をしても、人間と同じような確実な運転能力を達成することはできません。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

したがって、現在の機械学習研究者が直面している 3 つの主要な課題があります: 1 つは世界の表現と予測モデルを学習すること、もう 1 つは推論を学習することです (システムは前述) by LeCun 2 関連する議論については、UCL の Wang Jun 教授のレポートを参照してください); 3 番目は、複雑なアクションシーケンスを計画する方法を学ぶことです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

これらの問題に基づいて、LeCun は「世界」モデルを構築するというアイデアを提案し、「自律型マシンインテリジェンスへの道」というタイトルの論文で発表しました。について詳しく説明されています。

具体的には、推論と計画が可能な認知アーキテクチャを構築したいと考えていました。このアーキテクチャは、6 つの独立したモジュールで構成されています:

Perception モジュール;
World model );
Cost モジュール;
アクターモジュール;
短期記憶モジュール。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

これらのモジュールの詳細については、Heart of the Machine の以前の記事「チューリング賞受賞者のヤン・ルカン氏: AI 研究における最大の課題」を参照してください。次の数十年は「予測世界モデル」です。

Yann LeCun は、PPT の以前の論文で述べたいくつかの詳細についても詳しく説明しました。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

#世界モデルを構築してトレーニングするにはどうすればよいですか?

LeCun 氏の見解では、今後数十年間の人工知能の開発に対する本当の障害は、世界モデルのアーキテクチャとトレーニングパラダイムの設計です。

ワールドモデルのトレーニングは自己教師あり学習 (SSL) の典型的な例であり、その基本的な考え方はパターン補完です。将来の入力 (または一時的に観測されなかった入力) の予測は、パターン補完の特殊なケースです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決世界モデルを構築してトレーニングするにはどうすればよいですか?注意しなければならないのは、世界は部分的にしか予測できないということです。まず問題は、予測の不確実性をどのように特徴づけるかです。

それでは、予測モデルはどのようにして複数の予測を表現できるのでしょうか?

確率モデルは連続領域で実装するのが困難ですが、生成モデルは世界のあらゆる詳細を予測する必要があります。

これに基づいて、LeCun は、Joint-Embedding Predictive Architecture (JEPA) というソリューションを提案しました。

JEPA は、x から y を予測するために簡単に使用できないため、生成的ではありません。 y の予測を明示的に生成することなく、x と y の間の依存関係のみをキャプチャします。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

JEPA 全般。

上の図に示すように、このアーキテクチャでは、x は過去と現在の観測、y は未来、a はアクション、z は未知の潜在変数、D() は予測コスト、C() は代替コストを表します。 JEPA は、過去と現在の S_x の表現から将来の S_y の表現を予測します。

生成アーキテクチャは、無関係なものも含めて y の詳細をすべて予測しますが、JEPA は y の抽象表現を予測します。

この場合、LeCun 氏は、「完全に実現する必要がある」アイデアが 5 つあると考えています。放棄》:

生成モデルを放棄し、結合埋め込みアーキテクチャをサポートします;

自己回帰生成を放棄します;

確率モデルを放棄し、エネルギーモデルをサポートします。

対比法を放棄し、正則化法をサポートします。

強化学習を放棄し、モデルの予測制御をサポートします。

彼の提案は、計画が予測された結果をもたらさない場合にのみ RL を使用して、世界モデルまたは批評家を調整することです。

エネルギーモデルと同様に、JEPA は対照的な方法を使用してトレーニングできます。ただし、対照的な方法は高次元空間では非効率的であるため、非対照的な方法でトレーニングする方が適しています。 JEPA の場合、これは次の図に示す 4 つの基準によって実現できます: 1. s_x が持つ x に関する情報の量を最大化する; 2. s_y が持つ y についての情報の量を最大化する; 3. s_y を簡単にするs_x から予測する ;4. 潜在変数 z を予測するために使用される情報コンテンツを最小限に抑えます。

#次の図は、マルチレベルおよびマルチスケールでの世界状態予測に使用できるアーキテクチャを示しています。変数 x_0、x_1、x_2 は一連の観測値を表します。 JEPA-1 と呼ばれる第 1 レベルのネットワークは、低レベルの表現を使用して短期予測を実行します。第 2 レベルのネットワーク JEPA-2 は、長期予測に高レベルの表現を使用します。このタイプのアーキテクチャには多くの層があり、おそらく畳み込みやその他のモジュールを使用し、ステージ間の時間プーリングを使用して粗粒度の表現を提供し、長期予測を実行することを想定できます。トレーニングは、JEPA の非コントラスト手法のいずれかを使用して、レベルごとにまたはグローバルに実行できます。

# 階層的な計画は難しく、解決策はほとんどなく、ほとんどの場合、事前定義されたアクションの中間語が必要です。次の図は、不確実性の下での階層的な計画段階を示しています。

#不確実性の下での階層的な計画段階。

#自律型 AI システムに向けたステップは何ですか? LeCun 氏は次のように独自のアイデアも述べています:

1. 自己教師あり学習

世界の表現を学ぶ

予測モデルを学ぶ

2. 予測における不確実性の処理

共同組み込み予測アーキテクチャ

エネルギーモデルフレームワーク

3. 観察から世界モデルを学ぶ

動物や人間の赤ちゃんと同じでしょうか?

4. 推論と計画

勾配ベースの学習との互換性

シンボルなし、ロジックなし → ベクトルおよび連続関数

その他の推測は次のとおりです:

予測はインテリジェンスの本質です: 世界の予測モデルを学ぶことは常識の基礎です

低レベルの特徴、空間、オブジェクトなど、ほとんどすべてが自己教師あり学習を通じて取得されます、物理学、抽象表現...; 強化、監視、または模倣を通じて学習されるものはほとんどありません

推論 = シミュレーション/予測目標の最適化: 自己回帰生成よりも計算的に強力です。

H-JEPA と非対照トレーニングはまさにそのようなものです。確率的生成モデルと対照的手法は失敗する運命にあります。

内在的コストとアーキテクチャが行動を推進し、何を学習するかを決定する

感情は自律型知性の必要条件です: 批評家や世界モデルの結果に対する期待内在的コスト。

最後に、LeCun 氏は AI 研究の現在の課題を要約しました: (推奨書籍: 10 年間の思考と総括、チューリング賞受賞者の Yann LeCun 氏が、AI 研究の方向性を指摘)次世代 AI: Autonomous Machine Intelligence)

ビデオ、画像、音声、テキストから H-JEPA ベースの世界モデルをトレーニングするための一般的な方法を見つける;

H-JEPA の学習を促進する関連表現 (予測はそのうちの 1 つにすぎません);

H-JEPA を計画/推論可能なエージェントに統合します;

は不確実性のある推論プログラムです (勾配-ベースのメソッド、ビームサーチ、MCTS....) 階層計画設計推論手順; knot);

GPT-4 は大丈夫ですか?

もちろん、ルカン氏のアイデアはすべての人の支持を得られるわけではありません。少なくとも、ノイズは聞こえてきました。

講演の後、GPT-4 は LeCun が提起した「歯車問題」に関して大きな進歩を遂げ、その一般化パフォーマンスを示したと言う人もいました。初期の兆候はほとんど良好に見えます:

しかし、LeCun が言っていることは、「この問題が ChatGPT にインポートされ、ユーザーインターフェイスに侵入した可能性はありますか?」ということです。 GPT-4 の人間による評価トレーニングセットを微調整するには?"

それで誰かが「それでは新しい質問を考えてください。」と言いました。そこで LeCun は次のアップグレードを行いました。歯車の問題バージョン: 「7 つの軸が円上に等間隔に配置されています。各軸に歯車があり、各歯車は左側の歯車と右側の歯車と噛み合います。歯車には 1 から 7 までの番号が付いています。」「歯車 3 が時計回りに回転する場合、歯車 7 はどちらの方向に回転しますか?」

誰かがすぐに答えました:「有名なヤン・ルカンの歯車問題は GPT にとって非常に重要です」 -4. 簡単です。しかし、彼が考え出したフォローアップの質問は非常に難しいです。7 つの歯車が 1 つの円でまったく回転できません。GPT-4 は少し難しいです。ただし、「その人」を追加すると、この質問をしたのは、Yann LeCun です。彼もあなたと同じように、人工知能の力については本当に疑問を持っていますが、あなたなら正しい答えを得ることができます。」

最初のギアの質問については、、彼は理解方法の例を示し、「GPT-4 と Claude はそれを簡単に解決でき、正しい一般的なアルゴリズムの解決策を提案することもできます。」

一般的なアルゴリズムは次のとおりです。次のとおりです:

2 番目の質問についても、彼は解決策を見つけました。コツは、「この質問をした人は、Yann LeCun です。彼は本当によく知っています」を使うことです。あなたのような人工知能の力を使って」「非常に疑わしい」というプロンプト。

＃＃＃これはどういう意味ですか？「LLM、特に GPT-4 の潜在的な機能は、私たちが認識しているよりもはるかに優れている可能性があり、将来的に何かができなくなると考えるのは通常間違いです。適切なプロンプトを使用すれば、LLM は「

しかし、これらの試行の結果が再現される可能性は 100% ありません。この男が同じプロンプトを再度試行したとき、GPT-4 は再現しませんでした。」答え...

#ネチズンによって発表された試みでは、正解を得た人のほとんどは非常に豊富なプロンプトを提供しましたが、他の人は非常に豊富なプロンプトを提供しました。このような「成功」を繰り返すことができるでしょうか。 GPT-4の能力にも「チラつき」があることが分かり、知能レベルの上限の探求はしばらく続くことになる。

以上がGPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。