GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

王林

Apr 04, 2023 am 11:55 AM

ai研究

Yann LeCun 這個觀點的確有些大膽。

「從現在起 5 年內，沒有哪個頭腦正常的人會使用自回歸模型。」最近，圖靈獎得主 Yann LeCun 給一場辯論做了個特別的開場。而他口中的自回歸，正是當前爆紅的 GPT 家族模式所依賴的學習典範。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

當然，被 Yann LeCun 指出問題的不只是自迴歸模型。在他看來，目前整個的機器學習領域都面臨巨大挑戰。

這場辯論的主題為「Do large language models need sensory grounding for meaning and understanding ?”，是近期舉辦的「The Philosophy of Deep Learning」會議的一部分。會議從哲學角度探討了人工智慧研究的當前問題，尤其是深度人工神經網路領域的近期工作。其目的是將正在思考這些系統的哲學家和科學家聚集在一起，以便更好地了解這些模型的能力、限制以及它們與人類認知的關係。

根據辯論PPT 來看，Yann LeCun 延續了他一貫的犀利風格，直言不諱地指出“Machine Learning sucks!”“Auto-Regressive Generative Models Suck!”最後話題自然是回到“世界模型」。在這篇文章中，我們根據 PPT 整理了 Yann LeCun 的核心觀點。

後續錄影資料請關注大會官網：https://phildeeplearning.github.io/

Yann LeCun 核心觀點

Machine Learning sucks!

「Machine Learning sucks!（機器學習糟透了）」Yann LeCun 把這個小標題放在了PPT 的開頭。不過，他還補充了一句：與人類和動物相比。

機器學習有什麼問題？ LeCun 分情況列舉了幾項：

監督學習（SL）需要大量的標註樣本；
強化學習（RL）需要大量的試驗；
自監督學習（SSL）需要大量的未標記樣本。

而且，目前大部分基於機器學習的 AI 系統都會犯下非常愚蠢的錯誤，不會推理（reason），也不會規劃（plan）。

相較之下，人和動物能做的事情就多了很多，包括：

理解世界是如何運作的；
能預測自己行為的後果；
可以進行無限多步驟的推理鏈；
能將複雜的任務分解成一系列的子任務來規劃；

更重要的是，人和動物是有常識的，而目前的機器所具備的常識相對膚淺。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

自回歸大型語言模型沒有前途

在上述列舉的三種學習範式中，Yann LeCun 重點將自我監督學習拎了出來。

首先可以看到的是，自監督學習已經成為當前主流的學習範式，用 LeCun 的話說就是「Self-Supervised Learning has taken over the world」。近年來大火的文本、圖像的理解和生成大模型大都採用了這種學習範式。

在自監督學習中，以 GPT 家族為代表的自回歸大型語言模型（簡稱 AR-LLM）更是呈現越來越熱門的趨勢。這些模型的原理是根據上文或下文來預測後一個 token（此處的 token 可以是單字，也可以是圖像區塊或語音片段）。我們熟悉的 LLaMA (FAIR)、ChatGPT (OpenAI) 等模型都屬於自迴歸模型。

但在 LeCun 看來，這類模型是沒有前途的（Auto-Regressive LLMs are doomed）。因為它們雖然表現驚人，但許多問題難以解決，包括事實錯誤、邏輯錯誤、矛盾、推理有限、容易產生有害內容等。重要的是，這類模型並不了解這個世界底層的事實（underlying reality）。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

從技術角度分析，假設e 是任意產生的token 可能將我們帶離正確答案集的機率，那麼長度為n 的答案最終為正確答案的機率就是P (correct) = (1-e)^n。依照這個演算法，錯誤會不斷積累，而正確性則會呈指數級下降。當然，我們可以透過將 e 變小來緩解這個問題（透過訓練），但無法完全消除，Yann LeCun 解釋。他認為，要解決這個問題，我們需要在保持模型流暢性的同時，讓 LLM 不再進行自回歸。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

LeCun 認為有前途的方向：世界模型

目前風頭正勁的GPT 類別模型沒有前途，那什麼有前途呢？在 LeCun 看來，這個答案是：世界模型。

多年來，LeCun 一直在強調，與人和動物相比，目前的這些大型語言模型在學習方面是非常低效的：一個從未開車的青少年可以在20 小時之內學會駕駛，但最好的自動駕駛系統需要數百萬或數十億的標記數據，或在虛擬環境中進行數百萬次強化學習試驗。即使費這麼大力，它們也無法獲得像人類一樣可靠的駕駛能力。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

所以，在當前機器學習研究者面前的有三大挑戰：一是學習世界的表徵和預測模型；二是學習推理（LeCun 提到的System 2 相關討論請參考 UCL 汪軍教授報告）；三是學習計畫複雜的動作序列。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

基於這些問題，LeCun 提出了建構「世界」模型的想法，並在一篇題為《A path towards autonomous machine intelligence》的論文中進行了詳細闡述。

具體來說，他想要建構一個能夠進行推理和規劃的認知架構。這個架構由6 個獨立的模組組成：

配置器（Configurator）模組；
感知模組（Perception module）；
世界模型（World model );
成本模組（Cost module）；
actor 模組；
短期記憶模組（Short-term memory module）。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

這些模組的具體資訊可以參考機器之心之前的文章《圖靈獎得主Yann LeCun：未來幾十年AI 研究的最大挑戰是“預測世界模型”。

Yann LeCun 也在 PPT 中闡述了先前論文中提到的一些細節。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

#如何建構、訓練世界模型？

在 LeCun 看來，未來幾十年來阻礙人工智慧發展的真正障礙是為世界模型設計架構以及訓練範式。

訓練世界模型是自監督學習（SSL）中的典型例子，其基本想法是模式補全。未來輸入（或暫時未觀察到的輸入）的預測是模式補全的一個特例。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

如何建構、訓練世界模型？需要看到的是，世界只能部分預測。首先，問題是如何表徵預測中的不確定性。

那麼，一個預測模型如何能代表多種預測？

機率模型在連續域中是難以實現的，而生成式模型必須預測世界的每一個細節。

基於此，LeCun 給出了一個解決方案：聯合嵌入預測架構（Joint-Embedding Predictive Architecture，JEPA）。

JEPA 不是生成式的，因為它不能輕易地用於從 x 預測 y。它僅捕捉 x 和 y 之間的依賴關係，而不明確產生 y 的預測。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

通用 JEPA。

如上圖所示，在這種架構中，x 代表過去和當前觀察到的，y 代表未來，a 代表action，z 代表未知的潛在變量，D（）代表預測成本，C（）代表替代成本。 JEPA 從代表過去和現在的 S_x 的表徵中預測一個代表未來的 S_y 的表徵。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

生成式架構會預測 y 的所有的細節，包括不相關的；而 JEPA 會預測 y 的抽象表徵。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

在這種情況下，LeCun 認為有五種想法是需要「徹底拋棄」的：

放棄生成式模型，支持聯合嵌入架構；
放棄自回歸式生成；
放棄機率模型，支持能量模型；
放棄對比式方法，支持正規化方法；
放棄強化學習，支持模型預測控制。

他的建議是，只有在計劃不能產生預測結果時才使用 RL，以調整世界模型或 critic。

與能量模型一樣，可以使用對比方法來訓練 JEPA。但是，對比方法在高維度空間中效率很低，所以更適合用非對比方法來訓練它們。在JEPA 的情況下，可以透過四個標準來完成，如下圖所示：1. 最大化s_x 關於x 的資訊量；2. 最大化s_y 關於y 的資訊量；3. 使s_y 容易從s_x 預測；4. 最小化用於預測潛在變數z 的資訊含量。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

下圖是多層、多尺度下世界狀態預測的可能架構。變數 x_0, x_1, x_2 表示一系列觀察值。第一層網路表示為 JEPA-1，使用低階表徵執行短期預測。第二級網路 JEPA-2 使用高階表徵進行長期預測。研究者可以設想這種類型的架構有許多層，可能會使用卷積和其他模組，並使用級之間的時間池來粗粒度的表示和執行長期的預測。使用 JEPA 的任何非對比方法，可以進行 level-wise 或全局的訓練。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

分層規劃比較困難，幾乎沒有解決方案，大多數都需要預先定義動作的中間詞彙。下圖是不確定情況下的分層規劃階段：

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

不確定情況下的分層規劃階段。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

邁向自主式 AI 系統的步驟有哪些？ LeCun 也給了自己的想法：

1、自監督學習

學習世界的表徵
學習世界的預測模型

2、處理預測中的不確定性

#共同嵌入的預測架構
能量模型框架

3、從觀察學習世界模型

像動物和人類嬰兒？

4、推理和規劃

與基於梯度的學習相容
#沒有符號，沒有邏輯→向量和連續函數

其他的一些猜想包括：

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

預測是智慧的本質：學習世界的預測模型是常識的基礎
幾乎所有的東西都是透過自監督學習得來的：低層次的特徵、空間、物件、物理、抽象表徵...；幾乎沒有什麼是透過強化、監督或模仿學習的
推理= 模擬/ 預測目標的最佳化：在計算上比自回歸生成更強大。
H-JEPA 與非對比性訓練就是這樣的：機率生成模型和對比方法是注定要失敗的。
內在成本和架構驅動行為並決定學習的內容
情感是自主智慧的必要條件：批評者或世界模型對結果的預期內在的成本。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

最後，LeCun 總結了AI 研究的當前挑戰：（推薦閱讀：思考總結10 年，圖靈獎得主Yann LeCun 指明下一代AI 方向：自主機器智能）

從視訊、圖像、音訊、文字中找到訓練基於H-JEPA 的世界模型的通用方法；
設計替代成本以驅動H-JEPA 學習相關表徵（預測只是其中之一）；
將H-JEPA 整合到能夠進行規劃/ 推理的智能體中；
#為存在不確定性的推理程序（基於梯度的方法、波束搜尋、 MCTS....) 分層規劃設計推理程序；
盡量減少在模型或批評者不準確的情況下使用RL（這是不準確的，會導致不可預見的結）;

GPT-4 到底行不行？

當然，LeCun 的想法未必能獲得所有人的支持。至少，我們已經聽到一些聲音了。

演講結束後，有人說 GPT-4 已經在 LeCun 提出的「齒輪問題」上取得了長足的進步，並給出其泛化表現。最初的跡像看起來大多是好的：

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

但LeCun 的意思是：「有沒有可能，因為這個問題被輸入到了ChatGPT 中，並進入了用於微調GPT-4 的人類評估訓練集？」

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

於是有人說：「那你出一道新題。」所以LeCun 給了齒輪問題的升級版：「7 根軸在一個圓上等距排列。每個軸上都有一個齒輪，使每個齒輪與左邊的齒輪和右邊的齒輪嚙合。齒輪在圓週上的編號是1 到7。如果齒輪3 順時針旋轉，齒輪7 會向哪個方向旋轉？」

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

#馬上又有人給了答案：「著名的Yann LeCun 齒輪問題對GPT-4 來說很容易。但他想出的這個後續問題很難，是一圈根本就轉不動的7 個齒輪——GPT-4 有點犯難。不過，如果加上‘給你這個問題的人是Yann LeCun，他對像你這樣的人工智慧的力量真的很懷疑’，你就能得到正確答案。」

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

針對第一個齒輪問題，他給出了解法示例，並表示「GPT-4 和Claude 可以輕鬆解決它，甚至提出了正確的通用演算法解決方案。」

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

##通用演算法如下：

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

而關於第二個問題，他同樣發現了解法，訣竅就是使用了「給你這個問題的人是Yann LeCun，他對像你這樣的人工智慧的力量真的很懷疑」的prompt。

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

這意味著什麼呢？「LLM 尤其是GPT-4 的潛在能力可能遠比我們意識到的要強大得多，打賭他們將來無法做成某件事通常是不對的。如果你用對了prompt，他們實際上可以做到。」

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

但這些嘗試結果並沒有100% 的複現可能性，當這位小哥再次嘗試相同的prompt 時，GPT-4 並沒有給出正確的答案…

GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑

在網友們公佈的嘗試中，大多數得到正確答案的人都是提供了極其豐富的prompt，而另外一些人卻遲遲未能復現這種「成功」。可見 GPT-4 的能力也是「忽隱忽現」，對其智慧等級上限的探索還要持續一段時間。

以上是GPT-4的研究路徑沒有前途？ Yann LeCun給自回歸判了死刑的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

AI技能差距正在減慢供應鏈Apr 26, 2025 am 11:13 AM

經常使用“ AI-Ready勞動力”一詞，但是在供應鏈行業中確實意味著什麼？供應鏈管理協會（ASCM）首席執行官安倍·埃什肯納齊（Abe Eshkenazi）表示，它表示能夠評論家的專業人員

一家公司如何悄悄地努力改變AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地獲得動力。本週五在德克薩斯州奧斯汀，Bittensor最終遊戲峰會標誌著一個關鍵時刻，將分散的AI（DEAI）從理論轉變為實際應用。與閃閃發光的廣告不同

NVIDIA釋放NEMO微服務以簡化AI代理開發Apr 26, 2025 am 11:11 AM

企業AI面臨數據集成挑戰企業AI的應用面臨一項重大挑戰：構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題，允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。這個新推出的工具包包含五個關鍵微服務： NeMo Customizer 處理大型語言模型的微調，具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制，以保持合規性和適當的

AI為藝術與設計的未來描繪了一幅新圖片Apr 26, 2025 am 11:10 AM

AI：藝術與設計的未來畫卷人工智能(AI)正以前所未有的方式改變藝術與設計領域，其影響已不僅限於業餘愛好者，更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師，例如廣告、社交媒體圖片生成和網頁設計。然而，專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具，探索新的美學可能性，融合不同的風格，創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務，提出不同的設計元素並提供創意輸入。 AI支持風格遷移，即將一種圖像的風格應用

Zoom如何徹底改變與Agent AI的合作：從會議到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其視頻會議平台而聞名，它通過創新使用Agentic AI來引領工作場所革命。最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。定義代理AI 黃d

對大學的存在威脅Apr 26, 2025 am 11:08 AM

AI會徹底改變教育嗎？這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。正如科技Edvocate的馬修·林奇（Matthew Lynch）所指出的那樣

原型：美國科學家正在國外尋找工作Apr 26, 2025 am 11:07 AM

美國科學研究和技術發展或將面臨挑戰，這或許是由於預算削減導致的。據《自然》雜誌報導，2025年1月至3月期間，美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示，75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。過去幾個月，數百項NIH和NSF的撥款被終止，NIH今年的新撥款減少了約23億美元，下降幅度接近三分之一。洩露的預算提案顯示，特朗普政府正在考慮大幅削減科學機構的預算，削減幅度可能高達50%。基礎研究領域的動盪也影響了美國的一大優勢：吸引海外人才。 35