搜尋
首頁科技週邊人工智慧破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

大語言模型的「逆轉詛咒」,被解開了!

這個詛咒在去年9月首次被發現,一時間引起LeCun、Karpathy、馬庫斯等一眾大佬的驚呼。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

由於風光無兩、不可一世的大模型竟存在著“阿克琉斯之踵”:一個在“A是B”上訓練的語言模型,並不能正確回答「B是否A」。

例如下面這個例子:在LLM明知道「湯姆·克魯斯的母親是Mary Lee Pfeiffer」的情況下,卻無法答出「Mary Lee Pfeiffer的孩子是湯姆·克魯斯」。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

——這可是當時最先進的GPT-4,結果連小孩都具備的正常邏輯思維,LLM卻做不到。

基於海量的數據之上,記住了幾乎超過所有人類的知識,卻表現得如此呆板,取得了智慧之火,卻永遠被囚禁於這個詛咒之中。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

論文網址:https://arxiv.org/pdf/2309.12288v1.pdf

這事一出,全網一片嘩然。

一方面,網友表示,大模型真傻,真的。單知道「A是B」,卻不知道「B是A」,自己終於保住了身為人類的尊嚴。

而另一方面,研究人員也開始對此展開研究,快馬加鞭解決這個重大挑戰。

近日,來自Meta FAIR的研究人員推出了反向訓練大法來一舉解決LLM的「逆轉詛咒」。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

論文網址:https://arxiv.org/pdf/2403.13799.pdf

研究人員首先觀察到,LLMs從左到右以自回歸的方式進行訓練,——這可能是導致逆轉詛咒的原因。

那麼,如果以從右到左的方向來訓練LLM(逆向訓練),就有可能讓模型在反方向上看到事實。

可以將反向文字視為第二語言,透過多工或跨語言預訓練,來利用多個不同的來源。

研究人員考慮了4種反向類型:標記反轉、單字反轉、實體保留反轉和隨機段反轉。

標記和單字反轉,透過將序列分別拆分為標記或單詞,並顛倒它們的順序以形成新序列。

實體保留反轉,在序列中尋找實體名稱,並在其中保留從左到右的單字順序,同時進行單字反轉。

隨機段反轉,將標記化的序列分割成隨機長度的區塊,然後保留每個區塊內從左到右的順序。

研究人員在1.4B和7B的參數規模上,測試了這些反轉類型的有效性,結果表明,實體保留和隨機分段反向訓練可以減輕逆向詛咒,甚至在某些情況下完全消除它。

此外,研究人員還發現,與標準的從左到右訓練相比,訓練前逆轉的方式使模型的表現有所提高,——所以反向訓練可以作為一種通用的訓練方法。

反向訓練大法

逆向訓練包含取得具有N個樣本的訓練資料集,並建構反向樣本集REVERSE(x )。

函數REVERSE負責反轉給定的字串,具體做法如下:

單字反轉:每個範例首先被拆分為單詞,然後在單字層級反轉字串,用空格將其連接在一起。

實體保留反轉:對給定的訓練樣本運行實體偵測器,將非實體也拆分為單字。然後將非實體的單字顛倒,而表示實體的單字保留原有詞序。

隨機段反轉:這裡沒有使用實體偵測器,而是嘗試使用均勻取樣,將序列隨機分割成大小為1到k個token之間的句段,然後顛倒這些句段,但保持每個句段內的詞序,之後,這些句段使用特殊標記[REV]連接。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

上表給出了在給定字串上,不同反轉類型的範例。

此時,語言模型仍然從左到右進行訓練,在單字反轉的情況下,就相當於從右到左預測句子。

逆向訓練涉及標準和反向範例的訓練,因此訓練token的數量增加了一倍,同時正向和反向訓練樣本都混合在一起。

逆向轉換可以看作是模型必須學習的第二種語言,請注意,在反轉的過程中,事實之間的關係保持不變,模型可以從語法中判斷它是處於正向還是反向語言預測模式。

逆向訓練的另一個角度可以由資訊理論來解釋:語言建模的目標是學習自然語言的機率分佈

反向任務訓練測試

實體對映射

#首先建立一個簡單的基於符號數據集,以研究受控環境中的反轉詛咒。

以一對一的方式隨機配對實體a和b,訓練資料包含所有(a→b)映射對,但僅包含一半的(b→a)映射,另一半作為測試數據。

模型必須從訓練資料推斷規則a→b ⇔ b→a,然後將其推廣到測試資料中的對。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

上表展示了符號反向任務的測試準確度(%)。儘管這項任務很簡單,但標準語言模型訓練完全失敗了,這表明僅靠擴展不太可能解決。

相較之下,反向訓練幾乎可以解決兩個單字實體的問題,但隨著實體變長,其表現會迅速下降。

單字反轉適用於較短的實體,但對於具有較多單字的實體,實體保留反轉是必要的。當最大段長度k至少與實體一樣長時,隨機段反轉表現良好。

恢復人名

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

上表展示了確定人全名的反轉任務,當僅給出出生日期確定一個人的全名時,反轉任務的準確性仍然接近於零,——這是因為在本文採用的實體檢測方法中,日期被視為三個實體,因此在反轉中不會保留它們的順序。

如果將反轉任務簡化為僅確定人的姓氏,則單字層級的反轉就足夠了。

另一個可能會令人驚訝的現像是,實體保留方法可以確定該人的全名,但不能確定該人的姓氏。

這是一個已知的現象:語言模型可能完全無法檢索知識片段的後期標記(例如姓氏)。

現實世界事實

#這裡作者訓練了一個Llama-2 14億參數模型,在從左到右方向上訓練一個2萬億個token的基線模型。

相比之下,逆向訓練僅使用1兆token,但使用相同的資料子集在從左到右和從右到左兩個方向上進行訓練, ——兩個方向合起來是2兆個token,在運算資源上做到公平公正。

為了測試對現實世界事實的反轉能力,研究人員使用了一個名人任務,其中包含「諸如某個名人的母親是誰」之類的問題,同時還包含更具挑戰性的反向問題,例如「某個名人的父母的孩子是誰」。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

結果如上表所示。研究人員對每個問題的模型進行多次抽樣,如果其中任何一個包含正確答案,則將其視為成功。

一般來說,由於模型在參數數量方面很小,預訓練有限,並且缺乏微調,因此準確性通常相對較低。然而,反向訓練的表現更加優秀。

36年前的預言

1988年,Fodor和Pylyshyn在《認知》刊物上發了一篇關於思考的系統性的文章。

破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」

如果你真的理解這個世界,那你就應該可以理解a相對於b的關係,也能理解b相對於a的關係。

即使是非語言認知生物,也應該能夠做到這一點。

#

以上是破除36年前魔咒! Meta推出反向訓練大法消除大模型「逆轉詛咒」的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代May 02, 2025 am 11:17 AM

動盪遊戲:與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室,由暴風雪和黑曜石等行業巨頭的退伍軍人組成,有望用其創新的AI驅動的Platfor革新遊戲創作

Uber想成為您的Robotaxi商店,提供商會讓他們嗎?Uber想成為您的Robotaxi商店,提供商會讓他們嗎?May 02, 2025 am 11:16 AM

Uber的Robotaxi策略:自動駕駛汽車的騎車生態系統 在最近的Curbivore會議上,Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。 利用他們在

AI代理玩電子遊戲將改變未來的機器人AI代理玩電子遊戲將改變未來的機器人May 02, 2025 am 11:15 AM

事實證明,視頻遊戲是最先進的AI研究的寶貴測試理由,尤其是在自主代理商和現實世界機器人的開發中,甚至有可能促進人工通用情報(AGI)的追求。 一個

創業公司工業綜合體VC 3.0和James Currier的宣言創業公司工業綜合體VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不斷發展的風險投資格局的影響在媒體,財務報告和日常對話中顯而易見。 但是,對投資者,初創企業和資金的具體後果經常被忽略。 風險資本3.0:範式

Adobe在Adobe Max London 2025更新創意云和螢火蟲Adobe在Adobe Max London 2025更新創意云和螢火蟲May 02, 2025 am 11:13 AM

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新,反映了向可訪問性和生成AI的戰略轉變。 該分析結合了事件前簡報中的見解,並融合了Adobe Leadership。 (注意:Adob

Llamacon宣布的所有元數據Llamacon宣布的所有元數據May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一項綜合的AI策略,旨在直接與OpenAI等封閉的AI系統競爭,同時為其開源模型創建了新的收入流。 這個多方面的方法目標bo

關於AI僅僅是普通技術的主張的釀造爭議關於AI僅僅是普通技術的主張的釀造爭議May 02, 2025 am 11:10 AM

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱,是時候揭露“皇帝的新衣”了,而另一些人則強烈反對人工智能僅僅是普通技術的觀點。 讓我們來探討一下。 對這一創新性人工智能突破的分析,是我持續撰寫的福布斯專欄文章的一部分,該專欄涵蓋人工智能領域的最新進展,包括識別和解釋各種有影響力的人工智能複雜性(請點擊此處查看鏈接)。 人工智能作為普通技術 首先,需要一些基本知識來為這場重要的討論奠定基礎。 目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能(AGI)甚至可能實現人工超級智能(AS

模型公民,為什麼AI值是下一個業務碼模型公民,為什麼AI值是下一個業務碼May 02, 2025 am 11:09 AM

公司AI模型的有效性現在是一個關鍵的性能指標。自AI BOOM以來,從編寫生日邀請到編寫軟件代碼的所有事物都將生成AI使用。 這導致了語言mod的擴散

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版