搜尋
首頁網路3.0指令解碼增強了指令調整語言模型,無需更新參數

指令解碼增強了指令調整語言模型,無需更新參數

Oct 02, 2024 pm 06:12 PM
AIInstructive Decoding Attention Enhancement Instruction-Tuned LLMs Generation Phase

KAIST AI 的研究人員推出了指令解碼 (ID),這是一種無需參數更新即可增強指令調整 LM 的方法。

指令解碼增強了指令調整語言模型,無需更新參數

指令調整語言模型 (LM) 可以很好地泛化到零樣本設定中未見過的任務。然而,他們在訓練資料之外的任務上的表現往往受到限制。儘管建立在大型資料集上並擁有數十億個參數,但這些語言模型在上下文學習(ICL)方面表現出色,它們可以產生對幾個範例的回應,而無需重新訓練。然而,訓練資料集的範圍限制了它們在不熟悉的任務上的有效性。快速工程和輸出多樣化等技術有助於提高性能,但需要付出巨大的努力。最近的研究探討了將認知錨定效應應用於 LM,顯示強調初始提示可以增強特定任務的反應並提高對指令的保真度。

在這項工作中,KAIST AI 的研究人員介紹了指令解碼 (ID),這是一種無需任何參數更新即可增強指令調整 LM 的方法。受噪音監督技術的啟發,ID 使用「噪音指令」(原始指令的變更版本)來建立預測下一個標記的比較方法。透過將模型的輸出引導到不同的方向,特別是使用「相反」指令,ID 可以提高跨任務的模型效能。實驗表明,透過 ID 增強的較小模型的準確性明顯優於較大模型。此方法提高了對指令的遵守程度並提高了整體響應質量,證明了其在各種模型和任務中的有效性。

指令調優的目標是微調預先訓練的語言模型,使其更好地遵循自然語言指令,從而提高對未見過的任務的泛化能力,尤其是在零樣本場景中。儘管模型通常嚴重依賴預先訓練的知識,但擴大訓練任務的多樣性和複雜性可以增強這種能力。先前的研究強調,語言模型對熟悉的指令很敏感,甚至處理誤導性的指令,並且可以透過對比技術來利用這種敏感性。文字產生中的對比與對比解碼一樣,會比較不同模型或輸入的輸出以提高效能。這項研究透過使用噪音指令來增強指令調整 LM 的泛化能力,從而擴展了這些想法。

指令解碼透過比較噪音指令產生的輸出來改善指令調整模型中的回應產生。它建立在錨定效應的基礎上,其中初始訊息影響隨後的判斷,並利用原始指令和更改指令產生的反應之間的差異。此方法使用噪音指令變體(例如截斷、打亂或隨機單字)來誤導模型,同時確保任務保真度。透過在解碼過程中比較原始指令和噪音指令的邏輯,指令解碼可以幫助模型糾正偏差並產生與預期指令更加一致的響應,從而改善其在未見過的任務上的性能。

實驗設定使用 SUPNATINST 和 UNNATINST 資料集,跨語法錯誤修正和文字蘊涵等任務評估 Tk-Instruct、Alpaca 和 T0 等模型。 Rouge-L、精確匹配 (EM)、標籤黏附性 (LA) 和標籤一致性 (LC) 指標評估效能。 ID 持續改善結果,特別是對於 Tk-XXL 等較大模型,增強 LA 和 LC。有趣的是,儘管基準效能下降,但嘈雜的指令透過 ID 提高了輸出品質。儘管特定任務的表現各不相同,但「相反」指令變體在不同任務中證明是穩健的。總體而言,ID 在模型大小和任務類型方面顯示出顯著的增益。

研究調查了指令調整語言模型中看不見的任務泛化的挑戰。所提出的 ID 方法利用「噪音」指令的錨定效應來抵消固有的模型偏差。透過將預測與變更後的指令產生的預測進行對比,ID 可以增強模型效能,特別是對於與原始輸入偏差最大的「相反」雜訊變體。實證結果顯示 ID 在多個任務中的有效性,並且預測多樣性顯著提高。該方法不需要額外的參數更新,使其成為改善語言模型指令追蹤的實用工具。

查看論文。這項研究的所有功勞都歸功於該計畫的研究人員。另外,不要忘記在 Twitter 上關注我們並加入我們的 Telegram 頻道和 LinkedIn 群組。如果您喜歡我們的工作,您一定會喜歡我們的時事通訊。

別忘了加入我們的 50k ML SubReddit

以上是指令解碼增強了指令調整語言模型,無需更新參數的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
不變的(IMX)ZKEVM網絡使用率增長了5.7%的四分之一四分之一不變的(IMX)ZKEVM網絡使用率增長了5.7%的四分之一四分之一May 04, 2025 am 11:26 AM

2025年第一季度的每日網絡使用量的不變記錄。根據加密分析公司Messari的研究,對不可分割的ZKEVM的平均每日交易上升了5.7%的四分之一季度

Dogecoin(Doge)價格預測:Dogecoin價格會很快見到復興嗎?Dogecoin(Doge)價格預測:Dogecoin價格會很快見到復興嗎?May 04, 2025 am 11:24 AM

Memecoin市場目前的價值為553.6億美元,在過去的24小時內變化為-1.94%。此外,Memecoin細分市場的下降13.30%

一個加密貨幣交易者在短短五分鐘內虧損111,000美元已成為一個警告性的故事一個加密貨幣交易者在短短五分鐘內虧損111,000美元已成為一個警告性的故事May 04, 2025 am 11:22 AM

根據區塊鏈分析平台Lookonchain的說法,FOMO(害怕錯過)驅動的交易員花了200k usdc購買教皇

Stablecoins表示加密貨幣市場的情感和流動性Stablecoins表示加密貨幣市場的情感和流動性May 04, 2025 am 11:20 AM

加密市場的情感和流動性由Stablecoins發出信號。它們表明市場是看漲還是看跌。

購買蘸醬,2倍您的硬幣:BTFD的Final100優惠和2900%的潛力使它成為下一個爆炸的加密貨幣購買蘸醬,2倍您的硬幣:BTFD的Final100優惠和2900%的潛力使它成為下一個爆炸的加密貨幣May 04, 2025 am 11:18 AM

下一個要爆炸的加密? BTFD硬幣,AI16Z和Snek正在加熱圖表。不要錯過100%獎金和2900%ROI潛力的BTFD預售。

您是否曾經想過哪種加密貨幣可能是下一個100倍的寶石?您是否曾經想過哪種加密貨幣可能是下一個100倍的寶石?May 04, 2025 am 11:16 AM

由於Meme硬幣再次使加密貨幣世界燃燒,投資者正在競爭在他們飆升之前找到黃金機會。

Vitalik Buterin希望以太坊擁抱比特幣的最大優勢之一Vitalik Buterin希望以太坊擁抱比特幣的最大優勢之一May 04, 2025 am 11:14 AM

在最近的博客文章中,以太坊聯合創始人Vitalik Buterin提出了一系列旨在簡化以太坊1層設計的更改

世界上最大的加密貨幣期權交易所Deribit計劃擴展到美國。世界上最大的加密貨幣期權交易所Deribit計劃擴展到美國。May 04, 2025 am 11:12 AM

這一決定是在唐納德·特朗普總統領導下的美國監管環境發生的明顯轉變之後。

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。