命令型デコードにより、パラメーターを更新せずに命令調整言語モデルを強化-ウェブ3.0-php.cn

ホームページ

ウェブ3.0

命令型デコードにより、パラメーターを更新せずに命令調整言語モデルを強化

Susan Sarandon

Oct 02, 2024 pm 06:12 PM

AIInstructive Decoding Attention Enhancement Instruction-Tuned LLMs Generation Phase

KAIST AI の研究者は、パラメータを更新せずに命令調整された LM を強化する手法である命令デコーディング (ID) を導入しました。

命令型デコードにより、パラメーターを更新せずに命令調整言語モデルを強化

命令調整型言語モデル (LM) は、ゼロショット設定での目に見えないタスクによく一般化します。ただし、トレーニングデータ以外のタスクでのパフォーマンスは制限されることがよくあります。これらの LM は、大規模なデータセットに基づいて構築されており、数十億のパラメーターを持っているにもかかわらず、コンテキスト内学習 (ICL) に優れており、再トレーニングすることなく、いくつかの例に対する応答を生成できます。ただし、トレーニングデータセットの範囲により、不慣れなタスクに対する有効性は制限されます。迅速なエンジニアリングや出力の多様化などの手法はパフォーマンスの向上に役立ちますが、多大な労力が必要です。最近の研究では、認知アンカリング効果を LM に適用することが検討されており、最初のプロンプトを強調することでタスク固有の反応が強化され、指示への忠実度が向上する可能性があることが示唆されています。

この研究では、KAIST AI の研究者が、パラメータを更新せずに命令調整された LM を強化する手法である命令デコーディング (ID) を導入しました。ノイズのある監視手法に触発された ID は、元の命令を変更したバージョンである「ノイズのある命令」を使用して、次のトークンを予測するための対照的なアプローチを作成します。 ID は、特に「反対の」命令を使用して、モデルの出力をさまざまな方向に操作することにより、タスク全体でモデルのパフォーマンスを向上させます。実験では、ID によって強化された小型モデルの方が大型モデルよりも優れた精度の大幅な向上を示しました。この方法は、指示への遵守を改善し、全体的な応答品質を向上させ、さまざまなモデルやタスクにわたってその有効性を実証します。

命令チューニングの目標は、事前トレーニングされた LM を微調整して自然言語命令によりよく従うことです。これにより、特にゼロショットシナリオにおいて、目に見えないタスクへの一般化が向上します。トレーニングタスクの多様性と複雑さを拡大することでこの機能が強化されますが、モデルは事前にトレーニングされた知識に大きく依存することがよくあります。これまでの研究では、LM は見慣れた命令に対して敏感であり、たとえ誤解を招くような命令にも敏感であり、この敏感さは対照的な手法によって活用できることが明らかになりました。テキスト生成のコントラストは、コントラストデコーディングと同様に、異なるモデルまたは入力からの出力を比較してパフォーマンスを向上させます。この研究は、ノイズの多い命令を使用して命令調整された LM の一般化を促進することで、これらのアイデアを拡張します。

命令デコーディングは、ノイズの多い命令から生成された出力を対比することにより、命令調整モデルでの応答生成を改善します。これは、最初の情報がその後の判断に影響を与え、元の指示と変更された指示から生成された応答の違いを利用するアンカリング効果に基づいています。この手法では、タスクの忠実性を確保しながら、切り捨てられた単語、シャッフルされた単語、またはランダムな単語などのノイズの多い命令の変形を使用して、モデルを誤解させます。インストラクティブデコーディングは、デコード中に元の命令とノイズのある命令からのロジットを比較することで、モデルのバイアスを修正し、意図された命令により一致した応答を生成し、目に見えないタスクでのパフォーマンスを向上させるのに役立ちます。

実験セットアップでは SUPNATINST および UNNATINST データセットを使用し、文法エラー修正やテキスト含意などのタスクにわたって Tk-Instruct、Alpaca、T0 などのモデルを評価します。 Rouge-L、Exact Match (EM)、Label Adherence (LA)、Label Coherence (LC) メトリックによってパフォーマンスを評価します。 ID は、特に Tk-XXL のような大型モデルの結果を一貫して改善し、LA と LC を強化します。興味深いことに、ベースラインのパフォーマンスが低下しているにもかかわらず、ノイズの多い命令により ID による出力品質が向上します。タスク固有のパフォーマンスは異なりますが、「反対の」命令バリアントはタスク間で堅牢であることが証明されています。全体として、ID はモデルのサイズとタスクの種類全体で大幅な向上を示しています。

この研究では、命令調整型言語モデルにおける目に見えないタスクの一般化の課題を調査しています。提案された方法 ID は、「ノイズの多い」命令を使用したアンカリング効果を利用して、固有のモデルのバイアスを打ち消します。 ID は、変更された命令から生成された予測と比較することで、特に元の入力から最も逸脱する「反対の」ノイズの多いバリアントでのモデルのパフォーマンスを向上させます。実証結果では、複数のタスクにわたる ID の有効性が示されており、予測の多様性が顕著に向上しています。このアプローチでは追加のパラメーター更新が必要ないため、言語モデルでの命令追従を改善するための実用的なツールになります。

論文をチェックしてください。この研究の功績はすべて、このプロジェクトの研究者に与えられます。また、Twitter で私たちをフォローし、Telegram チャンネルと LinkedIn グループに参加することも忘れないでください。私たちの仕事を気に入っていただけましたら、ニュースレターも気に入っていただけると思います。

50,000 ML SubReddit への参加を忘れないでください

以上が命令型デコードにより、パラメーターを更新せずに命令調整言語モデルを強化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

不変（IMX）ZKEVMネットワークの使用は、四半期ごとに5.7％増加しますMay 04, 2025 am 11:26 AM

2025年の第1四半期に毎日のネットワーク使用量が着実に成長した不変。Crypto Analytics会社Messariの調査によると、不変のZkevmでの平均日常取引は四半期ごとに5.7％増加しました。

Dogecoin（Doge）価格予測：Dogecoin Priceはすぐにリバイバルを見るでしょうか？May 04, 2025 am 11:24 AM

MemeCoin市場は現在、5536億ドルと評価されており、過去24時間で-1.94％の変化があります。さらに、13.30％の低下で、MemeCoinセグメントには

わずか5分で暗号通貨トレーダーの111,000ドルの損失が警告物語になりましたMay 04, 2025 am 11:22 AM

Blockchain AnalyticsプラットフォームであるLookonChainによると、FOMO（逃した恐怖）主導のトレーダーは、Popeを購入するために200k USDCを費やしました

Stablecoinsは、暗号市場の感情と流動性を示していますMay 04, 2025 am 11:20 AM

暗号市場の感情と流動性は、馬鹿げたものによって示されています。彼らは、市場が強気であるか弱気であるかを示しています。

ディップを購入し、コイン2倍：BTFDのFinal100オファーと2900％の可能性により、爆発する次の暗号になりますMay 04, 2025 am 11:18 AM

爆発する次の暗号？ BTFDコイン、AI16Z、およびSnekがチャートを加熱しています。 100％のボーナスと2900％のROIポテンシャルを備えたBTFDのプレセールをお見逃しなく。

どの暗号通貨が次の100倍の宝石になるのか疑問に思ったことはありませんか？May 04, 2025 am 11:16 AM

Meme CoinsがCrypto World Ablazeを再び設定しているため、投資家は急上昇する前に絶好の機会を見つけるために競っています。

Vitalik Buterinは、EthereumがBitcoinの最大の強みの1つを受け入れることを望んでいますMay 04, 2025 am 11:14 AM

最近のブログ投稿で、Ethereumの共同設立者Vitalik Buterinは、EthereumのLayer-1デザインの簡素化を目的とした一連の変更を提案しました。

世界最大の暗号通貨オプション交換であるデリビットは、米国への拡大を計画しています。May 04, 2025 am 11:12 AM

この決定は、ドナルド・トランプ大統領の下での米国の規制環境における顕著な変化に従っています。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。