テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法-AI-php.cn

ホームページ

テクノロジー周辺機器

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 11, 2023 am 09:11 AM

モデル電車

ドメイン適応は転移学習を解決するための重要な手法であり、現在のドメイン適応手法は元のドメインと同期トレーニングのターゲットドメインのデータに依存しています。ソースドメインデータが利用できず、ターゲットドメインデータが完全に表示されない場合、テスト時トレーニングが新しいドメイン適応方法になります。テストタイムトレーニング（TTT）に関する現在の研究では、自己教師あり学習、対比学習、自己トレーニングなどの手法が広く利用されていますが、実環境におけるTTTの定義方法が無視されることが多く、異なる手法間の比較可能性が欠如しています。

最近、華南理工大学、A*STAR チーム、彭城研究室は共同で、手法に逐次推論能力 (逐次推論) があるかどうかを区別することにより、TTT 問題の体系的な分類基準を提案しました。）、ソースドメインのトレーニング目標を変更する必要があるかどうか、現在の方法が詳細に分類されています。同時に,ターゲットドメインデータのアンカークラスタリングに基づく手法を提案し,さまざまなTTT分類の下で最高の分類精度を達成した.この論文は,TTTに関するその後の研究の正しい方向性を示し,実験設定における混乱を回避した。比較対象ではありません。研究論文はNeurIPS 2022に採択されました。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

論文: https://arxiv.org/abs/2206.02721
1. はじめに

#深層学習の成功は主に、大量の注釈付きデータと、トレーニングセットとテストセットが独立しており、同一に分散されているという前提によるものです。一般に、合成データでトレーニングしてから実際のデータでテストする必要がある場合、上記の前提を満たすことができません。これはドメインシフトとも呼ばれます。この問題を軽減するために、ドメインアダプテーション (DA) が誕生しました。既存の DA ジョブは、トレーニング中にソースドメインとターゲットドメインのデータにアクセスする必要があるか、複数のドメインで同時にトレーニングする必要があります。前者では、適応トレーニング中にモデルがソースドメインデータに常にアクセスできる必要がありますが、後者ではより高価な計算が必要になります。ソースドメインデータへの依存を減らすために、プライバシーの問題やストレージのオーバーヘッドによりソースドメインデータにアクセスできなくなります。ソースドメインデータを使用しないソースフリードメインアダプテーション (SFDA) は、ソースドメインデータにアクセスできないというドメインアダプテーションの問題を解決します。著者は、SFDA が収束を達成するにはターゲットデータセット全体に対して複数ラウンドにわたってトレーニングする必要があることを発見しましたが、ストリーミングデータやタイムリーな推論予測の必要性に直面した場合、SFDA はそのような問題を解決できません。ストリーミングデータへのタイムリーな適応と推論予測を必要とするこのより現実的な設定は、テスト時間トレーニング (TTT) またはテスト時間適応 (TTA) と呼ばれます。

著者は、TTT の定義についてコミュニティ内で混乱があり、それが不公平な比較につながっていることに気づきました。この論文では、既存の TTT メソッドを 2 つの重要な要素に基づいて分類しています。

ストリーミング形式で表示され、現在発生しているデータをタイムリーに予測する必要があるデータの場合、それは One-TTT メソッドと呼ばれます。パス適応。上記の設定を満たさない他のプロトコルの場合は、マルチパス適応と呼ばれます。モデルは、複数ラウンドのテストセット全体で更新する必要がある場合があります。その後、最初から最後まで推論予測を行います。

より効果的な TTT を達成するために追加の自己教師ありブランチを導入するなど、必要に応じてソースドメインのトレーニング損失方程式を変更します。
この論文の目標は、最も現実的で困難な TTT プロトコル、つまりトレーニング損失方程式を変更せずにシングルラウンド適応を解決することです。この設定は、TENT [1] によって提案された TTA に似ていますが、特徴の統計など、ソースドメインからの軽量情報の使用に限定されません。テスト時に効率的に適応するという TTT の目標を考慮すると、この仮定は計算効率が高く、TTT のパフォーマンスが大幅に向上します。著者らは、この新しい TTT プロトコルを逐次テスト時間トレーニング (sTTT) と名付けました。

さまざまな TTT 方法の上記の分類に加えて、この論文では、sTTT をより効果的かつ正確にするための 2 つのテクノロジも提案しています。

この論文では、Test-Time Anchored Clustering (TTAC) 手法を提案しています。
クラスターの更新に対する誤った擬似ラベルの影響を軽減するために、このペーパーでは、ネットワークの予測安定性とサンプルの信頼性に基づいて擬似ラベルをフィルター処理します。

2. 手法の紹介

本稿は、提案手法を 4 つのパートに分けて説明します。 (TTT) 固定クラスタリングモジュール (図 1 のアンカークラスタリングパートに示す)、2) 図 1 の擬似ラベルフィルタパートに示すように、擬似ラベルをフィルタリングするためのいくつかの戦略を導入する、3) の L2 距離の使用とは異なるTTT [2] 2 つの分布間の距離を測定するために、著者は KL ダイバージェンスを使用して 2 つのグローバルな特徴分布間の距離を測定します; 4) テスト時間トレーニング (TTT) プロセスにおける特徴統計の効果的な更新反復方法を導入します。最後に、5 番目のセクションでは、アルゴリズム全体のプロセスコードを示します。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

最初の部分のアンカークラスタリングでは、著者はまずガウスの混合を使用してターゲットドメインの特徴をモデル化します。コンポーネントは、検出されたクラスターを表します。次に、作成者は、ソースドメインの各カテゴリの分布を、ターゲットドメインの分布のアンカーポイントとして使用して照合します。このようにして、テストデータの特徴は同時にクラスターを形成することができ、クラスターはソースドメインカテゴリに関連付けられるため、ターゲットドメインへの一般化が実現されます。要約すると、ソースドメインとターゲットドメインの特徴はそれぞれカテゴリ情報に従ってモデル化されます:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

# そして、KL を通じて 2 つを測定します。発散ガウス分布の距離を混合し、KL 発散を減らすことで 2 つのドメイン特徴のマッチングを実現します。ただし、2 つの混合ガウス分布上の KL 発散を直接解くための閉じた形式の解決策はなく、効果的な勾配最適化手法の使用が妨げられています。この論文では、著者はソースドメインとターゲットドメインに同じ数のクラスタを割り当て、各ターゲットドメインクラスタをソースドメインクラスタに割り当て、混合ガウス全体のKL発散解を各ペアの和に変えることができます。ガウス間の KL 発散の。次の式:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

上記の式の閉じた形式の解は次のとおりです:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

式 2 では、ソースドメインクラスターのパラメーターをオフラインで収集でき、軽量の統計データのみが使用されるため、プライバシー漏洩の問題は発生せず、使用するコンピューティングとストレージのオーバーヘッドは少量だけです。ターゲットドメインの変数には擬似ラベルの使用が含まれるため、著者は効果的で軽量な擬似ラベルフィルタリング戦略を設計しました。

疑似ラベルフィルタリング戦略の 2 番目の部分は、主に 2 つの部分に分かれています:

1) 時系列における一貫性予測のフィルタリング:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

2) 事後確率に基づくフィルタリング:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

最後に、フィルター処理されたサンプルを使用して、ターゲットドメインクラスターの統計を求めます:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

パート 3: アンカークラスタリングでは、フィルター処理されたサンプルの一部がターゲットドメインの推定に参加しません。また、著者は、アンカークラスタリングにおけるクラスターへのアプローチと同様に、すべてのテストサンプルに対してグローバルな特徴アラインメントを実行します。ここでは、すべてのサンプルが全体的なクラスターとみなされ、

はソースドメインとターゲットで定義されます。テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

次に、KL の相違を最小限に抑えるという目標に合わせてグローバルな特徴量の分布を再度調整します:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

# #4 第 4 回上記の 3 つのパートでは、いずれもいくつかのドメインアライメント手法を紹介していますが、TTT プロセスでは、ターゲットドメイン全体のデータを観察することができないため、ターゲットドメインの分布を推定することは簡単ではありません。最先端の研究では、TTT [2] は特徴キューを使用して過去の部分サンプルを保存し、局所的な分布を計算して全体の分布を推定します。しかし、これはメモリのオーバーヘッドをもたらすだけでなく、精度とメモリの間のトレードオフにもつながります。この論文では、著者はメモリのオーバーヘッドを軽減するために統計を反復更新することを提案しています。具体的な反復更新式は次のとおりです。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

一般に、アルゴリズム全体はアルゴリズム 1 に示すとおりです。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

3. 実験結果

序論で述べたように、この論文の著者は、異なる TTT 戦略の下で異なる方法を公正に比較することを非常に重視しています。著者は、すべての TTT 方法を次の 2 つの重要な要素に従って分類します。1) ワンパス適応プロトコル (One-Pass Adaptation) かどうか、および 2) ソースドメインのトレーニング損失方程式を変更するかどうか。それぞれ、Y/N として記録され、ソースドメインのトレーニング方程式を変更する必要があるかどうか、O/M はシングルラウンド適応またはマルチラウンド適応を表します。さらに、著者は 6 つのベンチマークデータセットに対して十分な比較実験とさらなる分析を実施しました。

表 1 に示すように、TTT [2] には追加の自己監視ブランチがあるため、TTT [2] は N-O プロトコルと Y-O プロトコルの両方で表示されます。 -監視付きブランチはプロトコールでは追加されませんが、この分子の喪失は通常、Y-O で使用できます。 TTAC も、Y-O の下で TTT [2] と同じ自己監視ブランチを使用します。表からわかるように、TTAC はすべての TTT プロトコルおよびすべてのデータセットで最適な結果を達成しており、CIFAR10-C と CIFAR100-C の両方のデータセットで 3% 以上の改善を達成しています。表 2 ～表 5 は、それぞれ ImageNet-C、CIFAR10.1、VisDA のデータを示しており、TTAC が最良の結果を達成しています。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃また、著者は、複数の TTT プロトコルの下で同時に厳密なアブレーション実験を実施し、表 6 に示すように各コンポーネントの役割を明確に認識しました。まず第一に、L2 Dist と KLD の比較から、KL 発散を使用して 2 つの分布を測定する方がより良い効果があることがわかります。次に、アンカークラスタリングまたは擬似ラベル監視を単独で使用した場合、改善率はわずか 14% ですが、アンカークラスターと疑似ラベルフィルターを組み合わせると、29.15% -> 11.33% という大幅なパフォーマンスの向上が見られます。これは、各コンポーネントの必要性と効果的な組み合わせも示しています。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

最後，作者在正文的尾部從五個維度對TTAC 展開了充分的分析，分別是sTTT (N-O)下的累計表現、TTAC 特徵的TSNE 可視化、源域無關的TTT 分析、測試樣本隊列和更新輪次的分析、以wall-clock 時間度量計算開銷。還有更多有趣的證明和分析會展示在文章的附錄中。

四、總結

本文只是粗糙地介紹了TTAC 這篇工作的貢獻點：對已有TTT 方法的分類比較、提出的方法、以及各個TTT 協議分類下的實驗。論文和附錄會有更詳細的討論和分析。我們希望這項工作能為 TTT 方法提供一個公平的基準，未來的研究應該在各自的協議內進行比較。

以上がテストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

あなたは無知のベールの後ろに職場AIを構築する必要がありますApr 29, 2025 am 11:15 AM

ジョン・ロールズの独創的な1971年の著書「正義の理論」で、彼は私たちが今日のAIデザインの核となり、意思決定を使用するべきであるという思考実験を提案しました：無知のベール。この哲学は、公平性を理解するための簡単なツールを提供し、リーダーがこの理解を使用してAIを公平に設計および実装するための青写真を提供します。あなたが新しい社会のルールを作っていると想像してください。しかし、前提があります。この社会でどのような役割を果たすかは事前にわかりません。過半数または限界少数派に属している、金持ちまたは貧弱、健康、または障害者になることがあります。この「無知のベール」の下で活動することで、ルールメーカーが自分自身に利益をもたらす決定を下すことができません。それどころか、人々はより公衆を策定する意欲があります

決定、決定…実用的な応用AIの次のステップApr 29, 2025 am 11:14 AM

ロボットプロセスオートメーション（RPA）を専門とする多くの企業は、繰り返しタスクを自動化するためのボットを提供しています。一方、プロセスマイニング、オーケストレーション、インテリジェントドキュメント処理スペシャル

エージェントが来ています - 私たちがAIパートナーの隣ですることについてもっとApr 29, 2025 am 11:13 AM

AIの未来は、単純な単語の予測と会話シミュレーションを超えて動いています。 AIエージェントは出現しており、独立したアクションとタスクの完了が可能です。このシフトは、AnthropicのClaudeのようなツールですでに明らかです。 AIエージェント：研究a

共感がAI主導の未来におけるリーダーのコントロールよりも重要である理由Apr 29, 2025 am 11:12 AM

急速な技術の進歩は、仕事の未来に関する将来の見通しの視点を必要とします。 AIが単なる生産性向上を超えて、私たちの社会構造の形成を開始するとどうなりますか？ Topher McDougalの今後の本、Gaia Wakes：

製品分類のためのAI：マシンは税法を習得できますか？Apr 29, 2025 am 11:11 AM

多くの場合、Harmonized System（HS）などのシステムからの「HS 8471.30」などの複雑なコードを含む製品分類は、国際貿易と国内販売に不可欠です。これらのコードは、すべてのINVに影響を与える正しい税申請を保証します

データセンターの要求は、気候技術のリバウンドを引き起こす可能性がありますか？Apr 29, 2025 am 11:10 AM

データセンターと気候技術投資におけるエネルギー消費の将来この記事では、AIが推進するデータセンターのエネルギー消費の急増と気候変動への影響を調査し、この課題に対処するための革新的なソリューションと政策の推奨事項を分析します。エネルギー需要の課題：大規模で超大規模なデータセンターは、数十万の普通の北米の家族の合計に匹敵する巨大な力を消費し、新たなAIの超大規模なセンターは、これよりも数十倍の力を消費します。 2024年の最初の8か月で、Microsoft、Meta、Google、Amazonは、AIデータセンターの建設と運用に約1,250億米ドルを投資しました（JP Morgan、2024）（表1）。エネルギー需要の成長は、挑戦と機会の両方です。カナリアメディアによると、迫り来る電気

AIとハリウッドの次の黄金時代Apr 29, 2025 am 11:09 AM

生成AIは、映画とテレビの制作に革命をもたらしています。 LumaのRay 2モデル、滑走路のGen-4、OpenaiのSora、GoogleのVEO、その他の新しいモデルは、前例のない速度で生成されたビデオの品質を向上させています。これらのモデルは、複雑な特殊効果と現実的なシーンを簡単に作成できます。短いビデオクリップやカメラ認知モーション効果も達成されています。これらのツールの操作と一貫性を改善する必要がありますが、進歩の速度は驚くべきものです。生成ビデオは独立した媒体になりつつあります。アニメーション制作が得意なモデルもあれば、実写画像が得意なモデルもあります。 AdobeのFireflyとMoonvalleyのMAであることは注目に値します

ChatGptはゆっくりとAIの最大のYES-MANになりますか？Apr 29, 2025 am 11:08 AM

ChatGptユーザーエクスペリエンスは低下します：それはモデルの劣化ですか、それともユーザーの期待ですか？最近、多数のCHATGPT有料ユーザーがパフォーマンスの劣化について不満を述べています。ユーザーは、モデルへの応答が遅く、答えが短い、助けの欠如、さらに多くの幻覚を報告しました。一部のユーザーは、ソーシャルメディアに不満を表明し、ChatGptは「お世辞になりすぎて」、重要なフィードバックを提供するのではなく、ユーザービューを検証する傾向があることを指摘しています。これは、ユーザーエクスペリエンスに影響を与えるだけでなく、生産性の低下やコンピューティングリソースの無駄など、企業の顧客に実際の損失をもたらします。パフォーマンスの劣化の証拠多くのユーザーは、特にGPT-4などの古いモデル（今月末にサービスから廃止される）で、ChatGPTパフォーマンスの大幅な分解を報告しています。これ

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。