ホームページ  >  記事  >  テクノロジー周辺機器  >  テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

WBOY
WBOY転載
2023-04-11 09:11:021388ブラウズ

ドメイン適応は転移学習を解決するための重要な手法であり、現在のドメイン適応手法は元のドメインと同期トレーニングのターゲット ドメインのデータに依存しています。ソース ドメイン データが利用できず、ターゲット ドメイン データが完全に表示されない場合、テスト時トレーニングが新しいドメイン適応方法になります。テストタイムトレーニング(TTT)に関する現在の研究では、自己教師あり学習、対比学習、自己トレーニングなどの手法が広く利用されていますが、実環境におけるTTTの定義方法が無視されることが多く、異なる手法間の比較可能性が欠如しています。

最近、華南理工大学、A*STAR チーム、彭城研究室は共同で、手法に逐次推論能力 (逐次推論) があるかどうかを区別することにより、TTT 問題の体系的な分類基準を提案しました。 )、ソースドメインのトレーニング目標を変更する必要があるかどうか、現在の方法が詳細に分類されています。同時に,ターゲットドメインデータのアンカークラスタリングに基づく手法を提案し,さまざまなTTT分類の下で最高の分類精度を達成した.この論文は,TTTに関するその後の研究の正しい方向性を示し,実験設定における混乱を回避した。比較対象ではありません。研究論文はNeurIPS 2022に採択されました。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

  • 論文: https://arxiv.org/abs/2206.02721
  • ##コード: https://github.com/Gorilla-Lab-SCUT/TTAC
  • 1. はじめに
#深層学習の成功は主に、大量の注釈付きデータと、トレーニング セットとテスト セットが独立しており、同一に分散されているという前提によるものです。一般に、合成データでトレーニングしてから実際のデータでテストする必要がある場合、上記の前提を満たすことができません。これはドメイン シフトとも呼ばれます。この問題を軽減するために、ドメイン アダプテーション (DA) が誕生しました。既存の DA ジョブは、トレーニング中にソース ドメインとターゲット ドメインのデータにアクセスする必要があるか、複数のドメインで同時にトレーニングする必要があります。前者では、適応トレーニング中にモデルがソース ドメイン データに常にアクセスできる必要がありますが、後者ではより高価な計算が必要になります。ソース ドメイン データへの依存を減らすために、プライバシーの問題やストレージのオーバーヘッドによりソース ドメイン データにアクセスできなくなります。ソース ドメイン データを使用しないソース フリー ドメイン アダプテーション (SFDA) は、ソース ドメイン データにアクセスできないというドメイン アダプテーションの問題を解決します。著者は、SFDA が収束を達成するにはターゲット データセット全体に対して複数ラウンドにわたってトレーニングする必要があることを発見しましたが、ストリーミング データやタイムリーな推論予測の必要性に直面した場合、SFDA はそのような問題を解決できません。ストリーミング データへのタイムリーな適応と推論予測を必要とするこのより現実的な設定は、テスト時間トレーニング (TTT) またはテスト時間適応 (TTA) と呼ばれます。

著者は、TTT の定義についてコミュニティ内で混乱があり、それが不公平な比較につながっていることに気づきました。この論文では、既存の TTT メソッドを 2 つの重要な要素に基づいて分類しています。

ストリーミング形式で表示され、現在発生しているデータをタイムリーに予測する必要があるデータの場合、それは One-TTT メソッドと呼ばれます。パス適応。上記の設定を満たさない他のプロトコルの場合は、マルチパス適応と呼ばれます。モデルは、複数ラウンドのテスト セット全体で更新する必要がある場合があります。その後、最初から最後まで推論予測を行います。

  • より効果的な TTT を達成するために追加の自己教師ありブランチを導入するなど、必要に応じてソース ドメインのトレーニング損失方程式を変更します。
  • この論文の目標は、最も現実的で困難な TTT プロトコル、つまりトレーニング損失方程式を変更せずにシングルラウンド適応を解決することです。この設定は、TENT [1] によって提案された TTA に似ていますが、特徴の統計など、ソース ドメインからの軽量情報の使用に限定されません。テスト時に効率的に適応するという TTT の目標を考慮すると、この仮定は計算効率が高く、TTT のパフォーマンスが大幅に向上します。著者らは、この新しい TTT プロトコルを逐次テスト時間トレーニング (sTTT) と名付けました。

さまざまな TTT 方法の上記の分類に加えて、この論文では、sTTT をより効果的かつ正確にするための 2 つのテクノロジも提案しています。

  • この論文では、Test-Time Anchored Clustering (TTAC) 手法を提案しています。
  • クラスターの更新に対する誤った擬似ラベルの影響を軽減するために、このペーパーでは、ネットワークの予測安定性とサンプルの信頼性に基づいて擬似ラベルをフィルター処理します。

2. 手法の紹介

本稿は、提案手法を 4 つのパートに分けて説明します。 (TTT) 固定クラスタリング モジュール (図 1 のアンカー クラスタリング パートに示す)、2) 図 1 の擬似ラベル フィルタ パートに示すように、擬似ラベルをフィルタリングするためのいくつかの戦略を導入する、3) の L2 距離の使用とは異なるTTT [2] 2 つの分布間の距離を測定するために、著者は KL ダイバージェンスを使用して 2 つのグローバルな特徴分布間の距離を測定します; 4) テスト時間トレーニング (TTT) プロセスにおける特徴統計の効果的な更新反復方法を導入します。最後に、5 番目のセクションでは、アルゴリズム全体のプロセス コードを示します。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

最初の部分のアンカー クラスタリングでは、著者はまずガウスの混合を使用してターゲット ドメインの特徴をモデル化します。コンポーネントは、検出されたクラスターを表します。次に、作成者は、ソース ドメインの各カテゴリの分布を、ターゲット ドメインの分布のアンカー ポイントとして使用して照合します。このようにして、テスト データの特徴は同時にクラスターを形成することができ、クラスターはソース ドメイン カテゴリに関連付けられるため、ターゲット ドメインへの一般化が実現されます。要約すると、ソース ドメインとターゲット ドメインの特徴はそれぞれカテゴリ情報に従ってモデル化されます:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

# そして、KL を通じて 2 つを測定します。発散 ガウス分布の距離を混合し、KL 発散を減らすことで 2 つのドメイン特徴のマッチングを実現します。ただし、2 つの混合ガウス分布上の KL 発散を直接解くための閉じた形式の解決策はなく、効果的な勾配最適化手法の使用が妨げられています。この論文では、著者はソースドメインとターゲットドメインに同じ数のクラスタを割り当て、各ターゲットドメインクラスタをソースドメインクラスタに割り当て、混合ガウス全体のKL発散解を各ペアの和に変えることができます。ガウス間の KL 発散の。次の式:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

上記の式の閉じた形式の解は次のとおりです:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

式 2 では、ソース ドメイン クラスターのパラメーターをオフラインで収集でき、軽量の統計データのみが使用されるため、プライバシー漏洩の問題は発生せず、使用するコンピューティングとストレージのオーバーヘッドは少量だけです。ターゲット ドメインの変数には擬似ラベルの使用が含まれるため、著者は効果的で軽量な擬似ラベル フィルタリング戦略を設計しました。

疑似ラベル フィルタリング戦略の 2 番目の部分は、主に 2 つの部分に分かれています:

1) 時系列における一貫性予測のフィルタリング:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

2) 事後確率に基づくフィルタリング:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

最後に、フィルター処理されたサンプルを使用して、ターゲット ドメイン クラスターの統計を求めます:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

パート 3: アンカー クラスタリングでは、フィルター処理されたサンプルの一部がターゲット ドメインの推定に参加しません。また、著者は、アンカー クラスタリングにおけるクラスターへのアプローチと同様に、すべてのテスト サンプルに対してグローバルな特徴アラインメントを実行します。ここでは、すべてのサンプルが全体的なクラスターとみなされ、

はソース ドメインとターゲットで定義されます。 テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

次に、KL の相違を最小限に抑えるという目標に合わせてグローバルな特徴量の分布を再度調整します:

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

# #4 第 4 回 上記の 3 つのパートでは、いずれもいくつかのドメイン アライメント手法を紹介していますが、TTT プロセスでは、ターゲット ドメイン全体のデータを観察することができないため、ターゲット ドメインの分布を推定することは簡単ではありません。最先端の研究では、TTT [2] は特徴キューを使用して過去の部分サンプルを保存し、局所的な分布を計算して全体の分布を推定します。しかし、これはメモリのオーバーヘッドをもたらすだけでなく、精度とメモリの間のトレードオフにもつながります。この論文では、著者はメモリのオーバーヘッドを軽減するために統計を反復更新することを提案しています。具体的な反復更新式は次のとおりです。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

一般に、アルゴリズム全体はアルゴリズム 1 に示すとおりです。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

3. 実験結果

序論で述べたように、この論文の著者は、異なる TTT 戦略の下で異なる方法を公正に比較することを非常に重視しています。著者は、すべての TTT 方法を次の 2 つの重要な要素に従って分類します。1) ワンパス適応プロトコル (One-Pass Adaptation) かどうか、および 2) ソース ドメインのトレーニング損失方程式を変更するかどうか。それぞれ、Y/N として記録され、ソースドメインのトレーニング方程式を変更する必要があるかどうか、O/M はシングルラウンド適応またはマルチラウンド適応を表します。さらに、著者は 6 つのベンチマーク データセットに対して十分な比較実験とさらなる分析を実施しました。

表 1 に示すように、TTT [2] には追加の自己監視ブランチがあるため、TTT [2] は N-O プロトコルと Y-O プロトコルの両方で表示されます。 -監視付きブランチはプロトコールでは追加されませんが、この分子の喪失は通常、Y-O で使用できます。 TTAC も、Y-O の下で TTT [2] と同じ自己監視ブランチを使用します。表からわかるように、TTAC はすべての TTT プロトコルおよびすべてのデータ セットで最適な結果を達成しており、CIFAR10-C と CIFAR100-C の両方のデータ セットで 3% 以上の改善を達成しています。表 2 ~ 表 5 は、それぞれ ImageNet-C、CIFAR10.1、VisDA のデータを示しており、TTAC が最良の結果を達成しています。 ################################################また、著者は、複数の TTT プロトコルの下で同時に厳密なアブレーション実験を実施し、表 6 に示すように各コンポーネントの役割を明確に認識しました。まず第一に、L2 Dist と KLD の比較から、KL 発散を使用して 2 つの分布を測定する方がより良い効果があることがわかります。次に、アンカー クラスタリングまたは擬似ラベル監視を単独で使用した場合、改善率はわずか 14% ですが、アンカー クラスターと疑似ラベル フィルターを組み合わせると、29.15% -> 11.33% という大幅なパフォーマンスの向上が見られます。これは、各コンポーネントの必要性と効果的な組み合わせも示しています。

テストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法

最後,作者在正文的尾部從五個維度對TTAC 展開了充分的分析,分別是sTTT (N-O)下的累計表現、TTAC 特徵的TSNE 可視化、源域無關的TTT 分析、測試樣本隊列和更新輪次的分析、以wall-clock 時間度量計算開銷。還有更多有趣的證明和分析會展示在文章的附錄中。

四、總結

本文只是粗糙地介紹了TTAC 這篇工作的貢獻點:對已有TTT 方法的分類比較、提出的方法、以及各個TTT 協議分類下的實驗。論文和附錄會有更詳細的討論和分析。我們希望這項工作能為 TTT 方法提供一個公平的基準,未來的研究應該在各自的協議內進行比較。

以上がテストフェーズのトレーニングを正しく定義するにはどうすればよいですか?逐次推論とドメイン適応型クラスタリング手法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。