提高模型泛化能力是推動基於視覺的感知方法落地的重要基礎,測試段訓練和適應(Test-Time Training/Adaptation)透過在測試段調整模型參數權重,將模型泛化至未知的目標域資料分佈段。現有 TTT/TTA 方法通常著眼於在閉環世界的目標域資料下提高測試段訓練表現。
然而,在許多應用場景中,目標領域很容易受到強域外資料(Strong OOD)的污染,例如與語意類別無關的資料。這種場景也被稱為開放世界測試段訓練(OWTTT)。在這種情況下,現有的TTT/TTA通常會強制將強域外資料分類到已知類別中,從而最終幹擾對弱域外資料(Weak OOD)如受到雜訊幹擾影像的分辨能力
最近,華南理工大學和A*STAR團隊首次提出了開放世界測試段訓練的設定,並且推出了相應的訓練方法
本文首先提出了一種自適應閾值的強域外資料樣本過濾方法,以提高自訓練TTT 方法在開放世界中的穩健性。該方法進一步提出了一種基於動態擴展原型來表徵強域外樣本的方法,以改善弱/強域外資料分離效果。最後,透過分佈對齊來約束自訓練
本研究的方法在5個不同的OWTTT基準上取得了最佳的表現表現,並為TTT的後續研究開拓了面向更加魯棒TTT方法的新方向。本研究已被ICCV 2023接收為口頭報告論文
#測試段訓練(TTT)可以只在推理階段存取目標域數據,並對分佈偏移的測試數據進行即時推理。 TTT 的成功已經在許多人工選擇的合成損壞目標域數據上得到證明。然而,現有的 TTT 方法的能力邊界尚未得到充分探索。
為促進開放場景下的 TTT 應用,研究的重點已轉移到調查 TTT 方法可能失敗的場景。人們在更現實的開放世界環境下開發穩定和強大的 TTT 方法已經做出了許多努力。而在本文工作中,我們深入研究了一個很常見但被忽略的開放世界場景,其中目標域可能包含從顯著不同的環境中提取的測試資料分佈,例如與源域不同的語義類別,或者只是隨機噪音。
我們將上述測試資料稱為強分佈外資料(strong OOD)。而在本工作中稱為弱 OOD 數據則是分佈偏移的測試數據,例如常見的合成損壞。因此,現有工作缺乏對這種現實環境的研究促使我們探索提高開放世界測試段訓練(OWTTT)的穩健性,其中測試資料被強 OOD 樣本污染。
圖1 :現有的TTT 方法在OWTTT 設定下的評估結果
如圖1 所示,我們首先對現有的TTT 方法在OWTTT 設定下進行評估,發現透過自我訓練和分佈對齊的TTT 方法都會受到強OOD 樣本的影響。這些結果表明,應用現有的 TTT 技術無法在開放世界中實現安全的測試時訓練。我們將它們的失敗歸因於以下兩個原因。
為了解決現有TTT方法失敗的潛在原因,我們提出了兩種技術結合的方法,以提高自訓練框架下開放世界TTT的穩健性
首先,我們在自訓練的變體上建立 TTT 的基線,即在目標域中以源域原型作為聚類中心進行聚類。為了減輕自訓練受到錯誤偽標籤的強 OOD 的影響,我們設計了一種無超參數的方法來拒絕強 OOD 樣本。
為了進一步分離弱 OOD 樣本和強 OOD 樣本的特徵,我們允許原型池透過選擇孤立的強 OOD 樣本來擴展。因此,自訓練將允許強 OOD 樣本圍繞新擴展的強 OOD 原型形成緊密的聚類。這將有利於源域和目標域之間的分佈對齊。我們進一步提出透過全域分佈對齊來規範自我訓練,以降低確認偏誤的風險。
最後,為了綜合開放世界的TTT 場景,我們採用CIFAR10-C、CIFAR100-C、ImageNet-C、VisDA-C、ImageNet-R、Tiny-ImageNet、MNIST 和SVHN 資料集,並透過利用一個資料集為弱OOD,其他為強OOD 建立基準資料集。我們將此基準稱為開放世界測試段訓練基準,並希望這能鼓勵未來更多的工作關注更現實場景中測試段訓練的穩健性。
論文將所提出的方法分成四個部分進行介紹
1)概述開放世界下測試段訓練任務的設定。
2)介紹如何透過重寫內容為:聚類分析實現 TTT 以及如何擴展原型以進行開放世界測試時訓練。
3)介紹如何利用目標域資料進行動態原型擴充。
4)引入分佈對齊與重寫內容為:聚類分析結合,以實現強大的開放世界測試時訓練。
圖2 :方法概覽圖
任務設定
TTT 的目的是使源域預訓練模型適應目標域,其中目標域可能會相對於源域有分佈遷移。在標準的封閉世界 TTT 中,源域和目標域的標籤空間是相同的。然而在開放世界TTT 中,目標域的標籤空間包含源域的目標空間,也就是說目標域具有未見過的新語意類別
為了避免TTT 定義之間的混淆,我們採用TTAC [2] 中提出的順序測試時間訓練(sTTT)協定進行評估。在 sTTT 協議下,測試樣本被順序測試,並在觀察到小批量測試樣本後進行模型更新。到達時間戳記 t 的任何測試樣本的預測不會受到任何到達 t k(其 k 大於 0)的測試樣本的影響。
重寫內容為:聚類分析
#受到網域適應任務中使用聚類的工作啟發[ 3,4],我們將測試段訓練視為發現目標域資料中的簇結構。透過將代表性原型識別為聚類中心,在目標域中識別聚類結構,並鼓勵測試樣本嵌入到其中一個原型附近。重寫內容為:聚類分析的目標定義為最小化樣本與聚類中心餘弦相似度的負對數似然損失,如下式所示。
我們發展了一個沒有超參數的方法來濾除強 OOD 樣本,以避免調整模型權重的負面影響。具體來說,我們為每個測試樣本定義一個強 OOD 分數 os 作為與源域原型的最高相似度,如下式所示。
#圖 3 離群值呈現雙峰分佈
我們觀察到離群值服從雙峰分佈,如圖 3 所示。因此,我們沒有指定固定閾值,而是將最佳閾值定義為分離兩種分佈的最佳值。具體來說,問題可以表述為將離群值分為兩個簇,最佳閾值將最小化中的簇內方差。優化下式可以透過以 0.01 的步長窮舉搜尋從 0 到 1 的所有可能閾值來有效實現。
#動態原型擴展
# 擴展強OOD 原型池需要同時考慮源域和強OOD 原型來評估測試樣本。為了從數據中動態估計簇的數量,先前的研究了類似的問題。確定性硬聚類演算法 DP-means [5] 是透過測量資料點到已知聚類中心的距離而開發的,當距離高於閾值時將初始化一個新聚類。 DP-means 已被證明相當於優化 K-means 目標,但對簇的數量有額外的懲罰,為動態原型擴展提供了一個可行的解決方案。
為了減輕估計額外超參數的難度,我們首先定義一個測試樣本,其具有擴展的強OOD 分數作為與現有源域原型和強OOD 原型的最近距離,如下式。因此,測試高於此閾值的樣本將建立一個新的原型。為了避免添加附近的測試樣本,我們增量地重複此原型擴展過程。
隨著其他強OOD 原型的確定,我們定義了用於測試樣本的重寫內容為:聚類分析損失,並考慮了兩個因素。首先,分類為已知類別的測試樣本應該嵌入到更靠近原型的位置並遠離其他原型,這定義了 K 類分類任務。其次,被分類為強 OOD 原型的測試樣本應該遠離任何源域原型,這定義了 K 1 類分類任務。考慮到這些目標,我們將重寫內容為:聚類分析損失定義為下式。
分佈對齊約束的意思是在設計或佈局中,要求元素以特定的方式排列和對齊。這種限制可以應用於各種不同的場景,包括網頁設計、平面設計和空間佈置等。透過使用分佈對齊約束,可以使元素之間的關係更加清晰和統一,提高整體設計的美觀性和可讀性
眾所周知,自訓練容易受到錯誤偽標籤的影響。目標域由 OOD 樣本組成時,情況會更加惡化。為了降低失敗的風險,我們進一步將分佈對齊 [1] 作為自我訓練的正規化,如下式。
#我們對5個不同的OWTTT基準資料集進行了測試,其中包括人工合成的損壞資料集和風格變化的資料集。實驗主要使用了三個評估指標:弱OOD分類準確率ACCS、強OOD分類準確率ACCN和二者的調和平均數ACCH
需要重寫的內容是:Cifar10-C 資料集中不同方法的表現如下表所示
#需要進行改寫的內容是:Cifar100 -C 資料集中不同方法的表現如下表所示:
#需要進行改寫的內容是:在ImageNet-C資料集上,不同方法的表現如下表所示
表 4 不同方法在 ImageNet-R 数据集的表现
表 5 不同方法在 VisDA-C 数据集的表现
我们的方法在几乎所有数据集上相较于目前最优秀的方法都有显著的提升,如上表所示。它能够有效地识别强 OOD 样本,并减小对弱 OOD 样本分类的影响。因此,在开放世界的场景下,我们的方法能够实现更加鲁棒的 TTT
本文首次提出了开放世界测试段训练(OWTTT)的问题和设定,指出现有的方法在处理含有和源域样本有语义偏移的强 OOD 样本的目标域数据时时会遇到困难,并提出一个基于动态原型扩展的自训练的方法解决上述问题。我们希望这项工作能够为 TTT 的后续研究探索面向更加鲁棒的 TTT 方法提供新方向
以上是運用動態原型擴展的自訓練方法,探索開放世界測試段訓練技巧的詳細內容。更多資訊請關注PHP中文網其他相關文章!