在機器學習模式日益應用於開放世界場景中,如何有效識別和處理分佈外(Out-of-Distribution,OOD)資料成為一個重要研究領域。分佈外資料的存在可能導致模型過度自信和錯誤預測,這在安全關鍵應用(如自動駕駛和醫療診斷)中尤其危險。因此,發展一種有效的OOD檢測機制,對於提高模型在實際應用中的安全性和可靠性至關重要。
傳統的OOD偵測方法主要集中在單一模式,特別是影像資料上,而忽略了其它潛在有用的資訊來源,例如文字資料。隨著視覺-語言模型(VLMs)的興起,它們在多模式學習場景中展示了強大的性能,特別是在處理需要同時理解圖像和相關文字描述的任務中表現出色。現有的基於VLMs的OOD檢測方法[3,4,5]僅使用了ID標籤的語意訊息,忽略了VLMs模型強大的零樣本能力,以及VLMs可解釋非常廣闊的語意空間。基於此,我們認為VLMs在OOD檢測中有巨大的未開發潛力,尤其是它們可以綜合利用圖像和文字資訊來改善檢測效果。
這篇文章圍繞著三個問題:
1.非ID標籤的資訊是否對零樣本OOD偵測有幫助?
2.如何挖掘出對零樣本OOD偵測有利的資訊?
3.如何利用挖掘出的資訊進行零樣本OOD偵測?
在這個專案中,我們提出了一種名為NegLabel的創新方法,該方法利用VLMs進行OOD檢測。 NegLabel方法特別引入了「負標籤」機制,這些負標籤與已知ID類別標籤具有顯著的語義差異,透過分析比較影像和ID標籤和負標籤的親和力和性質,NegLabel能夠有效地區分屬於分佈外的樣本,從而顯著增強模型對OOD樣本的辨識能力。
在多個零樣本OOD偵測基準測試中,NegLabel取得了優越的效能表現。在大規模資料集如ImageNet-1k上能夠達到94.21%的AUROC和25.40%的FPR95。相較於基於VLMs的OOD偵測方法,NegLabel不僅不需要額外的訓練過程,而且展現出更優越的表現。此外,NegLabel在不同的VLM架構上都展現了優異的通用性和穩健性。
Ø論文連結:https://arxiv.org/pdf/2403.20078.pdf
Ø程式碼連結:https://github.com/ tmlr-group/NegLabel
接下來將簡單地向大家分享我們近期發表在ICLR 2024 上的分佈外偵測方向的研究結果。
預備知識
方法介紹
NegLabel的核心就是引入了「負標籤」機制,這些負標籤與已知ID類別標籤有顯著的語意差異,透過分析比較影像與ID標籤和負標籤的親和力,NegLabel能夠有效地區分出屬於分佈外的樣本,從而顯著增強模型對OOD樣本的辨識能力。
圖1. NegLabel的總覽圖
#1. 如何選取負標籤?
2. 如何利用負標籤來進行OOD偵測?
3.如何理解負樣本可以促進零樣本OOD偵測?
實驗結果
我們的研究工作提供了多維度的實驗結果以理解我們提出的方法性能及底層機制。
如下表所示,與諸多性能優良的基準方法和先進方法相比,本文提出的方法可以大規模資料集(如ImageNet)上在其基礎上達到更優的分佈外檢測效果。
此外,如下表所示,本文的方法在ID資料發生域遷移時有著更好的穩健性。
在下列兩個表格中,我們對NegLabel的各個模組還有VLMs的結構進行了消融實驗。左表可以看出,NegMining演算法和Grouping策略都可以有效提升OOD偵測的效能。右表展示了我們提出的NegLabel演算法在不同結構的VLMs有著良好的適應性。
我們也對不同輸入影像對於ID標籤和負標籤的親和力進行了視覺化分析,更多詳細的實驗和結果請參考原文。
#參考文獻
[1] Hendrycks, D. and Gimpel, K. A baseline for detecting misclassified and out-of-distribution examples in neural networks. In ICLR, 2017.
[2] Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal,Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, et al. Learning transferable visual models from natural language supervision. In ICML, 2021.
[3] Sepideh Esmaeilpour, Bing Liu, Eric Robertson, and Lei Shu. Zero-shot out-of -distribution detection based on the pre-trained model clip. In AAAI, 2022.
[4] Yifei Ming, Ziyang Cai, Jiuxiang Gu, Yiyou Sun, Wei Li, and Yixuan Li. Delving into out-ofdisdbution detection with vision-language representations. In NeurIPS, 2022a.
[5] Hualiang Wang, Yi Li, Huifeng Yao, and Xiaomeng Li. Clipn for zero-shot ood detection: Teaching clip to iaomeng Li. Clipn for zero-shot ood detection: Teaching clip to say no.CV, 2023.
[6] Christiane Fellbaum. WordNet: An Electronic Lexical Database. Bradford Books, 1998.
#以上是ICLR 2024 Spotlight | 負標籤挖掘輔助基於CLIP的分佈外偵測任務的詳細內容。更多資訊請關注PHP中文網其他相關文章!

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

記事本++7.3.1
好用且免費的程式碼編輯器

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器