逆轉特徵讓re-id模型從88.54%到0.15%-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

逆轉特徵讓re-id模型從88.54%到0.15%

王林

May 04, 2023 pm 03:52 PM

模型

這篇文章初版2018年5月就寫好了，最近2022年12月才中。四年中得到了老闆們的許多支持和理解。

（這段經歷也希望給在投稿的同學們一點鼓舞，paper寫好肯定能中的，不要輕易放棄！）

arXiv早期版本為：Query Attack via Opposite-Direction Feature:Towards Robust Image Retrieval

逆轉特徵讓re-id模型從88.54%到0.15%

論文連結：https://link.springer.com/article/10.1007/s11263-022-01737-y

論文備份連結：https://zdzheng .xyz/files/IJCV_Retrieval_Robustness_CameraReady.pdf

程式碼：https://github.com/layumi/U_turn

#作者：Zhedong Zheng, Liang Zheng, Yi Yang and Fei Wu

與早期版本相比，

#我們在公式上做了一些調整；
加入了很多新的related works討論；
加入了多尺度Query攻擊/ 黑盒攻擊/ 防禦三個不同角度的實驗；
加入Food256，Market-1501，CUB，Oxford，Paris等資料集上的新方法和較新的可視化方式。
攻擊了reid中的PCB結構，攻擊了Cifar10中的WiderResNet。

實際案例

實際使用的話。舉個例子，例如我們要攻擊google或百度的影像檢索系統，搞大新聞（大霧）。我們可以下載一張狗的圖像，透過imagenet模型（也可以是其他模型，最好是接近檢索系統的模型）計算特徵，透過把特徵調頭（本文的方法），來計算對抗雜訊（adversarial noise）加回到狗上。再把攻擊過後的狗使用以圖搜圖，可以看到百度谷歌的系統就不能回狗相關的內容了。雖然我們人還能辨識出這是狗的圖像。

P.S. 我當時也試過攻擊谷歌以圖搜圖，人還能識別出這是狗的圖像，但谷歌往往會返回“馬賽克”相關圖像。我估計谷歌也不全是用深度特徵，或者和imagenet模型有較大差異，導致攻擊後，往往趨向於“馬賽克”，而不是其他實體類別（飛機啊之類的）。當然馬賽克也算某種程度的成功！

What

1.本文的初衷其實特別簡單，現有reid模型，或者風景檢索模型已經達到了95%以上的Recall-1召回率，那我們是不是可以設計一種方式來攻擊檢索模型呢？一方面探探reid模型的老底，一方面攻擊是為了更好的防禦，研究一下防禦異常case。

2.檢索模型與傳統的分類模型的差異在於檢索模型是用提取出來的特徵來比較結果（排序），這與傳統的分類模型有較大的差異，如下表。

逆轉特徵讓re-id模型從88.54%到0.15%

3. 檢索問題還有一個特點就是open set也就是說測試的時候類別往往是訓練時沒見過的。如果大家熟悉cub資料集，在檢索設定下，訓練的時候訓練集合100多種鳥，和測試時測試100多種鳥，這兩個100種是沒有overlapp種類的。純靠提取的視覺特徵來匹配和排序。所以有些分類攻擊方法不適合攻擊檢索模型，因為攻擊時基於類別預測的graident往往是不準的。

4. 檢索模型在測試時，有兩部分資料一部分是查詢圖片query，一部分是圖片庫 gallery（資料量較大，而且一般不能access）。考慮到實際可行性，我們方法將主要瞄準攻擊query的圖像來導致錯誤的檢索結果。

How

1. 很自然的一個想法就是攻擊特徵。那怎麼攻擊特徵？基於我們之前對於cross entropy loss的觀察，（可以參考large-margin softmax loss這篇文章）。往往我們使用分類loss的時候，特徵f會存在一個放射形的分佈。這是由於特徵在學習的時候與最後一層分類層權重W計算的是cos similarity。如下圖，導致我們學完模型，同一類別的樣本會分佈在該類別W附近，這樣f*W才能到達最大值。

逆轉特徵讓re-id模型從88.54%到0.15%

2. 所以我們提出了一個特別簡單的方法，就是讓特徵調頭。如下圖，其實有兩種常見的分類攻擊方法也可以一起視覺化出來。如（a）這種就是把分類機率最大的類別給壓下去（如Fast Gradient），透過給-Wmax，所以有紅色的梯度傳播方向沿著反Wmax；如（b）還有一種就是把最不可能的類別的特徵給拉上來（如Least-likely），所以紅色的梯度沿著Wmin。

3. 這兩種分類攻擊方法在傳統分類問題上當然是很直接有效的。但由於檢索問題中測試集都是沒見過的類別（沒見過的鳥種），所以自然f的分佈沒有那麼緊密貼合Wmax或者Wmin，因此我們的策略很簡單，既然有了f，那我們直接把f往-f去移動就好了，如圖(c)。

這樣在特徵匹配階段，原來排名高的結果，理想情況下，與-f算cos similarity，從接近1變到接近-1，反而會排到最低。

達成了我們攻擊檢索排序的效果。

4. 一個小extension。在檢索問題中，我們也常用multi-scale來做query augmentation，所以我們也研究了一下怎麼在這種情況下維持攻擊效果。（主要困難在於resize操作可能把一些小卻關鍵的抖動給smooth了。）

其實我們應對的方法也很簡單，就如model ensemble一樣，我們把多個尺度的adversarial gradient做個ensemble平均就好。

實驗

1. 在三個資料集三個指標下，我們固定了抖動幅度也就是橫座標的epsilon，比較在同樣抖動幅度下哪一種方法能使檢索模型犯下更多錯誤。我們的方法是黃色線都處在最下面，也就是攻擊效果更好。

逆轉特徵讓re-id模型從88.54%到0.15%

2. 同時我們也提供了在5個資料集上（Food，CUB，Market，Oxford，Paris）的量化實驗結果

逆轉特徵讓re-id模型從88.54%到0.15%

3. 為了展示模型的機制，我們也嘗試攻擊了Cifar10上的分類模型。

可以看到我們改變最後一層特徵的策略，對於top-5也有很強的壓制力。對於top-1，由於沒有拉一個候選類別上來，所以會比least-likely略低一些，但也差不多。

逆轉特徵讓re-id模型從88.54%到0.15%

4. 黑盒子攻擊

我們也嘗試了使用ResNet50產生的攻擊樣本去攻擊一個黑盒的DenseNet模型（這個模型的參數我們是不可取得的）。發現也能取得比較好的遷移攻擊能力。

逆轉特徵讓re-id模型從88.54%到0.15%

5. 對抗防禦

我們採用online adversarial training的方式來訓練一個防禦模型。我們發現他在接受新的白盒攻擊的時候依然是不行的，但是比完全沒有防禦的模型在小抖動上會更穩定一些（掉點少一些）。

逆轉特徵讓re-id模型從88.54%到0.15%

6. 特徵移動的視覺化

這也是我覺得最喜歡的實驗。我們利用Cifar10，把最後分類層的維度改為2，來plot分類層的feature的變化。

如下圖，隨著抖動幅度epsilon的變大，我們可以看到樣本的特徵慢慢「調頭」了。例如大部分橘色的特徵就移動到對面去了。

逆轉特徵讓re-id模型從88.54%到0.15%

以上是逆轉特徵讓re-id模型從88.54%到0.15%的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

AI技能差距正在減慢供應鏈Apr 26, 2025 am 11:13 AM

經常使用“ AI-Ready勞動力”一詞，但是在供應鏈行業中確實意味著什麼？供應鏈管理協會（ASCM）首席執行官安倍·埃什肯納齊（Abe Eshkenazi）表示，它表示能夠評論家的專業人員

一家公司如何悄悄地努力改變AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地獲得動力。本週五在德克薩斯州奧斯汀，Bittensor最終遊戲峰會標誌著一個關鍵時刻，將分散的AI（DEAI）從理論轉變為實際應用。與閃閃發光的廣告不同

NVIDIA釋放NEMO微服務以簡化AI代理開發Apr 26, 2025 am 11:11 AM

企業AI面臨數據集成挑戰企業AI的應用面臨一項重大挑戰：構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題，允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。這個新推出的工具包包含五個關鍵微服務： NeMo Customizer 處理大型語言模型的微調，具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制，以保持合規性和適當的

AI為藝術與設計的未來描繪了一幅新圖片Apr 26, 2025 am 11:10 AM

AI：藝術與設計的未來畫卷人工智能(AI)正以前所未有的方式改變藝術與設計領域，其影響已不僅限於業餘愛好者，更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師，例如廣告、社交媒體圖片生成和網頁設計。然而，專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具，探索新的美學可能性，融合不同的風格，創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務，提出不同的設計元素並提供創意輸入。 AI支持風格遷移，即將一種圖像的風格應用

Zoom如何徹底改變與Agent AI的合作：從會議到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其視頻會議平台而聞名，它通過創新使用Agentic AI來引領工作場所革命。最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。定義代理AI 黃d

對大學的存在威脅Apr 26, 2025 am 11:08 AM

AI會徹底改變教育嗎？這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。正如科技Edvocate的馬修·林奇（Matthew Lynch）所指出的那樣

原型：美國科學家正在國外尋找工作Apr 26, 2025 am 11:07 AM

美國科學研究和技術發展或將面臨挑戰，這或許是由於預算削減導致的。據《自然》雜誌報導，2025年1月至3月期間，美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示，75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。過去幾個月，數百項NIH和NSF的撥款被終止，NIH今年的新撥款減少了約23億美元，下降幅度接近三分之一。洩露的預算提案顯示，特朗普政府正在考慮大幅削減科學機構的預算，削減幅度可能高達50%。基礎研究領域的動盪也影響了美國的一大優勢：吸引海外人才。 35