逆转特征让re-id模型从88.54%到0.15%-人工智能-PHP中文网

首页

科技周边

人工智能

逆转特征让re-id模型从88.54%到0.15%

王林

May 04, 2023 pm 03:52 PM

模型

这篇文章初版2018年5月就写好了，最近2022年12月才中。四年中得到了老板们的很多支持和理解。

（这段经历也希望给在投稿的同学们一点鼓舞，paper写好肯定能中的，不要轻易放弃！）

arXiv早期版本为：Query Attack via Opposite-Direction Feature:Towards Robust Image Retrieval

逆转特征让re-id模型从88.54%到0.15%

论文链接：https://link.springer.com/article/10.1007/s11263-022-01737-y

论文备份链接：https://zdzheng.xyz/files/IJCV_Retrieval_Robustness_CameraReady.pdf

代码：https://github.com/layumi/U_turn

作者：Zhedong Zheng, Liang Zheng, Yi Yang and Fei Wu

与早期版本相比，

我们在公式上做了一些调整；
加入了很多新的related works讨论；
加入了多尺度Query攻击 / 黑盒攻击 / 防御三个不同角度的实验；
加入Food256，Market-1501，CUB，Oxford，Paris等数据集上的新方法和较新的可视化方式。
攻击了reid中的PCB结构，攻击了Cifar10中的WiderResNet。

实际案例

实际使用的话。举个例子，比如我们要攻击google或者百度的图像检索系统，搞大新闻（大雾）。我们可以下载一张狗的图像，通过imagenet模型（也可以是其他模型，最好是接近检索系统的模型）计算特征，通过把特征调头（本文的方法），来计算对抗噪声（adversarial noise）加回到狗上。再把攻击过后的狗使用以图搜图，可以看到百度谷歌的系统就不能返回狗相关的内容了。虽然我们人还能识别出这是狗的图像。

P.S. 我当时也试过攻击谷歌以图搜图，人还能识别出这是狗的图像，但谷歌往往会返回「马赛克」相关图像。我估计谷歌也不全是用深度特征，或者和imagenet模型有较大差异，导致攻击后，往往趋向于「马赛克」，而不是其他实体类别（飞机啊之类的）。当然马赛克也算某种程度的成功！

What

1.本文的初衷其实特别简单，现有reid模型，或者风景检索模型已经达到了95%以上的Recall-1召回率，那么我们是不是可以设计一种方式来攻击检索模型？一方面探探reid模型的老底，一方面攻击是为了更好的防御，研究一下防御异常case。

2.检索模型与传统的分类模型的差异在于检索模型是用提取出来的特征来比较结果（排序），这与传统的分类模型有较大的差异，如下表。

逆转特征让re-id模型从88.54%到0.15%

3. 检索问题还有一个特点就是open set也就是说测试的时候类别往往是训练时没见过的。如果大家熟悉cub数据集，在检索设置下，训练的时候训练集合100多种鸟，和测试时测试100多种鸟，这两个100种是没有overlapp种类的。纯靠提取的视觉特征来匹配和排序。所以一些分类攻击方法不适合攻击检索模型，因为攻击时基于类别预测的graident往往是不准的。

4. 检索模型在测试时，有两部分数据一部分是查询图像query，一部分是图像库 gallery（数据量较大，而且一般不能access）。考虑到实际可行性，我们方法将主要瞄准攻击query的图像来导致错误的检索结果。

How

1. 很自然的一个想法就是攻击特征。那么怎么攻击特征？基于我们之前对于cross entropy loss的观察，（可以参考large-margin softmax loss这篇文章）。往往我们使用分类loss的时候，特征f会存在一个放射形的分布。这是由于特征在学习的时候与最后一层分类层权重W计算的是cos similarity。如下图，导致我们学完模型，同一类的样本会分布在该类W附近，这样f*W才能到达最大值。

逆转特征让re-id模型从88.54%到0.15%

2. 所以我们提出了一个特别简单的方法，就是让特征调头。如下图，其实有两种常见的分类攻击方法也可以一起可视化出来。如（a）这种就是把分类概率最大的类别给压下去（如Fast Gradient），通过给-Wmax，所以有红色的梯度传播方向沿着反Wmax；如（b）还有一种就是把最不可能的类别的特征给拉上来（如Least-likely），所以红色的梯度沿着Wmin。

3. 这两种分类攻击方法在传统分类问题上当然是很直接有效的。但由于检索问题中测试集都是没见过的类别（没见过的鸟种），所以自然f的分布没有那么紧密贴合Wmax或者Wmin，因此我们的策略很简单，既然有了f，那我们直接把f往-f去移动就好了，如图(c)。

这样在特征匹配阶段，原来排名高的结果，理想情况下，与-f算cos similarity，从接近1变到接近-1，反而会排到最低。

达成了我们攻击检索排序的效果。

4. 一个小extension。在检索问题中，我们还常用multi-scale来做query augmentation，所以我们也研究了一下怎么在这种情况下维持攻击效果。（主要难点在于resize操作可能把一些小却关键的抖动给smooth了。）

其实我们应对的方法也很简单，就如model ensemble一样，我们把多个尺度的adversarial gradient做个ensemble平均就好。