最近,CVPR 2023的比赛结果公布了。网易伏羲实验室在CVPR 2023的UG2+雾霾目标识别挑战赛和VizWiz少样本目标识别挑战赛中取得了第一名的好成绩。他们的相关论文也被国际顶级期刊TIP录用。这显示了网易伏羲在计算机视觉领域的顶尖技术创新能力,获得了国际范围内的高度认可。
2023年2月至6月,IEEE/CVF Computer Vision and Pattern Recognition Conference(CVPR)作为国际计算机视觉与模式识别领域的顶级会议,与全球权威学术机构和知名企业合作,举办了多项挑战赛。这些挑战赛吸引了众多AI研究团队的广泛参与。近日,CVPR陆续公布了获奖结果,并颁发了获奖证书。CVPR作为IEEE主办的顶级AI学术会议,具有极高的学术影响力和社会认可度。
在CVPR 2023 UG2+Object Detection in Haze Challenge(雾霾目标识别挑战赛)和CVPR 2023 VizWiz Few-Shot Object Recognition Challenge(少样本目标识别挑战赛)两项赛事中,网易伏羲与中国科学技术大学於俊老师团队合作并取得了第一名的成绩。这次合作主要集中在计算机视觉领域的目标检测和少样本目标识别两个方面。这些技术可以广泛应用于各个领域的视觉任务中。特别是在工业应用中,少样本目标检测在数据获取和标注困难的场景下具有重要的价值和意义。通过这次比赛的成功,我们展示了网易伏羲在计算机视觉领域的研究实力和创新能力。我们将继续致力于推动计算机视觉技术的发展,为实际应用提供更加准确和高效的解决方案。
UG2+的目标是通过应用图像恢复和增强算法来提高分析性能,从而推进对于“困难”图像的分析。参赛者的任务是开发新的算法,以改进在问题条件下捕获的图像的分析能力。VizWiz的目标是让更多人了解视力障碍患者的技术需求和兴趣,并鼓励人工智能研究人员开发新算法来消除无障碍障碍。比赛通常包括识别图像中的物体、识别图像中的文本以及回答关于图像的问题等任务。以下是网易伏羲本次获奖论文的简要概述:
用于无监督异常检测的全频通道选择表示方法
Omni-frequency Channel-selection Representations for Unsupervised Anomaly Detection
关键词:无监督图像异常检测
异常检测在视觉图像理解中扮演着重要角色,用于判断给定图像是否偏离预设的正常状态。它在新颖性检测、基于工业图像的产品质量监控、缺陷自动修复、人体健康监测和视频监控等领域广泛应用。目前主要存在三类主流的无监督异常检测方法,包括基于密度的方法、基于分类的方法和基于重建的方法。这些方法通过分析图像的统计特征、学习正常样本和重建图像来实现异常检测,为各种应用提供了可靠的工具和技术支持。
其中,基于重构的方法由于重构能力差、性能不高而很少被提及,但其不需要额外花费大量的训练样本进行无监督训练,在工业应用中更加实用。为此,本研究着重改进基于重构的方法,提出了一种全新的全频通道选择重建网络(OCR-GAN),首创从频率的角度处理感官异常检测任务。大量的实验证明了该方法相对于其他方法的有效性和优越性。例如,在没有额外训练数据的情况下,在MVTec AD数据集上实现了新SOTA表现,AUC达到98.3,显著超过了基于重建的方法基线38.1和当前SOTA方法0.3。
论文提出了一种创新型解决方案来解决智能游戏兼容性测试中的UI异常问题。该解决方案利用人工智能技术自动化检测游戏运行时出现的UI异常问题,实现游戏兼容性测试的自动化。通过采用图像异常检测技术,从计算机视觉的角度对生成的大量游戏界面截图进行自动化检测,从中获取UI异常图片,并辅助游戏开发人员快速、准确地定位问题的原因,从而有效地节省了游戏测试专家的人力成本。
本篇论文与浙江大学刘勇老师团队合作,被选为IEEE Transactions on Image Processing(TIP)期刊发表。TIP是IEEE旗下图像处理研究领域的顶级期刊,是中科院SCI一区期刊,并且是中国计算机学会推荐的计算机图形学与多媒体领域A类期刊(CCF A)。该期刊在2022-2023年的影响因子达到11.041。
以上是网易伏羲在CVPR 2023 UG2+、VizWiz竞赛中夺冠,论文入选TIP的详细内容。更多信息请关注PHP中文网其他相关文章!