最近,CVPR 2023的比賽結果公佈了。網易伏羲實驗室在CVPR 2023的UG2 霧霾目標辨識挑戰賽和VizWiz少樣本目標辨識挑戰賽中取得了第一名的好成績。他們的相關論文也被國際頂尖期刊TIP錄用。這顯示了網易伏羲在電腦視覺領域的頂尖技術創新能力,並獲得了國際性的高度認可。
2023年2月至6月,IEEE/CVF Computer Vision and Pattern Recognition Conference(CVPR)作為國際電腦視覺與模式識別領域的頂級會議,與全球權威學術機構和知名企業合作,舉辦了多項挑戰賽。這些挑戰賽吸引了許多AI研究團隊的廣泛參與。近日,CVPR陸續公佈了獲獎結果,並頒發了獲獎證書。 CVPR作為IEEE主辦的頂尖AI學術會議,具有極高的學術影響力和社會認可。
在CVPR 2023 UG2 Object Detection in Haze Challenge(霧霾目標辨識挑戰賽)與CVPR 2023 VizWiz Few-Shot Object Recognition Challenge(少樣本目標辨識挑戰賽)兩場賽事中,網易伏羲與中國科學技術大學於俊老師團隊合作並取得了第一名的成績。這次合作主要集中在電腦視覺領域的目標檢測和少樣本目標識別兩個面向。這些技術可以廣泛應用於各領域的視覺任務。特別是在工業應用中,少樣本目標檢測在資料取得和標註困難的場景下具有重要的價值和意義。透過這次比賽的成功,我們展現了網易伏羲在電腦視覺領域的研究實力和創新能力。我們將繼續致力於推動電腦視覺技術的發展,為實際應用提供更準確和高效的解決方案。
UG2 的目標是透過應用影像復原和增強演算法來提高分析效能,從而推進對於「困難」影像的分析。參賽者的任務是開發新的演算法,以改進在問題條件下捕獲的影像的分析能力。 VizWiz的目標是讓更多人了解視力障礙患者的技術需求和興趣,並鼓勵人工智慧研究人員開發新演算法來消除無障礙障礙。比賽通常包括識別圖像中的物體、識別圖像中的文字以及回答關於圖像的問題等任務。以下是網易伏羲本次獲獎論文的簡要概述:
用於無監督異常檢測的全頻通道選擇表示方法
Omni-frequency Channel-selection Representations for Unsupervised Anomaly Detection
關鍵字:無監督影像異常偵測
異常偵測在視覺影像理解中扮演重要角色,用於判斷給定影像是否偏離預設的正常狀態。它在新穎性檢測、基於工業影像的產品品質監控、缺陷自動修復、人體健康監測和視訊監控等領域廣泛應用。目前主要存在三類主流的無監督異常檢測方法,包括基於密度的方法、基於分類的方法和基於重建的方法。這些方法透過分析影像的統計特徵、學習正常樣本和重建影像來實現異常檢測,為各種應用提供了可靠的工具和技術支援。
其中,基於重構的方法由於重構能力差、表現不高而很少被提及,但其不需要額外花費大量的訓練樣本進行無監督訓練,在工業應用上更加實用。為此,本研究著重改進基於重構的方法,提出了一種全新的全頻通道選擇重建網路(OCR-GAN),首創從頻率的角度處理感官異常檢測任務。大量的實驗證明了該方法相對於其他方法的有效性和優越性。例如,在沒有額外訓練資料的情況下,在MVTec AD資料集上實現了新SOTA表現,AUC達到98.3,顯著超過了基於重建的方法基線38.1和當前SOTA方法0.3。
論文提出了一種創新解決方案來解決智慧遊戲相容性測試中的UI異常問題。此解決方案利用人工智慧技術自動化檢測遊戲運行時出現的UI異常問題,以實現遊戲相容性測試的自動化。透過採用影像異常檢測技術,從電腦視覺的角度對生成的大量遊戲介面截圖進行自動化檢測,從中獲取UI異常圖片,並輔助遊戲開發人員快速、準確地定位問題的原因,從而有效地節省了遊戲測試專家的人力成本。
本論文與浙江大學劉勇老師團隊合作,被選為IEEE Transactions on Image Processing(TIP)期刊發表。 TIP是IEEE旗下影像處理研究領域的頂尖期刊,為中科院SCI一區期刊,並且是中國電腦學會推薦的電腦圖形學與多媒體領域A類期刊(CCF A)。該期刊在2022-2023年的影響因子達到11.041。
以上是網易伏羲在CVPR 2023 UG2+、VizWiz競賽中奪冠,論文入選TIP的詳細內容。更多資訊請關注PHP中文網其他相關文章!