首頁 >科技週邊 >人工智慧 >清華接手，YOLOv10問世：效能大幅提升，登上GitHub熱門榜

清華接手，YOLOv10問世：效能大幅提升，登上GitHub熱門榜

王林原創: 2024-06-06 12:20:451627瀏覽

目標偵測系統的標竿 YOLO 系列，再次獲得了重磅升級。

自今年 2 月 YOLOv9 發布之後， YOLO（You Only Look Once）系列的接力棒傳到了清華大學研究人員的手上。

上週末，YOLOv10推出的消息引發了AI界的關注。它被認為是電腦視覺領域的突破性框架，以其即時的端到端目標檢測能力而聞名，透過提供結合效率和準確性的強大解決方案，延續了YOLO系列的傳統。

清華接手，YOLOv10問世：效能大幅提升，登上GitHub熱門榜

論文網址：https://arxiv.org/pdf/2405.14458

計畫網址： https://github.com/THU-MIG/yolov10

新版本發布之後，很多人已經進行了部署測試，效果不錯：

清華接手，YOLOv10問世：效能大幅提升，登上GitHub熱門榜

#YOLO 因為效能強大、消耗算力較少，一直以來都是即時目標偵測領域的主要範式。該框架被廣泛用於各種實際應用，包括自動駕駛、監控和物流。其高效、準確的物體檢測能力使其成為即時識別行人和車輛等任務的理想選擇；在物流方面，它有助於庫存管理和包裹跟踪，透過 AI 能力幫助人們在許多工作上提高了效率。

幾年來，研究人員對 YOLO 的架構設計、最佳化目標、資料增強策略等進行了探索，取得了顯著進展。然而，後處理對非極大值抑制（NMS）的依賴阻礙了 YOLO 的端對端部署，並對推理延遲產生不利影響。此外，YOLO 中各個組件的設計缺乏全面徹底的檢查，導致明顯的計算冗餘並限制了模型的能力。

YOLOv10 的突破就在於從後處理和模型架構方面進一步提升了 YOLO 的效能 - 效率邊界。

為此，研究團隊首次提出了YOLO 無NMS 訓練的一致雙重分配（consistent dual assignment），這使得YOLO 在性能和推理延遲方面有所改進。

研究團隊為YOLO 提出了整體效率- 準確率驅動的模型設計策略，從效率和準確率兩個角度全面優化YOLO 的各個組件，大大降低了計算開銷並增強了模型能力。

大量實驗表明，YOLOv10 在各種模型規模上都實現了 SOTA 性能和效率。例如，YOLOv10-S 在 COCO 上的類似 AP 下比 RT-DETR-R18 快 1.8 倍，同時參數數量和 FLOP 大幅減少。與 YOLOv9-C 相比，在效能相同的情況下，YOLOv10-B 的延遲減少了 46%，參數減少了 25%。

清華接手，YOLOv10問世：效能大幅提升，登上GitHub熱門榜

方法介紹

#為了實現整體效率- 準確率驅動的模型設計，研究團隊從效率、準確率兩方面分別提出改進方法。

為了提高效率，研究提出了輕量級分類head、空間通道（spatial-channel）解耦下採樣和排序指導的區塊設計，以減少明顯的計算冗餘餘並實現更有效率的架構。

為了提高準確率，研究團隊探索了大核卷積並提出了有效的部分自註意力（partial self-attention，PSA）模組來增強模型能力，在低成本下挖掘性能改進的潛力。基於這些方法，團隊成功實現了一系列不同規模的即時端對端偵測器，即 YOLOv10-N / S / M / B / L / X。

用於無NMS 訓練的一致雙重分配

#在訓練期間，YOLO 通常利用TAL 為每個實例分配多個正樣本。一對多的分配方式產生了豐富的監督訊號，促進了最佳化並使模型實現了卓越的性能。

然而，這需要 YOLO 依賴 NMS 後處理，這導致了部署時次優的推理效率。雖然先前的研究工作探索了一對一匹配來抑制冗餘預測，但它們通常引入了額外的推理開銷。

與一對多分配不同，一對一配對對每個 ground truth 僅分配一個預測，避免 NMS 後處理。然而，這會導致弱監督，以至於準確率和收斂速度不理想。幸運的是，這種缺陷可以透過一對多分配來彌補。

本研究提出的「雙標籤分配」結合了上述兩種策略的優點。如下圖所示，該研究為 YOLO 引入了另一個一對一 head。它保留了與原始一對多分支相同的結構並採用相同的最佳化目標，但利用一對一匹配來獲取標籤分配。在訓練過程中，兩個 head 聯合優化，以提供豐富的監督；在推理過程中，YOLOv10 會丟棄一對多 head 並利用一對一 head 做出預測。這使得 YOLO 能夠進行端對端部署，而不會產生任何額外的推理成本。

清華接手，YOLOv10問世：效能大幅提升，登上GitHub熱門榜