搜尋
首頁科技週邊人工智慧最新的目標偵測的深度架構 參數少一半、速度快3倍+

簡單介紹

研究作者提出了 Matrix Net (xNet),一種用於目標偵測的新深度架構。 xNets將具有不同大小尺寸和縱橫比的目標映射到網路層中,其中目標在層內的大小和縱橫比幾乎是均勻的。因此,xNets提供了一種尺寸和縱橫比感知結構。研究者利用xNets增強基於關鍵點的目標偵測。新的架構實現了比任何其他單鏡頭偵測器的時效性高,具有47.8的mAP在MS COCO資料集,同時使用了一半的參數而且相比於第二好框架,其在訓練上快了3倍。

簡單結果展示

最新的目標偵測的深度架構 參數少一半、速度快3倍+

上圖所示,xNet的參數及效率要遠遠超過其它模型。其中FSAF在基於錨點的偵測器中效果是最好的,它超過了經典的RetinaNet。研究者提出的模型在參數量類似的情況下表現超過了所有其他single-shot架構。

背景及現狀

目標偵測是電腦視覺中最廣泛研究的任務之一,具有許多應用到其他視覺任務,如目標追蹤、實例分割和圖片字幕。目標偵測結構可分為兩類:single-shot偵測器two-stage偵測器。 Two-stage偵測器利用區域候選網路找到固定數量的目標候選,然後使用第二個網路來預測每個候選的分數並改善其邊界框。

常見的Two-stage演算法

最新的目標偵測的深度架構 參數少一半、速度快3倍+

#Single-shot偵測器也可以分為兩類:基於錨定的偵測器和基於關鍵點的偵測器。基於錨的偵測器包含許多錨點​​邊界框,然後預測每個模板的偏移量和類別。最著名的基於錨的體系結構是RetinaNet,它提出了focal損失函數,以幫助修正錨定邊界框的類別不平衡。性能最好的基於錨的探測器是FSAF。 FSAF將錨基輸出與無錨輸出頭整合在一起,以進一步提高效能。

另一方面,基於關鍵點的偵測器可以預測左上角和右下角的熱圖,並使用特徵嵌入將它們匹配起來。最初的基於關鍵點的偵測器是CornerNet,它利用一個特殊的coener池化層來準確地偵測不同大小的目標。從那時起,Centerne透過預測目標中心和角,大幅改進了CornerNet體系結構。

Matrix Nets

下圖所示為Matrix nets(xNets),使用分層矩陣建模具有不同大小和叢橫比的目標,其中矩陣中的每個條目i、j 表示一個層li,j,矩陣左上角層l1,1 中寬度降採樣2^(i-1),高度降採樣2^(j-1)。對角線層是不同大小的方形層,相當於一個 FPN,而非對角層是長方形層(這是xNets所特有的)。 層l1,1是最大的層,每向右一步,層寬度減半,而每向下一步高度減半。

最新的目標偵測的深度架構 參數少一半、速度快3倍+

例如,層l3,4是層l3,3寬度的一半。對角層建模寬高比接近方形的目標,而非對角層建模寬高比不接近方形的目標。接近矩陣右上角或左下角的層建模寬高比極高或極低的目標。這類目標非常罕見,所以可以將它們剪枝以提升效率。

1、Layer Generation

產生矩陣層是一個關鍵的步驟,因為它會影響模型參數的數量。參數越多,模型表達越強,優化問題越困難,因此研究者選擇盡可能少引入新的參數。對角線層可以從主幹的不同階段獲得,也可以使用特徵金字塔框架。上三角層是在對角線層上施加一系列具有1x2步長的共享3x3卷積得到的。類似地,左下角層是使用具有2x1步長的共享3x3卷積得到的。參數在所有下採樣卷積之間共享,以最小化新參數的數量。

2、層範圍

矩陣中的每個層都對具有一定寬度和高度的目標進行建模,因此我們需要定義分配給矩陣中每個層的目標的寬度和高度範圍。範圍需要反映矩陣層特徵向量的感受野。矩陣中向右的每一步都有效地使水平維度中的感受野加倍,而每一步都使垂直維度上的感受場加倍。因此,當我們在矩陣中向右或向下移動時,寬度或高度的範圍需要加倍。一旦定義了第一層l1,1的範圍,我們就可以使用上述規則為矩陣層的其餘部分產生範圍。

3、Matrix Nets的優點

Matrix Nets的主要優點是它們允許方形卷積核準確地收集有關不同縱橫比的資訊。在傳統的目標偵測模型中,如RetinaNet,需要一個方形卷積核來輸出不同的長寬比和尺度。這與直覺相反,因為不同方面的邊界框需要不同的背景。在Matrix Nets中,由於每個矩陣層的上下文發生變化,因此相同的方形卷積核可以用於不同比例和長寬比的邊界框。

由於目標大小在其指定的層內幾乎是均勻的,因此與其他架構(例如FPN)相比,寬度和高度的動態範圍更小。因此,回歸目標的高度和寬度將變得更容易優化問題。最後Matrix Nets可用作任何目標檢測架構、基於錨或基於關鍵點、one-shot或two-shots檢測器。

Matrix Nets 用於基於關鍵點的偵測

在CornerNet被提出來的時候,其是為了替代基於錨點的檢測,它利用一對角(左上角和右下角)來預測邊界框。對於每個角落來說,CornerNet可預測熱圖、偏移量和嵌入。 最新的目標偵測的深度架構 參數少一半、速度快3倍+

上圖是基於關鍵點的目標偵測框架- KP-xNet,它包含4個步驟。

  • (a-b):使用了xNet的主幹;
  • (c):使用了共享輸出子網絡,而針對每個矩陣層,預測了左上角和右下角的熱圖和偏移量,並在目標層內對它們進行中心點預測;
  • (d):利用中心點預測匹配同一層中的角,然後將所有層的輸出與soft非極大值抑制結合,從而得到最終輸出。

實驗結果

下表展示了在MS COCO資料集上的結果:

最新的目標偵測的深度架構 參數少一半、速度快3倍+

研究者也比較了新提出的模型與其他模型在不同的backbones上基於參數的數量。在第一張圖中,我們發現KP-xNet在所有參數層級上都優於所有其他結構。研究者認為這是因為KP-xNet使用了一種尺度和縱橫比感知的體系結構。

論文網址:https://arxiv.org/pdf/1908.04646.pdf

#

以上是最新的目標偵測的深度架構 參數少一半、速度快3倍+的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
烹飪創新:人工智能如何改變食品服務烹飪創新:人工智能如何改變食品服務Apr 12, 2025 pm 12:09 PM

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

Python名稱空間和可變範圍的綜合指南Python名稱空間和可變範圍的綜合指南Apr 12, 2025 pm 12:00 PM

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

視覺語言模型(VLMS)的綜合指南視覺語言模型(VLMS)的綜合指南Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容Apr 12, 2025 am 11:52 AM

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

生成的AI遇到心理摩托車生成的AI遇到心理摩托車Apr 12, 2025 am 11:50 AM

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

原型:科學家將紙變成塑料原型:科學家將紙變成塑料Apr 12, 2025 am 11:49 AM

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

AI分析師的崛起:為什麼這可能是AI革命中最重要的工作AI分析師的崛起:為什麼這可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器