搜尋
首頁科技週邊人工智慧Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

arXiv論文“Graph-DETR3D: Rethinking Overlapping Regions for Multi-View 3D Object Detection“,22年6月,中科大、哈工大和商湯科技的工作。

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

從多個影像視圖中偵測3-D目標是視覺場景理解的一項基本而富有挑戰性的任務。由於其低成本和高效率,多視圖3-D目標偵測顯示出了廣泛的應用前景。然而,由於缺乏深度訊息,透過3-D空間中的透視圖去精確檢測目標,極為困難。最近,DETR3D引入一種新的3D-2D query範式,用於聚合多視圖影像以進行3D目標檢測,並實現了最先進的性能。

本文透過密集的引導性實驗,量化了位於不同區域的目標,並發現「截斷實例」(即每個影像的邊界區域)是阻礙DETR3D效能的主要瓶頸。儘管在重疊區域中合併來自兩個相鄰視圖的多個特徵,但DETR3D仍然存在特徵聚合不足的問題,因此錯過了充分提高檢測性能的機會。

為了解決這個問題,提出Graph-DETR3D,透過圖結構學習(GSL)自動聚合多視圖影像資訊。在每個目標查詢和2-D特徵圖之間建立動態3D圖,以增強目標表示,尤其是在邊界區域。此外,Graph-DETR3D得益於一種新的深度不變(depth-invariant)多尺度訓練策略,其透過同時縮放影像大小和目標深度來保持視覺深度的一致性。

Graph-DETR3D的差異在於兩點,如圖所示:(1)動態圖特徵的聚合模組;(2)深度不變的多尺度訓練策略。它遵循DETR3D的基本結構,由三個組件組成:影像編碼器、transformer解碼器和目標預測頭。給定一組影像I={I1,I2,…,IK}(由N個週視攝影機捕捉),Graph-DETR3D旨在預測感興趣邊框的定位和類別。首先用影像編碼器(包括ResNet和FPN)將這些影像變成一組相對L個特徵圖級的特徵F。然後,建立一個動態3-D圖,透過動態圖特徵聚合(dynamic graph feature aggregation,DGFA)模組廣泛聚合2-D信息,優化目標查詢的表示。最後,利用增強的目標查詢輸出最終預測。

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

如圖顯示動態圖特徵聚合(DFGA)流程:首先為每個目標查詢建構一個可學習的3-D圖,然後從2-D影像平面採樣特徵。最後,透過圖連接(graph connections)增強了目標查詢的表示。這種相互連接的訊息傳播(message propagation)方案支援對圖結構構造和特徵增強的迭代細化方案。

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

多尺度訓練是2D和3D目標偵測任務中常用的資料增強策略,經證明有效且推理成本低。然而,它很少出現在基於視覺的3-D檢測方法中。考慮到不同輸入影像大小可以提高模型的穩健性,同時調整影像大小和修改攝影機內參來實現普通多尺度訓練策略。

一個有趣的現像是,最終的效能急劇下降。透過仔細分析輸入數據,發現簡單地重新縮放影像會導致透視-多義問題:當目標調整到較大/較小的比例時,其絕對屬性(即目標的大小、到ego point的距離)不會改變。

作為一個具體範例,如圖顯示這個多義問題:儘管(a)和(b)中所選區域的絕對3D位置相同,但影像像素的數量不同。深度預測網路傾向於基於影像的佔用面積來估計深度。因此,圖中的這種訓練模式可能會讓深度預測模型糊塗,並進一步惡化最終表現。

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

為此從像素透視重新計算深度。演算法偽代碼如下:

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

如下是解碼運算:

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

重新計算的像素大小是:

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

假設尺度因子r = rx = ry,則簡化得到:

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

實驗結果如下:

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考

註:DI = Depth-Invariant

#

以上是Graph-DETR3D: 在多視角3D目標偵測中對重疊區域再思考的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介紹 假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率,並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

生成AI的3種方法放大了企業家:當心平均值!生成AI的3種方法放大了企業家:當心平均值!Apr 15, 2025 am 11:33 AM

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大語言模型(LLM)中的幻覺是不可避免的嗎?大語言模型(LLM)中的幻覺是不可避免的嗎?Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

60%的問題 -  AI搜索如何消耗您的流量60%的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中