論文:利用Transformer技術進行鳥瞰攝影機和雷射雷達融合的Lift-Attend-Splat方法
請點擊連結查看文件:https://arxiv.org/pdf/2312.14919.pdf
#對於自動駕駛等安全關鍵應用來說,結合互補的感測器模態是至關重要的。最近的自動駕駛相機-光達融合方法使用單目深度估計來提高感知能力,但相比直接使用光達的深度信息,這是一項困難的任務。我們的研究發現,這種方法並沒有充分利用深度信息,並且證明天真地改進深度估計並不能提高目標檢測性能。令人驚訝的是,完全取消深度估計並不會降低目標檢測性能
這表明,在相機-光達融合過程中,依賴單目深度可能是一個不必要的架構瓶頸。本研究提出了一種新的融合方法,完全繞過了單目深度估計,而是利用簡單的注意力機制在BEV網格中選擇和融合相機和雷射雷達的特徵。研究結果表明,提出的模型能夠根據雷射雷達特徵的可用性來調整其對相機特徵的使用,並且在nuScenes資料集上比基於單目深度估計的基線模型有更好的3D檢測性能
本研究介紹了一種名為「Lift Attented Splat」的新型相機-雷射雷達融合方法。此方法避免了單眼深度估計,而是利用簡單的transformer在BEV中選擇和融合相機和雷射雷達的特性。實驗證明,與基於單目深度估計的方法相比,本研究方法能更好地利用相機,並提高物體偵測效能。本研究的貢獻如下:
- 基於Lift Splat範式的相機-雷射雷達融合方法並沒有像預期的那樣利用深度。特別地,我們表明,如果完全去除單目深度預測,它們的性能相當或更好。
- 本文介紹了一種新的相機-光達融合方法,該方法使用簡單的注意力機制融合純BEV中的相機和光達特徵。論文證明,與基於Lift Splat範式的模型相比,它可以更好地利用相機,並提高3D檢測性能。
主要結構介紹
深度預測的準確度通常較低。透過使用絕對相對誤差(Abs.Rel.)和均方根誤差(RMSE)來對比BEVFusion預測的深度品質與雷射雷達深度圖,可以進行定性和定量分析。如圖1所示,深度預測不能準確反映場景的結構,並且與光達深度圖有明顯差異,這表明單目深度沒有像預期那樣被充分利用。研究也發現,改進深度預測並不能提高物體偵測性能!完全取消深度預測不會對物體檢測性能產生影響
我們提出了一種相機-光達融合方法,該方法完全繞過單目深度估計,而是使用簡單的transformer在鳥瞰圖中融合相機和光達特徵。然而,由於大量的相機和光達特徵以及注意力的二次性,transformer架構很難簡單地應用於相機-雷射雷達融合問題。在BEV中投影相機特徵時,可以使用問題的幾何形狀來大幅限制注意力的範圍,因為相機特徵應該只對沿其對應光線的位置有貢獻。我們將這一想法應用於相機-雷射雷達融合的情況,並介紹了一種簡單的融合方法,該方法使用相機平面中的柱和雷射雷達BEV網格中的極射線之間的交叉注意力!交叉注意力不是預測單目深度,而是在光達特徵沿著其光線提供的背景下,學習哪些相機特徵是最顯著的
我們的模型與基於Lift Splat範式的方法具有相似的整體架構,除了在BEV中投影相機特徵。如下圖所示,它由相機和光達主幹、獨立生成每個模態特徵的模組、將相機特徵嵌入BEV並與光達融合的投影和融合模組以及檢測頭組成。在考慮目標偵測時,模型的最終輸出是場景中目標的屬性,包括位置、維度、方向、速度和分類信息,以3D邊界框的形式表示
Lift Attented Splat相機雷射雷達融合架構如下圖所示。 (左)整體架構:相機和光達主幹的特徵在傳遞到偵測頭之前融合在一起。 (inset)我們的3D投影的幾何結構:「Lift」步驟透過使用雙線性取樣沿z方向提升雷射雷達特徵,將光達BEV特徵嵌入投影地平線。 「splat」步驟對應於逆變換,因為它使用雙線性採樣將特徵從投影的地平線投影回BEV網格,再次沿著z方向!右邊是project模組的細節部分。
實驗結果
#原文連結:https://mp.weixin.qq.com/s/D7xgvrp8633S2SeUfCRFXQ
#以上是全新BEV LV融合方案:超越BEVFusion的Lift-Attend-Splat的詳細內容。更多資訊請關注PHP中文網其他相關文章!

用Microsoft Power BI圖來利用數據可視化的功能 在當今數據驅動的世界中,有效地將復雜信息傳達給非技術觀眾至關重要。 數據可視化橋接此差距,轉換原始數據i

專家系統:深入研究AI的決策能力 想像一下,從醫療診斷到財務計劃,都可以訪問任何事情的專家建議。 這就是人工智能專家系統的力量。 這些系統模仿Pro

首先,很明顯,這種情況正在迅速發生。各種公司都在談論AI目前撰寫的代碼的比例,並且這些代碼的比例正在迅速地增加。已經有很多工作流離失所

從數字營銷到社交媒體的所有創意領域,電影業都站在技術十字路口。隨著人工智能開始重塑視覺講故事的各個方面並改變娛樂的景觀

ISRO的免費AI/ML在線課程:通向地理空間技術創新的門戶 印度太空研究組織(ISRO)通過其印度遙感研究所(IIR)為學生和專業人士提供了絕佳的機會

本地搜索算法:綜合指南 規劃大規模活動需要有效的工作量分佈。 當傳統方法失敗時,本地搜索算法提供了強大的解決方案。 本文探討了爬山和模擬

該版本包括三種不同的型號,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

Chip Giant Nvidia週一表示,它將開始製造AI超級計算機(可以處理大量數據並運行複雜算法的機器),完全是在美國首次在美國境內。這一消息是在特朗普總統SI之後發布的


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

Atom編輯器mac版下載
最受歡迎的的開源編輯器

Dreamweaver CS6
視覺化網頁開發工具

Dreamweaver Mac版
視覺化網頁開發工具