搜尋
首頁科技週邊人工智慧全新BEV LV融合方案:超越BEVFusion的Lift-Attend-Splat

論文:利用Transformer技術進行鳥瞰攝影機和雷射雷達融合的Lift-Attend-Splat方法

請點擊連結查看文件:https://arxiv.org/pdf/2312.14919.pdf

#對於自動駕駛等安全關鍵應用來說,結合互補的感測器模態是至關重要的。最近的自動駕駛相機-光達融合方法使用單目深度估計來提高感知能力,但相比直接使用光達的深度信息,這是一項困難的任務。我們的研究發現,這種方法並沒有充分利用深度信息,並且證明天真地改進深度估計並不能提高目標檢測性能。令人驚訝的是,完全取消深度估計並不會降低目標檢測性能

這表明,在相機-光達融合過程中,依賴單目深度可能是一個不必要的架構瓶頸。本研究提出了一種新的融合方法,完全繞過了單目深度估計,而是利用簡單的注意力機制在BEV網格中選擇和融合相機和雷射雷達的特徵。研究結果表明,提出的模型能夠根據雷射雷達特徵的可用性來調整其對相機特徵的使用,並且在nuScenes資料集上比基於單目深度估計的基線模型有更好的3D檢測性能

本研究介紹了一種名為「Lift Attented Splat」的新型相機-雷射雷達融合方法。此方法避免了單眼深度估計,而是利用簡單的transformer在BEV中選擇和融合相機和雷射雷達的特性。實驗證明,與基於單目深度估計的方法相比,本研究方法能更好地利用相機,並提高物體偵測效能。本研究的貢獻如下:

  1. 基於Lift Splat範式的相機-雷射雷達融合方法並沒有像預期的那樣利用深度。特別地,我們表明,如果完全去除單目深度預測,它們的性能相當或更好。
  2. 本文介紹了一種新的相機-光達融合方法,該方法使用簡單的注意力機制融合純BEV中的相機和光達特徵。論文證明,與基於Lift Splat範式的模型相比,它可以更好地利用相機,並提高3D檢測性能。

主要結構介紹

深度預測的準確度通常較低。透過使用絕對相對誤差(Abs.Rel.)和均方根誤差(RMSE)來對比BEVFusion預測的深度品質與雷射雷達深度圖,可以進行定性和定量分析。如圖1所示,深度預測不能準確反映場景的結構,並且與光達深度圖有明顯差異,這表明單目深度沒有像預期那樣被充分利用。研究也發現,改進深度預測並不能提高物體偵測性能!完全取消深度預測不會對物體檢測性能產生影響

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

我們提出了一種相機-光達融合方法,該方法完全繞過單目深度估計,而是使用簡單的transformer在鳥瞰圖中融合相機和光達特徵。然而,由於大量的相機和光達特徵以及注意力的二次性,transformer架構很難簡單地應用於相機-雷射雷達融合問題。在BEV中投影相機特徵時,可以使用問題的幾何形狀來大幅限制注意力的範圍,因為相機特徵應該只對沿其對應光線的位置有貢獻。我們將這一想法應用於相機-雷射雷達融合的情況,並介紹了一種簡單的融合方法,該方法使用相機平面中的柱和雷射雷達BEV網格中的極射線之間的交叉注意力!交叉注意力不是預測單目深度,而是在光達特徵沿著其光線提供的背景下,學習哪些相機特徵是最顯著的

我們的模型與基於Lift Splat範式的方法具有相似的整體架構,除了在BEV中投影相機特徵。如下圖所示,它由相機和光達主幹、獨立生成每個模態特徵的模組、將相機特徵嵌入BEV並與光達融合的投影和融合模組以及檢測頭組成。在考慮目標偵測時,模型的最終輸出是場景中目標的屬性,包括位置、維度、方向、速度和分類信息,以3D邊界框的形式表示

Lift Attented Splat相機雷射雷達融合架構如下圖所示。 (左)整體架構:相機和光達主幹的特徵在傳遞到偵測頭之前融合在一起。 (inset)我們的3D投影的幾何結構:「Lift」步驟透過使用雙線性取樣沿z方向提升雷射雷達特徵,將光達BEV特徵嵌入投影地平線。 「splat」步驟對應於逆變換,因為它使用雙線性採樣將特徵從投影的地平線投影回BEV網格,再次沿著z方向!右邊是project模組的細節部分。

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

實驗結果

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

#原文連結:https://mp.weixin.qq.com/s/D7xgvrp8633S2SeUfCRFXQ

#

以上是全新BEV LV融合方案:超越BEVFusion的Lift-Attend-Splat的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
在LLMS中調用工具在LLMS中調用工具Apr 14, 2025 am 11:28 AM

大型語言模型(LLMS)的流行激增,工具稱呼功能極大地擴展了其功能,而不是簡單的文本生成。 現在,LLM可以處理複雜的自動化任務,例如Dynamic UI創建和自主a

多動症遊戲,健康工具和AI聊天機器人如何改變全球健康多動症遊戲,健康工具和AI聊天機器人如何改變全球健康Apr 14, 2025 am 11:27 AM

視頻遊戲可以緩解焦慮,建立焦點或支持多動症的孩子嗎? 隨著醫療保健在全球範圍內挑戰,尤其是在青年中的挑戰,創新者正在轉向一種不太可能的工具:視頻遊戲。現在是世界上最大的娛樂印度河之一

沒有關於AI的投入:獲勝者,失敗者和機遇沒有關於AI的投入:獲勝者,失敗者和機遇Apr 14, 2025 am 11:25 AM

“歷史表明,儘管技術進步推動了經濟增長,但它並不能自行確保公平的收入分配或促進包容性人類發展,”烏托德秘書長Rebeca Grynspan在序言中寫道。

通過生成AI學習談判技巧通過生成AI學習談判技巧Apr 14, 2025 am 11:23 AM

易於使用,使用生成的AI作為您的談判導師和陪練夥伴。 讓我們來談談。 對創新AI突破的這種分析是我正在進行的《福布斯》列的最新覆蓋範圍的一部分,包括識別和解釋

泰德(Ted)從Openai,Google,Meta透露出庭,與我自己自拍泰德(Ted)從Openai,Google,Meta透露出庭,與我自己自拍Apr 14, 2025 am 11:22 AM

在溫哥華舉行的TED2025會議昨天在4月11日舉行了第36版。它的特色是來自60多個國家 /地區的80個發言人,包括Sam Altman,Eric Sc​​hmidt和Palmer Luckey。泰德(Ted)的主題“人類重新構想”是量身定制的

約瑟夫·斯蒂格利茲(Joseph Stiglitz約瑟夫·斯蒂格利茲(Joseph StiglitzApr 14, 2025 am 11:21 AM

約瑟夫·斯蒂格利茨(Joseph Stiglitz)是2001年著名的經濟學家,是諾貝爾經濟獎的獲得者。斯蒂格利茨認為,AI可能會使現有的不平等和合併權力惡化,並在一些主導公司手中加劇,最終破壞了經濟上的經濟。

什麼是圖形數據庫?什麼是圖形數據庫?Apr 14, 2025 am 11:19 AM

圖數據庫:通過關係徹底改變數據管理 隨著數據的擴展及其特徵在各個字段中的發展,圖形數據庫正在作為管理互連數據的變革解決方案的出現。與傳統不同

LLM路由:策略,技術和Python實施LLM路由:策略,技術和Python實施Apr 14, 2025 am 11:14 AM

大型語言模型(LLM)路由:通過智​​能任務分配優化性能 LLM的快速發展的景觀呈現出各種各樣的模型,每個模型都具有獨特的優勢和劣勢。 有些在創意內容gen上表現出色

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具