向量化高清(HD)地圖建構需要預測地圖元素的類別和點座標(例如道路邊界、車道分隔帶、行人穿越道等)。現有技術的方法主要基於點級表示學習,用於回歸精確的點座標。然而,這種pipeline在獲得element-level資訊和處理element-level故障方面具有局限性,例如錯誤的element 形狀或element之間的糾纏。為了解決上述問題,本文提出了一個簡單而有效的HybrId框架,命名為HIMap,以充分學習和交互點級和element級資訊。
具體來說,引入了一種稱為HIQuery的混合表示來表示所有地圖元素,並提出了一種點element交互器來交互式地提取元素的混合信息,如點位置和element形狀,並將其編碼到HIQuery。此外,也提出了點-element一致性約束,以增強點級和element級資訊之間的一致性。最後,整合HIQuery的輸出點元素可以直接轉換為地圖元素的類別、點座標和遮罩。在nuScenes和Argoverse2資料集上進行了廣泛的實驗,結果顯示始終優於先前的方法。值得注意的是,在nuScenes資料集上方法實現了77.8mAP ,顯著優於以前的SOTA至少8.3 mAP!
論文名稱:HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map Construction
論文連結:https://arxiv.org/pdf/2403.08639.pdf
HIMap首先引入一種稱為HIQuery的混合表示來表示地圖中的所有地圖元素。它是一組可學習的參數,可以透過與BEV特徵互動來迭代更新和細化。然後,設計了一個多層混合解碼器,將地圖元素的混合訊息(如點位置、元素形狀)編碼到HIQuery中,並進行點元素交互,見圖2。混合解碼器的每一層包括點元素互動器、自關注和FFN。在點元交互器內部,執行了一個相互交互機制,以實現點級和元素級資訊的交換,避免單級資訊的學習偏差。最終,整合HIQuery的輸出點元素可以直接轉換為元素的點座標、類別和掩碼。此外,也提出了點-元素一致性約束,以加強點級和元素級資訊之間的一致性。
HIMap框架一覽#
HIMap的整體流程如圖3(a)所示。 HIMap能夠與多種機載感測器資料相容,例如來自多視圖相機的RGB影像、雷射雷達的點雲或多模態資料。這裡以多視圖RGB影像為例來解釋HIMap的工作原理。
BEV特徵擷取器是用於從多視圖RGB影像中擷取BEV特徵的工具。它的核心包括從每個透視圖中提取多尺度2D特徵的主幹部分,透過融合和細化多尺度特徵得到單一尺度特徵的FPN部分,以及利用2D到BEV特徵轉換模組將2D特徵映射為BEV特徵。這個過程有助於將影像資訊轉換為更適合用於處理和分析的BEV特徵,提高了特徵的可用性和準確性。透過這種方法,我們能夠更好地理解和利用多視圖影像中的信息,為後續的資料處理和決策提供更有力的支援。
HIQuery:為了充分學習地圖元素的點級和元素級訊息,引入HIQuery來表示地圖中的所有元素!
混合解碼器:混合解碼器透過將HIQuery Qh與BEV特徵X迭代互動來產生整合的HIQuery。
點元素互動器的目標是互動式地提取地圖元素的點級和元素級資訊並將其編碼到HIQuery中。兩個層次的資訊相互作用的動機來自於它們的互補性。點級資訊包含局部位置知識,而元素級資訊提供整體形狀和語意知識。因此,此交互作用使得能夠對地圖元素的局部資訊和整體資訊進行相互細化。
考慮到點級表示和元素級表示之間的原始差異,它們分別關注局部訊息和整體訊息,兩級表示的學習也可能相互幹擾。這將增加資訊互動的難度,降低資訊互動的有效性。因此,引入了點元素一致性約束,以增強每個點級別和元素級別資訊之間的一致性,元素的可分辨性也可以加強!
實驗結果對比
論文在NuScenes Dataset和Argoverse2 Dataset上進行了實驗!
在nuScenes val-set上的SOTA模型進行比較:
與Argoverse2 val set上的SOTA模型比較:
#與nuScenes驗證集多模態資料下SOTA模型比較:
#更多消融實驗:
以上是優於所有方法! HIMap:端到端向量化HD地圖構建的詳細內容。更多資訊請關注PHP中文網其他相關文章!

利用“設備” AI的力量:建立個人聊天機器人CLI 在最近的過去,個人AI助手的概念似乎是科幻小說。 想像一下科技愛好者亞歷克斯(Alex)夢見一個聰明的本地AI同伴 - 不依賴

他們的首屆AI4MH發射於2025年4月15日舉行,著名的精神科醫生兼神經科學家湯姆·因斯爾(Tom Insel)博士曾擔任開幕式演講者。 Insel博士因其在心理健康研究和技術方面的傑出工作而聞名

恩格伯特說:“我們要確保WNBA仍然是每個人,球員,粉絲和公司合作夥伴,感到安全,重視和授權的空間。” anno

介紹 Python擅長使用編程語言,尤其是在數據科學和生成AI中。 在處理大型數據集時,有效的數據操作(存儲,管理和訪問)至關重要。 我們以前涵蓋了數字和ST

潛水之前,一個重要的警告:AI性能是非確定性的,並且特定於高度用法。簡而言之,您的里程可能會有所不同。不要將此文章(或任何其他)文章作為最後一句話 - 目的是在您自己的情況下測試這些模型

建立杰出的AI/ML投資組合:初學者和專業人士指南 創建引人注目的投資組合對於確保在人工智能(AI)和機器學習(ML)中的角色至關重要。 本指南為建立投資組合提供了建議

結果?倦怠,效率低下以及檢測和作用之間的差距擴大。這一切都不應該令任何從事網絡安全工作的人感到震驚。 不過,代理AI的承諾已成為一個潛在的轉折點。這個新課

直接影響與長期夥伴關係? 兩週前,Openai提出了強大的短期優惠,在2025年5月底之前授予美國和加拿大大學生免費訪問Chatgpt Plus。此工具包括GPT-4O,A A A A A


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

Dreamweaver Mac版
視覺化網頁開發工具

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。