首頁 >科技週邊 >人工智慧 >自動駕駛領域的端對端技術是否會取代Apollo、autoware等框架？

自動駕駛領域的端對端技術是否會取代Apollo、autoware等框架？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB轉載: 2024-01-16 08:36:11942瀏覽

Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes

作者單位：百度
作者：共一Jiang-Tian Zhai, Ze Feng，百度王井東組
發表：arXiv
論文連結：https://arxiv.org/abs/2305.10430
程式碼連結：https://github.com/E2E -AD/AD-MLP

關鍵字：端對端自動駕駛，nuScenes 開環評估

1. 摘要

現有的自動駕駛系統通常被分為三個主任務：感知、預測和規劃；規劃任務涉及基於內部意圖和外部環境來預測自車的運動軌跡，並操縱車輛。現有方案大部分在nuScenes 資料集上評估他們的方法，評估指標為L2 error 和碰撞率（collision rate）

本文重新對現有的評價指標做了評估，探索他們是否能夠準確地度量不同方法的優越性。本文也設計了一個 MLP-based 方法，將原始 sensor 資料（歷史軌跡、速度等）作為輸入，直接輸出自車的未來軌跡，不使用任何感知和預測訊息，例如 camera 影像或 LiDAR。令人驚訝的是：這樣一個簡單的方法在 nuScenes 資料集上達到了 SOTA 的 planning 效能，減少了 30% 的 L2 error。我們進一步深入分析，對於 nuScenes 資料集上的規劃任務很重要的因子提供了一些新的見解。我們的觀察也表明，我們需要重新思考 nuScenes 中端到端自動駕駛的開環評測方案。

2. 論文的目的、貢獻及結論

本文希望對nuScenes 上端到端自動駕駛的開環評測方案做評估；不使用視覺和Lidar 的情況下，只使用自車狀態和高級命令（總共21 維的向量）作為輸入就可以在nuScenes 上達到Planning 的SOTA。作者由此指出了nuScenes 上開環評測的不可靠性，給出了兩個分析：nuScenes 資料集上自車軌跡傾向於直行或曲率非常小的曲線；碰撞率的檢測和網格密度相關，並且資料集的碰撞標註也有噪聲，目前評估碰撞率的方法不夠穩健且準確；

#3. 論文的方法

##3.1 簡介及相關工作簡述

現存的自動駕駛模型涉及多個獨立任務，例如感知、預測和規劃。這種設計簡化了跨團隊寫作的難度，但也會因為各個任務的最佳化和訓練的獨立性，導致整個系統的資訊遺失和誤差累積。端到端的方法被提出，這類方法從自車和周圍環境的時空特徵學習中受益。

相關工作：ST-P3[1] 提出一種可解釋的基於視覺的端對端系統，將感知、預測和規劃的特徵學習進行統一。 UniAD[2] 對Planning 任務進行系統化設計，採用基於query 的設計連接中間多個任務，可以對多個任務的關係進行建模和編碼；VAD[3] 以完全向量化的方式對場景進行構建模，不需要稠密的特徵表示，在計算上更有效率。

本文希望探討現有的評估指標是否能準確地測量不同方法的優劣。本文僅使用了自車在行駛中的的物理狀態（現有方法所使用資訊的子集）來進行實驗，而不是使用相機和雷射雷達提供的感知和預測資訊。總之，本文的模型沒有用視覺或點雲特徵的編碼器，直接將自車的物理資訊編碼為一維向量，在 concat 之後送到 MLP 中。訓練使用 GT 軌跡進行監督，模型直接預測自車未來一定時間內的軌跡點。 follow 之前的工作，在nuScenes 資料集上使用L2 Error 和碰撞率（collision rate.）進行評估

雖然模型設計簡單，但獲得了最好的Planning 結果，本文將此歸因於當前評估指標的不足。事實上，透過使用過去的自車軌跡、速度、加速度和時間連續性，就可以在一定程度上反映出自車在未來的運動

##3.2 模型結構

自動駕駛領域的端對端技術是否會取代Apollo、autoware等框架？模型結構總覽