首頁 >科技週邊 >人工智慧 >Think2Drive:首個用於自動駕駛的模型為基礎的RL方法(上海交大)

Think2Drive:首個用於自動駕駛的模型為基礎的RL方法(上海交大)

王林
王林轉載
2024-03-01 16:31:02781瀏覽

在CARLA v2中以專家級的熟練程度運作。

主題:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)

作者單位:上海交通大學

現實世界中的自動駕駛(AD),尤其是城市駕駛,涉及許多corner case。最近發布的AD模擬器CARLA v2在駕駛場景中增加了39個常見事件,並提供了比CARLA v1更接近真實的測試平台。這給社區帶來了新的挑戰,到目前為止,還沒有文獻報告CARLA v2中的新場景取得了任何成功,因為現有的工作大多必須依賴特定規則進行規劃,但它們無法涵蓋CARLA v2中更複雜的情況。這項工作主動直接訓練一個規劃器,希望能夠靈活有效地處理corner case,認為這也是AD的未來方向。據我們所知,我們開發了第一個基於模型的強化學習方法,名為Think2Drive,用於AD,具有一個世界模型來學習環境的轉變,然後它充當神經模擬器來訓練規劃器。這種範式大大提高了訓練效率,因為世界模型中的低維度狀態空間和張量的平行計算。

結果,Think2Drive能夠在單一A6000 GPU上進行3天的訓練後,在CARLA v2中以專家級的熟練程度運行,據我們所知,迄今為止尚未報告有關CARLA v2的成功(100 %的路線完成)。也提出了CornerCase-Repository,這是一個支援透過場景評估駕駛模型的基準。此外,提出了一個新的平衡指標來評估效能,包括路線完成、違規次數和場景密度,以便駕駛分數可以提供更多關於實際駕駛表現的資訊。

實驗結果

Think2Drive:首個用於自動駕駛的模型為基礎的RL方法(上海交大)

Think2Drive:首個用於自動駕駛的模型為基礎的RL方法(上海交大)

########################################### ###歡迎您來到我們的倉庫!這裡涵蓋了眾多技術領域,包括BEV、多模態融合、車輛佔用偵測、毫米波雷達視覺感知、車道線偵測以及3D感知等。我們也分享了關於線上地圖、多感測器校準、Nerf、大型模型、規劃控制和軌跡預測的綜述和論文。希望您喜歡我們的內容,並且不忘star和follow我們的倉庫以獲取更多精彩資訊!感謝您的支持! ##########

以上是Think2Drive:首個用於自動駕駛的模型為基礎的RL方法(上海交大)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除