搜尋
首頁科技週邊人工智慧整理自動駕駛端到端規劃方法的綜述

整理自動駕駛端到端規劃方法的綜述

Oct 30, 2023 pm 02:45 PM
科技自動駕駛

本文為經自動駕駛之心公眾號授權轉載,轉載請聯絡原文出處

一、Woven Planet(豐田子公司)的方案:Urban Driver 2021

這篇文章雖然是21年的,但許多新的文章都以它為對比基線,因此也有必要了解其方法

整理自動駕駛端到端規劃方法的綜述

整理自動駕駛端到端規劃方法的綜述

大概看了下,主要就是用Policy Gradients學習State->近期action的映射函數,有了這個映射函數,可以一步步推演出整個執行軌跡,最後loss就是讓這個推演給予的軌跡盡可能的接近專家軌跡。

效果應該當時還不錯,因此能成為各家新演算法的基線。

二、南洋理工大學方案一Conditional Predictive Behavior Planning with Inverse Reinforcement Learning 2023.04

整理自動駕駛端到端規劃方法的綜述

先使用規則列舉了多種行為,生成了10~30條軌跡。 (未使用預測結果)
使用Condtional Prediction算出每條主車待選軌跡情況下的預測結果,然後使用IRL對待選軌跡評分。

其中Conditional Joint Prediction模型長這樣:

整理自動駕駛端到端規劃方法的綜述

這個方法基本上很讚的點就是利用了Conditional Joint Prediction可以很好的完成互動性的預測,使得演算法有一定的博弈能力。
但我個人認為演算法缺點是前邊只產生了10~30條軌跡,而且軌跡生成時沒考慮預測,而且最後會直接在IRL打分後,直接選用這些軌跡中的一條作為最終結果,比較容易出現10~30條在考慮預測後發現都不大理想的狀況。相當於要在瘸子裡邊挑將軍,挑出來的也還是瘸子。基於這個方案,再解決前邊待選樣本產生品質會是很不錯的路子

三、英偉達方案:2023.02 Tree-structured Policy Planning with Learned Behavior Models

#用規則樹狀採樣,一層一層的往後考慮,對每一層的每個子結點都產生一個conditional prediction,然後用規則對prediction結果和主車軌跡打分,並用一些規則把不合法的幹掉,然後,利用DP往後產生最優軌跡,DP思路有點類似apollo裡dp_path_optimizer,不過加了一個時間維度。

不過因為多了一個維度,這個後邊擴展次數多了之後,還是會出現解空間很大計算量過大的情況,當前論文裡寫的方法是到節點過多之後,隨機丟棄了一些節點來確保計算量可控(感覺意思是節點過多之後可能也是n層之後了,可能影響比較小了)

本文主要貢獻就是把一個連續解空間通過這種樹形採樣規則轉變一個馬可夫決策過程,然後再利用dp求解。

四、南洋理工大學&英偉達聯合2023年10月最新方案:DTPP: Differentiable Joint Conditional Prediction and Cost Evaluation for Tree Policy Planning in Autonomous Driving

#你看標題就感覺很Exciting:

一、Conditional Prediction確保了一定賽局效果
二、可導,能夠整個梯度回傳,讓預測與IRL一起訓練。也是能拼出一個端對端自動駕駛的必備條件
三、Tree Policy Planning,可能有一定的交互推演能力

#仔細看完,發現這篇文章資訊含量很高,方法很巧妙。

整理自動駕駛端到端規劃方法的綜述

經過對英偉達的TPP和南洋理工的Conditional Predictive Behavior Planning with Inverse Reinforcement Learning進行糅合改進,成功解決了之前南洋理工論文中待選軌跡不好的問題

論文方案的主要模組包括:

一、Conditional Prediction模組,輸入一條主車歷史軌跡提示軌跡障礙車歷史軌跡,給出主車接近提示軌蹟的預測軌跡和與主車行為自洽的障礙車的預測軌跡。
二、評分模組,能夠給一個主車 障礙車軌跡打分看這個軌跡是否像專家的行為,學習方法是IRL。
三、Tree Policy Search模組,用來產生一堆待選軌跡

採用Tree Search演算法來探索主車的可行解,探索過程中每一步都將已經探索出來的軌跡作為輸入,利用Conditional Prediction演算法產生主車和障礙車的預測軌跡,並調用打分模組評估軌跡的優劣,從而影響下一步搜尋擴展節點的方向。透過這種方法,可以產生一些與其他方案不同的主車軌跡,並且在軌跡生成時考慮與障礙車之間的交互

傳統的IRL都是人工搞了一大堆的feature,如前後一堆障礙物在軌跡時間維度上的各種feature(如相對s, l和ttc之類的),本文裡為了讓模型可導,則是直接使用prediction的ego context MLP生成一個Weight數組( size = 1 * C),隱式表徵了主車周圍的環境訊息,然後用MLP直接接把主車軌跡對應多模態預測結果轉成Feature數組(size = C * N, N指的待選軌跡數),然後將兩個矩陣相乘得到最終軌跡評分。然後IRL讓專家得分最高。個人感覺這裡可能是為了計算效率,讓decoder盡可能簡單,還是有一定的主車信息丟失,如果不關注計算效率,可以用一些更複雜一些的網絡連接Ego Context和Predicted Trajectories,應該效果層面會更好?或者如果放棄可導性,這裡還是可以考慮再把人工設定的feature加進去,也應該可以提升模型效果。

在時間方面,該方案採用了一次重編碼 多次輕量化解碼的方法,成功地減少了計算延遲。文章中指出,延遲可以壓縮到98毫秒

在learning based planner中屬於SOTA行列,閉迴路效果接近前一篇文章中提到的nuplan 排第一的Rule Based方案PDM。

總結

看下來,感覺這麼範式是挺不錯的思路,中間具體過程可以自己想辦法調整:

  1. 用預測模型指導一些規則來產生一些待選ego軌跡
  2. 對每個軌跡,用Conditional Joint Prediction做互動式預測,產生agent預測。可以提升博弈效能。
  3. IRL等方法做利用Conditional Joint Prediction結果對前邊的主車軌跡評分,選出最優軌跡

整理自動駕駛端到端規劃方法的綜述

需要重新書寫的內容是:原文連結:https://mp.weixin.qq.com/s/ZJtMU3zGciot1g5BoCe9Ow

以上是整理自動駕駛端到端規劃方法的綜述的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境