2月17日消息,毫末智行宣布自動駕駛認知大模型正式升級為DriveGPT,並將在2023年4月的HAOMOAI DAY上公佈其最新重要進展。
隨著ChatGPT火爆全網,它所採用的Transformer大模型以及「人類回饋強化學習(RLHF)」技術再次引發業界關注。在自動駕駛領域,毫末在國內最早將Transformer大模型引進到資料智慧體系MANA當中。在2023年1月的HAOMO AI DAY上,毫末智行CEO顧維灝介紹,毫末推出的人駕自監督認知大模型就已藉鑑了ChatGPT的實現思路,採用RLHF(人類反饋強化學習)技術,通過引入真實人駕接手數據,持續優化自動駕駛認知決策模型。
毫末的認知決策演算法經歷了三個階段的演化。第一階段是引入個別場景的端對端模仿學習,直接擬合人駕行為。第二階段是透過認知大模型,引入海量正常人駕數據,透過Prompt的方式實現認知決策的可控、可解釋。第三階段,也就是當前階段,透過引入真實接管數據,並且在大模型中開始嘗試使用RLHF演算法,對人駕接管數據進行學習。為此,毫末建構了一個包含「舊策略、接管策略、人工label策略」的Pairwise排序模型。基於這個排序模型,毫末建構了自動駕駛決策的獎勵模型(rewardmodel),從而在各種規劃情境情境中做出最優的決策。透過這個大模型,在掉頭、環島等公認的困難場景中,場景通過率提升30%以上。
2月17日,毫末智行將人駕自監督認知大模型正式升級為“DriveGPT”,這也是全球首個自動駕駛認知大模型。目前,毫末DriveGPT已完成模型建置和第一階段資料的跑通,參數規模可對標GPT-2的水平。接下來,DriveGPT將持續引入大規模真實接管數據,透過人駕數據回饋的強化學習,來不斷提升評估效果,同時也將DriveGPT作為雲端測評模型,用來評估車端小模型的駕駛效果。毫末DriveGPT最新重要進展,將在2023年4月舉行的第八屆HAOMO AI DAY上公佈。
以上是毫末智行:自動駕駛認知大模型正式升級為DriveGPT的詳細內容。更多資訊請關注PHP中文網其他相關文章!