ホームページ  >  記事  >  テクノロジー周辺機器  >  Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

王林
王林転載
2024-03-01 16:31:02679ブラウズ

CARLA v2 ではエキスパートレベルの習熟度で実行できます。

タイトル: Think2Drive: 準現実的な自動運転のための潜在世界モデルで考えることによる効率的な強化学習 (CARLA-v2 内)

著者の所属: 上海交通大学

現実 世界の自動運転 (AD)、特に都市部での運転には、多くの特殊なケースが含まれます。最近リリースされた AD シミュレーター CARLA v2 は、運転シナリオに 39 の共通イベントを追加し、CARLA v1 よりも現実に近いテスト プラットフォームを提供します。これはコミュニティに新たな課題をもたらします。既存の作業のほとんどは計画のために特定のルールに依存する必要があるため、これまでのところ、CARLA v2 の新しいシナリオでの成功を報告した文献はありませんが、より複雑な状況での CARLA v2 をカバーすることはできません。 。この取り組みでは、プランナーを積極的かつ直接的に育成し、特殊なケースに柔軟かつ効果的に対応できるようにすることを目指しており、これが AD の将来の方向性でもあると考えています。私たちの知る限り、私たちは、環境の遷移を学習するための世界モデルを備えた、Think2Drive という AD 用の最初のモデルベースの強化学習手法を開発しました。この手法は、プランナーをトレーニングするためのニューラル シミュレーターとして機能します。このパラダイムは、ワールド モデルの低次元状態空間とテンソルの並列計算により、トレーニング効率を大幅に向上させます。

その結果、単一の A6000 GPU で 3 日間のトレーニングを行った後、Think2Drive は CARLA v2 でエキスパート レベルの習熟度で実行できました。私たちの知る限り、CARLA v2 での成功はこれまで報告されていません。 (ルートが 100% 完了)。シナリオを通じた運転モデル​​の評価をサポートするベンチマークである CornerCase-Repository も提案されています。さらに、ルートの完了、違反の数、シーンの密度などのパフォーマンスを評価するための新しいバランスの取れた指標が提案されているため、運転スコアから実際の運転パフォーマンスに関するより多くの情報が得られます。

#実験結果

Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

##最後に書きます

私たちの倉庫へようこそ! BEV、マルチモーダルフュージョン、車両乗員検出、ミリ波レーダー視覚認識、車線検出、3D認識など、多くの技術分野をカバーしています。また、オンライン マップ、マルチセンサー キャリブレーション、Nerf、大規模モデル、計画制御、軌道予測に関するレビューや論文も共有します。私たちのコンテンツを気に入っていただければ幸いです。さらにエキサイティングな情報を得るために、スターを付けたり、倉庫をフォローしたりすることを忘れないでください。ご協力ありがとうございます!

以上がThink2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。