検索
ホームページテクノロジー周辺機器AI強化学習が再び Nature の表紙を飾り、自動運転の安全性検証の新しいパラダイムによりテスト走行距離が大幅に削減

高密度強化学習を導入し、AI を使用して AI を検証します。

自動運転車 (AV) 技術の急速な進歩により、私たちは 1 世紀前の自動車の出現以来見られない規模の交通革命の頂点に立っています。自動運転技術は、交通安全、モビリティ、持続可能性を大幅に改善する可能性があるため、産業界、政府機関、専門機関、学術機関の注目を集めています。

自動運転車の開発は、特にディープラーニングの出現により、過去 20 年間で大きく進歩しました。 2015 年までに、企業は 2020 年までに AV を量産すると発表し始めました。しかし、今のところ、レベル 4 の AV は市場で入手できません。

この現象には多くの理由がありますが、最も重要なのは、自動運転車の安全性能が人間のドライバーの安全性能に比べて依然として大幅に低いということです。米国の平均的なドライバーの場合、自然運転環境 (NDE) での衝突の確率は 1 マイルあたり約 1.9 × 10^−6 です。比較すると、カリフォルニア州の 2021 年の離脱レポートによると、最先端の自動運転車の離脱率は約 2.0 × 10^−5/マイルです。

注: 離脱率は自動運転の信頼性を評価するための重要な指標であり、システムが 1,000 マイルの走行ごとにドライバーに運転を引き継ぐことを要求する回数を表します。システムの離脱率が低いほど、信頼性は高くなります。離脱率が0の場合は、自動運転システムがある程度無人運転のレベルに達していることを意味します。

離脱率は偏っていると批判されることもありますが、自動運転車の安全性能を評価するために広く使用されています。

自動運転車の安全性能を向上させる上での主なボトルネックは、安全検証の効率が低いことです。現在、ソフトウェア シミュレーション、クローズド テスト トラック、路上テストを組み合わせて自動運転車の非破壊検査をテストすることが一般的です。その結果、AV 開発者は評価のために多大な経済的および時間的コストを負担する必要があり、AV 展開の進行が妨げられています。

NDE 環境での AV セキュリティ パフォーマンスの検証は非常に複雑です。たとえば、運転環境は時空間的に複雑であるため、そのような環境を定義するために必要な変数は高次元になります。変数の次元が指数関数的に増加するにつれて、計算の複雑さも増加します。この場合、大量のデータが与えられたとしても、深層学習モデルを学習するのは困難です。

この記事では、ミシガン大学、アナーバー大学、清華大学などの研究者が、この課題を解決するための高密度深層強化学習 (D2RL) 手法を提案しています。

この研究は『Nature』誌の表紙に掲載されました。

強化学習が再び Nature の表紙を飾り、自動運転の安全性検証の新しいパラダイムによりテスト走行距離が大幅に削減

  • 論文アドレス: https://www.nature.com/articles/s41586-023-05732-2
  • プロジェクト アドレス: https://www.nature.com/articles/s41586-023-05732-2
://github.com/michigan-traffic-lab/Dense-Deep-Reinforcement-Learning

この論文は修士号を授与され、現在は同学科のテニュアトラック助教を務めています。清華大学オートメーション学科を卒業し、ミシガン大学交通研究所 (UMTRI) の研究助手も務めています。彼は、Zhang Yi 教授の指導の下、2014 年と 2019 年に清華大学オートメーション学部で学士号と博士号を取得しました。 2017 年から 2019 年まで、彼はミシガン大学の土木環境工学の客員博士課程学生として、ヘンリー X. リュー教授 (この記事の責任著者) の下で学びました。

研究紹介

D2RL 手法の基本的な考え方は、セーフティ クリティカルでないデータを特定して削除し、セーフティ クリティカルなデータを使用してニューラル ネットワークをトレーニングすることです。セキュリティ上重要なデータはほんの一部であるため、残りのデータには情報が非常に高密度になります。

DRL 手法と比較して、D2RL 手法は、不偏性を失うことなく、ポリシー勾配推定の分散を数桁大幅に削減できます。この大幅な分散の減少により、ニューラル ネットワークが DRL 手法では困難なタスクを学習して完了できるようになります。

AV テストでは、この研究では D2RL 手法を利用して、ニューラル ネットワークを通じてバックグラウンド ビークル (BV) をトレーニングし、いつどのような敵対的操作を実行するかを学習し、テスト効率の向上を目指しています。 D2RL は、公平なテストを保証しながら、AI ベースの敵対的テスト環境で AV に必要なテスト距離を数桁削減できます。

D2RL 手法は、以前のシナリオベースの手法では不可能であった、複数の高速道路、交差点、環状交差点などの複雑な運転環境に適用できます。さらに、本研究で提案する手法は、AIを活用してAIを検証するインテリジェントなテスト環境を構築することができます。これは、他の安全性が重要なシステムのテストやトレーニングを加速するための扉を開くパラダイム シフトです。

###本研究では、AIを活用した試験手法の有効性を証明するために、大規模な実走行データセットを用いてBVを学習させ、シミュレーション実験と物理的な試験路でのフィールド実験を実施しました。以下の図 1 を参照してください。 ###

強化学習が再び Nature の表紙を飾り、自動運転の安全性検証の新しいパラダイムによりテスト走行距離が大幅に削減

高密度深層強化学習

AI テクノロジーを活用するために、この研究では AV テスト問題をマルコフ決定プロセス (MDP) として定式化しました。 , BVの動作は現在のステータス情報に基づいて決定されます。この研究の目的は、AV と対話する BV の動作を制御するニューラル ネットワークによってモデル化されたポリシー (DRL エージェント) をトレーニングして、評価効率を最大化し、公平性を確保することです。ただし、前述したように、次元数と計算の複雑さの制限により、DRL 手法を直接適用した場合、効果的なポリシーを学習することは困難または不可能です。

ほとんどの状態は非クリティカルであり、セキュリティクリティカルなイベントに関する情報を提供できないため、D2RL はこれらの非クリティカルな状態からデータを削除することに重点を置いています。 AV テストの問題については、多くのセキュリティ メトリクスを活用して、さまざまな効率と有効性を持つ重大な状態を特定できます。この研究で利用される重大度メトリクスは、現在の状態の特定の時間フレーム (たとえば、1 秒) 内の AV 衝突率の外部近似です。次に、研究ではマルコフ プロセスを編集して非クリティカル状態のデータを破棄し、残りのデータを政策勾配推定と DRL トレーニング用のブートストラップに使用しました。

以下の図 2 に示すように、DRL と比較した D2RL の利点は、トレーニング プロセス中の報酬を最大化できることです。

強化学習が再び Nature の表紙を飾り、自動運転の安全性検証の新しいパラダイムによりテスト走行距離が大幅に削減

AV シミュレーション テスト

D2RL 手法の精度、効率、拡張性、汎用性を評価するために、この研究ではシミュレーションを実施しました。テスト。以下の図 3 に示すように、各テスト セットについて、固定距離の交通移動をシミュレーションし、テスト結果を記録して分析しました。

強化学習が再び Nature の表紙を飾り、自動運転の安全性検証の新しいパラダイムによりテスト走行距離が大幅に削減

D2RL のスケーラビリティと一般化をさらに研究するために、この研究では、車線数 (2 車線と 3 車線) と走行距離が異なる AV-I モデルを実施しました。 (400m、2km、4km、25km) の実験。米国の平均的な通勤者の移動距離は片道約 25 キロメートルであるため、この記事では 25 キロメートルの移動について検討します。結果を表 1 に示します。

以上が強化学習が再び Nature の表紙を飾り、自動運転の安全性検証の新しいパラダイムによりテスト走行距離が大幅に削減の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51ctoで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
迅速なエンジニアリングにおける思考のグラフは何ですか迅速なエンジニアリングにおける思考のグラフは何ですかApr 13, 2025 am 11:53 AM

導入 迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

Genaiエージェントとの電子メールマーケティングを組織に最適化しますGenaiエージェントとの電子メールマーケティングを組織に最適化しますApr 13, 2025 am 11:44 AM

導入 おめでとう!あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apr 13, 2025 am 11:40 AM

導入 今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

ChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますApr 13, 2025 am 11:23 AM

「ユーザーは何人いますか?」彼は突き出した。 「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。 「わずか数週間で2倍になったと言った」とアンダーソンは続けた。 「私はそのprivと言いました

PIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaPIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaApr 13, 2025 am 11:20 AM

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

生成AIアプリケーションのエージェントフレームワーク - 分析Vidhya生成AIアプリケーションのエージェントフレームワーク - 分析VidhyaApr 13, 2025 am 11:13 AM

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか?これでa

金融セクターにおける生成AIの応用金融セクターにおける生成AIの応用Apr 13, 2025 am 11:12 AM

導入 金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

オンライン学習とパッシブアグレッシブアルゴリズムのガイドオンライン学習とパッシブアグレッシブアルゴリズムのガイドApr 13, 2025 am 11:09 AM

導入 データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター