ホームページ  >  記事  >  テクノロジー周辺機器  >  バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

WBOY
WBOY転載
2023-04-12 23:40:011692ブラウズ

自動運転技術が進化を続ける中、車両の挙動と軌道予測は効率的かつ安全な運転にとって非常に重要な意味を持ちます。動的モデル演繹やアクセシビリティ分析などの従来の軌道予測手法には、明確な形式と強力な解釈可能性という利点がありますが、環境とオブジェクト間の相互作用のモデリング機能は、複雑な交通環境では比較的制限されます。したがって、近年では、さまざまな深層学習手法 (LSTM、CNN、Transformer、GNN など) や、BDD100K、nuScenes、Stanford Drone、ETH などのさまざまなデータセットに基づいて、多数の研究と応用が行われています。 /UCY、INTERACTION、ApolloScape なども登場しており、ディープ ニューラル ネットワーク モデルのトレーニングと評価を強力にサポートしており、GroupNet、Trajectron、MultiPath などの多くの SOTA モデルが良好なパフォーマンスを示しています。

上記のモデルとデータセットは通常の道路運転シナリオに集中しており、車線や信号機などのインフラストラクチャと機能を最大限に利用して予測プロセスを支援します。交通規制の制限、ほとんどの車両の移動パターンも比較的明確です。しかし、自動運転と自動駐車の「ラスト マイル」のシナリオでは、次のような多くの新たな困難に直面することになります。

  • 駐車場の交通ルール 車線と車線の要件車線の境界線は厳密ではなく、車両は意のままに運転して「近道をする」ことがよくあります。
  • 駐車タスクを完了するために、車両は頻繁に後退するなど、より複雑な駐車動作を実行する必要があります。駐車、ステアリングなどドライバーが不慣れな場合、駐車に長時間かかる可能性があります。
  • 駐車場内には障害物や乱雑な物が多く、車間距離も近いため、注意しないと駐車できなくなります。衝突や傷の原因となる可能性があります
  • 歩行者は駐車場を自由に歩き回ることが多く、車両にはさらなる回避行動が必要です
    そのようなシナリオでは、単純に既存の軌道予測モデルが理想的な結果を達成することは困難であり、再トレーニング モデルには対応するデータのサポートが不足しています。 CNRPark EXT や CARPK などの現在の駐車シーンベースのデータ セットは、無料の駐車スペース検出のみを目的として設計されており、写真は監視カメラの一人称視点から取得され、サンプリング レートが低く、オクルージョンが多いため、駐車スペースを検出することはできません。軌道予測に使用されます。

2022 年 10 月に閉幕したばかりの第 25 回 IEEE 高度道路交通システム国際会議 (IEEE ITSC 2022) で、 カリフォルニア大学バークレー校の研究者らが発表した駐車シーン用の最初の高解像度ビデオと軌跡データ セットを作成し、このデータ セットに基づいて、CNN と Transformer アーキテクチャを使用して、「ParkPredict」 と呼ばれる軌跡予測モデルを提案しました。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

  • 紙のリンク: https://arxiv.org/abs/2204.10777
  • データセットのホームページ、トライアルおよびダウンロード アプリケーション: https://sites.google.com/berkeley.edu/dlp-dataset (アクセスできない場合は、代替ページを試すことができます https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )
  • Dataset Python API: https://github.com/MPC - Berkeley/dlp-dataset

データセット情報

データセットはドローンによって収集され、合計時間は 3.5 時間、ビデオ解像度は4Kの場合、サンプリングレートは25Hzです。展望台の駐車場面積は約140m×80m、合計約400台収容可能です。データセットには正確に注釈が付けられており、合計 1,216 台の自動車、3,904 台の自転車、3,904 台の歩行者の軌跡が収集されました。

再処理後、軌跡データを JSON 形式で読み取り、接続グラフ (グラフ) のデータ構造にロードできます。 ):

  • 個人 (エージェント): 各個人 (エージェント) は、現在のシーン (Scene) 内で移動するオブジェクトであり、幾何学的形状や種類などの属性を持ち、その移動軌跡は次のファイルとして保存されます。インスタンスのリンク リスト
  • インスタンス: 各インスタンスは、フレーム (フレーム) 内の個人 (エージェント) の状態であり、その位置、角度、速度、加速度が含まれます。各インスタンスには、前のフレームと次のフレームの個人のインスタンスへのポインタが含まれています。
  • Frame (Frame): 各フレーム (Frame) はサンプリング ポイントであり、そのすべてが含まれます。現時点で表示されているインスタンス (Instance)、および前のフレームと次のフレームへのポインタ
  • 障害物 (Obstacle): 障害物はこのレコード内にあります まったく動かないオブジェクト、各オブジェクトの位置、角、幾何学的サイズを含む
  • シーン (シーン): 各シーン (シーン) は録画されたビデオ ファイルに対応します。このファイルには、最初と 2 番目のオブジェクトを指すポインターが含まれています。記録の最後のフレーム、すべての個人 (エージェント) とすべての障害物 (Obstacles) データセットによって提供される

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

2 つのダウンロード形式:

JSON のみ (推奨) : JSON ファイルには、すべての個体のタイプ、形状、軌跡などが含まれます。オープンソースの Python API を通じて、情報を直接読み取り、プレビューし、セマンティック イメージ (セマンティック イメージ) を生成できます。研究目的が軌跡と行動の予測のみであれば、JSON 形式であらゆるニーズを満たすことができます。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

元のビデオと注釈: 研究が以下に基づいている場合オリジナルのカメラ ターゲットの検出、分離、生画像の追跡などのマシン ビジョンの分野のトピックについては、オリジナルのビデオと注釈をダウンロードする必要がある場合があります。これが必要な場合は、研究のニーズをデータセット申請書に明確に記載する必要があります。さらに、アノテーション ファイル自体を解析する必要があります。

行動および軌道予測モデル: ParkPredict

アプリケーション例として、次の論文「ParkPredict: Multimodal Intent and Motion Prediction for Vehicles in parking Lots with CNN」を参照してください。 IEEE ITSC 2022 と Transformer 」では、研究チームはこのデータセットを使用して、CNN と Transformer アーキテクチャに基づいて駐車場のシーンにおける車両の意図 (Intent) と軌道 (Trajectory) を予測しました。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

チームは CNN モデルを使用して、セマンティック イメージを構築することで車両の意図 (Intent) の分布確率を予測しました。このモデルは車両のローカル環境情報を構築するだけでよく、現在の環境に応じて利用可能な意図の数を継続的に変更できます。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

チームは、Transformer モデルを改良し、意図 (Intent) の予測結果、車両の移動履歴、周囲環境のセマンティック マップを提供しました。マルチモーダルな意図と行動の予測を実現するための入力として。

バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。

概要

  • ドラゴン レイク パーキング (DLP) データ セットは、駐車シナリオ向けの最初の高精度データ セットとして、大規模なターゲットの認識と追跡を実現できます。駐車スペースの検出、車両と歩行者の行動と軌道予測、模倣学習などにより、データと API のサポートが提供されます。
  • CNN と Transformer アーキテクチャを使用することで、駐車シナリオにおける ParkPredict モデルの動作とパフォーマンスが向上します。軌道予測で優れた機能を示すことに加えて、
  • ドラゴン レイク パーキング (DLP) データ セットはトライアルおよびアプリケーション用に公開されています。データ セットのホームページ https://sites.google にアクセスできます。詳細については、.com/berkeley.edu/dlp-dataset (アクセスできない場合は、代替ページ https://www.php.cn/link を試してください) /966eaa9527eb956f0dc8788132986707

以上がバークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。