ホームページ >テクノロジー周辺機器 >AI >量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載: 2024-03-28 14:36:34850ブラウズ

前に書いた

現在の自動運転システムが高精度地図への依存を取り除くために使用しているアルゴリズムの 1 つは、次の事実を利用するものです。遠距離での知覚性能はまだ不十分です。この目的を達成するために、私たちは P-MapNet を提案します。「P」はモデルのパフォーマンスを向上させるためにマップ事前分布を融合することに焦点を当てています。具体的には、SDMap と HDMap の事前情報を活用します。一方で、OpenStreetMap から弱く調整された SDMap データを抽出し、入力をサポートするためにそれを独立した用語にエンコードします。厳密に変更された入力と実際の HD マップの間の整合性が弱いという問題がありますが、クロスアテンションメカニズムに基づく構造は、適応的に SDMap スケルトンに焦点を当て、大幅なパフォーマンス向上をもたらすことができますが、一方で、MAE を使用する方法を提案します。リファインモジュールは、HDMap の以前の分布をキャプチャします。このモジュールは、実際のマップとより一貫性のある分布を生成し、オクルージョンやアーティファクトなどの影響を軽減するのに役立ちます。私たちは、nuScenes と Argoverse2 データセットに対して広範な実験検証を実施しています。

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。図 1

要約すると、私たちの貢献は次のとおりです。

当社の SDMap アドバンストは、ラスタライズを含むオンラインマップ生成のパフォーマンスを向上させることができます (最大で改善されました)マップのパフォーマンスが 18.73 mIoU 向上し、量子化されました (最大 8.50 mAP 向上)。

(2) 以前の HDMap では、地図認識指数を最大 6.34% 向上させることができました。

(3) P-MapNet は、精度と効率をトレードオフするために、さまざまな推論モードに切り替えることができます。

P-MapNet は、より遠くのセンシング範囲に大きな改善をもたらす長距離 HD マップ生成ソリューションです。私たちのコードとモデルは https://jike5.github.io/P-MapNet/ で公開されています。

P-MapNet の概要

全体的なフレームワークを図 2 に示します。

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。図 2

入力: システム入力は点群: 、サラウンドカメラ:、はサラウンドカメラの数です。一般的な HDMap 生成タスク (HDMapNet など) は次のように定義できます。

ここで、は特徴抽出を表し、はセグメンテーションヘッドを表し、は HDMap 予測を表します。結果。

私たちが提案した P-MapNet は、SD マップと HD マップの事前情報を組み合わせたものです。この新しいタスク ( 設定) は次のように表現できます:

where, は以前の SDMap を表し、はこの記事で説明されている改良モジュールを表します。モジュールは、事前トレーニングを通じて HD マップの配布を学習します。同様に、以前に SDMap のみを使用した場合、のみの設定:

出力: マップ生成タスクの場合、通常、ラスター化とベクトル化という 2 つのマップ表現があります。この記事の研究では、この記事で設計された 2 つのアプリオリモジュールがラスタライズされた出力により適しているため、主にラスタライズされた表現に焦点を当てます。

3.1 SDMap 事前モジュール

SDMap データ生成

この記事は、研究用の nuScenes および Argoverse2 データセットに基づいています。 OpenStreetMapデータを使用して、上記のデータセットの対応するエリアのSDマップデータを生成し、車両GPSを通じて座標系を変換して、対応するエリアのSDマップを取得します。

BEV クエリ

図 2 に示すように、まず画像データに対して特徴抽出と透視変換を実行し、点群に対して特徴抽出を実行して BEV 特徴を取得します。次に、BEV 特徴が畳み込みネットワークを通じてダウンサンプリングされて新しい BEV 特徴が取得され、特徴マップが平坦化されて BEV クエリが取得されます。

SD Map 事前融合

SD Map データの場合、畳み込みネットワークによる特徴抽出後、得られた特徴を BEV Query Cross と比較します。 -アテンションメカニズム: クロスアテンションメカニズムの後に取得された BEV フィーチャは、セグメンテーションヘッドを通じてマップ要素の初期予測を取得できます。

3.2. HDMap 以前のモジュール

は、ラスタライズされた HD マップを元の MAE の入力として直接使用し、MAE は MSE 損失を通じてトレーニングされるため、改良モジュールを使用できない。そこでこの記事では、MAE の出力をセグメンテーションヘッドに置き換えます。予測されたマップ要素に連続性と信頼性（実際の HD マップの分布に近づける）を持たせるために、事前トレーニングされた MAE モジュールを使用して改良します。このモジュールのトレーニングは 2 つのステップで構成されます。最初のステップは、自己教師あり学習を使用して MAE モジュールをトレーニングし、HD マップの分布を学習することです。2 番目のステップは、取得した重みを使用してネットワークのすべてのモジュールを微調整することです。最初のステップで初期重みとして使用されます。

事前トレーニングの最初のステップでは、データセットから取得した実際の HD マップがランダムマスクを通過し、ネットワーク入力として使用されます

、トレーニングの目標は、 HD マップ:

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。微調整の 2 番目のステップでは、

最初のステップで事前にトレーニングされた重みを初期重みとして使用します。ネットワークは:

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。

4. 実験

4.1 データセットと指標

私たちnuScenes と Argoverse2 という 2 つの主流のデータセットに対して評価を実施しました。長距離における提案手法の有効性を証明するために、3 つの異なる検出距離を設定しました:,

, 。このうち、範囲の BEV Grid の解像度は 0.15m、他の 2 つの範囲の解像度は 0.3m です。 mIOU メトリックを使用してラスター化された予測結果を評価し、mAP を使用してベクトル化された予測結果を評価します。地図の信頼性を評価するために、地図認識指標として LPIPS 指標も使用します。

4.2 結果

SOTA 結果との比較: 提案手法と現行 SOTA 手法を短距離 (60m × 30m) および長距離 (90m × 30m) で比較します。 ) ) を使用してマップ生成結果を比較します。表 II に示すように、私たちの方法は、既存の視覚のみおよびマルチモーダル (RGB LiDAR) 方法と比較して優れたパフォーマンスを示します。

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。さまざまな距離およびさまざまなセンサーモードを使用して、HDMapNet [14] とのパフォーマンス比較を実行しました。結果は表 I および表 III にまとめられています。私たちの方法では、240m × 60m の範囲で mIOU が 13.4% 向上しました。知覚された距離がセンサーの検出範囲を超える、または超えると、SDMap 事前の有効性がより重要になり、SDMap 事前の有効性が検証されます。最後に、HD マップを活用して、初期の予測結果をより現実的なものにし、誤った結果を排除することで、パフォーマンスをさらに向上させます。

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。 HD 先験的な知覚指標をマップします。 HDMap の以前のモジュールは、ネットワークの初期予測を HD マップの分布にマッピングし、より現実的なものにします。 HDMap の以前のモジュール出力の信頼性を評価するために、評価には知覚メトリック LPIPS (値が低いほどパフォーマンスが良い) を使用しました。表 IV に示すように、

設定の LPIPS インジケーターは、のみの設定よりも大幅に改善されています。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃視覚化：＃＃＃

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。

以上が量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

架构 map github 算法 transformer https 传感器

声明：

この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：Microsoft の「脱 OpenAI」がハイレベルの人事異動を引き起こす: Bing の CEO が DeepMind Lianchuang に締め出された!ナデラ、Stable Diffusion の責任者と面会次の記事：Microsoft の「脱 OpenAI」がハイレベルの人事異動を引き起こす: Bing の CEO が DeepMind Lianchuang に締め出された!ナデラ、Stable Diffusion の責任者と面会

続きを見る

量産型キラー！ P-Mapnet: 従来の低精度地図 SDMap を使用することで、マッピングのパフォーマンスが 20 ポイント近く大幅に向上しました。

前に書いた

関連作業のレビュー

P-MapNet の概要

3.1 SDMap 事前モジュール

私たちnuScenes と Argoverse2 という 2 つの主流のデータセットに対して評価を実施しました。長距離における提案手法の有効性を証明するために、3 つの異なる検出距離を設定しました:,

関連記事