ホームページ >テクノロジー周辺機器 >AI >マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

王林
王林転載
2023-10-27 11:17:04936ブラウズ

元のタイトル: GraphAlign: Enhancing Accurate feature Alignment by Graphmatching for Multi-Modal 3D Object Detection

書き直す必要がある内容は次のとおりです: 論文リンク: https://arxiv.org/pdf/ 2310.08261. pdf

著者の所属: 北京交通大学、河北科技大学、清華大学

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

#論文のアイデア:

LiDAR とカメラは、自動運転における 3D 物体検出のための補完的なセンサーです。ただし、点群と画像の間の不自然な相互作用を研究することは困難であり、鍵となるのは、異種モダリティの特徴位置合わせをどのように実行するかにあります。現在、多くの方法は投影キャリブレーションを通じてのみ特徴の位置合わせを実現しており、センサー間の座標変換精度誤差の問題を無視しているため、最適なパフォーマンスが得られません。この論文では、グラフ マッチングによる 3D オブジェクト検出のための、GraphAlign と呼ばれる、より正確な特徴位置合わせ戦略を提案します。具体的には、この論文では、画像ブランチのセマンティック セグメンテーション エンコーダの画像特徴と、LiDAR ブランチの 3D スパース CNN の点群特徴を融合します。計算量を削減するために、この論文ではユークリッド距離計算を使用して、点群特徴部分空間内で最近傍関係を構築します。画像と点群間の投影キャリブレーションを通じて、点群フィーチャの最近傍が画像フィーチャに投影されます。次に、単一の点群の最も近い点を複数の画像と照合することで、より適切な特徴の位置合わせを検索します。さらに、この論文では、異種モダリティ間の特徴の調整を微調整するために重要な関係の重みを強化するセルフ アテンション モジュールも提供します。この記事で提案した GraphAlign の有効性と効率性を証明するために、nuScenes ベンチマークで多数の実験が実施されました。

主な貢献:

この記事では、GraphAlign を提案しました。マルチモーダル 3D オブジェクト検出における位置ずれの問題を解決する、グラフベースのグラフ マッチング機能位置合わせフレームワーク。

この記事では、画像特徴と点群特徴の正確な位置合わせを実現するためのグラフ特徴位置合わせ (GFA) およびセルフアテンション特徴位置合わせ (SAFA) モジュールを提案します。これにより、点群と画像モダリティの間の特徴位置合わせがさらに強化されます。となり、検出精度が向上します。

KITTI と nuScenes の 2 つのベンチマークを使用して実験を実施することにより、GraphAlign が、特に長距離ターゲット検出において点群検出の精度を効果的に向上させることができることを証明しました

ネットワーク設計:

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

図 1. フィーチャ アライメント戦略の比較

(a) 投影ベースの方法では、モーダル フィーチャ間の関係を迅速に確立できます。ただし、センサー誤差により位置ずれが発生する場合があります。 (b) アテンションベースの方法は、アライメントを学習することで意味情報を保持しますが、計算コストが高くなります。 (c) この論文で提案されている GraphAlign は、グラフベースの特徴アライメントを使用してモダリティ間のより合理的なアライメントを照合することで、計算量を削減し、精度を向上させます。

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

図 2. GraphAlign のフレームワーク。

中国語で次のように書き直されます。これは、グラフ特徴アライメント (GFA) モジュールとセルフアテンション特徴アライメント (SAFA) モジュールで構成されます。 GFA モジュールは、画像および点群フィーチャを入力として受け取り、投影キャリブレーション マトリックスを使用して 3D 位置を 2D ピクセル位置に変換し、最近傍情報を構築して最近傍を見つけ、画像および点群フィーチャを結合します。 SAFA モジュールは、セルフ アテンション メカニズムを通じて K の最近傍間のコンテキスト上の関係をモデル化し、融合された特徴の重要性を高め、最終的に最も代表的な特徴を選択します

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション #図 3. GFA処理フロー

(a) センサーの精度誤差により位置ずれが発生します。 (b) GFA は、点群フィーチャのグラフを通じて近接関係を確立します。 (c) この記事では、点群特徴を画像特徴に投影し、画像特徴の K 最近傍を取得します。 (d) この論文では、より適切な位置合わせを達成するために、個々の点群特徴を K 個の隣接する画像特徴と融合することによって、1 対多の融合を実行します。

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション図 4. SAFA モジュールのプロセス

head モジュールと max モジュールを簡略化しました。SAFA モジュールの目的は、head モジュールと max モジュールの間のグローバル コンテキスト情報を改善することです。 K 近傍。 、融合されたフィーチャの表現を強化するため

################ 実験結果: ############################### #

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション##引用:

#Song, Z.、Wei, H.、Bai, L.、Yang, L.、Jia, C. (2023) . GraphAlign:マルチモーダル 3D オブジェクト検出のためのグラフ マッチングによる正確なフィーチャ アライメントの強化。マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

ArXiv. /abs/2310.08261

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション元のリンク: https://mp .weixin.qq.com/s/eN6THT2azHvoleT1F6MoSw

以上がマルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーションの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。