マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション-AI-php.cn

ホームページ

テクノロジー周辺機器

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

王林

Oct 27, 2023 am 11:17 AM

3dモーダル

元のタイトル: GraphAlign: Enhancing Accurate feature Alignment by Graphmatching for Multi-Modal 3D Object Detection

書き直す必要がある内容は次のとおりです: 論文リンク: https://arxiv.org/pdf/ 2310.08261. pdf

著者の所属: 北京交通大学、河北科技大学、清華大学

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

#論文のアイデア:

LiDAR とカメラは、自動運転における 3D 物体検出のための補完的なセンサーです。ただし、点群と画像の間の不自然な相互作用を研究することは困難であり、鍵となるのは、異種モダリティの特徴位置合わせをどのように実行するかにあります。現在、多くの方法は投影キャリブレーションを通じてのみ特徴の位置合わせを実現しており、センサー間の座標変換精度誤差の問題を無視しているため、最適なパフォーマンスが得られません。この論文では、グラフマッチングによる 3D オブジェクト検出のための、GraphAlign と呼ばれる、より正確な特徴位置合わせ戦略を提案します。具体的には、この論文では、画像ブランチのセマンティックセグメンテーションエンコーダの画像特徴と、LiDAR ブランチの 3D スパース CNN の点群特徴を融合します。計算量を削減するために、この論文ではユークリッド距離計算を使用して、点群特徴部分空間内で最近傍関係を構築します。画像と点群間の投影キャリブレーションを通じて、点群フィーチャの最近傍が画像フィーチャに投影されます。次に、単一の点群の最も近い点を複数の画像と照合することで、より適切な特徴の位置合わせを検索します。さらに、この論文では、異種モダリティ間の特徴の調整を微調整するために重要な関係の重みを強化するセルフアテンションモジュールも提供します。この記事で提案した GraphAlign の有効性と効率性を証明するために、nuScenes ベンチマークで多数の実験が実施されました。

主な貢献:

この記事では、GraphAlign を提案しました。マルチモーダル 3D オブジェクト検出における位置ずれの問題を解決する、グラフベースのグラフマッチング機能位置合わせフレームワーク。

この記事では、画像特徴と点群特徴の正確な位置合わせを実現するためのグラフ特徴位置合わせ (GFA) およびセルフアテンション特徴位置合わせ (SAFA) モジュールを提案します。これにより、点群と画像モダリティの間の特徴位置合わせがさらに強化されます。となり、検出精度が向上します。

KITTI と nuScenes の 2 つのベンチマークを使用して実験を実施することにより、GraphAlign が、特に長距離ターゲット検出において点群検出の精度を効果的に向上させることができることを証明しました

ネットワーク設計:

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

図 1. フィーチャアライメント戦略の比較

(a) 投影ベースの方法では、モーダルフィーチャ間の関係を迅速に確立できます。ただし、センサー誤差により位置ずれが発生する場合があります。 (b) アテンションベースの方法は、アライメントを学習することで意味情報を保持しますが、計算コストが高くなります。 (c) この論文で提案されている GraphAlign は、グラフベースの特徴アライメントを使用してモダリティ間のより合理的なアライメントを照合することで、計算量を削減し、精度を向上させます。

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

図 2. GraphAlign のフレームワーク。

中国語で次のように書き直されます。これは、グラフ特徴アライメント (GFA) モジュールとセルフアテンション特徴アライメント (SAFA) モジュールで構成されます。 GFA モジュールは、画像および点群フィーチャを入力として受け取り、投影キャリブレーションマトリックスを使用して 3D 位置を 2D ピクセル位置に変換し、最近傍情報を構築して最近傍を見つけ、画像および点群フィーチャを結合します。 SAFA モジュールは、セルフアテンションメカニズムを通じて K の最近傍間のコンテキスト上の関係をモデル化し、融合された特徴の重要性を高め、最終的に最も代表的な特徴を選択します

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション #図 3. GFA処理フロー

(a) センサーの精度誤差により位置ずれが発生します。 (b) GFA は、点群フィーチャのグラフを通じて近接関係を確立します。 (c) この記事では、点群特徴を画像特徴に投影し、画像特徴の K 最近傍を取得します。 (d) この論文では、より適切な位置合わせを達成するために、個々の点群特徴を K 個の隣接する画像特徴と融合することによって、1 対多の融合を実行します。

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション図 4. SAFA モジュールのプロセス

head モジュールと max モジュールを簡略化しました。SAFA モジュールの目的は、head モジュールと max モジュールの間のグローバルコンテキスト情報を改善することです。 K 近傍。、融合されたフィーチャの表現を強化するため

#＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃実験結果：＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション ##引用:

#Song, Z.、Wei, H.、Bai, L.、Yang, L.、Jia, C. (2023) . GraphAlign:マルチモーダル 3D オブジェクト検出のためのグラフマッチングによる正確なフィーチャアライメントの強化。マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

ArXiv. /abs/2310.08261

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション

マルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーション元のリンク: https://mp .weixin.qq.com/s/eN6THT2azHvoleT1F6MoSw

以上がマルチモーダル 3D オブジェクト検出を強化するための正確な特徴位置合わせ: GraphAlign のアプリケーションの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

AIのスキルギャップは、サプライチェーンのダウンを遅くしていますApr 26, 2025 am 11:13 AM

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか？サプライチェーン管理協会（ASCM）のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します

1つの会社がAIを永遠に変えるために静かに取り組んでいる方法Apr 26, 2025 am 11:12 AM

分散型AI革命は静かに勢いを増しています。今週の金曜日、テキサス州オースティンでは、ビテンサーのエンドゲームサミットは極めて重要な瞬間を示し、理論から実用的な応用に分散したAI（DEAI）を移行します。派手なコマーシャルとは異なり

Nvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますApr 26, 2025 am 11:11 AM

エンタープライズAIはデータ統合の課題に直面していますエンタープライズAIの適用は、ビジネスデータを継続的に学習することで正確性と実用性を維持できるシステムを構築する大きな課題に直面しています。 NEMOマイクロサービスは、NVIDIAが「データフライホイール」と呼んでいるものを作成することにより、この問題を解決し、AIシステムがエンタープライズ情報とユーザーインタラクションへの継続的な露出を通じて関連性を維持できるようにします。この新しく発売されたツールキットには、5つの重要なマイクロサービスが含まれています。 NEMOカスタマイザーは、より高いトレーニングスループットを備えた大規模な言語モデルの微調整を処理します。 NEMO評価者は、カスタムベンチマークのAIモデルの簡素化された評価を提供します。 Nemo Guardrailsは、コンプライアンスと適切性を維持するためにセキュリティ管理を実装しています

aiは芸術とデザインの未来のために新しい絵を描きますApr 26, 2025 am 11:10 AM

AI：芸術とデザインの未来人工知能（AI）は、前例のない方法で芸術とデザインの分野を変えており、その影響はもはやアマチュアに限定されませんが、より深く影響を与えています。 AIによって生成されたアートワークとデザインスキームは、広告、ソーシャルメディアの画像生成、Webデザインなど、多くのトランザクションデザインアクティビティで従来の素材画像とデザイナーに迅速に置き換えられています。ただし、プロのアーティストやデザイナーもAIの実用的な価値を見つけています。 AIを補助ツールとして使用して、新しい美的可能性を探求し、さまざまなスタイルをブレンドし、新しい視覚効果を作成します。 AIは、アーティストやデザイナーが繰り返しタスクを自動化し、さまざまなデザイン要素を提案し、創造的な入力を提供するのを支援します。 AIはスタイル転送をサポートします。これは、画像のスタイルを適用することです

エージェントAIとのズームがどのように革命を起こしているか：会議からマイルストーンまでApr 26, 2025 am 11:09 AM

最初はビデオ会議プラットフォームで知られていたZoomは、エージェントAIの革新的な使用で職場革命をリードしています。 ZoomのCTOであるXD Huangとの最近の会話は、同社の野心的なビジョンを明らかにしました。エージェントAIの定義 huang d

大学に対する実存的な脅威Apr 26, 2025 am 11:08 AM

AIは教育に革命をもたらしますか？この質問は、教育者と利害関係者の間で深刻な反省を促しています。 AIの教育への統合は、機会と課題の両方をもたらします。 Tech Edvocate NotesのMatthew Lynch、Universitとして

プロトタイプ：アメリカの科学者は海外の仕事を探していますApr 26, 2025 am 11:07 AM

米国における科学的研究と技術の開発は、おそらく予算削減のために課題に直面する可能性があります。 Natureによると、海外の雇用を申請するアメリカの科学者の数は、2024年の同じ期間と比較して、2025年1月から3月まで32％増加しました。以前の世論調査では、調査した研究者の75％がヨーロッパとカナダでの仕事の検索を検討していることが示されました。 NIHとNSFの助成金は過去数か月で終了し、NIHの新しい助成金は今年約23億ドル減少し、3分の1近く減少しました。リークされた予算の提案は、トランプ政権が科学機関の予算を急激に削減していることを検討しており、最大50％の削減の可能性があることを示しています。基礎研究の分野での混乱は、米国の主要な利点の1つである海外の才能を引き付けることにも影響を与えています。 35

Openaiは、強力なGPT-4.1シリーズを発表しました。実際のアプリケーション向けに設計された3つの高度な言語モデルのファミリー。この大幅な飛躍は、より速い応答時間、理解の強化、およびTと比較した大幅に削減されたコストを提供します

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。