ホームページ >テクノロジー周辺機器 >AI >DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載: 2023-12-04 11:33:52951ブラウズ

この記事では、オフライン 3D オブジェクト検出アルゴリズムフレームワーク DetZero のセットを提案します。Waymo の公開データセットの包括的な調査と評価を通じて、DetZero は連続的で完全なオブジェクトを生成できます。、長期点群機能を最大限に活用して、知覚結果の品質を大幅に向上させます。同時に、85.15 mAPH (L2) の性能で WOD 3D 物体検出ランキングで 1 位にランクされました。さらに、DetZero はオンラインモデルトレーニングに高品質の自動ラベル付けを提供でき、その結果は手動ラベル付けのレベルに達するか、それを超えています。

これは論文のリンクです: https://arxiv.org/abs/2306.06023

書き直す必要がある内容は次のとおりです: コードのリンク: https://github.com/PJLab -ADG/ DetZero

ホームページのリンクにアクセスしてください: https://superkoma.github.io/detzero-page

1 はじめに

データアノテーションの効率を向上させるために、私たちは新しいアプローチを検討しました。この手法は深層学習と教師なし学習に基づいており、アノテーション付きデータを自動的に生成できます。大量のラベルなしデータを使用することで、道路上の物体を認識および検出する自動運転知覚モデルをトレーニングできます。この方法により、データのラベル付けコストを削減できるだけでなく、後処理の効率も向上します。実験では比較のためのベースラインとして Waymo のオフライン 3D オブジェクト検出手法 3DAL[] を使用しました。結果は、提案した手法の精度と効率が大幅に向上していることを示しています。この手法は将来の自動運転技術において重要な役割を果たすと考えています。

物体検出 (Detection): 少量の連続点群フレームデータを入力し、各フレームを出力します。 ;
動作分類動作分類) における 3D オブジェクトの境界ボックスとカテゴリ情報: オブジェクトの軌道特性に基づいて、オブジェクトの動作状態 (静止または移動) を決定します;
オブジェクト中心の最適化 (オブジェクト中心のリファイニング): 前のモジュールによって予測された運動状態に基づいて、静止オブジェクトと移動オブジェクトの時間点群特徴がそれぞれ抽出され、正確な境界ボックスを予測します。最後に、最適化された 3D バウンディングボックスは、ポーズマトリックスを通じてオブジェクトが配置されている各フレームの座標系に戻されます。
ただし、多くの主流のオンライン 3D オブジェクト検出方法は、点群の時間コンテキスト機能を利用することで、既存のオフライン 3D 検出方法よりも優れた結果を達成しています。ただし、これらの方法では、長いシーケンス点群の特性を効果的に利用できないことを認識しています。

現在のターゲット検出および追跡アルゴリズムは、主にバウンディングボックスレベル (ボックスレベル) のパフォーマンス指標に焦点を当てています。オンライン TTA およびマルチモデルフュージョン後の 3D 検出アルゴリズムによって生成された多数の冗長フレームは、追跡アルゴリズムへの入力として使用されます。これは通常、軌跡のセグメンテーション、ID 切り替え、誤った関連付けなどの深刻な問題を引き起こしやすく、連続的かつ完全なオブジェクトシーケンスの生成が保証されるため、オブジェクトに対応する長期的な点群フィーチャの使用が妨げられます。以下の図に示すように、オブジェクトの元の軌道は複数のサブシーケンス (T1、T2、T3) に分割され、その結果、より多くの情報を含む T1 セグメントの特徴を T2 と T3 の間で共有できなくなり、最適化されたフレームが得られます。 T4 セグメント内の失われたフラグメントもリコールできません。T5 フラグメント内の最適化されたフレームは、元の FP 位置に移動された後も FP のままです。

オブジェクトシーケンスの品質は、下流の最適化モデルに大きな影響を与えます

運動状態分類に基づく最適化モデルは、オブジェクトの特徴のタイミング。たとえば、剛体オブジェクトのサイズは時間が経過しても一定であり、さまざまな角度からデータをキャプチャすることでより正確なサイズ推定を達成できます。オブジェクトの運動軌跡は特定の運動学的制約に従う必要があり、これは軌跡の滑らかさに反映されます。。以下の図 (a) に示すように、動的オブジェクトの場合、スライディングウィンドウに基づく最適化メカニズムはオブジェクトジオメトリの一貫性を考慮せず、複数の隣接するフレームの時系列点群情報を通じて境界ボックスを更新するだけです。予測された幾何学的サイズにずれが発生します。 (b) の例では、オブジェクトのすべての点群を集約することで、密な時系列点群特徴が得られ、バウンディングボックスの正確な幾何学的サイズをフレームごとに予測できます。 DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

運動状態に基づく最適化モデルはオブジェクトのサイズを予測し (a)、幾何最適化モデルはさまざまな視点からすべての点群を集約した後にオブジェクトのサイズを予測します ( b)

2 方法

この論文では、DetZero と呼ばれる新しいオフライン 3D オブジェクト検出アルゴリズムフレームワークを提案します。このフレームワークには次の特徴があります: (1) マルチフレーム 3D 検出器とオフライントラッカーを上流モジュールとして使用し、オブジェクトシーケンスの高い再現率 (トラックレベルの再現率) に焦点を当て、正確かつ完全なオブジェクト追跡を提供します。(2) 下流モジュールアテンションメカニズムに基づく最適化モデルが含まれており、長期的な点群特徴を使用して、洗練された幾何学的寸法、スムーズなモーション軌跡の位置、更新された信頼スコアなど、オブジェクトのさまざまな属性を学習および予測します。

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

2.1 完全なオブジェクトシーケンスの生成

2.2 属性予測に基づくオブジェクト最適化モジュール

ローカル位置とグローバル位置の間の相互作用: オブジェクトシーケンス内の任意のボックスを原点としてランダムに選択し、他のすべてのボックスと対応するオブジェクト点群をこの座標系に転送し、各点とそれぞれの境界までの距離を計算します。フレームの中心点と 8 つの隅の点は、グローバル位置特徴のキーと値として機能します。オブジェクトシーケンス内の各サンプルは位置クエリとして使用され、現在の位置と他の位置の間の相対距離を決定するためにセルフアテンションレイヤーに送信され、その後、クロスアテンションレイヤーに入力されて、コンテキスト関係をシミュレートします。ローカル位置からグローバル位置に変換し、この座標系を予測します。各初期中心点と真の中心点の間のオフセット、および機首角の差。
信頼の最適化: 分類ブランチは、オブジェクトが TP か FP かを分類するために使用されます。IoU 回帰ブランチは、幾何学的モデルと位置モデルによって最適化された後、オブジェクトとグラウンドトゥルースボックスの間の IoU サイズを予測します。。最終的な信頼スコアは、これら 2 つの分岐の幾何平均です。

3 実験

3.1 主なパフォーマンス

Waymo 3D 検出ランキング結果は、すべての結果で使用されています。 TTA またはアンサンブルテクノロジー、† はオフラインモデルを指します、‡ は点群画像融合モデルを指します、* は匿名の提出結果を示します DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

Waymo 3D 追跡ランキング、* 結果の匿名送信を示します DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

3.2 アブレーション実験

提案した各モジュールの役割をより適切に検証するために、Waymo 検証セットでアブレーション実験を実施し、より厳しい IoU しきい値を採用しました。測定基準

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。 Waymo検証セットの車両と歩行者で実施され、IoUしきい値はそれぞれ標準値(0.7 & 0.5)と厳密値(0.8 & 0.6)を選択しました

同時に、同じ一連の検出結果に対して、クロスコンビネーション検証のために 3DAL と DetZero のトラッカーと最適化モデルを選択しました。結果は、DetZero のトラッカーとオプティマイザーのパフォーマンスが優れており、この 2 つを組み合わせるとより効果的であることをさらに証明しました。利点。

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。さまざまな上流モジュールと下流モジュールの組み合わせの相互検証実験。下付き文字 1 と 2 はそれぞれ 3DAL と DetZero を表し、インジケーターは 3D APHです。

当社のオフライントラッカーはより注目を集めていますオブジェクトシーケンスの完全性については、両者の MOTA パフォーマンスの差は非常に小さいですが、Recall@track のパフォーマンスが最終的な最適化パフォーマンスに大きな差をもたらす理由の 1 つです。

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。オフライントラッカー (Trk2) ) と 3DAL トラッカー (Trk1) MOTA と Recall@track のパフォーマンス比較

さらに、他の最先端トラッカーとの比較もポイントを証明します

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。 Recall@track追跡アルゴリズムによる処理後のシーケンスリコール、3D APH は同じ最適化モデルによる処理後の最終パフォーマンス

3.3 一般化パフォーマンス

最適化を検証するためモデル上流の結果の特定のセットへの適合を修正できるかどうか、異なるパフォーマンスを持つ上流の検出追跡結果を入力として選択しました。結果は、パフォーマンスが大幅に向上したことを示しており、上流モジュールがより多くの完全なオブジェクトシーケンスを呼び出すことができる限り、オプティマイザーは最適化のために時系列点群の特性を効果的に利用できることをさらに証明しています。

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。

3DAL の実験設定を使用して、比較 5 つの指定されたシーケンスに対する DetZero の AP パフォーマンスをレポートします。単一フレームベースの再アノテーション結果と元のグラウンドトゥルースアノテーション結果の一貫性を比較することで人間のパフォーマンスを測定します。 3DAL や人間と比較して、DetZero はさまざまなパフォーマンス指標で利点を示しています。

DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。 - 高品質の自動アノテーション結果は、オンラインモデルトレーニングの手動アノテーション結果を置き換えることができるため、Waymo 検証セットで半教師あり学習検証を実施しました。教師モデル (DetZero) のトレーニングデータとしてトレーニングデータの 10% をランダムに選択し、残りの 90% のデータに対して推論を実行して、自動アノテーションの結果を取得しました。この結果は、生徒モデルのラベルとして使用されます。学生モデルとしてシングルフレーム CenterPoint を選択しました。車両カテゴリでは、90% の自動ラベルと 10% の真のラベルを使用したトレーニングの結果は、100% の真のラベルを使用したトレーニングの結果に近いですが、歩行者カテゴリでは、自動ラベルでトレーニングされたモデルの結果がすでに優れています。自動ラベル付けがオンラインモデルトレーニングに使用できることを示す結果