ホームページ > 記事 > テクノロジー周辺機器 > DetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。
この記事では、オフライン 3D オブジェクト検出アルゴリズム フレームワーク DetZero のセットを提案します。Waymo の公開データセットの包括的な調査と評価を通じて、DetZero は連続的で完全なオブジェクトを生成できます。 、長期点群機能を最大限に活用して、知覚結果の品質を大幅に向上させます。同時に、85.15 mAPH (L2) の性能で WOD 3D 物体検出ランキングで 1 位にランクされました。さらに、DetZero はオンライン モデル トレーニングに高品質の自動ラベル付けを提供でき、その結果は手動ラベル付けのレベルに達するか、それを超えています。
これは論文のリンクです: https://arxiv.org/abs/2306.06023
書き直す必要がある内容は次のとおりです: コードのリンク: https://github.com/PJLab -ADG/ DetZero
ホームページのリンクにアクセスしてください: https://superkoma.github.io/detzero-page
データアノテーションの効率を向上させるために、私たちは新しいアプローチを検討しました。この手法は深層学習と教師なし学習に基づいており、アノテーション付きデータを自動的に生成できます。大量のラベルなしデータを使用することで、道路上の物体を認識および検出する自動運転知覚モデルをトレーニングできます。この方法により、データのラベル付けコストを削減できるだけでなく、後処理の効率も向上します。実験では比較のためのベースラインとして Waymo のオフライン 3D オブジェクト検出手法 3DAL[] を使用しました。結果は、提案した手法の精度と効率が大幅に向上していることを示しています。この手法は将来の自動運転技術において重要な役割を果たすと考えています。
運動状態分類に基づく最適化モデルは、オブジェクトの特徴のタイミング。たとえば、剛体オブジェクトのサイズは時間が経過しても一定であり、さまざまな角度からデータをキャプチャすることでより正確なサイズ推定を達成できます。オブジェクトの運動軌跡は特定の運動学的制約に従う必要があり、これは軌跡の滑らかさに反映されます。 。以下の図 (a) に示すように、動的オブジェクトの場合、スライディング ウィンドウに基づく最適化メカニズムはオブジェクト ジオメトリの一貫性を考慮せず、複数の隣接するフレームの時系列点群情報を通じて境界ボックスを更新するだけです。予測された幾何学的サイズにずれが発生します。 (b) の例では、オブジェクトのすべての点群を集約することで、密な時系列点群特徴が得られ、バウンディング ボックスの正確な幾何学的サイズをフレームごとに予測できます。
この論文では、DetZero と呼ばれる新しいオフライン 3D オブジェクト検出アルゴリズム フレームワークを提案します。このフレームワークには次の特徴があります: (1) マルチフレーム 3D 検出器とオフライン トラッカーを上流モジュールとして使用し、オブジェクト シーケンスの高い再現率 (トラック レベルの再現率) に焦点を当て、正確かつ完全なオブジェクト追跡を提供します。(2) 下流モジュールアテンション メカニズムに基づく最適化モデルが含まれており、長期的な点群特徴を使用して、洗練された幾何学的寸法、スムーズなモーション軌跡の位置、更新された信頼スコアなど、オブジェクトのさまざまな属性を学習および予測します。
Waymo 3D 検出ランキング結果は、すべての結果で使用されています。 TTA またはアンサンブル テクノロジー、† はオフライン モデルを指します、‡ は点群画像融合モデルを指します、* は匿名の提出結果を示します
同様に、検出フレームのおかげで、オブジェクト追跡シーケンスの精度と完全性の点で、 Waymo 3D トラッキングランキングで 75.05 MOTA (L2) のパフォーマンスで 1 位を獲得しました。Waymo 3D 追跡ランキング、* 結果の匿名送信を示します
提案した各モジュールの役割をより適切に検証するために、Waymo 検証セットでアブレーション実験を実施し、より厳しい IoU しきい値を採用しました。測定基準
Waymo検証セットの車両と歩行者で実施され、IoUしきい値はそれぞれ標準値(0.7 & 0.5)と厳密値(0.8 & 0.6)を選択しました
同時に、同じ一連の検出結果に対して、クロスコンビネーション検証のために 3DAL と DetZero のトラッカーと最適化モデルを選択しました。結果は、DetZero のトラッカーとオプティマイザーのパフォーマンスが優れており、この 2 つを組み合わせるとより効果的であることをさらに証明しました。利点。
さまざまな上流モジュールと下流モジュールの組み合わせの相互検証実験。下付き文字 1 と 2 はそれぞれ 3DAL と DetZero を表し、インジケーターは 3D APHです。
当社のオフライン トラッカーはより注目を集めていますオブジェクト シーケンスの完全性については、両者の MOTA パフォーマンスの差は非常に小さいですが、Recall@track のパフォーマンスが最終的な最適化パフォーマンスに大きな差をもたらす理由の 1 つです。
オフライン トラッカー (Trk2) ) と 3DAL トラッカー (Trk1) MOTA と Recall@track のパフォーマンス比較
さらに、他の最先端トラッカーとの比較もポイントを証明します
Recall@track追跡アルゴリズムによる処理後のシーケンス リコール、3D APH は同じ最適化モデルによる処理後の最終パフォーマンス
最適化を検証するためモデル 上流の結果の特定のセットへの適合を修正できるかどうか、異なるパフォーマンスを持つ上流の検出追跡結果を入力として選択しました。結果は、パフォーマンスが大幅に向上したことを示しており、上流モジュールがより多くの完全なオブジェクト シーケンスを呼び出すことができる限り、オプティマイザーは最適化のために時系列点群の特性を効果的に利用できることをさらに証明しています。
Waymo 検証セットでの一般化パフォーマンス検証、指標は 3D APH3.4 人間のラベリング能力との比較- 高品質の自動アノテーション結果は、オンライン モデル トレーニングの手動アノテーション結果を置き換えることができるため、Waymo 検証セットで半教師あり学習検証を実施しました。教師モデル (DetZero) のトレーニング データとしてトレーニング データの 10% をランダムに選択し、残りの 90% のデータに対して推論を実行して、自動アノテーションの結果を取得しました。この結果は、生徒モデルのラベルとして使用されます。学生モデルとしてシングルフレーム CenterPoint を選択しました。車両カテゴリでは、90% の自動ラベルと 10% の真のラベルを使用したトレーニングの結果は、100% の真のラベルを使用したトレーニングの結果に近いですが、歩行者カテゴリでは、自動ラベルでトレーニングされたモデルの結果がすでに優れています。自動ラベル付けがオンライン モデル トレーニングに使用できることを示す結果
Waymo 検証セットでの半教師あり実験結果3.5 視覚化results最初の行は上流の入力結果を表します。 2 行目は最適化モデルの出力結果を表し、点線内のオブジェクトは最適化前後で明らかな違いがある位置を表します
元のリンク: https://mp.weixin.qq.com/s/HklBecJfMOUCC8gclo-t7Q
以上がDetZero: Waymo は 3D 検出リストで 1 位にランクされており、手動アノテーションに匹敵します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。