ホームページ >テクノロジー周辺機器 >AI >自動運転におけるSLAM技術の応用について論じた記事
自動運転において測位はかけがえのない位置を占めており、今後の発展が期待されています。現在、自動運転における測位はRTKと高精度地図に依存しているため、自動運転の実装には多大なコストと困難が加わります。想像してみてください。人間が運転するとき、自分自身の全世界の高精度測位や詳細な周囲環境を知る必要はありません。全地球的なナビゲーション パスを持ち、そのパス上の車両の位置を照合するだけで十分です。ここで必要なのは、 SLAM分野のキーテクノロジー。
SLAM (Simultaneous Localization and Mapping)、CML (Concurrent Mapping and Localization) とも呼ばれるリアルタイム測位マップの構築、またはマッピングと位置決めを同時に実行します。この問題は次のように説明できます: ロボットを未知の環境の未知の場所に置く場合、ロボットがどの方向に移動するかを決定しながら、環境の完全な地図を徐々に描画する方法はあるでしょうか?たとえば、掃除ロボットは非常に典型的な SLAM 問題であり、いわゆる完全なマップ (一貫したマップ) とは、ロボットが障害物なしに部屋のアクセス可能な隅々まで移動できることを意味します。
SLAM は、1988 年に Smith、Self、Cheeseman によって初めて提案されました。その重要な理論的および応用的価値により、多くの学者によって、真の完全自律移動ロボットを実現するための鍵であると考えられています。
模擬人間が見知らぬ環境に来たとき、すぐに環境に慣れて自分のタスク (レストランを探す、ホテルを探すなど) を完了するために、次のことを行う必要があります。
a. 周囲の建物、大木、花壇などのランドマークを目で観察し、その特徴を記憶します(特徴抽出)
#b. 双眼鏡で得た情報をもとに、自分の頭の中で特徴的なランドマークを三次元地図上に再構築する(三次元再構築)
#c. 歩行中は常に新しいフィーチャ ランドマークを取得し、頭の中でマップ モデルを修正します (バンドル調整または EKF)d. に基づいて位置 (軌道) を決定します。以前に歩いて得た地物ランドマーク
e. 意図せず遠くまで歩いてしまったときは、頭の中で以前のランドマークと照らし合わせて、元に戻っているかどうかを確認してくださいパス (ループ終了検出)。実際には、このステップはオプションです。上記の 5 つのステップは同時に実行されるため、同時ローカリゼーションとマッピングになります。
レーザー SLAM と視覚 SLAM
VSLAM は主にカメラを使用して実装されます。カメラには多くの種類があり、主に単眼、双眼、単眼構造化光、双眼に分類されます。ライトと ToF にはいくつかのカテゴリがあります。その中心は、RGB とデプス マップ (深度情報) を取得することです。製造コストの影響により、ビジュアルSLAMは近年ますます普及していますが、低コストのカメラによるリアルタイムのマッピングと位置決めも技術的に非常に困難です。有望な深度取得方法である ToF (Time of Flight) を例に挙げます。
センサーは、変調された近赤外光を発し、物体に当たると反射し、発光と反射の時間差または位相差を計算して物体までの距離を換算します。撮影シーンを撮影して奥行き情報を生成します。レーダーと同様、またはコウモリを想像してください。softkinetic の DS325 は ToF ソリューション (TI によって設計) を使用します。ただし、受信機の微細構造は2枚以上のシャッターを備え、psレベルの時間差を測定できる比較的特殊な構造となっていますが、単位画素サイズが通常100umであるため、現状の分解能は高くありません。
深度マップを取得した後、SLAM アルゴリズムが動作し始めます。センサーや要件が異なるため、SLAM の表示形式は若干異なります。 . .レーザーSLAM(同じく2Dと3Dに分かれる)とビジュアルSLAM(同じくSparse、semiDense、Denseに分かれる)に大別できますが、主な考え方は似ています。
SLAM 技術は非常に実用的ですが、非常に難しいものでもあり、常に正確な位置決めが必要な自動運転の分野では、 SLAMの実装を完了したいのですが、それも困難がいっぱいです。一般的に言えば、SLAM アルゴリズムは実装時に主に次の 4 つの側面を考慮します: 1. 密と疎のようなマップ表現の問題は、アルゴリズムの異なる表現です。 on 実際のシーンでは選択が必要; 2. 情報認識の問題、環境を包括的に認識する方法を考慮する必要がある 通常、RGBD カメラの FOV は小さいですが、LIDAR は大きいです。 3. データの関連付けの問題: センサーが異なれば、データ型、タイムスタンプ、座標系の式も異なるため、これらを均一に処理する必要があります。 4. 位置決めと合成の問題は、多くの数学的問題、物理モデルの確立、状態推定と最適化を含む姿勢推定とモデリングを達成する方法を指します。その他には、ループ検出問題、探索問題 (探索)、誘拐問題 (誘拐) が含まれます。 。 現在人気のあるビジュアル SLAM フレームワークには、主にフロントエンドとバックエンドが含まれています: フロントエンド #フロントエンドは、フレーム間の変換関係を研究する VO (ビジュアル オドメトリ) に相当します。 まず、各フレーム画像の特徴点を抽出し、隣接するフレーム画像を使用して特徴点をマッチングし、次にRANSACを使用して大きなノイズを除去し、マッチングを実行して姿勢情報を取得します(位置と姿勢)、同時に IMU (慣性測定ユニット) によって提供される姿勢情報をフィルタリングと融合に使用できます。バックエンドは主に、フィルタリング理論 (EKF) を使用してフロントエンドの結果を最適化します。 、UKF、PF)、または最適化理論 TORO、G2O ツリーまたはグラフの最適化を実行します。最後に、最適な姿勢推定値が取得されます。 バックエンド バックエンドには、より多くの困難があり、より多くの数学的知識が必要になります。一般的に、誰もが徐々に放棄してきました。従来のフィルタリング理論に基づいてグラフの最適化に移行しました。 フィルタリング理論に基づくと、フィルタの安定性があまりにも速く増加するため、頻繁な反転が必要な EKF (拡張カルマン フィルタ) の PF に多大な圧力がかかります。 グラフベースの SLAM は、通常、複数のノードとアフィン変換行列などのノード間の相対的な変換関係を確立するためのキーフレームに基づいており、キー ノードのメンテナンスは継続的に実行されます。グラフの容量を削減し、精度を確保しながら計算量を削減します。 Slam 技術は、多くの分野で優れた導入効果と成果を上げています。モバイルロボット、ARシーン、ドローンなど。自動運転の分野では、SLAM 技術はあまり注目されていませんが、一方で、現在の自動運転産業のほとんどは RTK によって解決されているため、詳細な研究にはあまり多くのリソースが投資されません。 , SLAM技術があまり注目されていないのは、現状の技術がまだ成熟していないからでもありますが、自動運転などの生活関連分野では、どんな新技術も実用化するには時間の試練を経なければなりません。受け入れられました。 将来的には、センサーの精度が徐々に向上し、低コストで自動運転の分野でもSLAMは才能を発揮します。堅牢性が自動運転に革新的な変化をもたらします。 SLAM 技術の普及が進むにつれ、測位の才能に恵まれた人材が自動運転の分野に流入し、自動運転に新たな血液が注入され、新たな技術的方向性や研究分野がもたらされるでしょう。
SLAM アルゴリズム実装の要素
自動運転分野における SLAM の将来の応用
以上が自動運転におけるSLAM技術の応用について論じた記事の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。