検索
ホームページテクノロジー周辺機器AI自動運転におけるSLAM技術の応用について論じた記事

自動運転において測位はかけがえのない位置を占めており、今後の発展が期待されています。現在、自動運転における測位はRTKと高精度地図に依存しているため、自動運転の実装には多大なコストと困難が加わります。想像してみてください。人間が運転するとき、自分自身の全世界の高精度測位や詳細な周囲環境を知る必要はありません。全地球的なナビゲーション パスを持ち、そのパス上の車両の位置を照合するだけで十分です。ここで必要なのは、 SLAM分野のキーテクノロジー。

SLAM とは

SLAM (Simultaneous Localization and Mapping)、CML (Concurrent Mapping and Localization) とも呼ばれるリアルタイム測位マップの構築、またはマッピングと位置決めを同時に実行します。この問題は次のように説明できます: ロボットを未知の環境の未知の場所に置く場合、ロボットがどの方向に移動するかを決定しながら、環境の完全な地図を徐々に描画する方法はあるでしょうか?たとえば、掃除ロボットは非常に典型的な SLAM 問題であり、いわゆる完全なマップ (一貫したマップ) とは、ロボットが障害物なしに部屋のアクセス可能な隅々まで移動できることを意味します。

自動運転におけるSLAM技術の応用について論じた記事

SLAM は、1988 年に Smith、Self、Cheeseman によって初めて提案されました。その重要な理論的および応用的価値により、多くの学者によって、真の完全自律移動ロボットを実現するための鍵であると考えられています。

模擬人間が見知らぬ環境に来たとき、すぐに環境に慣れて自分のタスク (レストランを探す、ホテルを探すなど) を完了するために、次のことを行う必要があります。

a. 周囲の建物、大木、花壇などのランドマークを目で観察し、その特徴を記憶します(特徴抽出)

#b. 双眼鏡で得た情報をもとに、自分の頭の中で特徴的なランドマークを三次元地図上に再構築する(三次元再構築)

#c. 歩行中は常に新しいフィーチャ ランドマークを取得し、頭の中でマップ モデルを修正します (バンドル調整または EKF)

d. に基づいて位置 (軌道) を決定します。以前に歩いて得た地物ランドマーク

e. 意図せず遠くまで歩いてしまったときは、頭の中で以前のランドマークと照らし合わせて、元に戻っているかどうかを確認してくださいパス (ループ終了検出)。実際には、このステップはオプションです。上記の 5 つのステップは同時に実行されるため、同時ローカリゼーションとマッピングになります。

レーザー SLAM と視覚 SLAM

現在 SLAM で使用されているセンサーは、主に LIDAR とカメラの 2 つのカテゴリに分類されます。 LiDAR は、角度分解能と精度が異なるシングルライン タイプとマルチライン タイプに分類できます。

自動運転におけるSLAM技術の応用について論じた記事

VSLAM は主にカメラを使用して実装されます。カメラには多くの種類があり、主に単眼、双眼、単眼構造化光、双眼に分類されます。ライトと ToF にはいくつかのカテゴリがあります。その中心は、RGB とデプス マップ (深度情報) を取得することです。製造コストの影響により、ビジュアルSLAMは近年ますます普及していますが、低コストのカメラによるリアルタイムのマッピングと位置決めも技術的に非常に困難です。有望な深度取得方法である ToF (Time of Flight) を例に挙げます。

センサーは、変調された近赤外光を発し、物体に当たると反射し、発光と反射の時間差または位相差を計算して物体までの距離を換算します。撮影シーンを撮影して奥行き情報を生成します。レーダーと同様、またはコウモリを想像してください。softkinetic の DS325 は ToF ソリューション (TI によって設計) を使用します。ただし、受信機の微細構造は2枚以上のシャッターを備え、psレベルの時間差を測定できる比較的特殊な構造となっていますが、単位画素サイズが通常100umであるため、現状の分解能は高くありません。

自動運転におけるSLAM技術の応用について論じた記事

深度マップを取得した後、SLAM アルゴリズムが動作し始めます。センサーや要件が異なるため、SLAM の表示形式は若干異なります。 . .レーザーSLAM(同じく2Dと3Dに分かれる)とビジュアルSLAM(同じくSparse、semiDense、Denseに分かれる)に大別できますが、主な考え方は似ています。

SLAM アルゴリズム実装の要素

SLAM 技術は非常に実用的ですが、非常に難しいものでもあり、常に正確な位置決めが必要な自動運転の分野では、 SLAMの実装を完了したいのですが、それも困難がいっぱいです。一般的に言えば、SLAM アルゴリズムは実装時に主に次の 4 つの側面を考慮します:

1. 密と疎のようなマップ表現の問題は、アルゴリズムの異なる表現です。 on 実際のシーンでは選択が必要;

2. 情報認識の問題、環境を包括的に認識する方法を考慮する必要がある 通常、RGBD カメラの FOV は小さいですが、LIDAR は大きいです。

3. データの関連付けの問題: センサーが異なれば、データ型、タイムスタンプ、座標系の式も異なるため、これらを均一に処理する必要があります。

4. 位置決めと合成の問題は、多くの数学的問題、物理モデルの確立、状態推定と最適化を含む姿勢推定とモデリングを達成する方法を指します。その他には、ループ検出問題、探索問題 (探索)、誘拐問題 (誘拐) が含まれます。 。

自動運転におけるSLAM技術の応用について論じた記事

現在人気のあるビジュアル SLAM フレームワークには、主にフロントエンドとバックエンドが含まれています:

フロントエンド

#フロントエンドは、フレーム間の変換関係を研究する VO (ビジュアル オドメトリ) に相当します。

まず、各フレーム画像の特徴点を抽出し、隣接するフレーム画像を使用して特徴点をマッチングし、次にRANSACを使用して大きなノイズを除去し、マッチングを実行して姿勢情報を取得します(位置と姿勢)、同時に IMU (慣性測定ユニット) によって提供される姿勢情報をフィルタリングと融合に使用できます。バックエンドは主に、フィルタリング理論 (EKF) を使用してフロントエンドの結果を最適化します。 、UKF、PF)、または最適化理論 TORO、G2O ツリーまたはグラフの最適化を実行します。最後に、最適な姿勢推定値が取得されます。

バックエンド

バックエンドには、より多くの困難があり、より多くの数学的知識が必要になります。一般的に、誰もが徐々に放棄してきました。従来のフィルタリング理論に基づいてグラフの最適化に移行しました。

フィルタリング理論に基づくと、フィルタの安定性があまりにも速く増加するため、頻繁な反転が必要な EKF (拡張カルマン フィルタ) の PF に多大な圧力がかかります。

グラフベースの SLAM は、通常、複数のノードとアフィン変換行列などのノード間の相対的な変換関係を確立するためのキーフレームに基づいており、キー ノードのメンテナンスは継続的に実行されます。グラフの容量を削減し、精度を確保しながら計算量を削減します。

自動運転分野における SLAM の将来の応用

Slam 技術は、多くの分野で優れた導入効果と成果を上げています。モバイルロボット、ARシーン、ドローンなど。自動運転の分野では、SLAM 技術はあまり注目されていませんが、一方で、現在の自動運転産業のほとんどは RTK によって解決されているため、詳細な研究にはあまり多くのリソースが投資されません。 , SLAM技術があまり注目されていないのは、現状の技術がまだ成熟していないからでもありますが、自動運転などの生活関連分野では、どんな新技術も実用化するには時間の試練を経なければなりません。受け入れられました。

自動運転におけるSLAM技術の応用について論じた記事

将来的には、センサーの精度が徐々に向上し、低コストで自動運転の分野でもSLAMは才能を発揮します。堅牢性が自動運転に革新的な変化をもたらします。 SLAM 技術の普及が進むにつれ、測位の才能に恵まれた人材が自動運転の分野に流入し、自動運転に新たな血液が注入され、新たな技術的方向性や研究分野がもたらされるでしょう。

以上が自動運転におけるSLAM技術の応用について論じた記事の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
AIのスキルギャップは、サプライチェーンのダウンを遅くしていますAIのスキルギャップは、サプライチェーンのダウンを遅くしていますApr 26, 2025 am 11:13 AM

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか? サプライチェーン管理協会(ASCM)のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します

1つの会社がAIを永遠に変えるために静かに取り組んでいる方法1つの会社がAIを永遠に変えるために静かに取り組んでいる方法Apr 26, 2025 am 11:12 AM

分散型AI革命は静かに勢いを増しています。 今週の金曜日、テキサス州オースティンでは、ビテンサーのエンドゲームサミットは極めて重要な瞬間を示し、理論から実用的な応用に分散したAI(DEAI)を移行します。 派手なコマーシャルとは異なり

Nvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますNvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますApr 26, 2025 am 11:11 AM

エンタープライズAIはデータ統合の課題に直面しています エンタープライズAIの適用は、ビジネスデータを継続的に学習することで正確性と実用性を維持できるシステムを構築する大きな課題に直面しています。 NEMOマイクロサービスは、NVIDIAが「データフライホイール」と呼んでいるものを作成することにより、この問題を解決し、AIシステムがエンタープライズ情報とユーザーインタラクションへの継続的な露出を通じて関連性を維持できるようにします。 この新しく発売されたツールキットには、5つの重要なマイクロサービスが含まれています。 NEMOカスタマイザーは、より高いトレーニングスループットを備えた大規模な言語モデルの微調整を処理します。 NEMO評価者は、カスタムベンチマークのAIモデルの簡素化された評価を提供します。 Nemo Guardrailsは、コンプライアンスと適切性を維持するためにセキュリティ管理を実装しています

aiは芸術とデザインの未来のために新しい絵を描きますaiは芸術とデザインの未来のために新しい絵を描きますApr 26, 2025 am 11:10 AM

AI:芸術とデザインの未来 人工知能(AI)は、前例のない方法で芸術とデザインの分野を変えており、その影響はもはやアマチュアに限定されませんが、より深く影響を与えています。 AIによって生成されたアートワークとデザインスキームは、広告、ソーシャルメディアの画像生成、Webデザインなど、多くのトランザクションデザインアクティビティで従来の素材画像とデザイナーに迅速に置き換えられています。 ただし、プロのアーティストやデザイナーもAIの実用的な価値を見つけています。 AIを補助ツールとして使用して、新しい美的可能性を探求し、さまざまなスタイルをブレンドし、新しい視覚効果を作成します。 AIは、アーティストやデザイナーが繰り返しタスクを自動化し、さまざまなデザイン要素を提案し、創造的な入力を提供するのを支援します。 AIはスタイル転送をサポートします。これは、画像のスタイルを適用することです

エージェントAIとのズームがどのように革命を起こしているか:会議からマイルストーンまでエージェントAIとのズームがどのように革命を起こしているか:会議からマイルストーンまでApr 26, 2025 am 11:09 AM

最初はビデオ会議プラットフォームで知られていたZoomは、エージェントAIの革新的な使用で職場革命をリードしています。 ZoomのCTOであるXD Huangとの最近の会話は、同社の野心的なビジョンを明らかにしました。 エージェントAIの定義 huang d

大学に対する実存的な脅威大学に対する実存的な脅威Apr 26, 2025 am 11:08 AM

AIは教育に革命をもたらしますか? この質問は、教育者と利害関係者の間で深刻な反省を促しています。 AIの教育への統合は、機会と課題の両方をもたらします。 Tech Edvocate NotesのMatthew Lynch、Universitとして

プロトタイプ:アメリカの科学者は海外の仕事を探していますプロトタイプ:アメリカの科学者は海外の仕事を探していますApr 26, 2025 am 11:07 AM

米国における科学的研究と技術の開発は、おそらく予算削減のために課題に直面する可能性があります。 Natureによると、海外の雇用を申請するアメリカの科学者の数は、2024年の同じ期間と比較して、2025年1月から3月まで32%増加しました。以前の世論調査では、調査した研究者の75%がヨーロッパとカナダでの仕事の検索を検討していることが示されました。 NIHとNSFの助成金は過去数か月で終了し、NIHの新しい助成金は今年約23億ドル減少し、3分の1近く減少しました。リークされた予算の提案は、トランプ政権が科学機関の予算を急激に削減していることを検討しており、最大50%の削減の可能性があることを示しています。 基礎研究の分野での混乱は、米国の主要な利点の1つである海外の才能を引き付けることにも影響を与えています。 35

オープンAIの最新のGPT 4.1ファミリ - 分析VidhyaオープンAIの最新のGPT 4.1ファミリ - 分析VidhyaApr 26, 2025 am 10:19 AM

Openaiは、強力なGPT-4.1シリーズを発表しました。実際のアプリケーション向けに設計された3つの高度な言語モデルのファミリー。 この大幅な飛躍は、より速い応答時間、理解の強化、およびTと比較した大幅に削減されたコストを提供します

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。