ホームページ > 記事 > テクノロジー周辺機器 > データクローズドループ研究: 自動運転の開発はテクノロジー主導からデータ主導へ移行
Zozi Auto R&Dは「2022年中国自動運転データクローズドループ調査報告書」を発表しました。
現在、自動運転センサー ソリューションとコンピューティング プラットフォームはますます高度化しています。均質なサプライヤーとの技術格差は日に日に縮まっています。過去 2 年間で自動運転技術は急速に進歩し、量産も加速しました。 Zuosiデータセンターによると、2021年には国内のL2運転支援乗用車の累計台数は479万台に達し、前年比58.0%増加する見込みだ。 2022年1月から6月にかけて、中国の新車乗用車市場におけるL2運転支援の普及率は32.4%に上昇した。
自動運転の場合、データは研究開発、テスト、量産、運用、メンテナンスのライフサイクル全体を通じて実行されます。スマート コネクテッド カー センサーの数の急速な増加に伴い、ADAS や自動運転車によって生成されるデータの量も、GB から TB、PB、EB、そして将来的には ZB へと指数関数的に増加しています。データ主導の自動車の進化を利用してユーザーの個別のニーズを満たすことによってのみ、自動車会社はさらに前進することができます。
「自動車収集データの処理に関する安全ガイドライン」によれば、自動車収集データとは、自動車のセンシング機器や制御装置によって収集されたデータおよび処理後に生成されるデータを指します。車外データ、コックピットデータ、運行データ、位置軌跡データなどに分かれています。
中国サイバースペース局が2021年8月に公布した「自動車データセキュリティ管理に関するいくつかの規定(試行)」によると、収集、分析、保管、送信、自動車データの照会、適用、削除など全体の処理が詳細に規定されています。自動車データ処理のプロセスでは、無秩序な収集と自動車の違法な乱用を減らすために、「車内処理」、「デフォルトでは収集なし」、「適用される精度の範囲」、「非感作処理」というデータ処理原則を遵守します。データ。自動運転技術の開発プロセスでは、まずデータの収集と処理が合法かつコンプライアンスに準拠していなければなりません。
車載カメラ、ミリ波レーダー、ライダーから超音波および超音波レーダーによって収集された大量の非構造化データ (画像、ビデオ、音声) は、生のままで混沌としたものになる可能性があります。データを意味のあるものにするには、データを整理し、構造化し、整理する必要があります。複数のソースからのデータは、まず適切なリポジトリにインポートされ、データ形式が標準化され、関連するルールに従って集約されます。次に、データ ポイントの破損、重複、欠落がないかチェックし、データ セットの全体的な品質に影響を与える可能性のある不要なデータを破棄します。最後に、昼、夜、晴れ、雨など、さまざまな条件で撮影されたビデオを分類するためにラベルが使用されます。このステップでは、トレーニングと検証に使用されるクリーンな構造化データが提供されます。
#データ アノテーション データ収集後にクリーンアップされた構造化データは、ラベルになります。アノテーションは、コード化された値を生データに割り当てるプロセスです。エンコードされた値には、クラス ラベルの割り当て、境界ボックスの描画、オブジェクト境界のマークが含まれますが、これらに限定されません。教師あり学習モデルにオブジェクトが何であるかを教え、訓練されたモデルのパフォーマンスを測定するには、高品質のアノテーションが必要です。 自動運転の分野では、データ アノテーション処理のシナリオには通常、車線変更や追い越し、交差点の通過、保護されていない左折や右折などが含まれます。赤信号を走行する車両、道路を横断する歩行者、路肩に不法駐車している車両など、いくつかの複雑なロングテールシーンが含まれます。 一般的に使用される注釈ツールには、一般的な画像描画、車線境界線注釈、ドライバーの顔注釈、3D 点群注釈、2D/3D 融合注釈、パノラマ セマンティック セグメンテーションなどが含まれます。ビッグ データの発展と大規模なデータ セットの数の増加により、データ アノテーション ツールの使用は急速に拡大し続けています。 データ送信 現在、データ収集の頻度はミリ秒レベルになっています。データの損失、乱れ、ジャンプや遅延を回避しながら、数千の信号次元 (バス信号、センサーの内部状態、ソフトウェアの埋め込みポイント、ユーザーの行動や環境認識データなど) の高精度データを必要とします。 at high 高精度・高品質を前提に、伝送・保存コストを大幅に削減。 Internet of Vehicles データのアップリンクとダウンリンクは比較的長く (車両 MCU、DCU、ゲートウェイ、4G/5G からクラウドまで)、各リンク ノードのデータ伝送品質を確保する必要があります。データ伝送における新たな変化に対応して、一部の企業は、リアルタイム データに基づく、Zhixiehui や EXCEEDDATA の柔軟なデータ収集プラットフォーム ソリューションなど、効率的なデータ収集と車両とクラウドの統合伝送ソリューションを提供できるようになりました。車両エッジコンピューティング環境では、10ミリ秒レベルのリアルタイムコンピューティングを使用して柔軟なデータ収集およびアップロード機能をトリガーし、アップロードされたデータは計算およびフィルタリングされ、アップロードされるデータ量が大幅に削減されます。さらに、車両からのオリジナル信号は100〜300倍に圧縮されてロスレスに保存され、クラウド管理プラットフォームは車両からの高品質信号をロスなく高圧縮率で保存し、データ収集アルゴリズムの発行、トリガーをサポートします。複数の取得モード、および収集されたデータのリアルタイムアップロード ビジネスデスクトップへのワンクリックダウンロード、車両、イベント、期間などによる複数の柔軟なフィルタリング、使いやすく解決しやすい、ストレージと計算の分離、車両・クラウド同型データ収集・計算・アップロード・処理の閉ループを実現、2021年に国内初のEXCEEDDATAソリューションを搭載した量産モデル(HiPhiX)を発売。
出典: Zhixiehuitong
周囲の環境をより明確に認識するために、自動運転車にはより多くのセンサーが搭載され、大量のデータが生成されます。一部の高度な自動運転システムには、車両周囲の 360 度の環境を正確に認識するために 40 を超えるさまざまなセンサーが装備されています。自動運転システムの開発には、データ収集、データ集約、クリーニングとラベル付け、モデルトレーニング、シミュレーション、ビッグデータ分析などの複数のステップが必要です。このプロセスには、大量のデータの集約と保存、異なるリンクにある異なるシステム間のデータフローが含まれます。モデルのトレーニング中に大量のデータを読み書きします。データはストレージのボトルネックという新たな課題に直面しています。
この目的を達成するために、この分野における多くのクラウド サービス プロバイダーのテクノロジーと能力が、自動車会社の勝利を支援する鍵となっています。たとえば、Amazon Cloud Technology AWS は自動運転データレイクを中心として使用し、自動車会社がエンドツーエンドの自動運転データの閉ループを構築できるように支援します。 Amazon Simple Storage Service (Amazon S3、クラウド オブジェクト ストレージ サービス) を使用して自動運転データレイクを構築し、データ収集、データ管理と分析、データ注釈、モデルとアルゴリズム開発、シミュレーション検証、マップ開発、DevOps と MLOps を実現します。自動車会社 自動運転の全プロセスの開発、テスト、応用をより簡単に実現できます。
出典: AWS
国内テクノロジー大手の中で、Baidu データ クローズド ループ ソリューションを例に挙げると、そのデータ ストレージは次のようなサービスを提供します。路側車・車両のマルチソースデータ情報のデータ検索サービス。ビジネスプラットフォーム上で大量のデータを検索し、多次元検索(車両情報、走行距離、自動運転継続時間など)、データからライフサイクル全体を管理生産から廃棄まで、パノラマ データ ビュー、データ トレーサビリティ、オープン データ共有などの利点をサポートします。
出典: Baidu
自動運転の開発はテクノロジー主導からデータ主導に移行しましたが、データ主導のビジネス モデルは多くの困難に直面しています。
膨大なデータの処理が難しい:高度な自動運転実験車両が毎日収集するデータ量はTBレベルで、開発チームにはPBレベルの保管スペースが必要ですが、これらのデータはトレーニングに使用できます。値のデータが占める割合は 5% 未満です。さらに、車載カメラ、LIDAR、高精度測位などのセンサーによって収集されたデータには厳格な安全性コンプライアンス要件があり、大量のデータへのアクセス、保存、感度の低下、処理に大きな課題をもたらしていることは間違いありません。
データ注釈のコストは高い: データ注釈には多くの人的コストと時間コストがかかります。高度な自動運転機能の開発に伴い、シナリオはますます複雑になり、より困難なシナリオが出現することになります。車両認識モデルの精度を向上させるには、トレーニング データ セットの規模と品質に対してより高い要件が課されます。従来の手動アノテーションでは、効率とコストの観点から、モデルトレーニング用の大規模なデータセットの需要を満たすことができませんでした。
シミュレーション テストの効率が低い: 仮想シミュレーションは、自動運転アルゴリズムのトレーニングを加速する効果的な手段ですが、シミュレーション シナリオの構築が難しく、復元の程度が低く、特に一部の複雑で危険なシナリオは困難です。建設するのが難しい。さらに、並列シミュレーション能力が不十分であり、シミュレーションテストの効率が低く、アルゴリズムの反復サイクルが長すぎます。
高精度地図のカバー率が低い: 高精度地図は主に自己収集および自作の地図に依存しており、実験段階で指定された道路のシナリオのみを満たしています。将来的には、商用化され、全国の主要都市の都市部の道路に拡張される予定ですが、カバー範囲、動的な更新、コストと効率の面で非常に顕著な課題に直面することになります。
さまざまな困難や問題を解決するために、自動運転を効率的に開発するには、効率的なデータクローズドループシステムを構築する必要があります。
出典: Freetech
自動運転データの閉ループに関しては、コーナーで自動運転の実現には常に問題を解決する必要があり、そのためには十分なデータサンプルと車両側での便利な検証方法が必要です。シャドウ モードは、コーナーケースを解決するための最良のソリューションの 1 つです。
シャドウ モードは、2019 年 4 月にテスラによって提案され、関連する決定を比較し、データのアップロードをトリガーするために車両に適用されました。販売車両の自動運転ソフトウェアは、センサーによって検出されたデータを継続的に記録し、機械学習と元の自動運転アルゴリズムの改善のために適切なタイミングで選択的に送信するために使用されます。
Dojo スーパーコンピューターは、教師なしの注釈やトレーニングに大量のビデオ データを使用できます。
2021年、テスラは世界で93万6,200台の車両を納入し、そのうち48万4,100台が中国の工場で納入されました。 2022年上半期には56万台が納入される予定。テスラは大量生産を利用し、シャドウ モードを通じてアルゴリズムを継続的に最適化しています。シャドウ モードを使用して、数百万台の販売車両をテスト車両として使用し、周囲の認識や特殊な道路状況をキャプチャし、不確実な出来事を予測、回避し、そこから学習する能力を継続的に強化します。それをサポートするために何百万台も販売された車両があるため、コーナーケースや極端な労働条件のカバレッジはより包括的になります. 柔軟なトリガリングによって収集された高品質のデータは、より良いアルゴリズムを反復することができ、アルゴリズムの反復の卓越性がその価値を決定しますソフトウェア。ソフトウェア アップグレード サブスクリプション サービスに関しては、データ クローズド ループの爆発的な力が現れたばかりです。
自動運転システムの継続的な反復の前提は、アルゴリズムの継続的な最適化とアルゴリズム 卓越性はデータ閉ループシステムの効率に左右される 自動運転開発の各シナリオにおけるデータの効率的なフローが重要である データインテリジェンスが自動運転車の量産を加速する鍵となる自動運転。
2021 年 12 月、HaoMo Zhixing は、中国初の自動運転データ インテリジェンス システムである MANA Xuehu を正式にリリースしました。これは、知覚、認知、注釈、シミュレーション、シミュレーションの 5 つの主要な機能から自動運転を加速します。計算、運転技術の進化。今後 3 年間で、運転支援システムは 100 万台以上の乗用車に搭載される可能性があります。 Haomo Zhixing は、完全に自社開発した自動運転システムを利用して、データの蓄積、処理、および応用において大きな利点を達成しました。大量のデータは技術の反復による利点をもたらします。コスト削減と効率向上のメリットは明らかです。
別の例として、Momenta は、知覚、融合、予測、制御などのアルゴリズム モジュールを含む、最先端のフルプロセスのデータ駆動型技術機能を実現しており、これらはシステム内で効率的に反復できます。データドリブンな方法で更新を行います。そのクローズド ループ オートメーションは、データ フローによるデータ駆動型アルゴリズムの自動反復を可能にする一連のツール チェーンです。 CLA は、大量のゴールデン データを自動的にフィルタリングし、アルゴリズムの自動反復を駆動し、自動駆動フライホイールの回転をますます速くすることができます。
出典: Momenta
ソフトウェア デファインド カーの文脈では、データ、アルゴリズム、コンピューティング能力が自動運転開発のトロイカです。自動車会社の研究開発サイクルが短縮され、機能の反復が加速され、将来的には、低コスト、高効率で継続的にデータを収集し、実際のデータを通じてアルゴリズムを反復して、最終的にデータの閉ループを形成し、ビジネスのクローズドループは、自動運転企業の持続可能な発展の鍵です。
以上がデータクローズドループ研究: 自動運転の開発はテクノロジー主導からデータ主導へ移行の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。