ホームページ  >  記事  >  テクノロジー周辺機器  >  Haomo DriveGPT は大型モデルの「ボリュームの王様」です。 「コスト削減・効率化・ベテランドライバー」に注力

Haomo DriveGPT は大型モデルの「ボリュームの王様」です。 「コスト削減・効率化・ベテランドライバー」に注力

王林
王林転載
2023-09-17 09:01:091198ブラウズ

「開放性が発展を導き、協力が未来を勝ち取る」をテーマとした2023年中国国際サービス貿易交易会が9月6日に無事閉幕した。今回のサービス見本市では、人工知能、自動運転、衛星リモートセンシングなどの分野に長年取り組んできたリーディングカンパニーが最新の科学技術成果を展示し、未来への歩みを示しました

##自動運転ユニコーン企業Hao Mo ZhixingのデータインテリジェンスサイエンティストであるHe Xiang氏が「自動運転3.0時代の到来を加速するBei Mo DriveGPT Xuehu・Hairuo」について基調講演を行い、メディアのインタビューに応じたモデル時代の自動運転技術の研究と応用の探求は、包括的な解釈をもたらしました

Haomo DriveGPT は大型モデルの「ボリュームの王様」です。 「コスト削減・効率化・ベテランドライバー」に注力

画像の説明: データ インテリジェンス、He Xiang (右) HaoMo Zhixing の科学者がメディアのインタビューを受けています

以下はインタビューの記録です:

ホスト: 何氏、Haomo がどのような結果と展示を行っているのか紹介していただけますかZhixing は今年のサービス貿易に貢献してくれるでしょうか?

何翔氏は、今年の最も重要な成果の一つは、Hao Mo Zhixingが4月にリリースした業界初の自動運転生成モデルDriveGPTであると述べました

モデレータ: DriveGPT?運転と関係があるような気がしますが?

何翔: はい、これは自動運転分野に関連する問題を解決するために使用される大規模な AI モデルです。私たちはこれを自動運転生成事前トレーニング大規模モデル DriveGPT と呼んでいます

モデレーター:ジェネレーティブな事前トレーニング?事前トレーニングをどのように理解すればよいでしょうか?

He Xiang 氏は次のように述べています。大規模モデルの技術的な詳細は、まず大量のドライバーの運転行動データを使用して、クラウドで事前トレーニングを実施する必要があることです。事前トレーニングでは、最初にモデルをトレーニングし、トレーニング後にモデルのプロトタイプを取得し、ドライバーの引き継ぎデータを導入します。いわゆる引き継ぎデータとは、自動運転がオンになるたびに、自動運転の判断が不十分な場合、ドライバーがブレーキを踏んだり、ハンドルを握ったりするなどの操作を引き継ぐことを意味します。この乗っ取りデータは、私たちの自動運転に関する決定の修正に相当します。このデータを取得した後、モデルを継続的に修正して、モデルの運転効果をますます向上させることができます。これは、より優れた自動運転効果を達成するための、継続的なエラー修正と継続的な反復のプロセスです。

ホスト: これは、従来の自動運転のアップグレードであると言えます。書き換えた内容は以下の通りです。 司会者: これは従来の自動運転のアップグレードであると言えるでしょう 何翔: はい、技術的な変化であると言えます。単純な比較が可能ですが、従来の自動運転技術の開発モデルでは、自動運転で問題が見つかった場合、通常、大量のデータからその問題に関連するデータを見つけ出すことになりますが、そのコストは非常に高くなります。膨大なデータの中から欲しいデータを見つけるのはそう簡単ではないからです。このデータを見つけたら、次に行うことは、このデータの山をアノテーション会社に渡し、その中にある問題に手動でアノテーションを付けることです。アノテーションが完了したら、このデータを使用して小さなモデルをトレーニングします。このモデルはトレーニング後、車に置きます。現時点では、この車にはこの問題を解決する能力があり、私たちはこのモデルをスモールデータおよびスモールモデルと呼んでおり、「問題駆動型」です。

DriveGPT の大規模モデルでは、開発モデル全体が異なります。 DriveGPT のサポートにより、現在の開発モデルでは、まず大量のデータ、ベテランドライバーのデータ、運転行動を使用して事前トレーニングを実施し、運転能力のある予備モデルを取得します。自動運転中に問題を発見した場合、ドライバーが運転を引き継ぎますが、この引き継ぎは運転判断を修正することに相当し、修正されたデータに基づいて、元の事前学習済みの大規模モデルを修正するためにデータが送り返されます。データの閉ループが確立されると、このモデルの効果は日々進化し、改善され続けます。この開発モデルをビッグデータやビッグモデルと呼び、「データ駆動型」となります。これは画期的な改善です。

司会者: 現在の自動運転技術のレベルはおよそ L2 レベルであり、現在ではほとんどの車両が L2.5 レベルに達していることがわかります。

何翔: L2、私たちはそれを高レベルと呼んでいます。運転支援。

モデレーター: 大型モデルの DriveGPT のサポートにより、どの程度のレベルを達成できますか?

何翔: まだ高レベルの運転支援段階にあるはずです。私たちの大規模モデルは主に 2 つのビジネス価値を生み出します。

最初のビジネス価値はクラウド全体にあります。従来の自動運転開発モデルはクラウドに移行する必要があり、これには非常に高いコストがかかり、多くのデータ スクリーニング、特に手動による参加と大量の手動注釈が必要になります。ただし、大規模なモデルでは、データのスクリーニング、アノテーション、データ生成全体を完全に自動化できるため、コスト削減に非常に効果的です

たとえば、アノテーションの分野では、自動運転企業はアノテーションに毎年数億元を費やしているはずです。DriveGPT を使用すると、画像やビデオに自動的にアノテーションを付けることができます。ビデオ アノテーションや 4D クリップ ラベリングを行う場合は、おそらく可能です。コストを98%削減します。アノテーションを付ける画像が 1 枚だけの場合でも、コストを 90% 削減できます。クラウドのコストは大幅に削減できます。

2 番目のビジネス価値は自動車側にあり、その効果は大幅に向上します。モデルは大量のデータに基づいてトレーニングされています。大量のデータとは、モデルが多くのデータを確認したことを意味します。モデルはあらゆる種類のシナリオを確認しました。情報が多ければ多いほど、その能力はより強力になります。この能力は、モデルまたは AI の汎化能力と呼ばれます。一般化機能があれば、自動運転の効果はさらに高まります。

さらに、モデル全体は「高齢ドライバー」の運転行動データに基づいてトレーニングされており、非常に高品質のデータです。その全体的な運転効果や運転体験は「高齢ドライバー」の運転行動データに近づきます。 」。ユーザーは使用中に運転体験がより良くなることを感じるでしょう。

3 番目のポイントは、私たちの大規模モデルには、意思決定を推進する理由を出力する特別な機能があります。たとえば、「ブレーキを踏む」または「ハンドルを回す」などの運転上の決定が行われた場合、モデルはその行動がとられた理由を説明できます。このような説明ができれば、知能運転車両とユーザーの間に良好な信頼関係が構築でき、ユーザーはより安心して自動運転製品を利用できるようになります。

大規模なモデルとデータに基づいた継続的な反復により、閉ループ 、現在の高度な運​​転支援では、いつでもドライバーが運転を引き継ぐ必要があります。将来的には、継続的な反復アップグレードを通じて、真の無人運転を徐々に実現したいと考えています。

ホスト: この観点から見ると、コストが削減されるだけでなく、効率も向上します。

He Xiang 氏は次のように述べています。 「ドライバーは何度も試行錯誤する必要はありません。ビッグデータがこの問題の解決に役立ちます。ビッグデータはすべてのドライバーの乗っ取り行動を収集し、すべての問題を一度に解決できます。このようにして、運転効果は非常に迅速に改善されます。」 「###

以上がHaomo DriveGPT は大型モデルの「ボリュームの王様」です。 「コスト削減・効率化・ベテランドライバー」に注力の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はjiqizhixin.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。