ホームページ > 記事 > テクノロジー周辺機器 > NVIDIA が新時代を開く: ロボット トレーニング データ用の「永久運動マシン」
これまでの合成データのほとんどは、AI の大規模モデルのトレーニングに使用されていましたが、今回、NVIDIA はロボット トレーニング用の「データ倉庫」を構築しました。ロボット技術の開発ペースが他の AI 分野に大きく遅れをとっている主な理由の 1 つです。データが不足しています。わずか 200 人の人間によるデモンストレーション ソース データを使用して、システムは 50,000 のトレーニング データを直接生成できます。
AI による膨大なデータ需要により、データ リソースが枯渇しつつあるため、さまざまな企業がデータを取得するための「新しい方法」、つまり独自のデータを「作成」する方法を模索し始めています。 ただし、以前の合成データのほとんどは大規模な AI モデルのトレーニングに使用されていましたが、今回、NVIDIA はロボットのトレーニング用に「データ倉庫」を作成しました。
Nvidia とテキサス大学オースティン校による最近の研究論文では、少数の人によるデモンストレーションだけで大規模なロボット トレーニング データ セットを自動的に生成できる「MimicGen」と呼ばれるシステムが紹介されています。 Nvidiaの上級科学者ジム・ファン氏は、同社は生成されたデータセットを含むすべてをオープンソース化すると述べた。
生成されるデータのサイズはどれくらいですか? MimicGen は、10 人の人間によるデモンストレーションを使用して 1,000 の合成例を生成できます。200 人の人間によるデモンストレーションを使用すると、MimicGen は 18 のタスクと複数のシミュレーション環境を含む 50,000 のトレーニング データを直接生成できます。
生成されたデータセットはどのようになりますか?MimicGen は、既存のデータに基づいて同じシーンをさまざまな段階で「進化」させることができます:
また、アイテムの組み立て、コーヒーの注ぎ、マグカップの洗浄など、幅広いタスク リセット分布にわたってさまざまなデータ セットを生成することもできます。
さまざまな新しいロボット アームのデモを生成できます:
さらに、長期のトレーニングが必要なタスク データもあります:
現実世界のシーンデータも問題ありません:
研究者らが異なるソース データ セットによって生成されたデータを比較したことは注目に値します。しかし、彼らは 2 つの結果セットが同等であることを発見しました。これは、
「(ソース) データの品質は、大規模なデータ メカニズムではそれほど重要ではない可能性があります。」を示唆しています。 それだけでなく、研究者らは 10 人の人間によるデモンストレーションと 200 人の人間によるデモンストレーションによって生成されたデータも比較しましたが、結果にも大きな違いはありませんでした。したがって、人間によるデモンストレーションデータが増えると冗長性や不必要なデータ注釈コストが発生するかどうかについて、さらなる研究が必要であることも論文は認めています。
なぜそこまで合成データにこだわるのですか?記事の冒頭で述べた限られたソース データ リソースに加えて、データの収集にも非常に費用と時間がかかります。MimicGen のようなシステムを使用すると、
はわずかな量のデータで大規模でリッチなデータ セットを自動的に生成できます。これらのデータセットは、複数のシーン、オブジェクトの機能、ロボットアームにまたがっており、長期的なタスクや高精度のタスクにも使用でき、「ロボットの学習を拡張するための強力かつ経済的な方法」と言えます。"合成データは、私たちの「飢えた」モデルにテラスケール データの次の波を提供します。
" NVIDIA シニア サイエンティストのジム ファンは、MimicGen を紹介する際に次のように述べています。開発のペースが他のAI分野に大きく遅れているのは、データが不足しているためです。インターネットから(ロボットの)制御信号を取得することができません。」「インターネット上の高品質なリアルデータは急速に枯渇しつつあり、合成データから生まれる AI が今後の発展の方向性となります。 出典: Science and Technology Innovation Board Daily
以上がNVIDIA が新時代を開く: ロボット トレーニング データ用の「永久運動マシン」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。