NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」-AI-php.cn

ホームページ

テクノロジー周辺機器

NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 30, 2023 pm 02:49 PM

ロボットトレーニングデータ永久機関

これまでの合成データのほとんどは、AI の大規模モデルのトレーニングに使用されていましたが、今回、NVIDIA はロボットトレーニング用の「データ倉庫」を構築しました。ロボット技術の開発ペースが他の AI 分野に大きく遅れをとっている主な理由の 1 つです。データが不足しています。わずか 200 人の人間によるデモンストレーションソースデータを使用して、システムは 50,000 のトレーニングデータを直接生成できます。

AI による膨大なデータ需要により、データリソースが枯渇しつつあるため、さまざまな企業がデータを取得するための「新しい方法」、つまり独自のデータを「作成」する方法を模索し始めています。ただし、以前の合成データのほとんどは大規模な AI モデルのトレーニングに使用されていましたが、今回、NVIDIA はロボットのトレーニング用に「データ倉庫」を作成しました。

Nvidia とテキサス大学オースティン校による最近の研究論文では、少数の人によるデモンストレーションだけで大規模なロボットトレーニングデータセットを自動的に生成できる「MimicGen」と呼ばれるシステムが紹介されています。 Nvidiaの上級科学者ジム・ファン氏は、同社は生成されたデータセットを含むすべてをオープンソース化すると述べた。

NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」

生成されるデータのサイズはどれくらいですか? MimicGen は、10 人の人間によるデモンストレーションを使用して 1,000 の合成例を生成できます。200 人の人間によるデモンストレーションを使用すると、MimicGen は 18 のタスクと複数のシミュレーション環境を含む 50,000 のトレーニングデータを直接生成できます。

生成されたデータセットはどのようになりますか?

MimicGen は、既存のデータに基づいて同じシーンをさまざまな段階で「進化」させることができます:

NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」

また、アイテムの組み立て、コーヒーの注ぎ、マグカップの洗浄など、幅広いタスクリセット分布にわたってさまざまなデータセットを生成することもできます。

NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」さまざまな新しいロボットアームのデモを生成できます:

さらに、長期のトレーニングが必要なタスクデータもあります:

NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」現実世界のシーンデータも問題ありません:

NVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」研究者らが異なるソースデータセットによって生成されたデータを比較したことは注目に値します。しかし、彼らは 2 つの結果セットが同等であることを発見しました。これは、

「(ソース) データの品質は、大規模なデータメカニズムではそれほど重要ではない可能性があります。」

を示唆しています。それだけでなく、研究者らは 10 人の人間によるデモンストレーションと 200 人の人間によるデモンストレーションによって生成されたデータも比較しましたが、結果にも大きな違いはありませんでした。したがって、人間によるデモンストレーションデータが増えると冗長性や不必要なデータ注釈コストが発生するかどうかについて、さらなる研究が必要であることも論文は認めています。

なぜそこまで合成データにこだわるのですか?記事の冒頭で述べた限られたソースデータリソースに加えて、データの収集にも非常に費用と時間がかかります。MimicGen のようなシステムを使用すると、

はわずかな量のデータで大規模でリッチなデータセットを自動的に生成できます。これらのデータセットは、複数のシーン、オブジェクトの機能、ロボットアームにまたがっており、長期的なタスクや高精度のタスクにも使用でき、「ロボットの学習を拡張するための強力かつ経済的な方法」と言えます。

"合成データは、私たちの「飢えた」モデルにテラスケールデータの次の波を提供します。

" NVIDIA シニアサイエンティストのジムファンは、MimicGen を紹介する際に次のように述べています。開発のペースが他のAI分野に大きく遅れているのは、データが不足しているためです。インターネットから（ロボットの）制御信号を取得することができません。」

「インターネット上の高品質なリアルデータは急速に枯渇しつつあり、合成データから生まれる AI が今後の発展の方向性となります。出典: Science and Technology Innovation Board Daily

以上がNVIDIA が新時代を開く: ロボットトレーニングデータ用の「永久運動マシン」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Openai＆＃039; s o1-preview vs o1-mini：AGIへの一歩Apr 12, 2025 am 10:04 AM

導入 9月12日に、Openaiは「LLMSとの推論学習」というタイトルのアップデートをリリースしました。彼らは、複雑な推論タスクに取り組むために補強学習を使用して訓練されたO1モデルを導入しました。このmodを設定するもの

Openai O1でゲームを構築する方法は？ - 分析VidhyaApr 12, 2025 am 10:03 AM

導入 Openai O1モデルファミリは、特に科学、コーディング、問題解決において、推論と経済のパフォーマンスを大幅に進めています。 Openaiの目標は、これまでにない高度なAIとO1モデルを作成することです

導入今日、顧客クエリ管理の世界は前例のないペースで動いており、新しいツールが毎日見出しを作っています。大規模な言語モデル（LLM）エージェントは、このコンテキストでの最新のイノベーションであり、CUを後押しします

企業向けの100日生成AI実装計画Apr 12, 2025 am 09:56 AM

導入生成AIを採用することは、どの企業にとっても変革的な旅になります。ただし、Genaiの実装のプロセスは、しばしば面倒で混乱を招く可能性があります。 Niit Limの会長兼共同設立者であるRajendra Singh Pawar

PIXTRAL 12B対QWEN2-VL-72BApr 12, 2025 am 09:52 AM

導入 AI革命は、テキストからイメージのモデルが芸術、デザイン、テクノロジーの交差点を再定義している創造性の新しい時代を生み出しました。 Pixtral 12bおよびqwen2-vl-72bは、2つの先駆的な力のドリビンです

Paperqaとは何ですか、そしてそれは科学研究をどのように支援しますか？Apr 12, 2025 am 09:51 AM

導入 AIの進歩により、科学的研究では大きな変革が見られました。さまざまなテクノロジーやセクターで毎年何百万もの論文が掲載されています。しかし、この情報の海をretrに移動します

Datagemma：幻覚に対するLLMの接地 - 分析VidhyaApr 12, 2025 am 09:46 AM

導入大規模な言語モデルは、産業を急速に変革しています。Todayは、銀行業務におけるパーソナライズされたカスタマーサービスからグローバルコミュニケーションのリアルタイム言語翻訳まで、あらゆるものを動かしています。彼らはクエストに答えることができます

CrewaiとOllamaでマルチエージェントシステムを構築する方法は？Apr 12, 2025 am 09:44 AM

導入 APIにお金を費やしたくないのですか、それともプライバシーを心配していますか？それとも、LLMSをローカルに実行したいだけですか？心配しないで;このガイドは、ローカルLLMSを使用してエージェントとマルチエージェントフレームワークを構築するのに役立ちます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。