これまでの合成データのほとんどは、AI の大規模モデルのトレーニングに使用されていましたが、今回、NVIDIA はロボット トレーニング用の「データ倉庫」を構築しました。ロボット技術の開発ペースが他の AI 分野に大きく遅れをとっている主な理由の 1 つです。データが不足しています。わずか 200 人の人間によるデモンストレーション ソース データを使用して、システムは 50,000 のトレーニング データを直接生成できます。
AI による膨大なデータ需要により、データ リソースが枯渇しつつあるため、さまざまな企業がデータを取得するための「新しい方法」、つまり独自のデータを「作成」する方法を模索し始めています。 ただし、以前の合成データのほとんどは大規模な AI モデルのトレーニングに使用されていましたが、今回、NVIDIA はロボットのトレーニング用に「データ倉庫」を作成しました。
Nvidia とテキサス大学オースティン校による最近の研究論文では、少数の人によるデモンストレーションだけで大規模なロボット トレーニング データ セットを自動的に生成できる「MimicGen」と呼ばれるシステムが紹介されています。 Nvidiaの上級科学者ジム・ファン氏は、同社は生成されたデータセットを含むすべてをオープンソース化すると述べた。
生成されるデータのサイズはどれくらいですか? MimicGen は、10 人の人間によるデモンストレーションを使用して 1,000 の合成例を生成できます。200 人の人間によるデモンストレーションを使用すると、MimicGen は 18 のタスクと複数のシミュレーション環境を含む 50,000 のトレーニング データを直接生成できます。
生成されたデータセットはどのようになりますか?MimicGen は、既存のデータに基づいて同じシーンをさまざまな段階で「進化」させることができます:
さまざまな新しいロボット アームのデモを生成できます:
さらに、長期のトレーニングが必要なタスク データもあります:
現実世界のシーンデータも問題ありません:
研究者らが異なるソース データ セットによって生成されたデータを比較したことは注目に値します。しかし、彼らは 2 つの結果セットが同等であることを発見しました。これは、
を示唆しています。 それだけでなく、研究者らは 10 人の人間によるデモンストレーションと 200 人の人間によるデモンストレーションによって生成されたデータも比較しましたが、結果にも大きな違いはありませんでした。したがって、人間によるデモンストレーションデータが増えると冗長性や不必要なデータ注釈コストが発生するかどうかについて、さらなる研究が必要であることも論文は認めています。
なぜそこまで合成データにこだわるのですか?記事の冒頭で述べた限られたソース データ リソースに加えて、データの収集にも非常に費用と時間がかかります。MimicGen のようなシステムを使用すると、
はわずかな量のデータで大規模でリッチなデータ セットを自動的に生成できます。これらのデータセットは、複数のシーン、オブジェクトの機能、ロボットアームにまたがっており、長期的なタスクや高精度のタスクにも使用でき、「ロボットの学習を拡張するための強力かつ経済的な方法」と言えます。"合成データは、私たちの「飢えた」モデルにテラスケール データの次の波を提供します。
" NVIDIA シニア サイエンティストのジム ファンは、MimicGen を紹介する際に次のように述べています。開発のペースが他のAI分野に大きく遅れているのは、データが不足しているためです。インターネットから(ロボットの)制御信号を取得することができません。」「インターネット上の高品質なリアルデータは急速に枯渇しつつあり、合成データから生まれる AI が今後の発展の方向性となります。 出典: Science and Technology Innovation Board Daily
以上がNVIDIA が新時代を開く: ロボット トレーニング データ用の「永久運動マシン」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

導入 9月12日に、Openaiは「LLMSとの推論学習」というタイトルのアップデートをリリースしました。彼らは、複雑な推論タスクに取り組むために補強学習を使用して訓練されたO1モデルを導入しました。このmodを設定するもの

導入 Openai O1モデルファミリは、特に科学、コーディング、問題解決において、推論と経済のパフォーマンスを大幅に進めています。 Openaiの目標は、これまでにない高度なAIとO1モデルを作成することです

導入 今日、顧客クエリ管理の世界は前例のないペースで動いており、新しいツールが毎日見出しを作っています。大規模な言語モデル(LLM)エージェントは、このコンテキストでの最新のイノベーションであり、CUを後押しします

導入 生成AIを採用することは、どの企業にとっても変革的な旅になります。ただし、Genaiの実装のプロセスは、しばしば面倒で混乱を招く可能性があります。 Niit Limの会長兼共同設立者であるRajendra Singh Pawar

導入 AI革命は、テキストからイメージのモデルが芸術、デザイン、テクノロジーの交差点を再定義している創造性の新しい時代を生み出しました。 Pixtral 12bおよびqwen2-vl-72bは、2つの先駆的な力のドリビンです

導入 AIの進歩により、科学的研究では大きな変革が見られました。さまざまなテクノロジーやセクターで毎年何百万もの論文が掲載されています。しかし、この情報の海をretrに移動します

導入 大規模な言語モデルは、産業を急速に変革しています。Todayは、銀行業務におけるパーソナライズされたカスタマーサービスからグローバルコミュニケーションのリアルタイム言語翻訳まで、あらゆるものを動かしています。彼らはクエストに答えることができます

導入 APIにお金を費やしたくないのですか、それともプライバシーを心配していますか?それとも、LLMSをローカルに実行したいだけですか?心配しないで;このガイドは、ローカルLLMSを使用してエージェントとマルチエージェントフレームワークを構築するのに役立ちます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。
