Rumah > Artikel > Peranti teknologi > NVIDIA membuka era baharu: "mesin gerakan kekal" untuk data latihan robot
Kebanyakan data sintetik sebelum ini digunakan untuk latihan model besar AI Kali ini, NVIDIA telah membina "data granary" untuk latihan robot Salah satu sebab utama mengapa kepantasan pembangunan teknologi robot jauh ketinggalan daripada bidang AI yang lain kekurangan data. Dengan hanya 200 data sumber demonstrasi manusia, sistem ini boleh menjana secara langsung 50,000 data latihan.
Dengan permintaan AI yang besar untuk data, sumber data hampir habis Oleh itu, pelbagai syarikat telah mula meneroka "cara baharu" untuk mendapatkan data- "membuat" data mereka sendiri. Namun, kebanyakan data sintetik sebelum ini digunakan untuk latihan model AI yang besar Kali ini, NVIDIA mencipta "data granary" untuk latihan robot.
Dalam kertas penyelidikan terkini oleh NVIDIA dan University of Texas di Austin, sistem yang dipanggil "MimicGen" diperkenalkan, yang secara automatik boleh menjana set data latihan robot berskala besar dengan hanya sedikit demonstrasi manusia. Saintis kanan Nvidia Jim Fan berkata syarikat itu akan membuka sumber segala-galanya, termasuk set data yang dihasilkan.
Apakah saiz data yang dijana? Menggunakan 10 demo manusia, MimicGen boleh menjana 1,000 contoh sintetik; dengan 200 demo manusia, MimicGen boleh terus menjana 50,000 data latihan, melibatkan 18 tugasan dan pelbagai persekitaran simulasi.
Bagaimanakah set data yang dijana?
MimicGen boleh "mengembangkan" adegan yang sama dalam peringkat yang berbeza berdasarkan data sedia ada:
Ia juga boleh menjana set data yang berbeza merentas pelbagai pengedaran tetapan semula tugas, termasuk memasang item, menuang kopi, membersihkan cawan, dll.:
Boleh menjana demo lengan robot baharu yang berbeza:
Selain itu, terdapat juga data tugas yang memerlukan latihan jangka panjang:
Data adegan dunia sebenar juga tiada masalah:
Perlu diingat bahawa penyelidik membandingkan data yang dijana oleh set data sumber yang berbeza. Walau bagaimanapun, mereka mendapati bahawa kedua-dua set keputusan adalah setanding - mencadangkan bahawa "dalam mekanisme data berskala besar, kualiti data (sumber) mungkin tidak begitu penting". Bukan itu sahaja, penyelidik juga membandingkan data yang dihasilkan oleh 10 demonstrasi manusia dan 200 demonstrasi manusia, dan hasilnya juga tidak jauh berbeza. Oleh itu, kertas itu juga mengakui bahawa penyelidikan lanjut diperlukan sama ada lebih banyak data demonstrasi manusia akan menyebabkan redundansi dan kos anotasi data yang tidak diperlukan.
Kenapa anda terlalu taksub dengan data sintetik? Selain sumber data sumber terhad yang dinyatakan pada permulaan artikel, pengumpulan data juga sangat mahal dan memakan masa Dengan sistem seperti MimicGen,
boleh menjana set data berskala besar secara automatik dengan hanya sejumlah kecil data. dan data ini Ia menyepadukan berbilang adegan, keupayaan objek dan lengan robot, dan juga boleh digunakan untuk tugasan jangka panjang atau berketepatan tinggiIa boleh dipanggil "cara yang berkuasa dan menjimatkan untuk mengembangkan pembelajaran robot". "
Data sintetik akan menyediakan gelombang data terascale seterusnya untuk model lapar kami." saintis kanan NVIDIA Jim Fan berkata ketika memperkenalkan MimicGen, "Pembangunan teknologi robotik jauh di belakang AI lain Salah satu sebab utama dalam bidang ini ialah kekurangan data - anda tidak boleh mendapatkan isyarat kawalan (robot) daripada Internet ” “Kami sedang kehabisan data sebenar berkualiti tinggi daripada Internet, dan AI yang lahir daripada data sintetik akan menjadi hala tuju pembangunan masa hadapan
Sumber: Harian Lembaga Inovasi Sains dan TeknologiAtas ialah kandungan terperinci NVIDIA membuka era baharu: "mesin gerakan kekal" untuk data latihan robot. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!