>기술 주변기기 >일체 포함 >NVIDIA는 로봇 훈련 데이터를 위한 '영구 운동 기계'라는 새로운 시대를 열었습니다.

NVIDIA는 로봇 훈련 데이터를 위한 '영구 운동 기계'라는 새로운 시대를 열었습니다.

WBOY
WBOY앞으로
2023-10-30 14:49:02697검색

이전 합성 데이터의 대부분은 AI 대형 모델 훈련에 사용되었습니다. 이번에 NVIDIA는 로봇 훈련을 위한 "데이터 창고"를 구축했습니다. 로봇 기술의 발전 속도가 다른 AI 분야에 비해 크게 뒤처지는 주요 이유 중 하나는 데이터가 부족합니다. 200개의 인간 데모 소스 데이터만으로 시스템은 50,000개의 훈련 데이터를 직접 생성할 수 있습니다.

AI의 엄청난 데이터 수요로 인해 데이터 자원은 거의 고갈되었습니다. 따라서 다양한 기업에서는 데이터를 얻기 위한 "새로운 방법", 즉 자체 데이터를 "생성"하기 시작했습니다. 그러나 이전 합성 데이터의 대부분은 대규모 AI 모델 훈련에 사용되었습니다. 이번에 NVIDIA는 로봇 훈련을 위한 "데이터 창고"를 만들었습니다.

NVIDIA와 오스틴 텍사스 대학교의 최신 연구 논문에서는 소수의 인간 시연만으로 대규모 로봇 훈련 데이터 세트를 자동으로 생성할 수 있는 "MimicGen"이라는 시스템을 소개합니다. NVIDIA 수석 과학자 Jim Fan은 회사가 생성된 데이터 세트를 포함한 모든 것을 소스로 공개할 것이라고 말했습니다.

NVIDIA는 로봇 훈련 데이터를 위한 영구 운동 기계라는 새로운 시대를 열었습니다.

생성된 데이터의 크기는 얼마나 되나요? 10개의 인간 데모를 사용하여 MimicGen은 200개의 인간 데모를 통해 1,000개의 합성 예제를 생성할 수 있으며 MimicGen은 18개 작업과 여러 시뮬레이션 환경을 포함하는 50,000개의 교육 데이터를 직접 생성할 수 있습니다.

생성된 데이터 세트는 어떻게 되나요?

MimicGen은 기존 데이터를 기반으로 다양한 단계에서 동일한 장면을 "진화"할 수 있습니다.

NVIDIA는 로봇 훈련 데이터를 위한 영구 운동 기계라는 새로운 시대를 열었습니다.

또한 품목 조립, 커피 따르기, 머그 청소 등을 포함하여 광범위한 작업 재설정 분포에 걸쳐 다양한 데이터 세트를 생성할 수 있습니다.

NVIDIA는 로봇 훈련 데이터를 위한 영구 운동 기계라는 새로운 시대를 열었습니다.

다양하고 새로운 로봇 팔 데모를 생성할 수 있습니다:

또한 장기 훈련이 필요한 작업 데이터도 있습니다:

NVIDIA는 로봇 훈련 데이터를 위한 영구 운동 기계라는 새로운 시대를 열었습니다.

실제 장면 데이터도 문제가 되지 않습니다.

NVIDIA는 로봇 훈련 데이터를 위한 영구 운동 기계라는 새로운 시대를 열었습니다.

연구원들이 다양한 소스 데이터 세트에서 생성된 데이터를 비교했다는 점은 주목할 가치가 있습니다. 그러나 그들은 두 가지 결과 세트가 비슷하다는 것을 발견했습니다. 이는 "(소스) 데이터 품질이 대규모 데이터 메커니즘에서 그다지 중요하지 않을 수 있음"을 시사합니다.

그뿐만 아니라 연구진은 10명의 인간 시연과 200명의 인간 시연에서 생성된 데이터도 비교했는데 결과도 크게 다르지 않았습니다. 따라서 본 논문에서는 인간의 데모 데이터가 많아지면 중복성과 불필요한 데이터 주석 비용이 발생하는지에 대한 추가 연구가 필요하다고 인정합니다.

왜 합성 데이터에 그렇게 집착하시나요? 기사 시작 부분에서 언급한 제한된 소스 데이터 리소스 외에도 데이터 수집에는 비용과 시간이 많이 소요됩니다. MimicGen과 같은 시스템을 사용하면 적은 양의 데이터만으로 대규모의 풍부한 데이터 세트를 자동으로 생성할 수 있습니다. 그리고 이러한 데이터는 여러 장면, 개체 기능 및 로봇 팔을 통합하며 장기 또는 고정밀 작업에도 사용할 수 있습니다 "로봇 학습을 확장하는 강력하고 경제적인 방법"이라고 할 수 있습니다.

"합성 데이터는 '배고픈' 모델을 위한 차세대 테라스케일 데이터를 제공할 것입니다. " NVIDIA 수석 과학자 Jim Fan은 MimicGen을 소개하면서 이렇게 말했습니다. "로봇공학 기술 개발은 다른 AI보다 훨씬 뒤처져 있습니다. 이 분야의 주요 이유 중 하나 데이터 부족입니다 - 인터넷에서 (로봇의) 제어 신호를 얻을 수 없습니다.”

“인터넷에서 고품질의 실제 데이터가 급속히 고갈되고 있으며, 합성 데이터에서 탄생한 AI가 미래의 발전 방향이 될 것입니다

.

출처: 과학기술혁신위원회데일리

위 내용은 NVIDIA는 로봇 훈련 데이터를 위한 '영구 운동 기계'라는 새로운 시대를 열었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 sohu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제