이전 합성 데이터의 대부분은 AI 대형 모델 훈련에 사용되었습니다. 이번에 NVIDIA는 로봇 훈련을 위한 "데이터 창고"를 구축했습니다. 로봇 기술의 발전 속도가 다른 AI 분야에 비해 크게 뒤처지는 주요 이유 중 하나는 데이터가 부족합니다. 200개의 인간 데모 소스 데이터만으로 시스템은 50,000개의 훈련 데이터를 직접 생성할 수 있습니다.
AI의 엄청난 데이터 수요로 인해 데이터 자원은 거의 고갈되었습니다. 따라서 다양한 기업에서는 데이터를 얻기 위한 "새로운 방법", 즉 자체 데이터를 "생성"하기 시작했습니다. 그러나 이전 합성 데이터의 대부분은 대규모 AI 모델 훈련에 사용되었습니다. 이번에 NVIDIA는 로봇 훈련을 위한 "데이터 창고"를 만들었습니다.
NVIDIA와 오스틴 텍사스 대학교의 최신 연구 논문에서는 소수의 인간 시연만으로 대규모 로봇 훈련 데이터 세트를 자동으로 생성할 수 있는 "MimicGen"이라는 시스템을 소개합니다. NVIDIA 수석 과학자 Jim Fan은 회사가 생성된 데이터 세트를 포함한 모든 것을 소스로 공개할 것이라고 말했습니다.
생성된 데이터의 크기는 얼마나 되나요? 10개의 인간 데모를 사용하여 MimicGen은 200개의 인간 데모를 통해 1,000개의 합성 예제를 생성할 수 있으며 MimicGen은 18개 작업과 여러 시뮬레이션 환경을 포함하는 50,000개의 교육 데이터를 직접 생성할 수 있습니다.
생성된 데이터 세트는 어떻게 되나요?
MimicGen은 기존 데이터를 기반으로 다양한 단계에서 동일한 장면을 "진화"할 수 있습니다.
또한 품목 조립, 커피 따르기, 머그 청소 등을 포함하여 광범위한 작업 재설정 분포에 걸쳐 다양한 데이터 세트를 생성할 수 있습니다.
다양하고 새로운 로봇 팔 데모를 생성할 수 있습니다:
또한 장기 훈련이 필요한 작업 데이터도 있습니다:
실제 장면 데이터도 문제가 되지 않습니다.
연구원들이 다양한 소스 데이터 세트에서 생성된 데이터를 비교했다는 점은 주목할 가치가 있습니다. 그러나 그들은 두 가지 결과 세트가 비슷하다는 것을 발견했습니다. 이는 "(소스) 데이터 품질이 대규모 데이터 메커니즘에서 그다지 중요하지 않을 수 있음"을 시사합니다.
그뿐만 아니라 연구진은 10명의 인간 시연과 200명의 인간 시연에서 생성된 데이터도 비교했는데 결과도 크게 다르지 않았습니다. 따라서 본 논문에서는 인간의 데모 데이터가 많아지면 중복성과 불필요한 데이터 주석 비용이 발생하는지에 대한 추가 연구가 필요하다고 인정합니다.
왜 합성 데이터에 그렇게 집착하시나요? 기사 시작 부분에서 언급한 제한된 소스 데이터 리소스 외에도 데이터 수집에는 비용과 시간이 많이 소요됩니다. MimicGen과 같은 시스템을 사용하면 적은 양의 데이터만으로 대규모의 풍부한 데이터 세트를 자동으로 생성할 수 있습니다. 그리고 이러한 데이터는 여러 장면, 개체 기능 및 로봇 팔을 통합하며 장기 또는 고정밀 작업에도 사용할 수 있습니다 "로봇 학습을 확장하는 강력하고 경제적인 방법"이라고 할 수 있습니다.
"합성 데이터는 '배고픈' 모델을 위한 차세대 테라스케일 데이터를 제공할 것입니다. " NVIDIA 수석 과학자 Jim Fan은 MimicGen을 소개하면서 이렇게 말했습니다. "로봇공학 기술 개발은 다른 AI보다 훨씬 뒤처져 있습니다. 이 분야의 주요 이유 중 하나 데이터 부족입니다 - 인터넷에서 (로봇의) 제어 신호를 얻을 수 없습니다.”
“인터넷에서 고품질의 실제 데이터가 급속히 고갈되고 있으며, 합성 데이터에서 탄생한 AI가 미래의 발전 방향이 될 것입니다
.출처: 과학기술혁신위원회데일리
위 내용은 NVIDIA는 로봇 훈련 데이터를 위한 '영구 운동 기계'라는 새로운 시대를 열었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.
