6월 26일 뉴스에 따르면, 구글 자회사 딥마인드(DeepMind)가 다양한 로봇 팔을 제어해 일련의 작업을 수행할 수 있는 로보캣(RoboCat)이라는 인공지능 모델을 개발했다고 밝혔습니다. 이것만으로는 특별히 새로운 것은 아니지만 DeepMind는 이 모델이 다양한 작업을 해결하고 적응할 수 있으며 다른 실제 로봇을 사용하여 이를 수행할 수 있는 최초의 모델이라고 주장합니다.
RoboCat은 텍스트, 이미지 및 이벤트를 분석하고 처리할 수 있는 DeepMind의 또 다른 AI 모델인 Gato에서 영감을 받았습니다. RoboCat의 훈련 데이터에는 가상 환경의 다른 로봇 제어 모델, 인간이 제어하는 로봇 및 이전 버전의 RoboCat 자체에서 파생된 시뮬레이션 로봇과 실제 로봇의 이미지 및 모션 데이터가 포함됩니다.
DeepMind의 연구 과학자이자 RoboCat 팀의 공동 작업자 중 한 명인 Alex Lee는 TechCrunch와의 이메일 인터뷰에서 다음과 같이 말했습니다. "우리는 단일 대형 모델이 여러 실제 로봇 엔터티에서 해결될 수 있음을 보여주었습니다. 다양한 작업을 수행하고 신속하게 ”
IT House는 RoboCat을 훈련하기 위해 먼저 인간이 제어하는 로봇 팔을 사용하여 100~1000개의 작업 또는 로봇 시연에서 각 데이터를 수집했다고 언급했습니다. 예를 들어, 로봇 팔이 기어를 집거나 빌딩 블록을 쌓게 하세요. 그런 다음 RoboCat을 미세 조정하여 각 작업에 대해 특화된 "파생" 모델을 생성하고 평균 10,000회 연습하도록 했습니다. 연구원들은 파생 모델과 데모 데이터에서 생성된 데이터를 활용하여 RoboCat의 교육 데이터 세트를 계속 확장하고 RoboCat의 새로운 버전을 교육하고 있습니다.
RoboCat의 최종 버전은 총 253개의 작업에 대해 교육을 받았으며 시뮬레이션과 실제 세계에서 이러한 작업의 141가지 변형에 대해 테스트되었습니다. DeepMind는 RoboCat이 몇 시간에 걸쳐 수집된 1,000개의 인간 제어 시연을 관찰한 후 다양한 유형의 로봇 팔을 작동하는 방법을 배웠다고 주장합니다. RoboCat은 두 손가락 팔을 가진 4대의 로봇에 대해 훈련을 받았지만, 모델은 세 손가락 그리퍼와 두 배 더 많은 제어 가능한 입력을 사용하여 더 복잡한 팔에 적응할 수 있었습니다.
그럼에도 불구하고 DeepMind의 테스트에서 RoboCat의 다양한 작업 성공률은 최저 13%에서 최고 99%까지 매우 다양했습니다. 이는 훈련 데이터에 1000개의 시연이 있는 경우입니다. 시연 횟수가 절반으로 줄어들면 그에 따라 성공률도 감소합니다. 그러나 경우에 따라 DeepMind는 RoboCat이 단 100개의 데모를 관찰하여 새로운 작업을 배울 수 있다고 주장합니다.
Alex Lee는 RoboCat이 새로운 작업을 해결하는 것을 덜 어렵게 만들 수 있다고 믿습니다. "새로운 작업에 대한 특정 횟수의 시연이 주어지면 RoboCat은 새로운 작업에 맞게 미세 조정하고 더 많은 데이터를 자체 생성하여 더욱 개선할 수 있습니다."라고 그는 덧붙였습니다.
앞으로 연구팀은 RoboCat에게 새로운 작업을 완료하도록 가르치는 데 필요한 시연 횟수를 10회 미만으로 줄이는 것을 목표로 합니다.
위 내용은 Google DeepMind는 다양한 로봇을 제어하여 일련의 작업을 수행할 수 있는 RoboCat AI 모델을 개발했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!