그림 AI는 나선을 공개합니다. Helix : VLA (Vision-Language-Action) 프레임 워크로 구동되는 혁신적인 휴머노이드 로봇. 이 혁신적인 접근 방식을 통해 Helix는 전례없는 인간과 같은 기능으로 추론하고 작동하여 통제 된 산업용 로봇과 가정 환경의 예측할 수없는 역학 사이의 격차를 해소합니다. 이 자세한 개요는 최근에 발표 된 문서 및 데모를 기반으로 Helix의 기능을 탐색합니다.
목차 :
시스템 2 : "큰 두뇌"
시스템 1 : 정확한 조치 실행
주요 기술 발전
데모 비디오
공동 식료품 처리
전체 상체 모터 컨트롤
언어 유도 객체 조작
요약
나선 이해 :
Helix는 35 도의 자유 (DOF)를 자랑하며, 인간형 로봇에 대한 비교할 수없는 손재주와 자율성을 제공합니다. 광범위한 수동 프로그래밍이 필요한 기존 로봇과 달리 Helix는 간단한 자연어 지침을 사용하여 복잡한 장기 작업을 동적으로 실행합니다. 이 돌파구는 다양한 물체와 예측할 수없는 시나리오에 대한 적응력이 가장 중요합니다. - .
건축 설계 : 시스템 1 및 시스템 2 :
Helix의 아키텍처는 인간의인지 과정을 반영하여 Kahneman의 "빠르고 느린"모델에서 영감을 얻습니다.
-
-
시스템 2 : "큰 두뇌": 이 7 억 파라미터 비전 언어 모델 (VLM)은 높은 수준의 추론, 언어 이해 및 시각적 장면 이해를 처리합니다. 추상 명령 ( "사막 항목을 선택")을 실행 가능한 단계로 변환합니다.
시스템 1 : 정밀한 조치 실행 : - 이 80 만 파라미터 Visuomotor 정책은 시스템 2의 지침을 기반으로 파악 및 객체 조작과 같은 정확한 동작에 대한 빠르고 낮은 수준의 제어를 보장합니다. 소형 크기는 신속한 실시간 응답을 가능하게합니다
-
두 시스템 모두 저전력 임베디드 GPU에서 작동하여 외부 컴퓨팅 리소스에 대한 의존성을 제거하고 상업적 생존력을위한 길을 열어줍니다.
주요 기술 발전 :
- 통합 신경 네트워크 : Helix는 모든 동작 (선택, 배치, 서랍 작동, 냉장, 다중 로봇 상호 작용)에 단일 신경망을 사용하여 작업 별 미세 조정이 필요하지 않습니다. >
즉시 행동 생성 :
헬릭스는 보이지 않는 물체에 대한 지능적이고 새로운 행동을 생성하여 인간 프로그래밍 또는 시연의 필요성을 최소화합니다.
상업적 준비성 : - 내장 GPU 아키텍처는 클라우드 기반 시스템의 대기 시간 및 종속성 문제없이 즉각적인 실제 적용 가능성을 보장합니다.
데모 비디오 :
그림 AI는 여러 가지 매력적인 비디오를 통해 Helix의 기능을 보여줍니다
공동 작업 식료품 스토리지 : - 2 개의 나선 구동 로봇이 낯선 식료품을 공동 저장하여 조정과 적응성을 보여줍니다.
객체 조작 : 로봇은 자연어 명령을 기반으로 다양한 작업 (선택, 배치, 서랍 작동, 냉장고 상호 작용)을 수행합니다.
개념적 추론 : 나선은 언어를 신체적 행동에 연결하는 능력을 보여주는 "사막 항목을 선택"하는 것과 같은 추상 명령을 해석합니다.
공동 작업 식료품 처리 :
이 비디오는 단일 나선 인스턴스로 제어되는 두 개의 로봇을 강조하여 다양하고 익숙하지 않은 식료품 점을 효율적으로 저장합니다. 항목 핸드 오프 및 서랍/용기의 배치를 포함한 그들의 조정은 자연어 프롬프트에 의해 구동됩니다 ( "쿠키 백을 손에 넣으십시오 ...", "열린 서랍에 넣습니다"). 이것은 Helix의 다중 로봇 협력 및 제로 샷 일반화 기능을 보여줍니다
전체 상체 모터 제어 :
이 데모는 200Hz에서 Helix의 35-DOF 컨트롤을 보여줍니다. 로봇은 물체를 부드럽게 조작하여 최적의 도달 범위와 정밀성을 위해 전체 상체 (몸통, 머리, 손목, 손가락)를 조정합니다. 이것은 Helix의 실시간 손재주와 안정성을 강조하여 고도로 시스템과 관련된 과제를 극복합니다.
언어 유도 객체 조작 :
이 비디오는 Helix가 높은 수준의 명령을 정확한 행동으로 변환하는 능력을 강조합니다. Helix는 "사막 품목을 집어 올리기"에 응답하면 장난감 선인장을 식별하고 선택하여 추상 언어 이해력을 복잡한 모터 제어와 연결하는 능력을 보여줍니다.
그림 AI의 나선은 휴머노이드 로봇 공학에서 중요한 도약을 나타냅니다. 이중 시스템 아키텍처 및 온보드 처리 기능과 결합 된 혁신적인 VLA 프레임 워크는 인간과 같은 추론 및 손재주를 가능하게하여 특히 가정 환경에서 실제 응용 프로그램에 이상적으로 적합합니다. 사전 훈련없이 광범위한 물체를 처리하면서 자연어 지침을 이해하고 응답하는 Helix의 능력은 로봇 공학 분야에서 상당한 단계 변화를 나타냅니다.
위 내용은 그림의 나선 : 인간과 같은 로봇을 집으로 가져 오는 AI -Analytics Vidhya의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!