>  기사  >  기술 주변기기  >  5,620억 개의 매개변수! 구글, 로봇이 다양한 작업을 자율적으로 수행할 수 있는 역사상 최대 규모의 '일반' AI 모델인 PaLM-E 출시

5,620억 개의 매개변수! 구글, 로봇이 다양한 작업을 자율적으로 수행할 수 있는 역사상 최대 규모의 '일반' AI 모델인 PaLM-E 출시

WBOY
WBOY앞으로
2023-04-11 12:58:031601검색

3월 8일 뉴스: 월요일, Google과 베를린 공과대학의 인공 지능 연구원 그룹은 최대 5,620억 개의 매개변수 볼륨을 갖춘 역사상 가장 큰 시각적 언어 모델인 PaLM-E를 출시했습니다(GPT-3는 매개변수 볼륨은 1750 1억).

5,620억 개의 매개변수! 구글, 로봇이 다양한 작업을 자율적으로 수행할 수 있는 역사상 최대 규모의 '일반' AI 모델인 PaLM-E 출시

5,620억 개의 매개변수! 구글, 로봇이 다양한 작업을 자율적으로 수행할 수 있는 역사상 최대 규모의 '일반' AI 모델인 PaLM-E 출시

PaLM-E는 현재까지 알려진 가장 큰 VLM(시각적 언어 모델)입니다. 다중 모드로 구현된 VLM으로서 이미지를 이해할 수 있을 뿐만 아니라 재교육 없이 언어를 이해하고 생성하며 다양하고 복잡한 로봇 명령을 실행할 수 있습니다. 또한 강력한 출현 능력(예측할 수 없게 행동하는 모델)을 보여줍니다.

Google에 따르면 PaLM-E는 "서랍에 쌀가루 가져와"와 같은 높은 수준의 명령이 주어지면 팔(Google Robots에서 개발)을 갖춘 모바일 로봇 플랫폼에 대한 실행 계획을 생성할 수 있으며, 이러한 작업을 직접 수행하십시오.

5,620억 개의 매개변수! 구글, 로봇이 다양한 작업을 자율적으로 수행할 수 있는 역사상 최대 규모의 '일반' AI 모델인 PaLM-E 출시

PaLM-E는 장면을 사전 처리하지 않고 로봇 카메라의 데이터를 분석하여 이를 달성합니다. 이를 통해 인간이 데이터를 사전 처리하거나 주석을 달 필요가 없으므로 로봇 제어가 더욱 자율적으로 이루어집니다.

PaLM-E는 또한 유연하고 환경에 반응할 수 있습니다. 예를 들어 PaLM-E 모델은 주방에서 감자칩 한 봉지를 가져오도록 로봇을 안내할 수 있습니다. PaLM-E는 제어 루프에 통합되어 있으므로 작업 중에 발생할 수 있는 중단을 방지할 수 있습니다. 한 영상 사례에서는 연구원이 로봇의 손에서 감자칩을 빼앗아 옮겼지만, 로봇은 감자칩을 찾아 다시 집어들었습니다.

또한 PaLM-E 모델은 로봇을 제어하여 원래 인간의 안내가 필요한 복잡한 작업을 자율적으로 완료할 수도 있습니다. 로봇 공학 외에도 Google 연구원들은 PaLM-E의 핵심으로 대규모 언어 모델을 사용하는 데 따른 몇 가지 흥미로운 효과를 관찰했습니다. 그 중 하나는 PaLM-E가 작업에서 학습할 수 있음을 의미하는 "순방향 전송"을 나타낼 수 있다는 것입니다. 습득한 지식과 기술은 다른 작업으로 이전될 수 있으며 이는 단일 작업 로봇 모델보다 더 나은 성능을 발휘할 수 있습니다.

Google 연구원들은 앞으로 홈 자동화나 산업용 로봇 등 PaLM-E의 더 많은 실제 응용 프로그램을 탐색할 계획이며 PaLM-E가 다중 모드 AI의 더 많은 응용 프로그램에 영감을 줄 수 있기를 바랍니다.

IT House는 Google AI의 강력한 라이벌인 ​​ Microsoft도 최근 시각적 데이터와 대규모 언어 모델을 사용하여 유사한 방식으로 로봇을 제어하는 ​​​​문서 "ChatGPT for Robotics"를 발표했다고 보도했습니다.

위 내용은 5,620억 개의 매개변수! 구글, 로봇이 다양한 작업을 자율적으로 수행할 수 있는 역사상 최대 규모의 '일반' AI 모델인 PaLM-E 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제