대규모 언어 모델링에서 영감을 받은 Deepmind는 유사한 방법을 적용하여 다중 모드, 다중 작업 및 다중 구현 특성을 가지며 600개의 다양한 임무를 수행할 수 있는 단일 "일반" 에이전트 Gato를 구축했습니다. 이 인공 지능은 틀림없이 현재까지 세계에서 가장 인상적인 올인원 기계 학습 제품군입니다.
DeepMind는 공식 블로그에서 다음과 같이 설명했습니다.
"Gato는 다중 모드, 다중 작업, 다중 구성 요소로 구성된 일반 인공 지능입니다. 동일한 네트워크 조건에서 Atari 게임을 할 수 있고, 이미지에 캡션을 추가할 수 있으며, 현재 상황에 따라 텍스트 출력, 로봇 팔 회전, 버튼 누르기 또는 기타 표시 수행 여부를 결정할 것입니다. "
Gato가 어떻게 수행되는지는 아직 알 수 없지만 GPT-3이 기대할 수 있는 모든 것 이상인 것 같습니다. 성취하다.
이미지 출처: DeepMind 공식 웹사이트
GPT-3은 자금력이 풍부한 인공일반지능(AGI) 회사 OpenAI가 제작한 대규모 언어 모델(LLM)입니다. Microsoft로부터 수십억 달러의 지원을 받을 뿐만 아니라 미국 정부 규제에 따라 기본적으로 모든 작업을 수행할 수 있습니다.
저희가 주목하는 인공일반지능(AGI)은 인간의 지능을 갖고 인간이 할 수 있는 모든 지적 작업을 수행할 수 있는 인공지능의 일종입니다. 일부 연구자들은 일반 인공지능을 강력한 AI(strong AI) 또는 완전 AI(full AI)라고 부르거나, 기계가 일반적인 지능형 작업을 수행할 수 있는 능력을 가지고 있다고 부릅니다. 약한 AI에 비해 강한 AI는 인간의 인지 능력을 모두 갖췄습니다.
원래 OpenAI의 임무는 AGI를 개발하고 제어하는 것이었지만 현실은 회사가 만든 모든 것이 매우 화려한 LLM이었고 이는 "원래 의도"와 다소 반대되었습니다.
GPT-3와 DeepMind의 Gato는 똑같이 인상적이지만 대중의 평가 기준에는 약간의 뉘앙스가 필요합니다.
OpenAI가 AGI로 가는 길에서 LLM 경로를 택하고 있기 때문입니다. 이유는 간단합니다. AGI를 작동시키는 방법을 아는 사람은 아무도 없습니다. '불의 발견'과 '내연기관의 발명' 사이에 많은 시간이 걸렸듯이, 딥러닝에서 AGI로 전환하는 방법을 알아내는 것은 하루아침에 이루어진 것이 아닙니다. 그럼에도 불구하고 GPT-3는 텍스트 생성과 같이 인간처럼 보이는 몇 가지 작업을 수행할 수 있습니다.
그리고 스스로를 "일반 인공 지능"이라고 칭하는 Gato는 GPT-3와 거의 동일한 작업을 수행합니다. 이는 LLM과 매우 유사하게 작동하는 것을 600개 이상의 트릭을 수행할 수 있는 "마술사"로 통합할 뿐입니다. 가장 중요한 점은 단일 시퀀스 모델을 사용하여 모든 작업을 해결하지만 훈련 데이터의 양과 다양성을 늘려야 한다는 것입니다.
여러 작업을 수행하는 Gato의 능력은 600가지의 다양한 방식으로 플레이할 수 있는 게임보다는 600가지의 다양한 게임을 저장할 수 있는 콘솔에 더 가깝습니다. 소개에서 알 수 있듯이 일반적인 인공지능은 아니지만, 미리 훈련된 좁은 모델들이 깔끔하게 묶여 있는 묶음으로 구성되어 있습니다.
이미지 출처: DeepMind 공식 웹사이트
Knives and Paintbrushes 연구 그룹의 Mike Cook이 최근 TechCrunch의 Kyle Wiggers에게 다음과 같이 말했습니다.
“Gato와 같은 AI가 이 모든 작업을 수행할 수 있다는 것은 매우 다르게 들립니다. 텍스트를 작성하고 로봇을 제어하는 소리가 우리와 매우 다르기 때문에 흥미롭습니다
하지만 실제로는 GPT-3가 일반 영어 텍스트와 Python 코드를 이해하는 것과 크게 다르지 않습니다
이것을 달성하기 쉬운 것은 아니지만 외부에 관찰자에게는 AI가 차를 끓이거나 10~50가지 다른 작업도 쉽게 배울 수 있는 것처럼 들릴 수도 있지만 실제로는 그렇지 않습니다."
간단히 말하면 Gato와 GPT-3는 모두 강력한 인공 지능입니다. 시스템이지만 일반 지능 기능은 없습니다.
DeepMind는 10년 넘게 AGI 방향으로 발전해 왔으며 OpenAI는 2015년에 시작되었습니다. 그러나 어느 쪽도 AGI로 향하는 첫 번째 문제, 즉 훈련 없이 새로운 것을 배울 수 있는 AI를 구축하는 문제를 해결하지 못합니다.
AGI의 출현이 행운의 결과라고 장담하지 않는 한, 이제 AGI 분야에서 이들 기업의 발전을 재평가해야 할 때입니다.
아마 Gato는 아마도 세계에서 가장 발전된 다중 모드 인공 지능 시스템일 것입니다. 그러나 DeepMind는 AGI를 OpenAI와 마찬가지로 막다른 골목으로 만드는 것과 동일한 개념을 채택하여 시장성을 더욱 높였습니다.
Gato는 Alexa, Siri 또는 Google Assistant보다 마케팅을 통해 소비자 시장에서 더 많은 호감을 얻을 수 있습니다. 그러나 Gato와 GPT-3는 위에서 언급한 가상 비서보다 AGI에 대한 실행 가능한 진입점이 아닙니다.
이것이 당신이 찾고 있는 AI 유형이라면 그것은 나쁜 것이 아닙니다. 그러나 가토의 동반 연구 논문에는 AGI로 가는 디딤돌은커녕 AGI의 올바른 방향으로 나아가고 있다는 증거가 전혀 없다.
위 내용은 GPT-3 넘어 딥마인드가 애용하는 새 가토 출시했으나 "약 바꾸지 않고 수프만 교체한다"는 의혹의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!