집 >기술 주변기기 >일체 포함 >ChatGPT의 축복으로 대규모 의사결정 모델이 AGI에 한 걸음 더 가까워졌습니다.

ChatGPT의 축복으로 대규모 의사결정 모델이 AGI에 한 걸음 더 가까워졌습니다.

王林앞으로: 2023-04-12 18:19:091582검색

1년도 채 되지 않아 ChatGPT와 GPT-4가 차례로 출시되어 AI에 대한 사람들의 이해가 지속적으로 향상되었습니다.

새로운 기술은 변화를 가져오며 AI가 인간을 대체할지 여부에 대한 논의를 촉발합니다. OpenAI CEO인 Sam Altman도 인공 지능 기술의 강력한 기능에 대해 공개적으로 우려를 표명했습니다.

최근 UCL(University College London) 컴퓨터 과학과 왕준 교수는 AI Technology Review와의 인터뷰에서 ChatGPT가 강력한 언어 및 대화 능력을 갖추고 있지만 체계적인 의사 결정이 불가능하다고 인정했습니다. , 기계 제어 및 그룹 협업, 동적 스케줄링 등과 같은 AI 기술 물결의 더욱 혁신적인 부분입니다.

왕준, University College London(UCL) 컴퓨터 과학 교수, Alan Turing Institute의 Turing Fellow. 그의 주요 연구는 기계 학습, 강화 학습, 다중 에이전트, 데이터 마이닝, 컴퓨터 광고, 추천 시스템 등을 포함한 지능형 정보 시스템입니다. Google Scholar는 16,000회 이상 인용되었으며 120개 이상의 학술 논문을 발표했습니다. 여러 차례 인용되어 최우수 논문상을 수상했습니다.

ChatGPT 加持，决策大模型距离 AGI 更进一步

Wang Jun

2022년 4월 Shanghai Digital Brain Research Institute가 공식적으로 설립되었으며, Enigma Tech(중국명 "Enigma Technology")가 내부적으로 인큐베이팅되어 설립되었습니다. Wang Jun은 Shanghai Digital의 공동 창립자를 역임했습니다. 뇌 연구소 소장이자 퍼즐 기술의 수석 과학자를 역임한 수리 과학 연구소는 CV, NLP, 강화 학습 및 다중 에이전트를 보유하고 있으며 기업이 다중 시나리오 의사 결정 문제를 해결하도록 돕는 데 전념하고 있습니다.

Wang Jun은 ChatGPT의 출현으로 과거 대규모 모델 훈련의 임계값을 낮추는 방법에 대한 문제가 해결되었다고 믿습니다. 자연어 처리와 대규모 의사 결정 모델을 결합하면 ChatGPT가 채팅뿐만 아니라 AIGC도 가져올 수 있습니다. (AI 생성 콘텐츠, 콘텐츠 제작), AIGA(AI 생성 작업, 의사 결정 생성)를 추가로 탐색하여 모델의 사고 및 의사 결정 기능을 특정 시나리오에 적용하여 기업과 사람들이 의사 결정 문제를 해결하는 데 진정으로 도움을 줄 수 있습니다. , 창의적인 활동에 인간을 더 많이 풀어줍니다.

1. 다중 에이전트

AI 지능형 탐색에서 "지능"으로 이어지는 과정에서 정의 문제의 궁극적인 추구와 불가분의 관계에 있습니다.

왕준은 지능에 이르는 길을 두 단계로 나눈다. 첫 번째 단계는 생물학적 시스템(생명 시스템(사람은 생물학적 시스템에 속함))과 비생물학적 시스템의 차이점을 명확히 하는 것입니다.

2013년 생물물리학자 제레미 잉글랜드는 생명의 기원이 열역학의 불가피한 결과라고 생각하는 획기적인 "소산 중심 적응" 이론을 제안했습니다. 지속적인 에너지 소비와 "엔트로피"의 증가.

엔트로피 증가와 엔트로피 감소 이론에서는 생명의 신체가 무질서에서 질서로 변화하는 과정이 계속해서 에너지를 흡수하고 엔트로피가 감소한다고 믿습니다. 엔트로피 감소 임무 해결 기본 문제의 핵심은 지능을 어떻게 정의할 것인지, AI가 일정 수준의 지능을 달성하기 위해 얼마나 많은 에너지를 흡수해야 하는가입니다.

이미지 분류 및 인식에 AI를 사용할 경우 분류 알고리즘의 정확도는 98%에 달할 수 있습니다. 분류를 통해 AI는 무질서한 이미지 콘텐츠 구성을 질서 있고 규칙적인 이미지로 변환하는 데 도움을 줄 수 있습니다. 시스템의 불확실성이 줄어들고 엔트로피가 감소합니다. 엔트로피 감소에는 알고리즘의 컴퓨팅 성능을 결정하는 계산도 필요합니다. 컴퓨팅 성능은 소비되는 에너지의 표현입니다.

왕준은 지능을 향한 두 번째 단계는 생물학적 시스템과 소위 AI 시스템의 의식을 구별하는 것이라고 믿습니다. 현재 인공지능은 도구로만 존재하며, 기계 자체는 생각하지 않고, 인간과 동일한 사고 능력을 갖추기 위해서는 먼저 인간 두뇌의 다양한 현상을 이해해야 한다. AI 인식 문제에 대한 이해가 높아집니다.

왕준의 관점에서, 의식은 지능의 중요한 표현입니다. 포유류는 의식을 감지하고, 의식을 인지하고, 동시에 주관적인 감정을 형성할 수 있습니다. 여러 개인이 환경과 상호 작용할 때, 한 개인 외에 또 다른 의식 있는 사람이 있어야 합니다. 개인과 환경이 영향을 미치고 공명하여 주관적인 감정을 표현할 수 있게 해줍니다.

이와 관련하여 왕준과 그의 팀은 AI 연구에서 다중 에이전트(Multi-Agent)의 상호작용을 활용하여 의식을 유도해야 한다고 제안했습니다.

대형 모델을 예로 들면, 교차 작업은 인위적으로 정의되어 주어진 특정 작업으로 제한되며, 기계가 실행할 알고리즘과 모델의 사고 및 결정을 설계하는 것만으로는 더 지능적인 AI를 생성하기가 어렵습니다. 만드는 능력이 향상될 수는 없습니다.

왕준은 AI Technology Review에서 "여러 가지를 동시에 발전시킬 때는 큰 아이디어가 필요합니다. 그렇지 않다면 분명히 고유한 법칙이 부족한 것입니다."라고 말했습니다. " 기계 모델에서. 중요한 경로.

2022년 5월 DeepMind는 CV와 NLP를 결합한 범용 에이전트인 "GATO"를 출시했습니다. Atari 게임, 그림 자막 출력, 로봇 팔로 블록 쌓기, 사람들과 채팅 등이 가능하며, 텍스트, 조인트 토크, 버튼 누르기 또는 기타 토큰(단어 단위)을 출력할지 여부에 따라 이 작업은 당시 상당한 논의를 불러일으켰습니다. 왕준(Wang Jun)도 추종자 중 한 명이다.

실제로 Wang Jun과 그의 팀은 2021년부터 교차 작업을 구현하고 CV, NLP, 강화 학습 및 다중 에이전트를 통합된 의사 결정에 중첩할 수 있는 의사 결정 모델을 만들 가능성에 대해 생각하기 시작했습니다. 모델만들기. "GATO"의 출현으로 Wang Jun은 대형 모델의 광대한 탐색 공간을 볼 수 있었습니다. "이것은 하나의 모델이 여러 분야의 작업을 해결하는 것이 일반적인 추세임을 입증하기에 충분합니다.

대형 의사 결정 모델은 불가능합니다." 단순히 모델 크기의 의미부터 시작하세요. 데이터 세트의 강화 학습을 통해 환경과의 지속적인 상호작용을 통해 일정 수준의 인지를 달성하는 것이 핵심입니다. 강화학습과 환경 상호작용의 복잡성을 줄이는 것이 가장 큰 기술적 포인트이다.

이 링크에서는 원본 데이터가 중요한 역할을 합니다.

다른 작업이나 환경과 상호 작용하는 알고리즘에 의해 생성된 원본 데이터를 훈련하여 사전 훈련된 모델을 구축하세요. 이 모델은 새로운 작업에 직면했을 때 빠르게 적용할 수 있으므로 규칙, 관계 및 데이터 변경의 가치를 극대화할 수 있습니다. 사전 훈련 데이터 세트가 계속 확장됨에 따라 모델도 모든 작업을 처리할 수 있을 때까지 커집니다.

최종 결과는 문제를 해결하기 위한 방법들이 모여 있고, 여러 방향이 융합되어 업무 전반에 걸쳐 일정화 및 일반화가 가능한 멀티 에이전트로 통합된다는 것입니다. 다중 에이전트 에이전트는 종종 균형 관계를 고려해야 합니다. 즉, 자신의 목표를 달성하는 동시에 상대방도 목표를 달성하고 안정적인 균형을 유지하기 위해 서로를 제지할 수 있습니다.

실제 적용 시나리오에서 다중 에이전트는 검색, 추천, 심지어 인터넷 광고까지 사람들이 많은 실제 문제를 해결하는 데 도움을 줄 수 있습니다. 이는 본질적으로 사용자가 필요한 콘텐츠를 찾을 수 있도록 돕는 의사 결정 프로세스이며, 이 콘텐츠는 사용자 선호도에 따라 "당신에게 권장되는 것은 실제로 결정입니다."

멀티 에이전트의 장점은 교차 작업 기능을 최대한 활용할 수 있다는 것입니다.

사실 이미 2017년부터 Wang Jun과 그의 학생 Zhang Weinan(Shanghai Jiao Tong University 교수)은 자연어 처리(NLP)에 강화 학습을 추가하려는 교차 작업 시도를 시작했습니다.

과거 자연어 처리가 GAN을 사용하여 텍스트를 생성할 때 변환 프로세스 중 단어 인덱스와 단어 벡터의 불연속적인 데이터로 인해 미세 조정 매개변수가 작동하지 않는 경우가 많았습니다. GAN은 전체 Scoring으로 데이터를 생성했지만, 텍스트는 일반적으로 단어 단위로 생성되므로 세부적인 제어가 어렵습니다.

이를 위해 그들은 강화 학습 전략을 활용하여 이산 데이터에 GAN을 적용하는 문제를 해결한 SeqGAN 모델을 제안했습니다. 이는 또한 강화 학습을 사용하여 생성 언어 모델을 훈련하여 텍스트를 달성한 최초의 논문 중 하나였습니다. 자연에서의 생성 언어처리, 정보검색 등 다양한 분야에 폭넓게 활용되고 있습니다.

ChatGPT 加持，决策大模型距离 AGI 更进一步

논문 주소: https://arxiv.org/pdf/1609.05473.pdf

"강화 학습과 의사 결정은 본질적으로 연결되어 있습니다. 강화 학습을 통해 일부 의사 결정 문제를 해결할 수 있습니다." Jun의 견해에 따르면, 의사결정은 장기적인 연구 문제입니다. 대규모 다중 에이전트 의사결정 모델 제안은 일반화 후 특정 특정 분야에서 고유한 이점을 형성할 수 있습니다. 규모의 의사결정 모델.

2. AIGA는 AIGC를 뛰어넘습니다

ChatGPT는 아직 열기를 통과하지 못했습니다. 3월 15일 다중 모드 사전 훈련된 대형 모델 GPT-4가 출시된 후 또 다른 파괴적인 변화가 일어났습니다.

이번 일반 인공지능 대회에서는 ChatGPT와 GPT-4가 종점이 아닙니다. 대회의 핵심 초점은 그 물결 아래서 더욱 가치 있는 산업 혁명과 혁신입니다.

이 기간 동안 왕준은 시가총액을 걱정하는 친구들과도 긴밀한 소통을 유지했습니다.

왕준의 견해에 따르면 학계의 일부 문제는 충분히 대담하지 않고 자원의 제약을 받으며 문제에 대한 사고는 특정 요인에 의해 제약을 받습니다. 산업계에서는 대규모 의사결정 모델이 더 풍부한 적용 시나리오를 가질 수 있습니다. 전통 산업, 인터넷 검색 추천, 산업 인터넷 등 다양한 결정이 필요합니다.

이 아이디어를 염두에 두고 Wang Jun은 대규모 의사 결정 모델을 산업, 학계 및 연구에 통합할 가능성을 고려하기 시작했습니다.

1년간의 준비 기간을 거쳐 2022년 4월 상하이 디지털 뇌 연구소가 공식적으로 설립되었습니다. Enigma Tech("Enigma Technology")는 내부적으로 인큐베이팅 및 설립되었으며 디지털 두뇌의 과학적 연구 결과를 구현하는 일을 주로 담당합니다. 연구소는 업계에 진출하여 디지털 연구를 위한 플랫폼을 제공합니다. 이 연구소는 실제 시나리오와 실제 비즈니스 데이터를 제공합니다. Wang Jun은 수학 연구소의 공동 창립자이자 학장이자 Puzzle Technology의 수석 과학자입니다.

대형 모델이 실제 적용 시나리오에 들어갈 때 기업은 종종 두 가지 주요 문제점에 직면합니다. 모델이 광범위하지 않고 진입 문턱이 높다는 것입니다.

기존의 머신러닝 방식은 기업이 작업을 발행한 후 먼저 문제를 정의하고, 훈련을 위한 데이터를 수집하고, 2차 작업이 발행된 후 모델을 수집하고 정의해야 합니다. 문제를 해결하고 훈련을 위한 데이터를 수집하고 다시 모델링합니다. 테스트로 인해 기업은 배포 시 많은 재정적, 인적 자원을 낭비하는 경우가 많으며 범위가 넓지 않습니다. 동시에 대형 모델을 사용하려면 엔지니어의 매우 높은 기술적 능력이 필요하고 특정 최적화 경험이 필요하며 기업 참여의 문턱이 높습니다.

Wang Jun은 ChatGPT와 대규모 의사결정 모델을 결합하면 임계값이 낮고 스펙트럼이 넓은 문제를 효과적으로 해결할 수 있다고 믿습니다.

이러한 생각 하에 Wang Jun은 퍼즐 기술 팀을 이끌고 DB 대형 모델(AIGA 방향 모델, AIGA: AI 생성 행동, 의사 결정 생성)을 제안했습니다. 최초의 DB1은 세계 최초의 다중 모드 의사 결정 대형 모델입니다. DeepMind가 출시한 GATO는 다중 에이전트를 완벽하게 지원하고 천 개가 넘는 의사 결정 작업을 동시에 처리할 수 있습니다.

ChatGPT 加持，决策大模型距离 AGI 更进一步

차량 협업 작업에서 DB1의 성능

ChatGPT를 대규모 의사결정 모델과 결합하여 ChatGPT는 채팅뿐만 아니라 AIGC를 기반으로 AIGA를 더욱 심층적으로 탐색하여 모델의 사고 능력과 의사 결정을 가능하게 합니다. 생성 기능은 특정 시나리오에 적용됩니다. 결과적인 상호 작용은 특정 시나리오의 환경과 상호 작용합니다. 작은 데이터는 실제 산업 시나리오를 직접 지향할 수 있는 대규모 작업을 완료하여 로봇을 달성합니다. 협업, 장비 역학, 기업 자율성, 스케줄링, 소프트웨어 개발 및 기타 광범위한 애플리케이션.

그리고 나서 회사와 사람들이 의사 결정 문제를 해결하도록 진정으로 돕고 인간을 보다 창의적인 활동에 투입하세요. "궁극적으로 인류 전체의 발전에 큰 도움이 될 것입니다. 이러한 상황에서만 우리는 진정한 AGI(인공지능)를 키울 수 있습니다."

현재 디지털 뇌 연구소의 기본 구조는 완성되었으며, 비즈니스 콘텐츠는 알고리즘 및 시스템부터 특정 엔지니어링 프로젝트까지 모든 것을 다루며 추천 시스템, 결함 예측, 자율 주행, 시장 설계, 게임 시나리오, EDA 최적화 등 다양한 시나리오에 적용하여 기업의 실질적인 문제를 해결할 수 있습니다. 운영.

연구실을 떠나 디지털 뇌 연구소를 설립한 왕준의 감정과 상태는 완전히 다릅니다. 연구에서 모든 요소를 함께 고려하는 것은 불가능합니다. 이 문제를 해결하려면 먼저 다른 것들이 단순화되어야 하고 현실이 되어야 합니다. 문제가 해결되면 다음 단계로 넘어갑니다. 연구 실행은 여러 문제의 집합이 될 가능성이 높으며, 이는 각 문제를 하나씩 해결하고 문제를 해결하기 위한 방법을 통합된 방식으로 적용해야 합니다. .

지난해 7월, AI Technology Review에서는 왕준 학장과 심도 있는 논의를 나누는 영광을 누렸습니다. 당시 그는 수학연구소의 목표가 의사결정 지능 연구와 AI 연구를 촉진하는 것이라고 밝혔습니다. , 그리고 중국에서 가장 훌륭하고 기본적인 연구를 수행합니다.

1년 만에 Stable Diffusion, ChatGPT, GPT-4 등의 모델이 등장하면서 Wang Jun은 AI 기술의 혁명적인 발전을 깨닫게 되었고, 수학 연구소에 대한 더욱 구체적인 목표를 갖게 되었습니다. 실제적으로 중요한 문제를 해결하기 위해 특정 시나리오에 대한 의사 결정 모델을 제공합니다.

학계에서 산업계에 이르기까지 디지털뇌연구소는 오랫동안 발전하지 못했고, 그 프로토타입에도 인공지능의 길에서 왕준이 탐색하고 탐색하는 방향이 반영되어 있습니다. "우리는 단지 우리만의 길을 가고 싶을 뿐입니다. 어떻게 하면 산학, 학계, 연구를 결합하여 이전에 묻지 않았던 질문을 던질 수 있을까요?"

3. 왕준과의 대화

대형 모델 수학기술연구소 시행 의사결정 과정

AI 기술 리뷰: 지난 해 대규모 다중 에이전트 의사 결정 모델에 관해 수학 연구소에서 수행한 작업과 진행 상황을 소개합니다.

왕준: 작년 여름부터 새로운 주제를 기획하기 시작했어요. NLP와 CV뿐만 아니라 의사결정에서도 큰 역할을 한다고 느꼈거든요. 그때 딥마인드의 'GATO' 작업이 결합을 시도했어요. 다양한 작업을 대형 모델에 넣고 이를 Transform에서 학습한 결과 영감을 받아 이를 기반으로 더 탐구하기로 결정하고 비디오, 이미지 데이터, 자연어 데이터, 로봇 데이터, 최적화 작업 수행 방법, 생산 일정 조정, 차량 최적화 방법 등과 같은 솔버 데이터도 추가됩니다. 약 10억~15억 개의 매개변수로 대형 모델을 만들었는데, 초기 탐색이었지만 대형 모델이 자연어 처리뿐 아니라 의사결정에도 중요한 역할을 한다는 사실도 입증됐다.

저희는 얼마 전 축구 경기를 작업하던 중 해결되지 않은 문제를 발견했습니다. 강화 학습, AlphaGo, StarCraft, Dota 및 기타 게임 시스템의 현재 연구 논리에 사람이 많을수록 의사 결정 공간이 많아집니다. 복잡하다.

이와 관련하여 저희는 게임 현장에서 축구를 문제의 연구 포인트로 삼았고, 단순한 2인 축구부터 5인 축구, 11인 축구까지 대규모 다중 에이전트 의사 결정 모델에서 많은 시도를 했습니다. -사람. 이는 강화 학습에 대한 상대적으로 규모가 크고 어려운 시나리오입니다. 현재 문제의 본질이 완전히 해결되지 않았거나 매우 잘 해결되었으므로 우리는 이 문제에 많은 시간을 투자하여 일부를 만들려고 합니다. 업적.

AI 기술 리뷰: ChatGPT 출시 후 수학연구소 연구에 어떤 영향을 미칠까요?

왕준: 우리의 초점은 항상 의사결정에 있었고 지금도 마찬가지입니다. 하지만 ChatGPT가 나온 후 우리는 기대를 완전히 뛰어넘는 언어 능력에 매우 놀랐고 의사 결정 작업을 촉진하는 데에도 일정한 역할을 했습니다.

의사결정 최적화 과정에서는 넓은 스펙트럼과 낮은 임계값이라는 두 가지 주요 문제점을 해결해야 합니다.

대형 의사결정 모델은 모델의 광범위한 문제를 어느 정도 해결합니다. 대형 모델에는 반복 및 미세 조정을 위해 새로운 작업이 배치됩니다.

AI 회사에서는 임계값이 낮은 문제가 일반적이었습니다. 이전에는 대규모 모델을 사용하려면 최적화 경험이 있는 사람이 문제 의사 결정 과정에 참여해야 하는 경우가 많았습니다. 기업의 참여율도 매우 높았으며, AI 사용 비용도 증가했습니다.

낮은 사용 임계값 문제를 해결하기 위해 우리는 이전에 자연어보다 복잡하고 엄격하지만 실제 프로그래밍보다 간단하고 누구나 사용할 수 있는 비교적 간단한 언어를 발명하는 것을 구상했습니다. ChatGPT, 갑자기 기계의 자연어가 사람과의 정상적인 의사소통 수준에 도달할 수 있고, 낮은 문턱의 페인포인트가 단번에 해결된다는 것을 깨닫게 해주세요. 우리에게는 이 변화가 미치는 영향이 상당히 큽니다.

더 흥미로운 점은 ChatGPT에는 복잡한 문제를 여러 하위 문제로 분해하는 데 도움이 될 수 있는 특정 논리적 추론 기능이 있다는 것입니다. 이 하위 문제 부분은 원래 전문가가 수동으로 분해해야 했지만 ChatGPT의 의미론 이해를 통해 예시를 얻으면 문제를 기본 문제로 분해할 수 있고, 대규모 의사결정 모델을 통해 기본 문제에 대한 기존 의사결정 능력을 직접 호출할 수 있습니다.

ChatGPT는 의사결정의 문턱을 낮춥니다

AI 기술 해설: 다중 에이전트 의사결정 모델은 다양한 영역을 포괄합니다. ChatGPT와 결합한 후 특정 분야의 데이터에 특별한 요구 사항이 있나요?

왕준: 구체적인 요구사항이 있을 거예요.

자연어 데이터는 오프라인이며 방법론적 학습에 속합니다. 의사결정에는 많은 데이터 생성 기능이 필요하며 시뮬레이터가 필요합니다. 예를 들어, 로봇 개에게 걷기 훈련을 할 때, 데이터 수집을 위해 비가 오는 날이나 다른 환경에서 돌아다니도록 두지 않을 것입니다. 우리는 종종 외부 세계와 매우 유사한 시뮬레이터를 구축하고 이를 사용하여 생성합니다. 데이터는 모델이 학습된 후 실제 장면에 배치되어 피드백을 제공하고 다시 학습하여 의사 결정 기능을 실제 응용 프로그램으로 신속하게 전달할 수 있습니다. 대형 모델 기술은 비가 오거나, 계단을 걷거나, 모래 위를 걷는 등 다양한 장면을 다루므로 문제가 없습니다.

ChatGPT 加持，决策大模型距离 AGI 更进一步

다양한 환경에서 걷는 기계개

두 번째 어려움은 의사결정 데이터 훈련이 자연어 처리보다 어렵다는 것입니다. 이 과정에서 데이터가 지속적으로 생성됩니다. 데이터 생성의 효율성, 생성 위치 및 학습을 위해 이를 다양한 학습 모듈에 할당하는 방법이 필요합니다. 통합 시스템 수준 솔루션으로서 우리는 이전에 이 강화 학습 훈련 방법에 주로 사용되는 대규모 학습 방법 세트를 개발했습니다. 그러나 ChatGPT가 나온 이후에는 대규모 오라클 모델을 기반으로 한 학습 방식이 적합하지 않게 되었습니다.

AI 기술 검토: 특정 시나리오에서 ChatGPT를 사용하여 대규모 의사 결정 모델과 결합하는 방법은 무엇입니까?

왕준: 기계식 개를 예로 들어보겠습니다. 초기에는 기계식 개를 훈련하기 위해 고전적인 제어 방법을 사용했습니다. 문제는 단일 환경 도로 조건에서 걷는 데 문제가 없다는 것입니다. 하지만 대형 모델 솔루션을 추가하자 로봇 개는 기본적인 상호 작용 기능을 갖추고 추론을 수행할 수 있게 되었습니다. 로봇 개에게 메시지를 보내라는 명령을 보내면 모델은 자동으로 작업을 1~5개의 기본 단계로 분해합니다. 각 모듈은 A 지점에서 B 지점으로의 경로 계획과 같은 전송에 해당 로직을 갖습니다.

로봇개 자체에는 동쪽이나 서쪽으로 가는 개념이 없고 좌표만 있기 때문에 대화형 지침을 특정 의미와 결합하고 대응해야 하기 때문에 ChatGPT를 통해 지침을 프로그래밍 언어로 변환할 필요가 없습니다. 질문을 받은 후 로봇 개는 먼저 Chat의 일부를 최적화하고 ChatGPT에서 생성된 자연어와 행동, 결정 및 의미를 일치시킵니다.

이것이 우리의 다음 연구의 주요 방향이 되었습니다. 이를 AIGA(AI 생성 작업)라고 합니다. 초기 단계에서 ChatGPT는 대규모 의사 결정 모델과 결합하여 콘텐츠 생성에서 한 단계 더 나아갔습니다. 행동을 생성합니다.

디지털연구소의 강점은 대규모 의사결정 모델에 있기 때문에, AI가 의사소통뿐만 아니라 더 중요하게는 최적화하고 도움을 줄 수 있도록 대규모 의사결정 모델의 방향을 고집하고 있습니다. 결정을 내리세요. 우리는 이것이 매우 가치 있다고 생각합니다. ChatGPT가 대규모 의사 결정 모델과 결합된 후 생성되는 상호 작용은 더 이상 질문에 대답하는 능력에 국한되지 않고 복잡하고 복잡한 구성을 이해할 수 있는지 여부도 특정 시나리오의 환경과 상호 작용함으로써 ChatGPT를 결합할 수 있습니다. 로봇 협업, 장치 역학, 기업 자율 스케줄링, 소프트웨어 개발 및 기타 광범위한 애플리케이션을 실현하기 위한 대규모 의사 결정 모델을 갖추고 있습니다.

자연어가 기본

AI 기술 해설: 다중 모달 데이터를 학습한 후 매개변수 수가 어느 수준에 도달하면 텍스트, 이미지, 음성, 비디오... 어느 양식이 더 많을까요? 다중 양식에 적합합니까? 모델의 영향이 더 큽니까?

왕준: '힘은 기적을 낳는다'라는 문제에는 데이터적인 한계가 있어요. 아직 그 한계를 완전히 본 건 아니지만, 단순히 훈련 방법을 배우는 데만 집중하고 있는 건 아닌 것 같아요. ChatGPT.

ChatGPT는 강력한 언어 능력과 강력한 대화 능력을 갖추고 있지만 ChatGPT는 자신이 흡수하는 것을 진정으로 이해하고 있을까요? 이해가 안 되는 것 같아요. 추측 게임을 하게 하세요. 표면적으로는 플레이할 수 있지만 실제로는 마음 속 숫자를 알지 못하고 추측할 수도 없습니다. ChatGPT는 원본 훈련 데이터의 논리적 내용을 기억하는 것에 더 가깝습니다. 정보를 일치시키는 능력은 매우 강력하지만 진정으로 이해하는 능력은 매우 약합니다.

제한을 깨는 방법은 무엇입니까? 전 세계에 대한 모델의 이해를 훈련에 추가해야 한다고 생각합니다. 세계를 설명하는 수학적 모델을 구축하고 그 이해를 세계 모델에 적용하지 않으면 주변 세계에 대한 더 깊은 이해를 갖지 못할 것입니다. 의. 간단한 예를 들자면, ChatGPT에 2000포인트 미만의 모든 인간 체스 플레이 능력 데이터를 제공합니다. 모델이 사람만 모방한다면 2000포인트 이상의 지능은 모방할 수 없습니다.

ChatGPT 加持，决策大模型距离 AGI 更进一步

왕준 팀이 이전에 만든 AI 생성 어시스턴트

데이터도 중요하지만 동시에 모델의 크기도 중요하며 이를 개선하려면 다양한 훈련 방법이 있어야 합니다.

다양성에서는 자연어가 기초입니다. 사람들이 생각할 때 언어는 비교적 명확한 논리적 설명을 구성합니다. 이 논리적 설명은 100% 엄격하지 않을 수 있으며 차이가 분명합니다. 모호하지만 매우 복잡한 논리적 관계를 표현하는 것만으로도 충분합니다.

그러나 동시에 우리는 자연어에 내재된 의미 정보와 표현이 매우 중요하다는 점, 즉 문제를 매우 명확하게 표현할 수도 있지만 이는 겉모습일 뿐이라는 점을 분명히 깨달아야 합니다. 결국 가장 중요한 것은 대화에 포함된 의미 관계입니다. 다른 다중 모드가 오면 해당 의미 표현을 일치시켜 다른 모드로 전송할 수 있습니다.

자연어를 기반으로 모델에 참여하기 위해 더 많은 양식을 추가할 수 있습니다.

AI 기술 검토: 다중 모드 대형 모델 또는 의사 결정 대형 모델에 대한 "인간 피드백" 데이터의 영향을 어떻게 보시나요?

왕준: 인간의 피드백 데이터가 필요하지만 그 양은 이전 지도 학습 요구 사항만큼 크지 않습니다. 기본 모델은 몇 가지 시연만 하면 됩니다. 기본 모델이 새로운 것에 적응하도록 안내하는 것이 목적입니다. 작업 시나리오 기본 모델이 원래의 기능을 드러내도록 하세요. 이는 고전적인 기계 학습 훈련 모델의 혁신입니다.

과거에는 대부분의 AI 기업이 머신러닝을 위한 맞춤형 모델을 채택했는데, 과제가 오면 먼저 문제를 정의하고, 훈련용 데이터를 수집하고, 두 번째 과제가 발행된 후 다시 수집하고 정의했습니다. 문제를 해결하고 훈련을 위해 수집된 데이터와 모델 테스트를 수행하는 것은 복제하기 어려울 뿐만 아니라 배포에도 많은 재정적, 인적 자원이 소모됩니다.

ChatGPT 이후의 머신 러닝은 먼저 구체적인 문제가 무엇인지 알 필요가 없으며, 먼저 모델을 구축한 다음 이를 고객이나 제조업체에 배포합니다. 회사에서는 전체 프로세스를 거꾸로 배포하고 정의하는 기능이 없습니다. 그 본질은 대규모 모델을 활성화하고 이를 특정 작업에 적용한 다음 작업을 정의하고 결과를 출력하는 것입니다. 모델에 대한 "인간 피드백" 데이터를 활용하여 광범위한 스펙트럼, 낮은 임계값 AI를 진정으로 실현합니다.

AI 기술 의견: 일부 사람들은 이번 ChatGPT 대회에서 컴퓨팅 성능과 모델이 더 이상 이전 두 기간만큼 중요하지 않다고 생각하지만, 이번 라운드에서는 시나리오와 데이터가 핵심이 될 것이라고 생각하시나요?

왕준: 모델은 정말 중요해요. 현재 일부 대형 모델의 언어 능력이 향상되면서 사람을 이해하는 능력을 갖춘 모델이 나올 수도 있겠지만 이는 겉모습에 불과하다. 몇 개의 단어에만 의존하여 다음 단어를 예측하는 기본적인 모델 학습 방법은 더 큰 지능을 생산하기 어렵습니다. 모델의 사고 및 의사 결정 능력은 향상될 수 없으며, 이 두 가지는 인공 지능의 가장 기본적인 능력입니다. 환경과 상호작용하는 방법을 아는 것.

이 모델의 관점에서 볼 때 모델은 여전히 혁신이 필요합니다. Transform 아키텍처는 매우 훌륭하지만 이것이 우리가 앞으로 나아갈 수 있다는 의미는 아닙니다. 혁신적이고 창의적이며 사고하는 신경망 모델이 등장해야 한다는 의미는 아닙니다. .

컴퓨팅 파워, 모델, 데이터, 시나리오 모두 매우 중요합니다. 데이터와 컴퓨팅 파워가 일정 수준에 도달하면 혁신 이후에는 데이터와 컴퓨팅 파워의 변수가 축적되고, 그 다음에는 새로운 혁신이 나타나야 합니다. 그것은 나선형 과정인 특정 높이와 혁신에 도달합니다.

시나리오는 궁극적으로 연구를 학문적 수준에 머물게 하는 것이 아니라 시나리오에서 문제를 정의하고 해결해야 합니다. 장면이 구동된 후에는 새로운 모델이나 방법이 사용되며 데이터와 컴퓨팅 성능을 사용하여 또 다른 극단에 도달합니다.

ChatGPT는 매우 광범위하지만 모든 AI 문제를 해결할 수 있다는 의미는 아닙니다. 다음 시나리오에서는 무엇을 생각해야 하며 어떤 문제를 해결할 수 있나요? 문제의 핵심은 모델의 사고와 의사결정 능력을 특정 시나리오에 실제로 적용할 수 있도록 하는 동시에 환경, 사람, 다양한 시나리오와 상호 작용하여 궁극적으로 모델의 적용을 실현해야 한다는 것입니다. 이는 에너지 산업 전반에 걸쳐 인류 발전에 큰 기여를 했습니다.

이 경우 실제 AGI를 탄생시킬 수 있습니다. 이는 수학연구소의 목표이기도 합니다.

위 내용은 ChatGPT의 축복으로 대규모 의사결정 모델이 AGI에 한 걸음 더 가까워졌습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：

이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제