최근 국내 굴지의 인공지능 대형모델 기업인 Wall-Facing Intelligence가 청화대학교 NLP 연구소와 손잡고 대형 모델 '슈퍼히어로'를 공동 개발, 출시했다고 합니다. XAgent.
작업 테스트를 통해 실제 복잡한 작업에서 XAgent의 처리 능력이 AutoGPT를 완전히 능가했습니다.
XAgent는 LLM을 핵심으로 인간의 지시를 이해하고 복잡한 계획을 수립하며 자율적으로 조치를 취할 수 있는 새로운 AI 에이전트입니다. 기존 에이전트는 일반적으로 인간이 맞춤화한 규칙에 의해 제한되며 제한된 범위 내에서만 문제를 해결할 수 있습니다. 그들은 진정한 "자율 행위자"라기보다는 인간이 사용하기 위한 "도구"에 더 가깝고 복잡한 문제를 자율적으로 해결하기가 어렵습니다.
자율적인 계획 및 의사 결정 기능이 부여되어 인간의 사전 설정에 얽매이지 않고 독립적으로 작동하고 새로운 전략과 솔루션을 발견할 수 있습니다.
그 기능은 AutoGPT를 완전히 능가하여 많은 장면 작업에서 놀라운 자율성과 복잡한 작업 해결 기능을 보여 AI 에이전트의 지능 수준을 새로운 수준으로 높였습니다.
그러면 다시 질문이 뜹니다. 어떻게 구현되나요?
"좌우뇌" 협업, 이중 순환 메커니즘인간에게 "좌뇌"와 "우뇌"가 있는 것처럼 복잡한 작업을 처리할 때 일반적으로 이를 "매크로"라는 두 가지 관점에서 고려합니다. 전체적인 상황에 대한 조정과 계획이 필요하며, 실행 차원에서도 고려해야 합니다.
"을 혁신적으로 도입했습니다.
외부 루프: 전체 상황을 담당합니다. 작업 복잡한 작업을 간단하고 실행 가능한 작업으로 분해하여 계획을 세우는 것입니다.
"PlanAgent"로서 리더십을 보여줍니다. 복잡한 작업을 여러 개의 간단한 작업으로 분할하고 문제 해결의 전체 프로세스를 감독합니다.
먼저 주어진 복잡한 작업을 더 작고 관리하기 쉬운 "하위 작업"으로 분해하고 "초기 계획
"을 생성하고 작업 순서를 구성합니다.이후 각 하위 작업을 내부 루프에 차례로 전달하여 해결합니다. 이 과정에서 외부 루프는 작업의 진행 상황과 상태를 지속적으로 모니터링하고 피드백을 기반으로 후속 계획에 대해 "반복 최적화
"를 수행합니다.내부 루프에서 XAgent는 신속하게 정체성을 변경하여 효율적인 "실행자"(ToolAgent
)로서의 전문성을 보여 외부 루프에서 전달되는 하위 작업이 기대치를 충족하는지 확인합니다.하위 작업의 성격에 따라 외부 시스템에서 도구를 가져와서 하위 작업을 단계별로 해결할 수 있습니다. 하위 작업이 완료된 후 현재 하위 작업 실행 프로세스의 반영을 생성하고 이를 외부 루프로 피드백하여 현재 작업이 완료되었는지 여부와 작업 실행의 잠재적인 최적화 지점을 나타냅니다. 그림과 같이 사용자는 iris.zip 파일을 XAgent에 제출하고 XAgent에서 데이터를 분석하도록 했습니다. 보시다시피 XAgent는 먼저 외부 루프를 통해 이 작업을 4개의 하위 작업으로 분해합니다. 이후 각 하위 작업을 실행할 때 XAgent는 내부 루프를 통해 파일 읽기 및 쓰기, 쉘 명령, Python 노트북 및 해당 팬더, sci-kit learn, seaborn, matplotlib 및 기타 데이터 분석 라이브러리를 능숙하게 사용하고, 데이터의 시각적 분석도 수행할 수 있습니다.
AutoGPT는 동일한 작업을 수행할 때 Python 환경 및 관련 라이브러리를 확인할 계획을 세우지 않고 직접 실행을 위한 코드 작성을 시작하여 실행 시 실패 및 오류 보고가 발생했습니다. 관련 라이브러리를 사용하여 데이터에 대한 정교한 분석도 완료되지 않았습니다. AutoGPT는 기존 GPT 모델의 한계를 어느 정도 극복했지만, 여전히 무한 루프, 부정확 등의 실행 오류 현상이 존재합니다. 수동 개입이 필요한 통화를 해결할 수 있습니다. XAgent는 설계 초기부터 관련 문제를 고려했으며 인간-기계 협업을 향상시키기 위해 특별히 설계된 상호 작용 메커니즘을 도입했습니다. XAgent는 사용자와 자율적으로 상호 작용하고 인간의 개입 및 안내 요청을 발행할 수 있습니다. 지능형 에이전트에게 "인간과 협력할 수 있는지"는 지능을 반영하는 중요한 지표이기도 합니다. 우선, XAgent는 직관적인 인터페이스를 갖추고 있으며, 사용자는 XAgent가 제공하는 제안을 직접 무시하거나 수정할 수 있어 AI 효율성과 인간의 직관 및 전문 지식을 효과적으로 결합할 수 있습니다. 둘째, XAgent는 익숙하지 않은 문제에 직면했을 때 "인간에게 도움을 구하는" 능력을 갖추고 있어 불확실한 영역에서도 에이전트가 잘 수행될 수 있도록 사용자로부터 실시간 피드백, 제안 또는 지침을 구합니다. .최고의 효과. Pictures 이 상호 작용 패러다임은 AI의 자율성과 인간의 지혜를 유기적으로 통합하여 인간과 XAgent 간의 새로운 협력 관계를 보여줍니다. 그림과 같이 사용자는 XAgent를 통해 친구들과 파티할 수 있는 맛있는 레스토랑을 추천해 주기를 원하지만 구체적이고 자세한 정보는 제공되지 않습니다. 이때, XAgent는 현재 사용자가 제공하는 정보만으로는 추천을 하기에는 부족하다는 것을 깨닫고 인간에게 사용자가 선호하는 위치, 예산 범위, 취향 선호도, 금기 사항 등을 물어보는 요청을 합니다. , 사용자의 추천을 받은 후 피드백을 바탕으로 추천 레스토랑을 제공합니다. 그러나 AutoGPT는 추천을 위해 직접 인터넷에서 레스토랑 정보를 검색하기 시작했습니다. 최종 추천 결과는 잘못된 위치에 있었고, 사용자의 예산을 고려하지 않았으며, 사용자의 요구를 충족시키지 못했습니다. "이중 사이클" 작동 메커니즘이나 "인간-기계 협업"의 상호 작용 기능에 관계없이 XAgent의 전반적인 설계에서 Wallface Intelligence와 Tsinghua 팀은 다음 사항에 중점을 두었습니다. 안정성, 효율성, 안전성 등 지능 핵심 기능. 그리고 구조화된 통신 방법 역시 강력하고 안정적인 지능형 에이전트를 구축하는 데 중요한 요소 중 하나입니다. XAgent는 내부 통신 언어로 Function Call을 사용하는데, 이는 구조화, 표준화, 통일의 장점을 가지고 있습니다. 또한 AI 에이전트가 복잡한 문제를 해결할 수 있는 능력이 있는지 평가하는 중요한 능력 중 하나는 도구 호출입니다. XAgent에는 보다 안전하고 효율적이며 확장 가능한 도구 실행 기능을 달성할 수 있는 독창적인 도구 실행 엔진 ToolServer이 설계되어 있습니다. 격리된 Docker 환경에서 실행되므로 도구 실행으로 인해 기본 시스템의 안정성이나 보안이 손상되지 않습니다. 이 디자인은 여러 가지 이점을 제공합니다. ToolServer의 주요 구성 요소에는 실행 작업, 노드 검사, 주기 관리 등에 강력한 기능을 제공하는 ToolServerNode, ToolServerMonitor 및 ToolServerManager가 포함됩니다. 현재 XAgent의 ToolSever는 FileSystemEnv, PythonNotoBook, WebEnv, ExecuteShell, RapidAPIEnv, AskHumanforHelp 및 기타 도구를 지원합니다. XAgent는 몇 가지 간단한 작업을 수행하는 데 도움이 될 뿐만 아니라 모델을 훈련시키는 데에도 도움이 될 수 있습니다. 예를 들어 사용자는 영화 리뷰를 분석하고 영화에 대한 대중의 평가 품질을 판단하기를 원합니다. 이때 XAgent는 먼저 imdb 데이터 세트를 다운로드하여 BERT 모델을 훈련하고 훈련된 BERT 모델을 사용하여 영화 리뷰를 예측합니다. 일련의 작업을 테스트한 후 확인할 수 있습니다(그림 a 및 b 참조). 아래), GPT-4의 XAgent 성능을 기준으로 모든 벤치마크 테스트에서 원본 GPT-4의 성능을 능가하고 모든 측면에서 AutoGPT를 능가합니다. 이러한 작업에는 상담원 추론 계획과 검색 엔진(FreshQA+HotpotQA)으로 질문에 답하는 능력, Python 프로그래밍 능력(MBPP), 수학적 추론 능력(MATH) 및 대화형을 포함한 외부 도구를 사용할 수 있는 능력이 필요합니다. 프로그래밍 능력(InterCode), 구체화된 추론 능력(ALFWorld), 실제 복잡한 작업 등 그림 a: XAgent가 실제 복잡한 작업 처리에서 AutoGPT를 완전히 능가합니다 그림 b: XAgent가 AutoGPTXAgent를 능가하고 6개 주요 AI 에이전트 벤치마크 테스트에서 GPT-4를 완전히 앞서는 것을 볼 수 있습니다 XAgent 시스템 설계는 GPT-4의 기본 기능을 완전히 활용하고 매우 높은 테스트 결과와 인간 선호도(Human Preference)를 달성할 수 있습니다. 이는 XAgent가 추론 계획이 필요한 전통적인 AI 테스트에서 좋은 성능을 발휘할 뿐만 아니라, 복잡한 실제 명령어 처리에서도 더 높은 성능을 발휘함을 보여줍니다 AI Agent의 등장 빅 모델의 개발을 통해 업계 전체는 대규모 모델 기술의 중요한 구현 방향을 확인할 수 있었으며, 이를 통해 복잡한 프롬프트 탐색 없이도 완전한 워크플로우 세트의 작업 실행을 실현할 수 있었습니다. XAgent는 무한한 잠재력을 지닌 대형 모델 "슈퍼 히어로"로서 모든 평범한 사람들의 "개인 비서"가 될 수 있습니다. 이는 일정을 계획하고 여행 일정을 조정하며 생활과 업무에서 시간과 자원 할당을 관리하는 데 도움이 될 수 있습니다. 또한 다양한 데이터 수집, 처리 및 분석 도구를 독립적으로 사용하여 대용량 데이터를 완전 자동으로 분석하고 보고서를 작성하여 사용자가 중요한 정보를 효율적으로 얻을 수 있도록 도와줍니다. 또한 XAgent는 외부 도구와 자율 계획 알고리즘을 결합하여 환경 정보를 기반으로 의사 결정을 내려 보다 효율적이고 정확한 작업 실행을 달성할 수도 있습니다. XAgent의 R&D 팀은 Wall-Facing Intelligence와 Tsinghua University의 THUNLP Laboratory에서 대형 모델 분야의 수많은 전문가와 학자들로 구성되어 있습니다. 그들은 대형 모델 세계의 "슈퍼 히어로"에 가깝습니다. 이 혁신적인 성과가 성공적으로 출시될 수 있었던 이유는 팀이 장기적인 과학 연구 과정에서 일련의 최첨단 혁신적인 대형 모델 인프라를 구축하여 기술 기반을 공고히 하고 혁신의 경계를 확장했기 때문입니다. 연구개발. Wallface Intelligence는 Tsinghua University NLP Laboratory 및 OpenBMB 오픈 소스 커뮤니티와 협력하여 "Trinity" 대형 모델 산학연 생태 레이아웃을 만들고 여러 대형 모델 도구 사용 프레임워크 및 엔진을 제안 및 출시했습니다. XAgent는 AI 에이전트가 복잡한 작업을 수행할 수 있는 능력의 상한을 확장하여 대형 모델 기술을 생산과 생활에 통합할 수 있는 최첨단 트렌드와 무한한 잠재력을 볼 수 있게 해줍니다.
인간-컴퓨터 협업: 에이전트 상호작용의 새로운 패러다임
효율적인 통신 언어, 초강력 도구 호출
대형 모델의 잠재력을 발휘하고 AutoGPT를 완전히 능가합니다
응용 프로그램 경계와 탄탄한 기술 기반을 확장합니다
위 내용은 AutoGPT를 전반적으로 능가하는 Wall-Facing Intelligence는 Tsinghua NLP Laboratory의 오픈 소스 대형 모델 “Superhero” XAgent와 협력합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!