2023년 10월 27일, Zhipu AI는 2023 중국 컴퓨터 컨퍼런스(CNCC)에서 완전히 자체 개발한 3세대 기본 모델 ChatGLM3 및 관련 제품 시리즈를 출시했습니다. 블록 대화 모델 ChatGLM 및 ChatGLM2에 이어 또 다른 획기적인 발전입니다. 이번에 출시된 ChatGLM3는 학습을 더욱 완벽하게 만들기 위해 독창적인 다단계 강화 사전 학습 방법을 채택했습니다. 평가 결과, 44개의 중국어 및 영어 공개 데이터 세트 테스트에서 ChatGLM3가 동일한 크기의 국내 모델 중 1위를 차지한 것으로 나타났습니다. Zhipu AI CEO Zhang Peng은 현장에서 신제품을 출시하고 실시간으로 최신 제품 기능을 시연했습니다.
더 높은 성능과 더 낮은 비용으로 ChatGLM3 신기술 업그레이드
풍부한 훈련 데이터와 더 나은 훈련 솔루션을 통해 Zhipu AI가 출시한 ChatGLM3의 성능은 더욱 강력해졌습니다. ChatGLM2와 비교하여 MMLU는 36%, CEval은 33%, GSM8K는 179%, BBH는 126% 증가했습니다.
동시에 ChatGLM3은 GPT-4V를 목표로 하며 다중 모드 이해 기능을 갖춘 CogVLM(이미지 인식 의미론)을 포함하여 여러 가지 새로운 기능의 반복적인 업그레이드를 구현했습니다. 이는 10개 이상의 국제 표준 그래픽 평가 데이터 세트에서 SOTA를 달성했습니다. code 강화된 모듈인 Code Interpreter는 사용자 요구에 따라 코드를 생성하고 실행하며, 데이터 분석, 파일 처리 등 복잡한 작업을 자동으로 완료합니다. 네트워크 검색 강화 WebGLM-액세스 검색 강화는 질문을 기반으로 인터넷에서 관련 정보를 자동으로 검색하고 제공합니다. 답변 시 관련 참고문헌이나 기사 링크. ChatGLM3의 의미론적, 논리적 기능이 크게 향상되었습니다.
ChatGLM3에는 특히 지능형 계획 및 실행 측면에서 모델 에이전트 기능을 활성화하는 자체 개발 AgentTuning 기술이 통합되어 있으며, 이는 ChatGLM2에 비해 1000% 향상되었으며 국내 대형 모델에서도 도구 호출, 코드 실행을 기본적으로 지원할 수 있습니다. , 게임, 데이터베이스 운영, 지식 그래프 검색 및 추론, 운영 체제 및 기타 복잡한 시나리오.
또한 ChatGLM3는 이번에 휴대폰에 배포할 수 있는 최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B를 출시합니다. 이들은 vivo, Xiaomi, Samsung을 포함한 다양한 휴대폰 및 차량 탑재 플랫폼을 지원합니다. 모바일 플랫폼에서 CPU 칩 추론을 지원합니다. 속도는 20개 토큰/초에 도달할 수 있습니다. 정확도 측면에서 1.5B 및 3B 모델의 성능은 공개 벤치마크에서 ChatGLM2-6B 모델의 성능에 가깝습니다.
최신의 효율적인 동적 추론 및 메모리 최적화 기술을 기반으로 동일한 하드웨어 및 모델 조건에서 ChatGLM3의 현재 추론 프레임워크를 버클리 대학에서 출시한 vLLM 및 최신 버전의 Hugging을 포함한 현재 최고의 오픈 소스 구현과 비교합니다. Face TGI, 추론 속도는 2~3배 증가하고 추론 비용은 2배 증가합니다. 토큰 1000개당 0.5포인트에 불과하며 비용이 가장 저렴합니다.
중국 최초의 코드 상호 작용 기능인 차세대 "Zhipu Qingyan" 출시
새로 업그레이드된 ChatGLM3를 기반으로 생성 AI 비서 Zhipu Qingyan이 코드 상호 작용 기능을 갖춘 중국 최초의 대형 모델 제품(코드 해석기)이 되었습니다(https://chatglm.cn/main/code).
"코드" 기능은 현재 이미지 처리, 수학적 계산, 데이터 분석 및 기타 사용 시나리오를 지원합니다. 다음은:
§ 데이터를 처리하여 차트 생성
§ 그래픽을 그리는 코드
§ SQL 코드 분석 업로드
WebGLM 대형 모델 기능이 추가되면서 Zhipu Qingyan에는 검색 향상 기능도 있어 사용자가 관련 질문에 대한 온라인 문헌이나 기사 링크를 분류하고 직접 답변을 제공하는 데 도움이 됩니다.
이전에 출시된 CogVLM 모델은 Zhipu Qingyan의 중국어 이미지 및 텍스트 이해 기능을 향상하여 GPT-4V에 가까운 이미지 이해 기능을 달성하고 다양한 유형의 시각적 질문에 답하고 복잡한 대상 감지를 완료하여 자동 데이터 주석을 완료할 수 있습니다.
2022년 초부터 Zhipu AI가 출시한 GLM 시리즈 모델은 Ascend, Sunway 슈퍼컴퓨팅 및 Haiguang DCU 아키텍처에 대한 대규모 사전 훈련 및 추론을 지원해 왔습니다. 지금까지 Zhipu AI의 제품은 Ascend, Sunway Supercomputer, Haiguang DCU, Haifeike, Muxixiyun, Computing Technology, Tianshu Intelligent Core, Cambrian 및 Moore Thread, Baidu Kunlun Core, Lingxi Technology, Great를 포함하여 10개 이상의 국내 하드웨어 생태계를 지원했습니다. 벽 Chaoyun 등 국내 칩 업체와의 공동 혁신을 통해 지속적인 성능 최적화를 통해 국내 토종 대형 모델과 국산 칩이 조속히 국제무대에 진출할 수 있도록 돕겠습니다.
Zhipu AI가 출시한 ChatGLM3 및 관련 제품 시리즈는 모델 성능을 종합적으로 개선하고 업계를 위한 보다 오픈 소스 생태계를 조성했으며 일반 사용자가 AIGC 제품을 사용하는 문턱을 더욱 낮췄습니다. AI는 우리를 새로운 시대로 이끌고 있으며, 대형 모델은 이 순간의 도래를 확실히 가속화할 것입니다.
위 내용은 Zhipu AI, 포괄적인 성능 혁신을 갖춘 3세대 대형 기본 모델 ChatGLM3 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!