>  기사  >  기술 주변기기  >  Zhipu AI, 더 많은 국내 칩에 적응하기 위해 3세대 대형 기본 모델 ChatGLM3 출시

Zhipu AI, 더 많은 국내 칩에 적응하기 위해 3세대 대형 기본 모델 ChatGLM3 출시

WBOY
WBOY앞으로
2023-10-30 18:05:231064검색

2023년 10월 27일자 Zhipu AI가 중국 컴퓨터 컨퍼런스(CNCC)에서 자체 개발한 새로운 3세대 대형 기본 모델 ChatGLM3 및 관련 제품 시리즈를 출시했다는 소식입니다. 이번 릴리스는 1,000억 개의 기본 대화 모델 ChatGLM 및 ChatGLM2를 출시한 후 Zhipu AI의 획기적인 발전입니다

ChatGLM3는 독창적인 다단계 강화 사전 학습 방법을 사용하여 개발되었습니다. 이 방법을 사용하면 훈련을 더욱 완벽하게 만들 수 있습니다. 평가 결과에 따르면 44개 중·영 공개 데이터셋 테스트에서 ChatGLM3가 같은 크기의 국내 모델 중 1위를 차지했다. Zhipu AI CEO Zhang Peng은 기자간담회에서 신제품을 출시하고 최신 제품 기능을 실시간으로 시연했습니다

더 높은 성능과 더 낮은 비용으로 ChatGLM3 신기술 업그레이드

Zhipu AI가 출시한 ChatGLM3는 풍부한 훈련 데이터와 더 나은 훈련 솔루션으로 더욱 강력해졌습니다. ChatGLM2와 비교하여 MMLU는 36%, CEval은 33%, GSM8K는 179%, BBH는 126% 증가했습니다

동시에 ChatGLM3은 GPT-4V를 목표로 하며 다중 모드 이해 기능을 갖춘 CogVLM(이미지 인식 의미론)을 포함하여 여러 가지 새로운 기능의 반복적인 업그레이드를 구현했습니다. 이는 10개 이상의 국제 표준 그래픽 평가 데이터 세트에서 SOTA를 달성했습니다. code 강화된 모듈인 Code Interpreter는 사용자 요구에 따라 코드를 생성하고 실행하며, 데이터 분석, 파일 처리 등 복잡한 작업을 자동으로 완료합니다. 네트워크 검색 강화 WebGLM-액세스 검색 강화는 질문을 기반으로 인터넷에서 관련 정보를 자동으로 검색하고 제공합니다. 답변 시 관련 참고문헌이나 기사 링크. ChatGLM3의 의미론적, 논리적 기능이 크게 향상되었습니다.

ChatGLM3에는 특히 지능형 계획 및 실행 측면에서 모델 에이전트 기능을 활성화하는 자체 개발 AgentTuning 기술이 통합되어 있으며, 이는 ChatGLM2에 비해 1000% 향상되었으며 국내 대형 모델에서도 도구 호출, 코드 실행을 기본적으로 지원할 수 있습니다. , 게임, 데이터베이스 운영, 지식 그래프 검색 및 추론, 운영 체제 및 기타 복잡한 시나리오.

또한 ChatGLM3는 이번에 휴대폰에 배포할 수 있는 최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B를 출시합니다. 이들은 vivo, Xiaomi, Samsung을 포함한 다양한 휴대폰 및 차량 탑재 플랫폼을 지원합니다. 모바일 플랫폼에서 CPU 칩 추론을 지원합니다. 속도는 20개 토큰/초에 도달할 수 있습니다. 정확도 측면에서 1.5B 및 3B 모델의 성능은 공개 벤치마크에서 ChatGLM2-6B 모델의 성능에 가깝습니다.

최신의 효율적인 동적 추론 및 메모리 최적화 기술을 기반으로 동일한 하드웨어 및 모델 조건에서 ChatGLM3의 현재 추론 프레임워크를 버클리 대학에서 출시한 vLLM 및 최신 버전의 Hugging을 포함한 현재 최고의 오픈 소스 구현과 비교합니다. Face TGI, 추론 속도는 2~3배 증가하고 추론 비용은 2배 증가합니다. 토큰 1000개당 0.5포인트에 불과하며 비용이 가장 저렴합니다.

본 내용은 참고용이며 투자 조언이 아닙니다. 독자는 이 정보를 사용할 때 스스로 판단해야 하며 자신의 결정에 대한 책임을 져야 합니다. 이 웹사이트는 이 콘텐츠의 사용으로 인해 발생하는 모든 손실에 대해 책임을 지지 않습니다

이 계정은 게시된 정보의 가용성, 정확성, 적시성, 타당성 또는 완전성에 대해 어떠한 진술이나 보장도 하지 않으며, 이에 따라 해당 정보로 인해 발생할 수 있는 모든 책임이나 결과에 대해 책임을 지지 않습니다. 재작성 후: 이 계정은 게시된 정보의 가용성, 정확성, 적시성, 타당성 또는 완전성에 대해 어떠한 진술이나 보증도 하지 않으며 이 진술서에 대한 책임이나 결과를 가정하지 않습니다

2. 이 계정은 비상업적, 비영리적입니다. 복제된 콘텐츠는 귀하가 그 견해에 동의하고 그 진위 여부에 대해 책임을 진다는 것을 의미하지 않으며 다른 지침을 구성할 의도도 없습니다. 이 웹사이트는 복제되거나 게시된 정보의 부정확성이나 오류에 대해 직접적 또는 간접적인 책임에 대해 책임을 지지 않습니다.

3. 이 글에 사용된 정보, 자료, 텍스트, 사진 등은 인터넷에서 가져온 것이며, 복제된 모든 내용에는 출처가 표시되어 있습니다. 귀하의 지적 재산권이나 개인의 법적 권리를 침해하는 저작물을 발견한 경우 당사에 연락해 주시면 적시에 수정하거나 삭제해 드리겠습니다

Zhipu AI, 더 많은 국내 칩에 적응하기 위해 3세대 대형 기본 모델 ChatGLM3 출시

위 내용은 Zhipu AI, 더 많은 국내 칩에 적응하기 위해 3세대 대형 기본 모델 ChatGLM3 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 sohu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제