2023년 항저우 컴퓨팅 컨퍼런스에서 Alibaba Cloud 최고 기술 책임자 Zhou Jingren은 수천억 개의 매개변수를 갖춘 대형 모델인 Tongyi Qianwen 2.0을 출시했습니다. 10개의 권위 있는 평가에서 Tongyi Qianwen 2.0의 종합적인 성능은 GPT-3.5를 넘어섰으며 GPT-4를 따라잡는 데 박차를 가하고 있습니다.
Tongyi Qianwen 2.0이 지난 6개월 동안 엄청난 발전을 이룬 것으로 보고되었습니다. 4월에 출시된 버전 1.0과 비교하여 Tongyi Qianwen 2.0은 복잡한 명령 이해, 문학 창작, 일반 수학, 지식 기억 및 환각 저항 능력이 크게 향상되었습니다. 현재 Tongyi Qianwen의 종합 성능은 GPT-3.5를 초과했으며 GPT-4를 따라잡는 속도를 가속화하고 있습니다
Tongyi Qianwen 2.0은 MMLU, C-Eval, GSM8K, HumanEval, and MATH 세트의 전체 점수는 Meta의 Llama-2-70B를 초과하고 승률은 OpenAI의 Chat-3.5보다 91%, GPT-4보다 46% 높으며 GPT-4와의 격차는 더욱 좁아집니다
중국어 그리고 영어 이해 능력은 대형 언어 모델의 기본 기술입니다. 영어 작업 측면에서 Tongyi Qianwen 2.0은 MMLU 벤치마크에서 82.5점을 얻었으며 이는 GPT-4에 이어 두 번째입니다. Tongyi Qianwen 2.0은 작업 측면에서 복잡한 언어 구조와 개념을 더 잘 이해하고 처리할 수 있습니다. , Tongyi Qianwen 2.0은 분명한 이점으로 C-Eval 벤치마크에서 가장 높은 점수를 달성했습니다. 이는 모델이 훈련 중에 더 많은 중국어 코퍼스를 학습하여 중국어 이해 및 표현 능력을 더욱 강화했기 때문입니다.
Tongyi Qianwen 2.0은 수학적 추론 및 코드 이해와 같은 분야에서 상당한 진전을 이루었습니다. 추론 벤치마크 테스트 GSM8K에서 Tongyi Qianwen은 2위에 올랐으며 HumanEval 테스트에서 강력한 컴퓨팅 및 논리적 추론 능력을 보여주었습니다. Tongyi Qianwen의 점수는 주로 대규모 모델의 능력을 측정하는 GPT-4 및 GPT-3.5를 밀접하게 따랐습니다. 코드 조각을 이해하고 실행하는 것은 프로그래밍 지원 및 자동 코드 복구와 같은 시나리오에서 사용되는 대규모 모델의 기초입니다.
위 내용은 Alibaba Cloud, GPT-4를 따라잡기 위해 성능을 가속화한 Tongyi Qianwen 2.0 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!