>  기사  >  기술 주변기기  >  Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시

Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시

WBOY
WBOY앞으로
2023-10-31 18:05:161348검색

10월 31일 Alibaba Cloud는 수천억 개의 매개변수를 갖춘 대형 모델인 Tongyi Qianwen 2.0을 공식 출시했습니다. 10공인 평가에서 Tongyi Qianwen 2.0의 종합적인 성능은 GPT-3.5를 넘어 GPT-4를 따라잡는 데 박차를 가하고 있습니다. 같은 날 Tongyi Qianwen APP가 주요 모바일 애플리케이션 시장에 공식 출시되었으며, 누구나 이 APP를 통해 최신 모델 기능을 직접 경험할 수 있습니다.

지난 6개월 동안Tongyi Qianwen 2.0은 4월에 출시된 1.0 버전과 비교하여 복잡한 수업 이해, 문학 창작, 일반 부문에서 성능이 크게 향상되었습니다. 목적 수학, 지식 기억, 환각 저항 및 기타 능력이 모두 크게 향상되었습니다. 현재 Tongyi Qianwen의 종합 성능은 GPT-3.5를 초과하여 GPT-4를 따라잡는 데 박차를 가하고 있습니다.

사진: Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시

Tongyi Qianwen 2.0 종합 성능

이 GPT-3.5를 넘어섰고 GPT-4

을 따라잡기 위해 가속하고 있습니다. ,

C- 평가 ,GSM8K, HumanEval, MATH 외 10개

주류 벤치마크 평가 세트, Tongyi Qianwen 2.0의 전체 점수는 Meta의 Llama-2-70B를 능가했으며 OpenAI의 Chat-3.5와 비교하면 9승 1패, GPT와 비교하면 -4 4승 6패로 GPT-4와의 격차가 더욱 좁아졌다. 중국어와 영어를 이해하는 능력은 대형언어모델의 기본 스킬입니다.

영어 작업 측면에서 Tongyi Qianwen 2.0은 MMLU 벤치마크에서 GPT-4에 이어 두 번째로 높은 점수를 얻었습니다. Tongyi Qianwen 2.0은 복잡한 언어 구조와 개념을 더 잘 이해하고 처리할 수 있습니다. 중국어 작업 중 Tongyi Qianwen 2.0은 C-Eval 벤치마크에서 확실한 이점을 바탕으로 가장 높은 점수를 획득했습니다. 이는 모델이 훈련 중에 더 많은 중국어 코퍼스를 학습하여 중국어 이해 및 표현 능력을 더욱 강화했기 때문입니다.

수학적 추론 및 코드 이해와 같은 분야에서 Tongyi Qianwen 2.0은 상당한 진전을 이루었습니다. 추론 벤치마크 테스트 GSM8K에서 Tongyi Qianwen은 2위에 올랐으며 HumanEval 테스트에서 강력한 컴퓨팅 및 논리적 추론 능력을 보여주었습니다. Tongyi Qianwen의 점수는 주로 대규모 모델의 능력을 측정하는 GPT-4 및 GPT-3.5를 밀접하게 따랐습니다. 코드 조각을 이해하고 실행하는 것은 프로그래밍 지원 및 자동 코드 복구와 같은 시나리오에서 사용되는 대규모 모델의 기초입니다.

사진: Tongyi Qianwen 2Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시

.0

출시

Tongyi Qianwen이 더욱 성숙해지고 사용하기 쉬워졌습니다. Tongyi Qianwen 2.0은 지침 준수, 도구 사용, 세련된 생성 등의 측면에서 기술적 최적화를 수행하여 다운스트림 애플리케이션 시나리오에 더 잘 통합될 수 있습니다.

Tongyi 대형 모델 공식 웹사이트는 멀티모달 및 플러그인 기능을 출시하여 이미지 입력, 문서 구문 분석 등 세분화된 작업을 지원합니다.

동시에 Tongyi 대형 모델 교육을 기반으로 하는 8개의 주요 산업 모델 그룹이 온라인에 있습니다. 그들은

Tongyi Lingma-Intelligent Coding Assistant, Tongyi Zhiwen-AI Reading Assistant, 입니다. Tongyi Listening-AI 업무 및 학습 보조, Tongyi Stardust-맞춤형 캐릭터 생성 플랫폼, Tongyi Midas-지능형 투자 및 연구 보조, Tongy 나는 Xiaomi-스마트 고객 Service, Tongyi Renxin-개인 전담 건강 보조원, Tongyi Farui-AI 법률 컨설턴트. 8가지 주요 산업 모델은 전문 교육을 위해 도메인 데이터를 사용하여 가장 인기 있는 수직 시나리오를 지향합니다. 사용자는 공식 홈페이지에서 모델 기능을 직접 경험할 수 있고, 개발자는 웹 페이지 임베딩, API/SDK 호출 등을 통해 모델 기능을 자신의 대형 모델 애플리케이션 및 서비스에 통합할 수 있습니다. 사진: Tongyi 대형 모델 패밀리가 완전히 업그레이드되었으며,

8개의 주요 산업 모델Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시

이 그룹으로 온라인 상태입니다

10월 기준,

알리바바 클라우드 협력했습니다 60개 이상의 업계 주요 파트너가 사무, 문화 관광, 전력, 정부 업무, 의료 보험, 운송, 제조, 금융, 소프트웨어 개발 및 기타 분야에서 Tongyi Qianwen 구현을 촉진하기 위해 심층적인 협력을 진행하고 있습니다.

Zhou Jingren은 Alibaba Cloud가 가까운 시일 내에 Tongyi Qianwen의 72B 버전을 오픈 소스화할 계획이라고 밝혔습니다. 이전에 Alibaba Cloud는 7B 및 14B 버전 모델을 오픈 소스화했으며 모델의 누적 다운로드 수가 초과되었습니다. 100만

. Alibaba Cloud는 Tongyi Qianwen 오픈 소스 모델을 기반으로 모델과 애플리케이션을 혁신하기 위해 각계각층의 개발자를 계속 지원할 것입니다.

Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시

사진: Tongyi Qianwen 72B가 곧 오픈 소스가 됩니다

위 내용은 Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제