10월 31일 Alibaba Cloud는 수천억 개의 매개변수를 갖춘 대형 모델인 Tongyi Qianwen 2.0을 공식 출시했습니다. 10공인 평가에서 Tongyi Qianwen 2.0의 종합적인 성능은 GPT-3.5를 넘어 GPT-4를 따라잡는 데 박차를 가하고 있습니다. 같은 날 Tongyi Qianwen APP가 주요 모바일 애플리케이션 시장에 공식 출시되었으며, 누구나 이 APP를 통해 최신 모델 기능을 직접 경험할 수 있습니다.
지난 6개월 동안Tongyi Qianwen 2.0은 4월에 출시된 1.0 버전과 비교하여 복잡한 수업 이해, 문학 창작, 일반 부문에서 성능이 크게 향상되었습니다. 목적 수학, 지식 기억, 환각 저항 및 기타 능력이 모두 크게 향상되었습니다. 현재 Tongyi Qianwen의 종합 성능은 GPT-3.5를 초과하여 GPT-4를 따라잡는 데 박차를 가하고 있습니다.
사진:
Tongyi Qianwen 2.0 종합 성능이 GPT-3.5를 넘어섰고 GPT-4
을 따라잡기 위해 가속하고 있습니다. ,
주류 벤치마크 평가 세트, Tongyi Qianwen 2.0의 전체 점수는 Meta의 Llama-2-70B를 능가했으며 OpenAI의 Chat-3.5와 비교하면 9승 1패, GPT와 비교하면 -4 4승 6패로 GPT-4와의 격차가 더욱 좁아졌다. 중국어와 영어를 이해하는 능력은 대형언어모델의 기본 스킬입니다.
영어 작업 측면에서 Tongyi Qianwen 2.0은 MMLU 벤치마크에서 GPT-4에 이어 두 번째로 높은 점수를 얻었습니다. Tongyi Qianwen 2.0은 복잡한 언어 구조와 개념을 더 잘 이해하고 처리할 수 있습니다. 중국어 작업 중 Tongyi Qianwen 2.0은 C-Eval 벤치마크에서 확실한 이점을 바탕으로 가장 높은 점수를 획득했습니다. 이는 모델이 훈련 중에 더 많은 중국어 코퍼스를 학습하여 중국어 이해 및 표현 능력을 더욱 강화했기 때문입니다.수학적 추론 및 코드 이해와 같은 분야에서 Tongyi Qianwen 2.0은 상당한 진전을 이루었습니다. 추론 벤치마크 테스트 GSM8K에서 Tongyi Qianwen은 2위에 올랐으며 HumanEval 테스트에서 강력한 컴퓨팅 및 논리적 추론 능력을 보여주었습니다. Tongyi Qianwen의 점수는 주로 대규모 모델의 능력을 측정하는 GPT-4 및 GPT-3.5를 밀접하게 따랐습니다. 코드 조각을 이해하고 실행하는 것은 프로그래밍 지원 및 자동 코드 복구와 같은 시나리오에서 사용되는 대규모 모델의 기초입니다.
사진: Tongyi Qianwen 2
.0출시
Tongyi Qianwen이 더욱 성숙해지고 사용하기 쉬워졌습니다. Tongyi Qianwen 2.0은 지침 준수, 도구 사용, 세련된 생성 등의 측면에서 기술적 최적화를 수행하여 다운스트림 애플리케이션 시나리오에 더 잘 통합될 수 있습니다.
동시에 Tongyi 대형 모델 교육을 기반으로 하는 8개의 주요 산업 모델 그룹이 온라인에 있습니다. 그들은
Tongyi Lingma-Intelligent Coding Assistant, Tongyi Zhiwen-AI Reading Assistant, 입니다. Tongyi Listening-AI 업무 및 학습 보조, Tongyi Stardust-맞춤형 캐릭터 생성 플랫폼, Tongyi Midas-지능형 투자 및 연구 보조, Tongy 나는 Xiaomi-스마트 고객 Service, Tongyi Renxin-개인 전담 건강 보조원, Tongyi Farui-AI 법률 컨설턴트. 8가지 주요 산업 모델은 전문 교육을 위해 도메인 데이터를 사용하여 가장 인기 있는 수직 시나리오를 지향합니다. 사용자는 공식 홈페이지에서 모델 기능을 직접 경험할 수 있고, 개발자는 웹 페이지 임베딩, API/SDK 호출 등을 통해 모델 기능을 자신의 대형 모델 애플리케이션 및 서비스에 통합할 수 있습니다. 사진: Tongyi 대형 모델 패밀리가 완전히 업그레이드되었으며,
8개의 주요 산업 모델
이 그룹으로 온라인 상태입니다10월 기준,
알리바바 클라우드 협력했습니다 60개 이상의 업계 주요 파트너가 사무, 문화 관광, 전력, 정부 업무, 의료 보험, 운송, 제조, 금융, 소프트웨어 개발 및 기타 분야에서 Tongyi Qianwen 구현을 촉진하기 위해 심층적인 협력을 진행하고 있습니다.
Zhou Jingren은 Alibaba Cloud가 가까운 시일 내에 Tongyi Qianwen의 72B 버전을 오픈 소스화할 계획이라고 밝혔습니다. 이전에 Alibaba Cloud는 7B 및 14B 버전 모델을 오픈 소스화했으며 모델의 누적 다운로드 수가 초과되었습니다. 100만
. Alibaba Cloud는 Tongyi Qianwen 오픈 소스 모델을 기반으로 모델과 애플리케이션을 혁신하기 위해 각계각층의 개발자를 계속 지원할 것입니다.
사진: Tongyi Qianwen 72B가 곧 오픈 소스가 됩니다
위 내용은 Alibaba Cloud, 성능 면에서 GPT-3.5를 능가하고 GPT-4 추구를 가속화하는 일반 질문 응답 2.0 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!