Maison  >  Article  >  Périphériques technologiques  >  Alibaba Cloud publie General Question Answering 2.0, qui surpasse GPT-3.5 en termes de performances et accélère sa quête de GPT-4

Alibaba Cloud publie General Question Answering 2.0, qui surpasse GPT-3.5 en termes de performances et accélère sa quête de GPT-4

WBOY
WBOYavant
2023-10-31 18:05:161376parcourir

Le 31 octobre, Alibaba Cloud a officiellement publié Tongyi Qianwen 2.0, un grand modèle avec des centaines de milliards de paramètres. Dans 10 évaluations faisant autorité, les performances globales de Tongyi Qianwen 2.0 ont dépassé GPT-3.5 et s'accélèrent pour rattraper GPT-4. Le même jour, l'APP Tongyi Qianwen a été officiellement lancée sur les principaux marchés d'applications mobiles, et tout le monde peut directement découvrir les dernières capacités du modèle via l'APP.

Au cours des 6 derniers mois,Tongyi Qianwen 2.0 a fait un énorme bond en termes de performances Par rapport à la version 1.0 publiée en avril, Tongyi Qianwen 2.0s'est améliorée dans la compréhension des instructions complexes, la création littéraire et le général. Objectif Les mathématiques, la mémoire des connaissances, la résistance aux hallucinations et d'autres capacités ont toutes été considérablement améliorées. À l'heure actuelle, les performances globales de Tongyi Qianwen ont dépassé GPT-3.5, accélérant pour rattraper GPT-4.

Alibaba Cloud publie General Question Answering 2.0, qui surpasse GPT-3.5 en termes de performances et accélère sa quête de GPT-4

Photo :

Les performances globales de Tongyi Qianwen 2.0 ont dépassé GPT-3.5 et accélèrent pour rattraper GPT-4


dans MMLU,

C- Évaluation ,GSM8K, HumanEval, MATH et 10 autres ensembles d'évaluation de référence grand public, le score de Tongyi Qianwen 2.0 a globalement dépassé celui de Meta's Llama-2-70B, par rapport à Chat-3.5 d'OpenAI, il était de neuf victoires et une défaite, et par rapport à GPT -4 Il compte quatre victoires et six défaites, réduisant encore davantage l'écart avec GPT-4.

La capacité de comprendre le chinois et l'anglais est la compétence de base des grands modèles linguistiques.

En termes de tâches d'anglais, Tongyi Qianwen 2.0 a obtenu un score de 82,5 au benchmark MMLU, juste derrière GPT-4. En augmentant considérablement le nombre de paramètres, Tongyi Qianwen 2.0 peut mieux comprendre et traiter des structures et des concepts linguistiques complexes. Parmi les tâches chinoises, Tongyi Qianwen 2.0 a obtenu le score le plus élevé au test C-Eval avec un net avantage, car le modèle a appris davantage de corpus chinois pendant la formation, renforçant ainsi ses capacités de compréhension et d'expression du chinois.

Dans des domaines tels que le raisonnement mathématique et la compréhension du code, Tongyi Qianwen 2.0 a fait des progrès significatifs. Dans le test de référence de raisonnement GSM8K, Tongyi Qianwen s'est classé deuxième, démontrant de solides capacités de calcul et de raisonnement logique ; dans le test HumanEval, le score de Tongyi Qianwen a suivi de près GPT-4 et GPT-3.5, qui mesurent principalement la capacité du modèle à grande échelle. Comprendre et exécuter des fragments de code constitue la base des grands modèles à utiliser dans des scénarios tels que l'assistance à la programmation et la réparation automatique du code.

Alibaba Cloud publie General Question Answering 2.0, qui surpasse GPT-3.5 en termes de performances et accélère sa quête de GPT-4

Photo : Tongyi Qianwen 2

.0 publié


Tongyi Qianwen est plus mature et plus facile à utiliser. Tongyi Qianwen 2.0 a apporté des optimisations techniques en termes de conformité aux instructions, d'utilisation des outils, de création raffinée, etc., afin de pouvoir mieux l'intégrer dans les scénarios d'application en aval.

Le site officiel de Tongyi Large Model a lancé des fonctions multimodales et plug-in, prenant en charge des tâches segmentées telles que la saisie d'images et l'analyse de documents. Dans le même temps, 8 grands groupes de modèles industriels basés sur la formation des grands modèles Tongyi sont en ligne,

Ils sont

Tongyi Lingma-assistant de codage intelligent, Tongyi Zhiwen-AI assistant de lecture, Tongyi Tingwu - Assistant IA pour le travail et les études, Tongyi Stardust - plateforme de création de personnages personnalisés, Tongyi Midas - assistant intelligent d'investissement et de recherche, Tongyi Xiaomi-Smart Customer Service, Tongyi Renxin-Assistant de santé personnel exclusif, Tongyi Farui-AI Legal Consultant. Les 8 principaux modèles industriels sont orientés vers les scénarios verticaux les plus populaires, en utilisant les données de domaine pour une formation spécialisée. Les utilisateurs peuvent directement découvrir les fonctions de modèle sur le site Web officiel, et les développeurs peuvent intégrer les capacités de modèle dans leurs propres applications et services de modèle volumineux via l'intégration de pages Web, les appels API/SDK, etc.

Photo : La grande famille de modèles Tongyi a été entièrement mise à niveau, Alibaba Cloud publie General Question Answering 2.0, qui surpasse GPT-3.5 en termes de performances et accélère sa quête de GPT-4

8 modèles industriels majeurs

sont en ligne en groupes

En octobre,

Alibaba Cloud a coopéré avec plus de 60 secteurs industriels Des partenaires de premier plan mènent une coopération approfondie pour promouvoir la mise en œuvre de Tongyi Qianwen dans les domaines du bureau, du tourisme culturel, de l'énergie électrique, des affaires gouvernementales, de l'assurance médicale, des transports, de la fabrication, de la finance, du développement de logiciels et d'autres domaines.

Zhou Jingren a révélé qu'Alibaba Cloud prévoit d'ouvrir la version 72B de Tongyi Qianwen dans un avenir proche, auparavant, Alibaba Cloud avait ouvert les modèles des versions 7B et 14B, et les téléchargements cumulés du modèle

ont dépassé. 1 million

. Alibaba Cloud continuera à aider les développeurs de tous horizons à innover en matière de modèles et d'applications basés sur le modèle open source Tongyi Qianwen.

Alibaba Cloud publie General Question Answering 2.0, qui surpasse GPT-3.5 en termes de performances et accélère sa quête de GPT-4

Photo : Tongyi Qianwen 72B sera bientôt open source

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer