Maison >Périphériques technologiques >IA >Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et s'accélèrent pour rattraper GPT-4.

Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et s'accélèrent pour rattraper GPT-4.

王林avant: 2023-10-31 18:17:131059parcourir

Alibaba Cloud a officiellement publié Tongyi Qianwen 2.0, un grand modèle avec des centaines de milliards de paramètres, le 31 octobre. Selon 10 résultats d'évaluation faisant autorité, les performances globales de Tongyi Qianwen 2.0 dépassent GPT-3.5 et rattrapent rapidement GPT-4. Le même jour, l'APP Tongyi Qianwen a été lancée sur les principaux marchés d'applications mobiles. Tout le monde peut directement découvrir les capacités du dernier modèle via l'APP

Au cours des 6 derniers mois, Tongyi Qianwen 2.0 a fait un énorme bond en avant en termes de performances par rapport à l'application Tongyi Qianwen. 4 Version 1.0 publiée en mars, Tongyi Qianwen 2.0 a considérablement amélioré ses capacités en matière de compréhension des commandes complexes, de création littéraire, de mathématiques générales, de mémoire des connaissances et de résistance aux hallucinations. À l'heure actuelle, les performances globales de Tongyi Qianwen ont dépassé GPT-3.5, accélérant pour rattraper GPT-4.

Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et saccélèrent pour rattraper GPT-4.

Les performances globales de Tongyi Qianwen 2.0 dépassent GPT-3.5 et s'accélèrent pour rattraper GPT-4

Dans 10 ensembles d'évaluation de référence grand public tels que MMLU, C-Eval, GSM8K, HumanEval et MATH, il a réussi Le score global de Yiqianwen 2.0 surpasse celui de Meta Llama-2-70B. Par rapport au Chat-3.5 d'OpenAI, il compte neuf victoires et une défaite. Par rapport à GPT-4, il compte quatre victoires et six défaites. avec GPT-4 s'est encore rétréci

La capacité à comprendre le chinois et l'anglais est la compétence de base des grands modèles linguistiques. En termes de tâches en anglais, Tongyi Qianwen 2.0 a obtenu un score de 82,5 au benchmark MMLU, juste derrière GPT-4. En augmentant considérablement le nombre de paramètres, Tongyi Qianwen 2.0 peut mieux comprendre et traiter les structures et concepts linguistiques complexes du chinois. , Tongyi Qianwen 2.0 a obtenu le score le plus élevé au benchmark C-Eval avec un net avantage, car le modèle a appris davantage de corpus chinois pendant la formation, renforçant ainsi ses capacités de compréhension et d'expression du chinois.

Dans des domaines tels que le raisonnement mathématique et la compréhension du code, Tongyi Qianwen 2.0 a fait des progrès significatifs. Dans le test de référence de raisonnement GSM8K, Tongyi Qianwen s'est classé deuxième, démontrant de solides capacités de calcul et de raisonnement logique ; dans le test HumanEval, le score de Tongyi Qianwen a suivi de près GPT-4 et GPT-3.5, qui mesurent principalement la capacité du modèle à grande échelle. Comprendre et exécuter des fragments de code constitue la base des grands modèles à utiliser dans des scénarios tels que l'assistance à la programmation et la réparation automatique du code.

Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et saccélèrent pour rattraper GPT-4.

Sortie de Tongyi Qianwen 2.0

Tongyi Qianwen est plus mature et plus facile à utiliser. Tongyi Qianwen 2.0 a apporté des optimisations techniques en termes de conformité aux instructions, d'utilisation des outils, de création raffinée, etc., afin de pouvoir mieux l'intégrer dans les scénarios d'application en aval. Le site officiel de Tongyi Large Model a lancé des fonctions multimodales et plug-in, prenant en charge des tâches segmentées telles que la saisie d'images et l'analyse de documents.

Dans le même temps, huit grands groupes de modèles industriels basés sur la formation des grands modèles Tongyi ont été lancés : Tongyi Lingma - assistant de codage intelligent, Tongyi Zhiwen - assistant de lecture IA, Tongyi Listening - assistant IA pour le travail et les études, Tongyi Stardust -. plate-forme de création de personnages personnalisée, Tongyi Midianjin - assistant de recherche en investissement intelligent, Tongyi Xiaomi - service client intelligent, Tongyi Renxin - assistant de santé personnel exclusif, Tongyi Farui - consultant juridique en IA. Les 8 principaux modèles industriels sont conçus pour les scénarios verticaux les plus populaires et sont spécialement formés à l'aide de données de domaine. Les utilisateurs peuvent directement découvrir les fonctions de modèle sur le site Web officiel, et les développeurs peuvent intégrer les capacités de modèle dans leurs propres applications et services de modèle volumineux via l'intégration de pages Web, les appels API/SDK, etc.

Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et saccélèrent pour rattraper GPT-4.

La grande famille de modèles Tongyi a été entièrement mise à niveau et 8 grands groupes de modèles industriels ont été lancés

Depuis octobre, Alibaba Cloud a mené une coopération approfondie avec des partenaires de premier plan dans plus de 60 secteurs , faisant la promotion du général Qianwen dans Applications pratiques dans les domaines du bureau, du tourisme culturel, de l'énergie électrique, des affaires gouvernementales, de l'assurance médicale, des transports, de la fabrication, de la finance, du développement de logiciels et d'autres domaines

Zhou Jingren a déclaré qu'Alibaba Cloud prévoyait d'ouvrir la version 72B de Tongyi Qianwen dans un futur proche. Auparavant, Alibaba Cloud avait ouvert les versions 7B et 14B du modèle, et les téléchargements cumulés de ces modèles ont dépassé le million. Alibaba Cloud continuera d'aider les développeurs de divers secteurs à utiliser le modèle open source Tongyi Qianwen pour innover en matière de modèles et d'applications

Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et saccélèrent pour rattraper GPT-4.

Tongyi Qianwen 72B sera bientôt open source

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

math gpt llama

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：La série Apple M3 fait ses débuts, avec deux fois plus de performances, M1 et M2 sont devenus les larmes du tempsArticle suivant：La série Apple M3 fait ses débuts, avec deux fois plus de performances, M1 et M2 sont devenus les larmes du temps

Articles Liés

Voir plus