Maison >Périphériques technologiques >IA >Zhipu AI lance le grand modèle de base ChatGLM3 de troisième génération pour s'adapter à davantage de puces nationales
La nouvelle du 27 octobre 2023 est que Zhipu AI a lancé un nouveau modèle de base à grande base de troisième génération auto-développé ChatGLM3 et une série de produits associés lors de la China Computer Conference (CNCC). Cette version marque une avancée majeure pour Zhipu AI après le lancement des modèles de conversation de base de 100 milliards ChatGLM et ChatGLM2
ChatGLM3 est développé à l'aide d'une méthode originale de pré-formation améliorée en plusieurs étapes. Cette méthode peut rendre la formation plus complète. Selon les résultats de l'évaluation, dans 44 tests d'ensembles de données publiques en chinois et en anglais, ChatGLM3 s'est classé premier parmi les modèles nationaux de même taille. Zhang Peng, PDG de Zhipu AI, a présenté de nouveaux produits lors de la conférence de presse et a présenté les dernières fonctionnalités du produit en temps réel
Nouvelle mise à niveau technologique ChatGLM3 avec des performances supérieures et un coût inférieur
ChatGLM3 lancé par Zhipu AI est devenu plus puissant avec des données de formation plus riches et de meilleures solutions de formation. Par rapport à ChatGLM2, MMLU a augmenté de 36 %, CEval a augmenté de 33 %, GSM8K a augmenté de 179 % et BBH a augmenté de 126 %
Dans le même temps, ChatGLM3 vise GPT-4V et a mis en œuvre des mises à niveau itératives de plusieurs nouvelles fonctions, notamment CogVLM avec des capacités de compréhension multimodale - sémantique de reconnaissance d'image, qui a atteint SOTA sur plus de 10 ensembles de données d'évaluation graphique standards internationaux ; code Le module amélioré Code Interpreter génère du code et l'exécute en fonction des besoins de l'utilisateur, accomplissant automatiquement des tâches complexes telles que l'analyse des données et le traitement des fichiers ; l'amélioration de la recherche sur le réseau L'amélioration de la recherche par accès WebGLM peut rechercher automatiquement des informations pertinentes sur Internet en fonction de questions et fournir références pertinentes lors de la réponse. Liens vers la littérature ou les articles. Les capacités sémantiques et logiques de ChatGLM3 ont été considérablement améliorées.
ChatGLM3 intègre également la technologie AgentTuning auto-développée, qui active les capacités de l'agent modèle, notamment en termes de planification et d'exécution intelligentes, qui est 1000 % améliorée par rapport à ChatGLM2 et permet également aux grands modèles nationaux de prendre en charge nativement les appels d'outils et l'exécution de code ; , jeux, opérations de base de données, recherche et raisonnement de graphiques de connaissances, systèmes d'exploitation et autres scénarios complexes.
De plus, ChatGLM3 lance cette fois les modèles de test final ChatGLM3-1.5B et ChatGLM3-3B qui peuvent être déployés sur les téléphones mobiles. Ils prennent en charge une variété de téléphones mobiles et de plates-formes montées sur véhicule, notamment Vivo, Xiaomi et Samsung, et même. prend en charge l'inférence des puces CPU sur les plates-formes mobiles. La vitesse peut atteindre 20 jetons/s. En termes de précision, les performances des modèles 1,5B et 3B sont proches de celles du modèle ChatGLM2-6B sur les benchmarks publics.
Basé sur la dernière technologie efficace d'inférence dynamique et d'optimisation de la mémoire, le cadre d'inférence actuel de ChatGLM3 dans les mêmes conditions matérielles et de modèle, comparé à la meilleure implémentation open source actuelle, y compris vLLM lancé par l'Université de Berkeley et la dernière version de Hugging Face à TGI, inférence La vitesse est augmentée de 2 à 3 fois et le coût d'inférence est doublé. Il n'est que de 0,5 point pour mille jetons et le coût est le plus bas.
Ce contenu est à titre indicatif uniquement et ne constitue aucun conseil en investissement. Les lecteurs doivent faire preuve de jugement lorsqu’ils utilisent ces informations et assumer la responsabilité de leurs propres décisions. Ce site Web n'est pas responsable des pertes causées par l'utilisation de ce contenu
Ce compte ne fait aucune déclaration ou garantie quant à la disponibilité, l'exactitude, l'actualité, la validité ou l'exhaustivité de toute information publiée, et décline par la présente toute responsabilité ou toute conséquence pouvant découler de l'information. Après réécriture : ce compte ne fait aucune déclaration ni garantie quant à la disponibilité, l'exactitude, l'actualité, la validité ou l'exhaustivité de toute information publiée, et n'assume aucune responsabilité ni conséquence dans cette déclaration
2. Ce compte est non commercial et à but non lucratif. Le contenu reproduit ne signifie pas que vous êtes d'accord avec ses opinions et que vous êtes responsable de son authenticité, et n'est pas non plus destiné à constituer une quelconque autre orientation. Ce site Web n'est pas responsable de toute responsabilité directe ou indirecte pour toute inexactitude ou erreur dans toute information reproduite ou publiée.
3. Les informations, documents, textes, images, etc. utilisés dans cet article proviennent d'Internet et tout le contenu reproduit a été marqué avec la source. Si vous trouvez une œuvre qui porte atteinte à vos droits de propriété intellectuelle ou à vos droits légaux personnels, veuillez nous contacter et nous la modifierons ou la supprimerons à temps
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!