Maison >Périphériques technologiques >IA >La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

PHPzoriginal: 2024-06-10 11:44:171343parcourir

La dernière version du grand modèle, 6 centimes et 1 million de Tokens.

Ce matin, lors de la journée portes ouvertes de l'IA, la très regardée société de grands modèles Zhipu AI a annoncé une série de chiffres de mise en œuvre dans l'industrie :

Selon les dernières statistiques, Zhipu AI grand modèle est open La plateforme compte actuellement 300 000 utilisateurs enregistrés et le volume d'appels quotidien moyen a atteint 40 milliards de jetons Parmi eux, la consommation quotidienne d'API a augmenté de plus de 50 fois au cours des 6 derniers mois et le modèle GLM-4 le plus puissant. a augmenté au cours des 4 derniers mois. Il y a une croissance plus de 90 fois supérieure.

Dans la récente application Qingtan, plus de 300 000 agents ont été actifs dans le centre d'agents, y compris de nombreux excellents outils de productivité, tels que des cartes mentales, des assistants documentaires, des planificateurs, etc.

Du côté des nouvelles technologies, la dernière version du GLM-4, GLM-4-9B, surpasse Llama 3 8B dans tous les aspects. Le modèle multimodal GLM-4V-9B est également en ligne, et tous les grands modèles restent ouverts. source.

Une série de réalisations commerciales et d'avancées technologiques attirent l'attention.

Mise à niveau de la plate-forme MaaS vers la version 2.0

Fixer le seuil d'application des grands modèles

Récemment, les grands modèles nationaux ont déclenché un nouveau cycle de concurrence.

Début mai, Zhipu AI a pris les devants en réduisant le prix du service grand modèle GLM-3-Turbo à 1/5 du prix d'origine, ce qui a également incité de nombreux acteurs du domaine des grands modèles à « rejoindre la guerre ». " Depuis la ruée vers la création de start-ups, la « bataille des 100 modèles » jusqu'à la guerre des prix, la concurrence dans la grande industrie du modélisme s'est intensifiée.

La réduction du coût des services de grands modèles peut permettre à davantage d'entreprises et de développeurs d'acquérir de nouvelles technologies, générant ainsi une utilisation suffisante. Cela accélérera non seulement les percées technologiques, mais permettra également aux grands modèles de pénétrer rapidement dans tous les domaines et de se déployer. l'agencement commercial.

Il convient de mentionner que à l'heure actuelle, le prix des grands modèles a été poussé très bas, mais Zhipu a déclaré qu'il n'avait pas peur de la guerre des prix.

"Je crois que tout le monde est conscient de la récente guerre des prix des grands modèles et est également très préoccupé par la stratégie de commercialisation de Zhipu. Nous sommes fiers de dire que nous avons obtenu une application grâce à l'itération de la technologie de base du modèle et à l'amélioration de l'efficacité, ainsi qu'à l'innovation technologique. La réduction continue des coûts garantit également l'amélioration continue de la valeur client », a déclaré Zhang Peng, PDG de Zhipu AI.

Selon les différentes échelles d'application des entreprises, Zhipu a annoncé une série de derniers ajustements de prix. La remise maximale sur l'API atteint 40 % et la version GLM-4-9B peut être utilisée pour seulement 6 cents / 1 million de jetons. Au début de l'année dernière, le prix des grands modèles de la série GLM a été réduit de 10 000 fois.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

En tant que première startup à investir dans l'IA générative, la vitesse de commercialisation de Zhipu AI est plus rapide que celle de nombreux concurrents. Créez une matrice de produits basée sur des centaines de milliards de modèles multimodaux pré-entraînés. Il a lancé un outil de personnalisation d'agent personnalisé GLM pour le côté C, permettant aux utilisateurs de créer leurs propres agents GLM avec de simples instructions de mots rapides sans aucune connaissance en programmation. Pour les clients professionnels, la dernière génération de grands modèles GLM-4 a été lancée sur la plateforme MaaS (Model as a Service), offrant un accès API.平平

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

^{Plateforme ouverte d'IA.}

Lors de la journée portes ouvertes d'aujourd'hui, Zhipu a lancé la plateforme ouverte MaaS 2.0, qui a permis d'améliorer les nouveaux modèles, les coûts, la sécurité et d'autres aspects.

Lors de l'événement, Zhipu AI a présenté les dernières avancées de sa plateforme ouverte. La plate-forme améliorée de réglage fin des modèles peut aider les entreprises à simplifier considérablement le processus de création de modèles privés. L'ensemble de la gamme de grands modèles GLM-4 prend désormais en charge le déploiement en seulement trois étapes.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

Pour la mise en œuvre de la technologie, les outils de modélisation ne sont qu'une petite étape. Zhang Peng, PDG de Zhipu, a toujours pensé qu'il existe trois couches de modèle dans les grands modèles, à savoir L0 (modèle de base), L1 (modèle industriel) et L2 (modèle d'inférence pour les scénarios segmentés). Il s'agit d'une relation progressive. Ce que Zhipu doit faire, c'est faire de son mieux pour faire L0, puis aider ses partenaires à faire L1 et L2.

Le parcours de commercialisation de Zhipu AI est basé sur la plateforme MaaS. Il fournit différentes solutions telles que l'API cloud, la privatisation du cloud, la privatisation locale, la machine intégrée logicielle et matérielle, etc. pour différents groupes de clients et besoins pour répondre aux besoins des entreprises. en même temps, il réalise également l'échelle des « modèles et services ».

GLM-4 9B surpasse largement Llama3

Parité multimodale avec GPT-4V, open source et gratuit

Pour Zhipu AI, qui considère la construction de l'AGI comme son objectif, l'itération continue des capacités techniques des grands modèles est également une priorité absolue.

Depuis le grand modèle all In en 2020, Zhipu est à l'avant-garde de la vague de l'intelligence artificielle. Ses recherches portent sur tous les aspects de la technologie des grands modèles, du cadre de pré-formation original GLM, à l'adaptation de la puissance de calcul nationale, aux grands modèles de base universelle, au raisonnement sémantique, à la génération multimodale, au contexte long, à la compréhension visuelle et aux capacités d'intelligence des agents. À tous égards, Zhipu a investi des ressources considérables pour promouvoir l’innovation technologique originale.

Au cours de l'année écoulée, Zhipu a lancé successivement quatre générations de grands modèles généraux : ChatGLM en mars 2023, ChatGLM2 en juin et ChatGLM3 en octobre de l'année dernière, en janvier de cette année, le grand modèle de base de dernière génération GLM-4 officiellement lancé ; . Lors de la journée portes ouvertes, Zhipu AI a présenté au monde extérieur la dernière réalisation open source du grand modèle de base GLM-4 - GLM-4-9B.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

Il s'agit de la version open source de la série GLM-4 de modèles pré-entraînés de dernière génération. GLM-4-9B possède des capacités de base plus solides, un contexte plus long, implémente des appels de fonction plus précis et des capacités Tous les outils, et possède pour la première fois des capacités multimodales.

Basé sur une base de pré-formation puissante, les performances globales du GLM-4-9B en chinois et en anglais ont été améliorées de 40 % par rapport à ChatGLM3-6B. Il offre d'excellentes performances dans les données de référence telles que la capacité d'alignement chinois AlignBench, conformité des commandes IFeval et code d'ingénierie Natural Code Bench Une amélioration très significative a été réalisée. Par rapport à Llama 3 8B, qui a une plus grande formation, il n'est pas inférieur. Il a obtenu une légère avance en anglais et s'est amélioré jusqu'à 50 % dans les matières chinoises.

La longueur du contexte du nouveau modèle a été étendue de 128 Ko à 1 Mo, ce qui signifie que le modèle peut gérer 2 millions de mots d'entrée en même temps, ce qui équivaut à deux livres de Dream of Red Mansions ou 125 articles. Sur LongBench-Chat d'une longueur de 128K, le modèle GLM-4-9B-Chat s'améliore de 20% par rapport à la génération précédente. Dans le test d'aiguille dans une botte de foin d'une longueur de 1M, GLM-4-9B-Chat-1M a également obtenu un bon résultat tout vert.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

La nouvelle génération de grands modèles améliore également la prise en charge de plusieurs langues. Le vocabulaire du modèle est passé de 60 000 à 150 000 et l'efficacité du codage des langues autres que le chinois et l'anglais a augmenté en moyenne de 30 %, ce qui signifie que le modèle peut gérer plus rapidement les tâches dans les petites langues. Les évaluations montrent que les capacités multilingues du modèle ChatGLM-4-9B dépassent largement celles de Llama-3 8B.

Tout en prenant en charge le fonctionnement local des cartes graphiques grand public, le GLM-4-9B démontre non seulement de puissantes capacités de dialogue, prend en charge 1 million de textes longs et couvre plusieurs langues, Plus important encore : le grand modèle publié par Zhipu est entièrement gratuit et open source . Désormais, chaque développeur peut exécuter cette version du modèle GLM-4 localement.

Lien GitHub : https://github.com/THUDM/GLM-4

Modèle : huggingface : https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7

Communauté magique : https:// / /modelscope.cn/organization/ZhipuAI

En plus du puissant modèle de texte, Zhipu AI a également open source le modèle multimodal GLM-4V-9B basé sur GLM-4-9B. En ajoutant Vision Transformer, ce modèle atteint des capacités comparables au GPT-4V avec seulement 13B paramètres.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

Alors que la technologie évolue, le prix des grands modèles est également en constante diminution. Zhipu a lancé le modèle GLM-4-AIR, qui conserve essentiellement les performances du grand modèle GLM-4 en janvier et a considérablement réduit son prix à 1 yuan/million de jetons.

Les performances du GLM-4-Air sont comparables à celles du grand modèle GLM-4-0116, et le prix n'est que de 1/100 de ce dernier. Il convient de mentionner que l'API du GLM-4-Air a considérablement amélioré la vitesse d'inférence par rapport au GLM-4-0116, la vitesse d'inférence du GLM-4-Air a été augmentée de 200 % et peut générer 71 jetons. par seconde, ce qui est bien supérieur à celui du GLM-4-0116. Plus rapide que la vitesse de lecture de l'œil humain.

Zhipu a déclaré que l'ajustement des prix pour les grands modèles est basé sur les résultats complets des avancées technologiques, de l'amélioration de l'efficacité de la puissance de calcul et du contrôle des coûts. Les prix seront ajustés à intervalles réguliers à l'avenir pour mieux répondre aux besoins des développeurs et des clients. le prix très compétitif est non seulement raisonnable, mais également conforme à sa propre stratégie commerciale.

La construction écologique est entrée dans un niveau supérieur

En tant que l'une des premières startups nationales à se lancer dans la voie des grands modèles, Zhipu AI est désormais devenue un représentant des entreprises nationales de technologie de l'IA.

Il s'agit non seulement du leader de la technologie nationale des grands modèles, mais également d'une force chinoise qui ne peut être ignorée dans le monde universitaire des grands modèles et dans l'écosystème open source. Zhipu a une grande influence dans le domaine de l'IA, avec des téléchargements cumulés de modèles open source atteignant 16 millions de fois. Soutenir la communauté open source est l'engagement inébranlable de Zhipu.

De plus, Zhipu AI développe également conjointement des normes de sécurité en matière d'IA pour les grands modèles. Le 22 mai, des entreprises de différents pays et régions, dont OpenAI, Google, Microsoft et Zhipu AI, ont signé conjointement les engagements de sécurité Frontier AI. Il souligne qu'il est nécessaire d'assurer une structure de gouvernance responsable et transparente pour la sécurité de l'intelligence artificielle de pointe, d'expliquer de manière responsable comment mesurer les risques des modèles d'intelligence artificielle de pointe et d'établir un processus clair pour les mécanismes d'atténuation des risques pour modèles de sécurité d’intelligence artificielle de pointe.

En dehors du domaine de l'IA, pour de nombreuses industries qui ont bénéficié des percées des grands modèles, Zhipu AI stimule les changements de productivité des entreprises grâce au MaaS, et son grand écosystème de modèles a commencé à prendre forme.

« Pourquoi jugeons-nous que 2024 est la première année de l'AGI ? Si vous pouvez répondre à cette question en une phrase : la mise à l'échelle de la loi n'a pas échoué et la croissance de la technologie de l'IA est entrée dans une nouvelle étape. "Nous progressons à pas de géant, et il y a même des signes d'accélération de plus en plus rapide", a déclaré Zhang Peng. "Franchement, nous n'avons jamais vu une technologie mise à niveau de manière itérative avec une courbe d'innovation aussi abrupte dans l'histoire, et cela dure aussi longtemps."

La vitesse de l'innovation technologique et de la mise en œuvre commerciale de Zhipu AI met en pratique ces courbes abruptes.

La version open source de GLM-4 est enfin là : surpassant Llama3, multi-modalité comparable à GPT4V, et la plateforme MaaS a également été considérablement améliorée.

Dans le processus de développement technologique, Zhipu AI a été sur la voie rapide.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Token github 人工智能 transformer https gpt llama agi

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Dites adieu à l'algorithme 3D Gaussian Splatting, le champ gaussien d'élagage spectral SUNDAE avec compensation neuronale est open sourceArticle suivant：Dites adieu à l'algorithme 3D Gaussian Splatting, le champ gaussien d'élagage spectral SUNDAE avec compensation neuronale est open source

Articles Liés

Voir plus