recherche
MaisonPériphériques technologiquesIAEst-ce que Baidu & # 039; s Ernie 4.5 & x1 remplacera GPT-4.5 et Deepseek-R1?

La Chine l'a recommencé avec ses modèles AI et cette fois, le coup est plus grand et meilleur! BAIDU - Une entreprise de l'IA chinoise, a récemment publié deux modèles de grande langue (LLMS) - Ernie 4.5 & x1. En prétendant mieux fonctionner que le dernier et plus grand modèle d'Openai à ce jour - GPT-4.5, ces modèles sont plus rentables que Deepseek-R1! Les modèles semblent trop beaux pour être vrais - offrant une haute qualité à une fraction du prix. Dans ce blog, nous explorerons les modèles Ernie 4.5 et X1, évaluerons leurs résultats de référence et verrons comment ils fonctionnent dans des applications réelles. Alors, commençons.

Table des matières

  • Que sont Ernie 4.5 et X1?
    • Ernie 4.5
    • Ernie x1
  • Comment accéder à Ernie 4.5 et x1?
  • Vérification des performances Ernie 4.5 et X1
    • Tâche 1: Analyse d'image du raisonnement
    • Tâche 2: Résumé de l'analyse des documents
    • Tâche 3: Analyse audio
    • Tâche 4: Génération d'images de créativité
  • Baidu's Ernie 4.5 & x1: Prix
  • Ernie 4.5 et X1: résultats de référence standard
  • Impact futur
  • Conclusion
  • Questions fréquemment posées

Que sont Ernie 4.5 et X1?

Ernie 4.5 et X1 sont les deux derniers LLM multimodaux développés par la principale société de technologie chinoise Baidu, spécialisée dans les services Internet, l'intelligence artificielle et la conduite autonome. Il est surtout connu pour son moteur de recherche dominant en Chine et ses progrès dans les innovations axées sur l'IA. Baidu a lancé son premier LLM, Ernie 3.0 Titan, en décembre 2021. Après cela, il a publié quelques modèles supplémentaires, tout en travaillant simultanément pour construire des LLM plus robustes. Le résultat de toutes les recherches et des efforts continus est Ernie 4.5 & x1.

Ernie 4.5

Ernie 4.5 est un modèle de fondation multimodal capable de comprendre et d'intégrer divers types de données, y compris du texte, des images, de l'audio et de la vidéo. Cette approche de modélisation diversifiée améliore sa capacité à comprendre et à générer différents types de contenu.

Voici quelques-unes des principales caractéristiques d'Ernie 4.5:

  • Ernie 4.5 montre des améliorations complètes de la compréhension, de la génération, du raisonnement et de la mémoire par rapport à son prédécesseur, Ernie 4.0.
  • Il montre de grandes capacités dans la prévention des hallucinations, le raisonnement logique et le codage, ce qui le rend adepte à manipuler des tâches complexes avec une précision plus élevée. ​
  • Le modèle fonctionne même mieux que le GPT-4.5 d'OpenAI dans plusieurs repères, alors qu'il ne coûte que 1% de ce qu'il en coûte d'utiliser GPT-4.5!

Ernie x1

Ernie X1 est conçu comme un modèle de raisonnement en profondeur avec des capacités multimodales. C'est un premier modèle de pensée profonde de son genre publié par Baidu. Voici quelques-unes de ses principales caractéristiques:

  • Ernie X1 excelle dans la compréhension du contexte, la planification de son processus de réflexion, la réflexion sur sa réponse et l'évolution au fil du temps.
  • Il est capable d'utiliser de manière autonome divers outils pour des tâches telles que la recherche avancée, la compréhension de l'image et les calculs complexes.
  • Le modèle offre des performances à égalité avec Deepseek-R1, mais à la moitié du prix, offrant une solution rentable pour les entreprises à la recherche de capacités avancées d'IA.

Comment accéder à Ernie 4.5 et x1?

Vous pouvez accéder à Ernie 4.5 et x1 via leur chatbot AI - Ernie Bot, soit via des API.

Accès via le bot:

  • Dirigez-vous vers https://yiyan.baidu.com .
  • Créez votre compte en ajoutant vos coordonnées et commencez.

Les deux modèles sont librement accessibles aux utilisateurs individuels sur la plate-forme Ernie Bot de Baidu. Cependant, l'inscription à Ernie Bot est actuellement limitée aux ressortissants chinois.

Accès via l'API:

  • Dirigez-vous vers la plate-forme Maas de Baidu Ai Cloud, Qianfan
  • Créez votre compte sur la plate-forme pour commencer.

Actuellement, la plate-forme n'est pas accessible par tous les utilisateurs. De plus, seul Ernie 4.5 est disponible via API, tandis qu'Ernie X1 sera bientôt disponible sur la plate-forme.

Vérification des performances Ernie 4.5 et X1

Dans cette section, nous découvrirons comment ces modèles fonctionnent aux tâches impliquant le multimédia, le raisonnement, l'analyse des documents, etc. Étant donné que l'interface du modèle ne prend en charge que la langue chinoise et que la création de compte est limitée aux ressortissants chinois, nous examinerons quelques exemples de la façon dont les gens utilisent les deux modèles et les résultats qu'ils ont reçus. Nous couvrirons certains des cas d'utilisation les plus courants d'Ernie 4.5 & x1 que nous avons trouvés en ligne, notamment:

  1. Raisonnement avec analyse d'image
  2. Analyse et résumé des documents
  3. Analyse audio
  4. Créativité et génération d'images

Tâche 1: Analyse d'image du raisonnement

Dans cette tâche, le modèle a été invité à résoudre un problème mathématique qui lui a été donné sous la forme d'une image.

Modèle utilisé: Ernie 4.5

Sortir:

Tout comme la plupart des autres LLM multimodales, Ernie 4.5 analyse rapidement la vidéo et résout le problème de l'image. Il prend toutes les questions de l'image une par une, et finalement les résume toutes. La vitesse et la précision de ses performances en font un outil utile pour les étudiants, les éducateurs, les chercheurs et les professionnels qui ont besoin d'une résolution de problèmes rapide et précise.

Tâche 2: Résumé de l'analyse des documents

Ici, le modèle a reçu un document et il a dû résumer les informations sur un sujet particulier de ce document.

Modèle utilisé: Ernie 4.5

Sortir:

Le modèle vous permet de télécharger plusieurs fichiers de différents types, en une seule fois. Il est capable de traiter les fichiers de différents types, y compris les documents, les PDF, les PPT, les feuilles Excel, etc. Dans les fichiers téléchargés, vous pouvez sélectionner celui (ou plusieurs) dont vous souhaitez interroger le chatbot et le modèle résume rapidement le sujet. Son traitement rapide de plusieurs fichiers peut être très utile pour des tâches telles que l'analyse de la recherche, l'examen des documents juridiques, l'extraction des données financières et les rapports d'entreprise.

Tâche 3: Analyse audio

Pour cette tâche, le modèle devait analyser l'audio donné et trouver sa source.

Modèle utilisé: Ernie 4.5

Sortir:

L'analyse audio est une fonctionnalité qu'aucun des chatbots AI populaire n'a incorporé dans leur interface, ce qui rend Ernie 4.5, le premier du genre. Le modèle analyse rapidement le clip, détermine sa source, puis continue même en décrivant la signification du clip. Son analyse rapide et la description détaillée en font un outil précieux pour des tâches telles que la transcription en temps réel, la recherche vocale, la détection de profondeur et l'analyse des sentiments dans les médias, le service client, l'éducation et l'application de la loi.

Tâche 4: Génération d'images de créativité

Pour cette tâche, le modèle a dû analyser une pièce et suggérer des décorations possibles qui peuvent améliorer son attrait global. Il a ensuite dû générer une image mise à jour de la pièce.

Modèle utilisé: Ernie X1

Sortir:

Le modèle traite rapidement l'image. Il suggère ensuite les améliorations possibles du décor de la pièce pour améliorer l'attrait global. Enfin, il génère l'image de la pièce avec toutes les améliorations suggérées. Cette fonctionnalité est un excellent ajout pour des tâches telles que la conception d'intérieur, la planification de la rénovation domiciliaire, la mise en scène immobilière et la visualisation de décoration virtuelle.

Remarque: nous avons pris les exemples de ce post sur X.

Baidu's Ernie 4.5 & x1: Prix

Ernie 4.5 et X1 ont toutes les deux toutes les fonctionnalités, et encore plus, par rapport aux modèles top par Openai, Deepseek, Grok, Claude, etc. Voici une panne de prix des deux modèles:

Modèle Prix ​​d'entrée (par million de jetons) Prix ​​de production (par million de jetons) Disponibilité
Ernie 4.5 0,55 $ 2,20 $ Disponible
Ernie x1 0,28 $ 1,10 $ Pas encore disponible

Par rapport à d'autres modèles top, Ernie 4.5 et X1 sont beaucoup moins chers, ce qui en fait un atout précieux dans l'avancement de l'IA générative.

Est-ce que Baidu & # 039; s Ernie 4.5 & x1 remplacera GPT-4.5 et Deepseek-R1?

Ernie 4.5 et X1: résultats de référence standard

Nous avons déjà vu les fonctionnalités, les capacités et la tarification des derniers modèles Ernie. Regardons maintenant certains nombres de performances de ces modèles contre des modèles top comme GPT-4.5, GPT-4O, Deepseek-R1, et plus encore.

Le graphique ci-dessous compare Ernie 4.5 et GPT-4O sur plusieurs repères qui testent les performances d'IA multimodales.

Est-ce que Baidu & # 039; s Ernie 4.5 & x1 remplacera GPT-4.5 et Deepseek-R1?

Le graphique montre que:

  • Ernie 4.5 surpasse GPT-4O dans la plupart des tâches multimodales.
  • Le score moyen pour Ernie 4.5 est de 77,77, ce qui est supérieur à celui de 73,92 de GPT-4O.
  • Ernie 4.5 a un avantage important dans Mathvista et Docvqa, montrant un meilleur raisonnement mathématique et des compétences en matière de réponses basées sur des documents.
  • Les deux modèles fonctionnent de manière similaire dans OCRBENCH et MMMU, mais Ernie 4.5 a toujours un léger avantage.

Le graphique suivant compare Ernie 4.5, Deepseek V3 - Chat, GPT-4O et GPT-4.5 sur plusieurs repères pour le raisonnement et la résolution de problèmes basés sur le texte.

Est-ce que Baidu & # 039; s Ernie 4.5 & x1 remplacera GPT-4.5 et Deepseek-R1?

Voici quelques plats clés du graphique:

  • Ernie 4.5 mène le pack avec un score moyen de 79,6, dépassant étroitement Deepseek V3 - chat à 79,14.
  • Il fonctionne bien à travers les connaissances générales, le raisonnement et les repères de programmation tels que MMLU-PRO, GSM8K et Humaneval.
  • GPT-4O et Deepseek V3 démontrent également des résultats solides, avec Deepseek V3 se produisant de manière compétitive dans des repères chinois comme CMMLU.
  • Ernie 4.5 excelle dans GSM8K (mathématiques) et C-Eval (raisonnement général), bien que Deepseek V3 soit très proche de la performance.

Impact futur

La course à être le Top LLM se réchauffe et Ernie 4.5 et X1 de Baidu présente une compétition sérieuse pour Openai, Deepseek, Anthropic et Meta. Les laboratoires d'IA chinois livrant des modèles qui rivalisent ou dépassent l'IA occidentale à une fraction du coût, les entreprises seront obligées d'innover plus rapidement et de réduire leurs coûts pour rester compétitifs.

Toutes ces progrès mèneront enfin à:

  • Les progrès plus rapides de l'IA dans tous les principaux centres de recherche sur l'IA.
  • IA plus abordable pour les entreprises et les développeurs.
  • Une nouvelle ère d'applications d'IA multimodales, s'étendant au-delà de l'IA traditionnelle basée sur le texte.

Conclusion

Les modèles Ernie 4.5 et X1 de Baidu ne sont pas seulement un autre ensemble de modèles d'IA - ce sont des perturbateurs de l'industrie. Leurs capacités multimodales et de raisonnement supérieures, leurs faibles prix et leur intégration profonde dans l'écosystème numérique chinois, signalent un changement de puissance sur le marché mondial de l'IA.

Si cette tendance se poursuit, nous verrions une démocratisation et une sensibilisation de l'IA à plus grande échelle dans diverses industries. Cela pousserait également de nombreuses entreprises occidentales à publier des modèles moins chers. Non seulement cela ajouterait à la compétitivité sur le marché, mais garantirait également que les utilisateurs obtiennent le plus de valeur pour leur argent.

Questions fréquemment posées

Q1. Que sont Ernie 4.5 et X1?

A. Ernie 4.5 et X1 sont les derniers modèles de grande langue (LLMS) développés par Baidu, conçus pour rivaliser avec les meilleurs modèles d'IA comme GPT-4.5 et Deepseek-R1 d'OpenAI. Ernie 4.5 est un modèle de fondation multimodal, tandis qu'Ernie X1 est un modèle de raisonnement en profondeur avec des capacités avancées.

Q2. En quoi Ernie 4.5 de Baidu est-elle différente d'Ernie X1?

A. Ernie 4.5 est optimisé pour la compréhension multimodale, capable de traiter le texte, les images, l'audio et la vidéo avec une grande précision. Ernie X1, en revanche, est conçue pour un raisonnement approfondi, excellant dans la compréhension du contexte, la planification et la résolution de problèmes avec l'auto-réflexion.

Q3. Comment Ernie 4.5 et X1 se comparent-ils au GPT-4.5 d'OpenAI?

A. Baidu Ernie 4.5 surpasse GPT-4.5 dans plusieurs repères, en particulier dans le raisonnement, la compréhension multimodale et la prévention des hallucinations, tout en ne coûtant que 1% du prix de GPT-4.5. Ernie X1 offre des performances de niveau Deepseek-R1 à la moitié du coût, ce qui en fait des solutions d'IA hautement compétitives.

Q4. Quels sont les détails des prix pour Ernie 4.5 et X1?

A. Ernie 4.5: Le coût des intrants de 0,55 $ par jetons 1 m, la production coûte 2,20 $ par 1 million de jetons.
Ernie X1: le coût des intrants de 0,28 $ par 1 M jetons, la production coûte 1,10 $ par 1 million de jetons.
Le modèle Ernie X1 n'est pas encore disponible via l'API mais le sera bientôt.

Q5. Comment puis-je accéder à Ernie 4.5 et x1?

A. Vous pouvez accéder à ces modèles à travers:
1. Ernie Bot (CHATBOT AI) sur yiyan.baidu.com (disponible uniquement pour les utilisateurs chinois).
2. La plate-forme Maas de Baidu Ai Cloud, Qianfan, pour l'accès à l'API (actuellement seul Ernie 4.5 est disponible).

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Les thérapeutes de l'IA sont là: 14 outils révolutionnaires de santé mentale que vous devez savoirLes thérapeutes de l'IA sont là: 14 outils révolutionnaires de santé mentale que vous devez savoirApr 30, 2025 am 11:17 AM

Bien qu'il ne puisse pas fournir la connexion humaine et l'intuition d'un thérapeute formé, la recherche a montré que de nombreuses personnes sont à l'aise de partager leurs inquiétudes et leurs préoccupations avec des robots d'IA relativement sans visage et anonymes. Que ce soit toujours un bon I

Appeler l'IA dans l'allée de l'épicerieAppeler l'IA dans l'allée de l'épicerieApr 30, 2025 am 11:16 AM

L'intelligence artificielle (IA), une technologie des décennies en cours, révolutionne l'industrie de la vente au détail alimentaire. Des gains d'efficacité à grande échelle et des réductions de coûts aux processus rationalisés à travers diverses fonctions commerciales, l'impact de l'IA est indéniable

Obtenir des pourparlers d'encouragement de l'IA génératrice pour soulever votre espritObtenir des pourparlers d'encouragement de l'IA génératrice pour soulever votre espritApr 30, 2025 am 11:15 AM

Parlons-en. Cette analyse d'une percée d'IA innovante fait partie de ma couverture de colonne Forbes en cours sur les dernières personnes en IA, notamment l'identification et l'explication de diverses complexités d'IA percutantes (voir le lien ici). De plus, pour ma comp

Pourquoi l'hyper-personnalisation alimentée par IA est un must pour toutes les entreprisesPourquoi l'hyper-personnalisation alimentée par IA est un must pour toutes les entreprisesApr 30, 2025 am 11:14 AM

Le maintien d'une image professionnelle nécessite des mises à jour occasionnelles de garde-robe. Bien que les achats en ligne soient pratiques, il n'a pas la certitude des essais en personne. Ma solution? Personnalisation alimentée par AI. J'imagine un assistant d'assistant de conservation des vêtements sélectionnés

Oubliez Duolingo: la nouvelle fonctionnalité d'IA de Google Translate enseigne les languesOubliez Duolingo: la nouvelle fonctionnalité d'IA de Google Translate enseigne les languesApr 30, 2025 am 11:13 AM

Google Translate ajoute une fonction d'apprentissage des langues Selon Android Authority, l'application Expert Assembedebug a constaté que la dernière version de l'application Google Translate contient un nouveau mode de test "Practice" conçu pour aider les utilisateurs à améliorer leurs compétences linguistiques grâce à des activités personnalisées. Cette fonctionnalité est actuellement invisible pour les utilisateurs, mais Assembedebug est en mesure de l'activer partiellement et de visualiser certains de ses nouveaux éléments d'interface utilisateur. Lorsqu'il est activé, la fonction ajoute une nouvelle icône de capuchon de graduation en bas de l'écran marqué d'un badge "bêta" indiquant que la fonction "Practice" sera publiée initialement sous forme expérimentale. L'invite contextuelle connexe montre "Pratiquez les activités adaptées à vous!", Ce qui signifie que Google générera des

Ils fabriquent TCP / IP pour l'IA, et ça s'appelle NandaIls fabriquent TCP / IP pour l'IA, et ça s'appelle NandaApr 30, 2025 am 11:12 AM

Les chercheurs du MIT développent Nanda, un protocole Web révolutionnaire conçu pour les agents de l'IA. Abréviation des agents en réseau et de l'IA décentralisée, Nanda s'appuie sur le protocole de contexte du modèle d'Anthropic (MCP) en ajoutant des capacités Internet, permettant à l'IA Agen

L'invite: Deepfake Detection est une entreprise en plein essorL'invite: Deepfake Detection est une entreprise en plein essorApr 30, 2025 am 11:11 AM

La dernière aventure de Meta: une application AI pour rivaliser avec un chatpt rival Meta, la société mère de Facebook, Instagram, WhatsApp et Threads, lance une nouvelle application alimentée par AI. Cette application autonome, Meta AI, vise à rivaliser directement avec le chatppt d'Openai. Levier

Les deux prochaines années dans la cybersécurité de l'IA pour les chefs d'entrepriseLes deux prochaines années dans la cybersécurité de l'IA pour les chefs d'entrepriseApr 30, 2025 am 11:10 AM

Naviguer dans la marée montante des cyberattaques d'IA Récemment, Jason Clinton, CISO pour anthropique, a souligné les risques émergents liés aux identités non humaines - à mesure que la communication de la machine à la machine prolifère, sauvegarde ces "identités"

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

DVWA

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

MantisBT

MantisBT

Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Listes Sec

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)