Ce géant chinois de la technologie vient de lancer un chatbot d'IA

Maison

Périphériques technologiques

Ce géant chinois de la technologie vient de lancer un chatbot d'IA - et c'est mieux que Deepseek

Susan Sarandon

Feb 07, 2025 am 06:01 AM

Avant que Deepseek ne puisse disparaître le titre, un autre modèle d'IA chinois a fini par le faire. Le géant chinois du commerce électronique Alibaba a annoncé une nouvelle version de sa famille Qwen de modèles d'IA, et il y a beaucoup à aimer - c'est mieux que Deepseek et Chatgpt dans certains domaines clés.

Qu'est-ce que Qwen Max?

Qwen Max est le modèle AI le plus récent et le plus puissant de la famille Qwen AI d'Alibaba. Actuellement, les modèles QWEN AI suivants sont disponibles:

Qwen2.5-plus
qwen2.5-max
qwen2.5-vl-72b-instruct
qwen2.5-14b-instruct-1m
qvq-72b-preview
qwq-32b-preview
qwen2.5-coder-32b -Instruct
qwen2.5-turbo
qwen2.5-72b-instruct

Tous les modèles ci-dessus sont gratuits à utiliser une fois que vous avez créé un Compte par e-mail, Google ou GitHub. Les modèles d'IA de QWEN sont également open-source, ce qui signifie que vous pouvez les trouver sur GitHub ou HuggingFace. Vous pouvez également les installer localement sur votre appareil (selon ses spécifications), vous permettant d'exécuter l'AI hors ligne.

Ce géant chinois de la technologie vient de lancer un chatbot d'IA - et c'est mieux que Deepseek

QWEN2.5-Max est un mélange de paramètres de 72 milliards de paramètres ( MOE) Modèle, prend en charge 29 langues et est formé sur plus de 20 billions de jetons. Il peut également gérer jusqu'à 128 000 jetons dans une seule conversation, ce qui signifie que faire fonctionner de longs documents via l'IA ne sera pas un problème. Si vous travaillez avec des données, Qwen peut traiter des formats structurés comme les tables, les CSV et les fichiers JSON.

Comme les noms le suggèrent, certains modèles QWEN sont meilleurs dans des tâches spécifiques. Par exemple, Qwen2.5-coder-32b-Istruct excelle dans les tâches de codage, tandis que QWQ-32B-Preview est capable de penser et de raisonnement. Tous les modèles ne peuvent pas tout faire, mais la plupart des modèles peuvent gérer les invites de texte, ainsi que la génération d'images et de vidéos.

Une autre caractéristique assez unique est la capacité de combiner deux modèles ensemble. D'après mon expérience, vous pouvez obtenir des résultats légèrement meilleurs lorsque vous combinez deux versions dans un appariement plus fort. Par exemple, l'appariement Qwen2.5-max avec Qwen2.5-coder-32b-instruct m'a aidé à générer du code avec moins d'invites et de problèmes dans la sortie.

Le site Web de Qwen est le seul endroit pour accéder officiellement Le modèle AI. Vous pouvez taper des invites et travailler avec du texte, mais il existe également des capacités de génération d'images et de vidéo et dans plusieurs ratios d'aspect. Il y a une fonction de recherche Web qui n'a pas encore été lancé.

À la baisse, parfois, Qwen prend un certain temps pour traiter vos invites. À tel point qu'au début, je pensais que le site Web ne fonctionnait pas correctement. J'ai trouvé que la première invite que vous envoyez dans une conversation peut prendre environ 30 secondes pour générer une réponse, après quoi les réponses accélèrent.

Les images et vidéos sont générées plus rapidement que ce à quoi je m'attendais. Ils ne sont pas haut de gamme en ce qui concerne la qualité ou le réalisme, mais si vous avez besoin de générer une image rapide dans une pincée, ils le feront. Vous pouvez vous attendre à une bonne quantité d'artefacts aléatoires dans la plupart des supports générés. Deepseek et Chatgpt. J'ai reçu des erreurs se connectant à Qwen car il y avait trop de demandes dans la file d'attente de temps en temps.

Qwen est-il meilleur que Deepseek?

Techniquement parlant, Qwen est meilleur que Deepseek à tous les niveaux. Le modèle d'Alibaba se sent plus naturel pour interagir avec et fonctionne très légèrement plus rapidement. Cependant, si vous deviez ignorer les résultats de référence, vous auriez du mal à trouver des différences entre les deux.

Le principal avantage de Qwen sur Deepseek est son meilleur alignement avec les préférences humaines, ce qui facilite la saisie des invites plus compliquées et d'obtenir des réponses précises sans beaucoup de réglage. Même des doublures simples peuvent générer une réponse assez détaillée avec beaucoup d'informations. Deepseek, bien qu'un modèle d'IA formidable, peut prendre quelques essais et une ingénierie rapide avant d'obtenir les résultats souhaités.

En ce qui concerne les connaissances générales et la précision factuelle, les deux modèles fonctionnent de manière similaire, mais Qwen a un léger avantage en ce qui concerne la cohérence factuelle.

Un domaine où Deepseek est le gagnant clair, cependant, est le coût d'utilisation. Deepseek coûte 0,25 $ par million de jetons, tandis que Qwen coûte 0,38 $. Cela dit, il est encore beaucoup moins cher que les tarifs de 5 $ et de 3 $ offerts par GPT-4O et Claude 3.5, respectivement.

Comparaisons de référence

Comme mentionné précédemment, Qwen surpasse Deepseek à peu près à tous les niveaux à travers le bord En ce qui concerne les repères.

table>

Les repères montrent clairement la meilleure compréhension et l'alignement de Qwen sur les valeurs humaines. En dehors de cela, en termes de connaissances et de raisonnement, de connaissances générales, de codage et de capacité globale, ce n'est que légèrement mieux que Deepseek.

Ces deux modèles d'IA en Chine ont introduit une nouvelle référence pour le développement de l'IA. Il y a cependant des problèmes de sécurité et de confidentialité, surtout, considérant que Deepseek a déjà subi sa première violation de données. Pourtant, les modèles d'IA de Qwen et Deepseek sont clairement meilleurs que leurs homologues occidentaux en termes de performances et ont vraiment mis le monde de l'IA sur le bord.

Benchmark	Qwen 2.5 Max	DeepSeek V3 R1
Arena-Hard	89.4	85.5
MMLU-Pro	76.1	75.9
GPQA-Diamond	60.1	59.1
LiveCodeBench	38.7	37.6
LiveBench	62.2	60.5

Benchmark

qwen 2.5 max

Deepseek v3 r1

arena-du-du-du-main

89.4

85.5

mmlu-pro

76.1

75.9

gpqa- Diamant

60.1

59.1

livecodebench

38.7

37.6

livebench

62.2

60.5

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Une invite peut contourner toutes les garanties de LLM majeuresApr 25, 2025 am 11:16 AM

Les recherches révolutionnaires de Hiddenlayer expose une vulnérabilité critique dans les principaux modèles de grande langue (LLM). Leurs résultats révèlent une technique de contournement universelle, surnommée "Policy Puppetry", capable de contourner presque tous les principaux LLM

5 erreurs que la plupart des entreprises feront cette année avec la durabilitéApr 25, 2025 am 11:15 AM

La pression pour la responsabilité environnementale et la réduction des déchets modifie fondamentalement le fonctionnement des entreprises. Cette transformation affecte le développement de produits, les processus de fabrication, les relations clients, la sélection des partenaires et l'adoption de nouveaux

H20 Chip Ban Jolts China Ai Cirmères, mais ils ont longtemps contrecarré pour l'impactApr 25, 2025 am 11:12 AM

Les récentes restrictions sur le matériel avancé d'IA mettent en évidence l'escalade de la concurrence géopolitique pour la domination de l'IA, exposant la dépendance de la Chine à l'égard de la technologie des semi-conducteurs étrangers. En 2024, la Chine a importé un énorme semi-conducteur de 385 milliards de dollars

Si Openai achète Chrome, AI peut gouverner les guerres du navigateurApr 25, 2025 am 11:11 AM

La cession potentielle forcée de Chrome de Google a déclenché un débat intense au sein de l'industrie technologique. La perspective d'Openai acquérir le principal navigateur, offrant une part de marché mondiale de 65%, soulève des questions importantes sur l'avenir du th

Comment l'IA peut résoudre les douleurs croissantes des médias de vente au détailApr 25, 2025 am 11:10 AM

La croissance des médias de la vente au détail ralentit, malgré le dépassement global de la croissance publicitaire. Cette phase de maturation présente des défis, notamment la fragmentation des écosystèmes, la hausse des coûts, les problèmes de mesure et les complexités d'intégration. Cependant, l'intelle artificielle

'L'IA est nous, et c'est plus que nous'Apr 25, 2025 am 11:09 AM

Une vieille radio crépite avec statique au milieu d'une collection d'écrans vacillants et inertes. Ce tas précaire d'électronique, facilement déstabilisé, constitue le cœur de "The E-Waste Land", l'une des six installations de l'exposition immersive, et

Google Cloud devient plus sérieux au sujet de l'infrastructure au prochain 2025Apr 25, 2025 am 11:08 AM

Google Cloud's Next 2025: Un accent sur l'infrastructure, la connectivité et l'IA La prochaine conférence de Google Cloud en 2025 a présenté de nombreuses progrès, trop pour détaillants ici. Pour des analyses approfondies des annonces spécifiques, reportez-vous aux articles de mon

Talking Baby Ai Meme, le pipeline de films AI de 5,5 millions de dollars d'Arcana, a révélé des bailleurs de fonds secrètes d'IrApr 25, 2025 am 11:07 AM

Cette semaine dans AI et XR: une vague de créativité alimentée par l'IA balaie les médias et le divertissement, de la génération de musique à la production de films. Plongeons dans les gros titres. Impact croissant du contenu généré par l'AI: Shelly Palme, consultante en technologie, Shelly Palme

See all articles