Après Deepseek, Kimi K1.5 surpasse Openai O1-IA-php.cn

Maison

Périphériques technologiques

Après Deepseek, Kimi K1.5 surpasse Openai O1

Christopher Nolan

Mar 07, 2025 am 11:34 AM

Kimi K1.5: Un modèle de raisonnement AI génératif remodelant le paysage

Les récentes percées dans l'apprentissage par renforcement (RL) et les modèles de langues importants (LLM) ont culminé dans la création de Kimi K1.5, un modèle prêt à révolutionner le raisonnement générateur d'IA. Cet article plonge dans les caractéristiques clés de Kimi K1.5, les innovations et l'impact potentiel, tirant des informations sur la recherche qui l'accompagne.

Table des matières:

Qu'est-ce que Kimi K1.5?
Kimi K1.5 Formation
Kimi K1.5 Benchmarks
Kimi K1.5 Key Innovations
Kimi K1.5 contre Deepseek R1
Accès à Kimi K1.5 via API
Conclusion

Qu'est-ce que Kimi K1.5?

Kimi K1.5 représente un bond en avant substantiel dans la mise à l'échelle de RL avec des LLM. Contrairement aux modèles conventionnels s'appuyant sur des méthodes complexes comme la recherche de Monte Carlo Tree, il utilise une approche rationalisée centrée sur la prédiction autorégressive et les techniques RL. Sa conception lui permet de gérer les tâches multimodales, présentant des performances exceptionnelles dans des références comme Math Vista et Live Code Bench.

Kimi K1.5 Formation

La formation de Kimi K1.5 est un processus en plusieurs étapes conçu pour améliorer le raisonnement via RL et l'intégration multimodale:

pré-entraînement: Le modèle est pré-entraîné sur un vaste ensemble de données multimodal de haute qualité englobant du texte (anglais, chinois, code, mathématiques, connaissances générales) et données visuelles, rigoureusement filtrées pour la pertinence et la diversité.
Affinement fin supervisé (SFT): Cela implique deux phases: Vanilla SFT en utilisant ~ 1 million d'exemples sur diverses tâches, et SFT de la chain de ce qui concerne (COT) pour la formation de voies de raisonnement complexes.
Apprentissage par renforcement (RL): Un ensemble invite soigneusement organisé entraîne la formation RL. Le modèle apprend à générer des solutions à travers une séquence d'étapes de raisonnement, guidée par un modèle de récompense évaluant la précision de la réponse. La descente de miroir en ligne optimise la politique.
Déployages partiels: Pour gérer efficacement les contextes longs, Kimi K1.5 utilise des déploiements partiels, économisant des parties inachevées pour la continuation ultérieure.
Pénalité de longueur et échantillonnage: Une pénalité de longueur encourage les réponses concises, tandis que le programme d'échantillonnage et la priorité des stratégies d'échantillonnage concentrent la formation sur les tâches plus faciles en premier.
Évaluation et itération: Évaluation continue contre les références guides les mises à jour du modèle itératif.

Kimi K1.5 Présentation du système et diagrammes de déploiement partiel:

After DeepSeek, Kimi k1.5 Outshines OpenAI o1

Kimi K1.5 Benchmarks

Kimi K1.5 démontre des performances de pointe dans diverses tâches:

Mathématiques: a obtenu un score parfait de 77,5 sur Aime 2024, dépassant Openai O1 (74,4) et Openai O1 Mini (63,6). Marqué 96.2 sur Math-500.
CODING: a obtenu un score de 94 sur lesforces de code, correspondant à OpenAI O1 et dépassant l'aperçu O1-MINI et QWQ 72B.
Raisonnement visuel: a marqué 74.9 sur MathVista_Test, dépassant QVQ 72B (71.4) et Openai O1-MinI (71).
Connaissances générales: a marqué 87,4 sur MMLU (EM), surperformant Openai 4O (87.2).

Diagramme des stratégies de raisonnement:

After DeepSeek, Kimi k1.5 Outshines OpenAI o1

Kimi K1.5 Innovations clés

Échelle de contexte long: traite jusqu'à 128 000 jetons, améliorant l'efficacité grâce à des déploiements partiels.
Chaîne de pensée Raisonnement: combine des stratégies de COT long et courtes pour l'adaptabilité.
pipeline d'apprentissage du renforcement: Un pipeline RL raffiné avec des invites organisées, un réglage fin supervisé et une optimisation de politique.
Gestion des données multimodales: traite efficacement les données de texte et visuelles.

Kimi K1.5 contre Deepseek R1

Kimi K1.5 et Deepseek R1 représentent différentes approches du développement de LLM. L'architecture rationalisée de Kimi K1.5, la RL intégrée et la manipulation du contexte long la distinguent-elles des méthodes plus traditionnelles de Deepseek R1. Les différences ont un impact sur leurs performances sur les tâches complexes et lourdes de contexte.

Accès à Kimi K1.5 via API

L'accès à l'API nécessite un enregistrement sur la console de gestion de Kimi. Un exemple de l'extrait de code Python montre l'interaction API:

# ... (API key setup and message preparation) ...

stream = client.chat.completions.create(
    model="kimi-k1.5-preview",
    messages=messages,
    temperature=0.3,
    stream=True,
    max_tokens=8192,
)

# ... (streaming response handling) ...

Conclusion

Kimi K1.5 représente une progression significative du raisonnement générateur d'IA, simplifiant la conception de RL tout en obtenant des résultats de pointe. Ses innovations dans la mise à l'échelle du contexte et la gestion des données multimodales la positionnent comme un modèle de premier plan avec de grandes implications dans diverses industries.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

déshabiller le site Web d'outil Porn GRATUITMay 13, 2025 am 11:26 AM

https://undressaitool.ai/ est une application mobile puissante avec des fonctionnalités AI avancées pour le contenu pour adultes. Créez maintenant des images ou des vidéos pornographiques générées par l'AI!

Comment créer des images / vidéos pornographiques à l'aide de UndressaiMay 13, 2025 am 11:26 AM

Tutoriel sur l'utilisation de Undressai pour créer des images / vidéos pornographiques: 1. Ouvrez le lien Web d'outil correspondant; 2. Cliquez sur le bouton de l'outil; 3. Téléchargez le contenu requis pour la production en fonction des invites de page; 4. Économisez et profitez des résultats.

déshabiller l'adresse du site Web du site Web officiel de l'IAMay 13, 2025 am 11:26 AM

L'adresse officielle de la déshabillage de l'IA est: https: //undressaitool.ai/; Undressai est une puissante application mobile avec des fonctionnalités AI avancées pour le contenu pour adultes. Créez maintenant des images ou des vidéos pornographiques générées par l'AI!

Comment Undessai génère-t-il des images / vidéos pornographiques?May 13, 2025 am 11:26 AM

Adresse officielle du site Web du site officiel de Porn AiMay 13, 2025 am 11:26 AM

Article du Guide du didacticiel Utilisation de DessaiMay 13, 2025 am 10:43 AM

[Images de style Ghibli-avec AI] Introduisez comment créer des images gratuites avec Chatgpt et CopyrightMay 13, 2025 am 01:57 AM

Le dernier modèle GPT-4O publié par OpenAI peut non seulement générer du texte, mais a également des fonctions de génération d'images, ce qui a attiré une attention généralisée. La caractéristique la plus accrocheuse est la génération d'illustrations de style ghibli-". Téléchargez simplement la photo sur Chatgpt et donnez des instructions simples pour générer une image de rêve comme une œuvre en studio Ghibli. Cet article expliquera en détail le processus de fonctionnement réel, l'expérience d'effet, ainsi que les erreurs et les problèmes de droit d'auteur qui doivent être prêts attention. Pour plus de détails sur le dernier modèle "O3" publié par Openai, veuillez cliquer ici⬇️ Explication détaillée de l'Openai O3 (Chatgpt O3): fonctionnalités, système de tarification et introduction O4-MinI Veuillez cliquer ici pour la version anglaise de l'article de style ghibli- Créer Ji avec Chatgpt

Expliquer des exemples d'utilisation et de mise en œuvre de Chatgpt dans les gouvernements locaux! Introduit également les gouvernements locaux interditsMay 13, 2025 am 01:53 AM

En tant que nouvelle méthode de communication, l'utilisation et l'introduction de Chatgpt dans les gouvernements locaux attirent l'attention. Alors que cette tendance progresse dans un large éventail de domaines, certains gouvernements locaux ont refusé d'utiliser Chatgpt. Dans cet article, nous présenterons des exemples de mise en œuvre de Chatgpt dans les gouvernements locaux. Nous explorerons comment nous réalisons des améliorations de la qualité et de l'efficacité dans les services gouvernementaux locaux grâce à une variété d'exemples de réforme, notamment en soutenant la création de documents et le dialogue avec les citoyens. Non seulement les représentants du gouvernement local qui visent à réduire la charge de travail du personnel et à améliorer la commodité des citoyens, mais aussi tous les cas d'utilisation avancés.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semainesByDDD

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

3 Il y a quelques semainesByDDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Nordhold: Système de fusion, expliqué

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Version Mac de WebStorm

Outils de développement JavaScript utiles

Version crackée d'EditPlus en chinois

Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.