在DeepSeek之后，Kimi K1.5击败Openai O1-人工智能-PHP中文网

首页

科技周边

人工智能

在DeepSeek之后，Kimi K1.5击败Openai O1

Christopher Nolan

Mar 07, 2025 am 11:34 AM

kimi k1.5：一种生成的AI推理模型，重塑了景观

最近的增强学习（RL）和大语言模型（LLM）的突破已经达到了创建Kimi K1.5的最终突破，这是一种准备彻底改变生成AI推理的模型。本文深入研究了Kimi K1.5的主要特征，创新和潜在影响，从随附的研究中获得见解。目录的

表：

什么是kimi k1.5？

kimi k1.5培训
kimi k1.5基准
kimi k1.5的关键创新
kimi k1.5 vs. deepseek r1
>通过API
结论

什么是kimi k1.5？

kimi k1.5代表了用LLM缩放RL的实质性飞跃。与依靠复杂方法（例如蒙特卡洛树搜索）等传统模型不同，它采用了以自动回归预测和RL技术为中心的简化方法。它的设计使其能够处理多模式任务，在Math Vista和Live Code -Bench等基准中展示出色的性能。>

Kimi K1.5的培训是一个多阶段的过程，旨在通过RL和多模式集成来增强推理：

预处理：该模型是在庞大的高质量多模式数据集中鉴定的，包括文本（英语，中文，代码，数学，数学，通用知识）和视觉数据，并严格过滤有关相关性和多样性。

有监督的微调（SFT）：
这涉及两个阶段：Vanilla SFT在各种任务中使用约100万个示例，以及长期链（COT）SFT来培训复杂的推理。

经过精心策划的提示集驱动RL培训。该模型学会通过一系列推理步骤生成解决方案，并在评估响应准确性的奖励模型的指导下。在线镜下降优化了策略。

局部推广：

>有效处理长上下文，kimi k1.5使用部分推出，保存未完成的部分以供以后继续。

长度惩罚和抽样：

长度惩罚鼓励简洁的答案，而课程和优先采样策略将重点放在更轻松的任务上。

>>评估与迭代：

针对基准测试的连续评估指导迭代模型更新。

kimi k1.5系统概述和部分推出图：

kimi k1.5展示了各种任务的最先进的表现：

数学：在AIME 2024上获得了77.5的完美分数，超过Openai O1（74.4）和Openai O1 Mini（63.6）。在Math-500上得分96.2。
编码：>在CodeForces上达到94分，匹配OpenAi O1并超过O1-Mini和QWQ 72B Preview。
在MathVista_test上得分74.9，超过QVQ 72B（71.4）和Openai O1-Mini（71）。
在mmlu（em）上得分为87.4，表现优于OpenAi 4o（87.2）。

kimi k1.5关键创新 After DeepSeek, Kimi k1.5 Outshines OpenAI o1

长上下文缩放：

思维推理链：
>加固学习管道：一条精致的RL管道，带有精心策划的提示，监督微调和策略优化。
多模式数据处理：有效地处理文本和视觉数据。
kimi k1.5 vs. deepseek r1

>通过API

访问Kimi K1.5 API访问需要注册Kimi的管理控制台。一个示例Python代码段演示了API交互：>

结论 Kimi K1.5代表生成AI推理的显着进步，在实现最新结果的同时简化了RL设计。它在上下文缩放和多模式数据处理位置上的创新是一个领先的模型，具有各个行业的广泛含义。

以上是在DeepSeek之后，Kimi K1.5击败Openai O1的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

[带AI的吉卜力风格图像]介绍如何使用Chatgpt和版权创建免费图像May 13, 2025 am 01:57 AM

OpenAI发布的最新模型GPT-4o，不仅能生成文本，还具备图像生成功能，引发广泛关注。其中最受瞩目的功能便是“吉卜力风格插画”的生成。只需将照片上传至ChatGPT，并给出简单的指令，即可生成宛如吉卜力工作室作品般梦幻的图像。本文将详细解读实际操作流程、效果感受，以及需要注意的错误和版权问题。 OpenAI发布的最新模型“o3”详情请点击此处⬇️ OpenAI o3(ChatGPT o3)详解：特性、定价体系及o4-mini介绍吉卜力风格文章的英文版请点击此处⬇️ 利用ChatGPT创作吉

解释在地方政府中使用和实施CANTGPT的示例！还介绍了禁止的地方政府May 13, 2025 am 01:53 AM

作为一种新的交流方法，在地方政府中使用和引入Chatgpt引起了人们的关注。尽管这种趋势在广泛的领域正在发展，但一些地方政府拒绝使用Chatgpt。在本文中，我们将介绍地方政府中ChatGPT实施的示例。我们将通过各种改革实例，包括支持文件创建和与公民对话，从而探索如何通过各种改革实例来实现地方政府服务的质量和效率提高。不仅旨在减少员工工作量并改善公民的便利性的地方政府官员，而且都对高级用例感兴趣。

chatgpt中的福卡式风格提示是什么？示例句子的详尽解释！May 13, 2025 am 01:52 AM

您是否听说过一个名为“福卡斯提示系统”的框架？诸如ChatGpt之类的语言模型非常出色，但是适当的提示对于发挥其潜力至关重要。福卡（Fukatsu）提示是旨在提高输出准确性的最受欢迎的提示技术之一。本文解释了福卡式风格提示的原理和特征，包括特定的用法方法和示例。此外，我们还引入了其他众所周知的及时模板和有用的技术来及时设计，因此，根据这些设计，我们将介绍C。

什么是chatgpt搜索？解释主要功能，用法和费用结构！May 13, 2025 am 01:51 AM

CHATGPT搜索：使用创新的AI搜索引擎有效获取最新信息！在本文中，我们将彻底解释OpenAI提供的新的ChatGpt功能“ ChatGpt搜索”。让我们仔细研究一下功能，用法以及该工具如何根据实时网络信息和直观的易用性来帮助您提高信息收集效率。 chatgpt搜索提供了一种对话互动搜索体验，该体验在舒适，隐藏的环境中回答用户问题，以隐藏广告

易于理解的解释如何在Chatgpt和提示中创建构图！May 13, 2025 am 01:50 AM

信息爆炸的现代社会，创作出令人信服的文章并非易事。如何在有限的时间和精力内，发挥创造力，撰写出吸引读者的文章，需要高超的技巧和丰富的经验。这时，作为革命性的写作辅助工具，ChatGPT 备受瞩目。ChatGPT 利用庞大的数据训练出的语言生成模型，能够生成自然流畅、精炼的文章。本文将介绍如何有效利用 ChatGPT，高效创作高质量文章的技巧。我们将逐步讲解使用 ChatGPT 的写作流程，并结合具体案例，详细阐述其优缺点、适用场景以及安全使用注意事项。ChatGPT 将成为作家克服各种障碍，

如何使用chatgpt创建图！还解释了插图的加载和插件May 13, 2025 am 01:49 AM

使用AI创建图表的有效指南视觉材料对于有效传达信息至关重要，但是创建它需要大量时间和精力。但是，由于AI技术（例如Chatgpt和dall-e 3）的兴起，图表创建过程正在发生巨大变化。本文使用这些尖端工具提供了有关有效而有吸引力的图创建方法的详细说明。它涵盖了从想法到完成的所有内容，并包含大量信息，可用于创建图表，从可以使用的特定步骤，提示，插件和API以及如何使用图像一代AI“ dall-e 3.”）

易于理解的解释Chatgpt加上定价结构和付款方式！May 13, 2025 am 01:48 AM

解锁ChatGPT Plus：费用、支付方式及升级指南全球瞩目的顶尖生成式AI，ChatGPT已广泛应用于日常生活和商业领域。虽然ChatGPT基本免费，但付费版ChatGPT Plus提供多种增值服务，例如插件、图像识别等，显着提升工作效率。本文将详细解读ChatGPT Plus的收费标准、支付方式及升级流程。 OpenAI最新图像生成技术“GPT-4o图像生成”详情请点击： GPT-4o图像生成详解：使用方法、提示词示例、商业应用及与其他AI的差异目录 ChatGPT Plus费用 Ch

解释如何使用chatgpt创建设计！我们还介绍了使用和提示示例May 13, 2025 am 01:47 AM

如何使用Chatgpt简化您的设计工作并提高创造力本文将详细说明如何使用ChatGpt创建设计。我们将介绍在各个设计领域中使用Chatgpt的示例，例如思想，文本生成和网页设计。我们还将介绍点，以帮助您提高各种创意作品的效率和质量，例如图形设计，插图和徽标设计。请看一下AI如何大大扩展您的设计可能性。目录 chatgpt：设计创建的强大工具

See all articles