DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％-人工智能-PHP中文网

首页

科技周边

人工智能

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

Mary-Kate Olsen

Mar 12, 2025 pm 02:06 PM

工程DeepSeekqwen大型推理模型

大型语言模型（LLM）在执行任务时也可能面临“过度思考”的困境，导致效率低下甚至失败。近期，来自加州大学伯克利分校、UIUC、ETH Zurich 和 CMU 等机构的研究人员对这一现象进行了深入研究，并发表了题为《过度思考的危险：考察代理任务中的推理-行动困境》的论文（论文链接：https://www.php.cn/link/d12e9ce9949f610ac6075ea1edbade93）。

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

研究人员发现，在实时交互环境中，LLM 常常在“直接行动”和“周密计划”之间犹豫不决。这种“过度思考”会导致模型花费大量时间构建复杂的行动计划，却难以有效执行，最终事倍功半。

为了深入了解这一问题，研究团队使用现实世界的软件工程任务作为实验框架，并选取了包括o1、DeepSeek R1、Qwen2.5等多种LLM进行测试。他们构建了一个受控环境，让LLM在信息收集、推理和行动之间取得平衡，并持续保持上下文。

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

研究人员将“过度思考”分为三种模式：分析瘫痪（Analysis Paralysis）、恶意行为（Rogue Actions）和过早放弃（Premature Disengagement）。他们开发了一个基于LLM的评估框架，对4018条模型轨迹进行了量化分析，并构建了一个开源数据集，以促进相关研究。

结果表明，过度思考与问题解决率呈显著负相关。推理模型的过度思考程度几乎是非推理模型的三倍，更容易受到此问题的影响。

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

为缓解过度思考，研究人员提出了原生函数调用和选择性强化学习两种方法，并取得了显著成效。例如，通过选择性地使用低推理能力的模型，可以大幅降低计算成本，同时保持较高的任务完成率。

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

研究还发现，模型规模与过度思考之间存在负相关关系，较小模型更容易过度思考。此外，增加推理token数量可以有效抑制过度思考，而上下文窗口大小则没有显著影响。

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

这项研究为理解和解决LLM的“过度思考”问题提供了宝贵的见解，有助于提升LLM在实际应用中的效率和可靠性。

以上是DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

AI游戏开发通过Upheaval的Dreamer Portal进入其代理时代May 02, 2025 am 11:17 AM

动荡游戏：与AI代理商的游戏开发彻底改变 Roupheaval是一家游戏开发工作室，由暴风雪和黑曜石等行业巨头的退伍军人组成，有望用其创新的AI驱动的Platfor革新游戏创作

Uber想成为您的Robotaxi商店，提供商会让他们吗？May 02, 2025 am 11:16 AM

Uber的Robotaxi策略：自动驾驶汽车的骑车生态系统在最近的Curbivore会议上，Uber的Richard Willder推出了他们成为Robotaxi提供商的乘车平台的策略。利用他们在

AI代理玩电子游戏将改变未来的机器人May 02, 2025 am 11:15 AM

事实证明，视频游戏是尖端AI研究的宝贵测试场所，尤其是在自主代理和现实世界机器人的开发中，甚至有可能促进人工通用智能（AGI）的追求。一个

创业公司工业综合体VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不断发展的风险投资格局的影响在媒体，财务报告和日常对话中显而易见。但是，对投资者，初创企业和资金的具体后果经常被忽略。风险资本3.0：范式

Adobe在Adobe Max London 2025更新创意云和萤火虫May 02, 2025 am 11:13 AM

Adobe Max London 2025对Creative Cloud和Firefly进行了重大更新，反映了向可访问性和生成AI的战略转变。该分析结合了事件前简报中的见解，并融合了Adobe Leadership。（注意：Adob

Llamacon宣布的所有元数据May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一项综合的AI策略，旨在直接与OpenAI等封闭的AI系统竞争，同时为其开源模型创建了新的收入流。这个多方面的方法目标bo

关于AI仅仅是普通技术的主张的酿造争议May 02, 2025 am 11:10 AM

人工智能领域对这一论断存在严重分歧。一些人坚称，是时候揭露“皇帝的新衣”了，而另一些人则强烈反对人工智能仅仅是普通技术的观点。让我们来探讨一下。对这一创新性人工智能突破的分析，是我持续撰写的福布斯专栏文章的一部分，该专栏涵盖人工智能领域的最新进展，包括识别和解释各种有影响力的人工智能复杂性（请点击此处查看链接）。人工智能作为普通技术首先，需要一些基本知识来为这场重要的讨论奠定基础。目前有大量的研究致力于进一步发展人工智能。总目标是实现人工通用智能（AGI）甚至可能实现人工超级智能（AS