ホームページ >テクノロジー周辺機器 >AI >DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

Mary-Kate Olsenオリジナル: 2025-03-12 14:06:01293ブラウズ

大規模な言語モデル（LLM）は、タスクを実行するときに「考えすぎ」のジレンマに直面する可能性があり、その結果、非効率性や障害さえもなります。最近、UC Berkeley、UIUC、ETHチューリッヒ、CMUなどの研究者は、この現象について詳細な研究を行っており、「過剰考えの危険：エージェントタスクの推論 - アクションジレンマ」（論文リンク： //ww.php.cn/link/d10ece99494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949494949 3）。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

研究者は、リアルタイムのインタラクティブな環境では、LLMが「直接的なアクション」と「慎重な計画」をheすることが多いことを発見しました。この種の「考え直し」により、モデルは複雑なアクションプランの構築に多くの時間を費やすことができますが、効果的に実装することは困難であり、最終的には2倍の努力で結果の半分を達成します。

この問題を深く理解するために、研究チームは実世界のソフトウェアエンジニアリングタスクを実験フレームワークとして使用し、テスト用のO1、Deepseek R1、QWEN2.5、その他のLLMSなどのさまざまなLLMを選択しました。彼らは、LLMが情報収集、推論、行動のバランスをとることができる制御された環境を構築し、コンテキストを一定に基づいて維持します。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

研究者は、分析麻痺、不正行為、早期解放の3つのモードに「考え直し」を分けます。彼らはLLMベースの評価フレームワークを開発し、4018モデルの軌跡の定量分析を実施し、関連する研究を促進するためにオープンソースデータセットを構築しました。

結果は、考え直しが問題解決率と大幅に負の相関があることを示しています。推論モデルは、非推論モデルのほぼ3倍の考え方があり、この問題の影響を受けやすいです。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

考え直しを軽減するために、研究者は2つの方法を提案しました：ネイティブ機能呼び出しと選択的強化学習、および驚くべき結果を達成しました。たとえば、低推論に対応するモデルを選択的に使用することにより、高いタスク完了率を維持しながら計算コストを大幅に削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

また、この研究では、モデルサイズと過剰な考えの間に負の相関があり、小さなモデルが考えすぎる可能性が高いことがわかりました。さらに、推論のトークンの数を増やすと、コンテキストのウィンドウサイズに大きな影響はありませんが、過剰な考えを効果的に抑制することができます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

DeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。

この研究は、LLMでの「考え直し」の問題を理解し解決するための貴重な洞察を提供します。これは、実際のアプリケーションでのLLMの効率と信頼性を改善するのに役立ちます。

以上がDeepSeek R1も脳の過負荷ですか？考え過ぎた後、パフォーマンスは低下し、コンピューティングコストを43％削減できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

php Token 并发 https 软件工程

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Bean BreadとDeepseekの違い次の記事：Bean BreadとDeepseekの違い

関連記事

続きを見る