DeepSeek R1 vs Openai O1 vs SONNET 3.5：最好的LLMS戰役-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

DeepSeek R1 vs Openai O1 vs SONNET 3.5：最好的LLMS戰役

尊渡假赌尊渡假赌尊渡假赌

Mar 09, 2025 pm 01:04 PM

DeepSeek R1：預算友好的LLM與GPT-4競爭和Claude

自新一年以來，

中國AI Innovator DeepSeek一直在引起轟動，推出了DeepSeek V3車型（GPT-4競爭對手）及其隨附的移動應用程序。他們的最新產品DeepSeek R1是一種大型語言模型（LLM），以大幅降低的價格挑戰行業領導者。這篇博客文章將DeepSeek R1與Openai的O1和Claude Sonnet 3.5進行了比較，並將其性能主張進行了測試。

deepseek r1：概述> DeepSeek R1是一個開源LLM，優先考慮高級推理功能。其獨特的培訓方法利用了加強學習（RL），最大程度地減少對傳統監督微調（SFT）的依賴。這種專注於邏輯，解決問題和解釋性，使其非常適合STEM任務，編碼和復雜的思想鏈（COT）推理。它直接與Openai的O1和Claude的十四行詩3.5競爭。重要的是，DeepSeek R1的API的成本明顯低得多，比SONNET 3.5和93％便宜97％（用於Cache Hit Input）。

DeepSeek R1 vs OpenAI o1 vs Sonnet 3.5: Battle of Best LLMs

DeepSeek R1 vs OpenAI o1 vs Sonnet 3.5: Battle of Best LLMs 訪問DeepSeek R1

DeepSeek R1可以通過DeepSeek Chat Interface（）或其API訪問（https://www.php.cn/link/23264092BDAF8349C3CEC606151BE6BD

）。聊天界面需要創建帳戶或登錄，然後選擇“ DeepThink”。 API訪問需要從開發人員門戶中獲取API密鑰並配置開發環境。 API基礎URL為：

https://www.php.cn/link/aaf9290b75757575756dd784f192425658d4 >> deepSeek r1 vs. Openai O1 vs. Claude Sonnet 3.5：詳細的比較

Feature	DeepSeek R1	OpenAI o1 Series	Claude Sonnet 3.5
Training Approach	Reinforcement learning (RL), minimal SFT	Supervised fine-tuning (SFT) RLHF	Supervised fine-tuning RLHF
Special Methods	Cold-start data, rejection sampling, pure RL	Combines SFT and RL for general versatility	Focused on alignment and safety
Core Focus	Reasoning-intensive tasks (math, coding, CoT)	General-purpose LLM	Ethical and safe AI, balanced reasoning
Input Token Cost (per million)	.14 (cache hit), .55 (cache miss)	.50–	.45–.60
Output Token Cost (per million)	.19		–
Affordability	Extremely cost-effective	High cost	Moderately priced
Accessibility	Fully open-source (free for hosting/customization)	Proprietary, pay-per-use API	Proprietary, pay-per-use API

性能基準：基於任務的評估

> 任務1：邏輯推理：一個單詞問題計算地板上的腿數。這些模型均未提供完全正確的答案。
>
> 任務2：科學推理：涉及激光和鏡像的基於物理的問題。 DeepSeek R1提供了最佳的響應，並有助於可視化。
>
>任務3：編碼技能：創建一個帶有更改背景顏色並添加五彩紙條的按鈕的HTML頁面。 DeepSeek R1提供了功能最強和集成的解決方案。
> 任務4：解決問題的技能：編寫一個解決Sudoku難題的程序。十四行詩3.5提供了最優雅，結構良好的代碼。

（每個任務輸出的詳細結果和屏幕截圖都包含在原始文章中。）

最終結果和結論

> DeepSeek R1表現出強大的推理能力，尤其是在科學推理和編碼任務中，但這並不完美。偶爾觀察到語法誤差和較慢的響應時間。 Openai O1提供了詳細的解釋，而十四行詩3.5提供了速度和簡潔性。這些模型之間的選擇取決於個人需求和優先級。 DeepSeek R1的重大成本優勢使其成為具有預算限制的用戶的引人注目的選擇。

（原始文章的結論部分（包括常見問題解答）也包括在原始響應中。）

以上是DeepSeek R1 vs Openai O1 vs SONNET 3.5：最好的LLMS戰役的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

META的新AI助手：生產力助推器還是時間下沉？May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴，拓展了Llama Stack的企業級部署整合。在安全方面，Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具，並啟動了Llama Defenders計劃，以增強AI安全性。此外，Meta還向10個全球機構（包括致力於改善公共服務、醫療保健和教育的初創企業）發放了總額150萬美元的Llama Impact Grants。由Llama 4驅動的全新Meta AI應用，被設想為Meta AI

80％的Zers將嫁給AI：研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說，這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。零售商與機器人ho積產品，銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題，Rende

賣給機器人：將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷，並可能超過以前技術轉變的影響。這些代理代表了生成AI的重大進步，不僅是處理諸如chatgpt之類的處理信息，而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。首先，丹佛的尼古拉·喬基奇（Nikola Jokic）錯過了三分球，導致亞倫·戈登（Aaron Gordon）的最後一秒鐘。索尼的鷹

AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上，擴大重生醫學專業知識在全球範圍內要求廣泛的旅行，動手培訓和多年指導。現在，AI正在改變這一景觀，克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位，同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此，英特爾必須在業界建立更多信任，不僅要證明其工藝的競爭力，還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰，以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程，以更以客