在Openai著名版本(例如GPT-4O,Sora和O1)的一年中,开源社区一直以其令人印象深刻的模型稳步发展。其中包括DeepSeek V3,这是一种开源模型,预算仅为550万美元,比GPT-4O(1亿美元)的培训成本低得多。 DeepSeek V3拥有6850亿参数和混合特性(MOE)体系结构,在编码和翻译等领域竞争,同时提供了成本效率和开源柔韧性。让我们探讨DeepSeek V3与GPT-4O的比较以及它为AI开发带来的餐桌带来了什么。
提示:创建一个全面的流程图,说明了代理AI中的反射模式。
这些是反思模式所涉及的步骤 -
生成初始输出
自我审查/批评输出
确定错误,差距或改进领域
提出改进建议
修改/完善输出
重复步骤2-5直到达到令人满意的结果
立即创建新的流程图
DeepSeek V3输出:
--------------------------------<br> |生成初始输出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |自我审查/批评输出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |确定错误,差距或改进领域|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |提出改进建议|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |修订/完善输出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |结果令人满意吗? |<br> --------------------------------<br> |<br> -----------------------<br> | |<br> VV<br>是否<br> | |<br> VV<br> --------------------------------<br> |最终输出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |结束|<br> --------------------------------
GPT 4O输出:
观察:
GPT-4O的流程图比DeepSeek V3更有效,因为它实现了适当的反馈循环。尽管V3的流程图试图根据令人满意的结果显示决策路径,但它具有逻辑缺陷,其中“是”和“否”结果都会导致相同的输出。相比之下,GPT-4O的设计正确地表明了结果不令人满意的结果如何重新回到过程中,更好地代表了改进的迭代性质。
判决:
DeepSeek V3 | gpt 4o✅
该GPT 4O与DeepSeek V3指南的第一个任务是,我有一个网站的斑马拼图。
提示:解决这个斑马难题,给我一个最终结果表。
DeepSeek V3输出:
将此回应放在网站上:
GPT 4O输出:
将此解决方案放在网站上:
观察:
尽管这两个模型都将随机名称分配给了无法提供信息的元素,但V3正确解决了问题,而GPT-4O未能这样做。
判决:
DeepSeek V3 | gpt 4o❌
提示:图显示了电路的一部分。它由平行和串联配置的电阻组成。找到等效电阻。
DeepSeek V3输出:
GPT 4O响应:
观察:
当比较给定电阻网络的DeepSeek V3和GPT-4O的解决方案时,GPT-4O的1.29Ω计算是正确的,而DeepSeek V3的结果为3.59Ω是不正确的。 GPT-4O通过三个平行分支正确地识别了电路的结构:(R1 R2 =3Ω),R3 =3Ω和(R4 R5 =9Ω),然后准确地应用了并行电阻公式(1/RT = 1/3 1/3 1/3 1/9 = 7/9),以获得最终结果。 DeepSeek V3通过错误地分组电阻,误会列表和并行组合而犯了关键错误,从而导致其最终计算不准确。
判决:
DeepSeek V3 | gpt 4o✅
提示:阅读文章Athttps://www.analyticsvidhya.com/blog/2024/07/building-agentic-agentic-rag-systems-with-langgraph/-了解为Wikipedia数据创建矢量数据库的过程。然后,提供关键步骤的简明摘要。
DeepSeek V3输出:
GPT 4O输出:
观察:
DeepSeek V3和GPT-4O都提供了技术上合理的解释,但是GPT-4O的响应与关于矢量db创建的原始查询更加准确地保持一致。尽管DeepSeek V3提供了更广泛的技术环境,涵盖了预处理,索引和langgraph集成,但GPT-4O专门针对Chromadb实施,该实施直接解决了手头的任务。两种方法都有其优点,但是对于特定的问题,GPT-4O的目标响应证明更适用。
判决:
DeepSeek V3 | gpt 4o✅
提示:图像分为几乎相同的两个部分。但是,左图中有三个元素在右图中缺少。您的任务是确定这些缺失的元素。
DeepSeek V3输出:
GPT 4O输出:
观察:
V3无法直接分析图像并提供了通用响应。 GPT-4确定了一个正确的差异,但其余的差异是不正确的。
判决:
DeepSeek V3 | gpt 4o❌
任务 | 优胜者 |
---|---|
流程图 | GPT-4O |
斑马拼图 | DeepSeek V3 |
物理电路问题 | GPT-4O |
文章摘要 | GPT-4O |
寻找差异 | 两者都不 |
另请阅读:
显然,GPT-4O在上述任务中优于DeepSeek V3。但是,它在解决难题任务中的成功突出了其在该领域的特殊优势。
话虽如此,DeepSeek V3证明,开源车型可以与GPT-4O等商业模型竞争,同时培训的成本效益要高得多(550万美元与1亿美元)。
我真的很高兴能潜入DeepSeek V3并探索其全部功能。你呢?您是否尝试过这两种型号?您更喜欢谁的反应?在下面的评论中分享您的想法!
从头开始学习DeepSeek!加入我们的“入门”课程,并探索其功能以提高您的AI技能。
以上是DeepSeek V3与GPT-4O:哪个更好?的详细内容。更多信息请关注PHP中文网其他相关文章!