全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

May 07, 2024 pm 04:13 PM

gitgpt-4模型moe

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2^[1]，全球最强开源 MoE 模型来了。

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

DeepSeek-V2 是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效的特点。它由 236B 个参数组成，其中 21B 个参数用于激活每个标记。与 DeepSeek 67B 相比，DeepSeek-V2 性能更强，同时节省了 42.5% 的训练成本，减少了 93.3% 的 KV 缓存，最大生成吞吐量提高到 5.76 倍。

DeepSeek 是一家探索通用人工智能（AGI）本质的公司，并致力于将研究、工程和商业三者融为一体。

DeepSeek-V2 的综合能力

在目前大模型主流榜单中，DeepSeek-V2 均表现出色：

中文综合能力（AlignBench）开源模型中最强：与 GPT-4-Turbo，文心 4.0 等闭源模型在评测中处于同一梯队
英文综合能力（MT-Bench）处于第一梯队：英文综合能力（MT-Bench）与最强的开源模型 LLaMA3-70B 处于同一梯队，超过最强 MoE 开源模型 Mixtral 8x22B
知识、数学、推理、编程等榜单结果位居前列
支持 128K 上下文窗口

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

全新的模型结构

当 AI 的潜力被不断挖掘，我们不禁要问：什么是推动智能进步的关键？DeepSeek-V2 给出了答案 —— 创新架构与成本效益的完美结合。

"DeepSeek-V2是一种改进版本，以236B的总参数和21B的激活，最终达到了70B~110B Dense模型的能力，同时显存消耗仅为同级别模型的1/5~1/100。在8卡H800机器上，每秒可处理超过10万tokens的输入，输出超过每秒5万tokens。这不仅是技术上的飞跃，更是成本控制的革命。"

在AI技术飞速发展的今天，DeepSeek-V2的出现，不仅代表了技术的突破，更预示着智能应用的普及化。它将AI的门槛降低，让更多企业和个人能够享受到高效智能服务的益处。同时，它也更预示着智能应用的普及化。它将AI的门槛降低，让更多企业和个人能够享受到高效智能服务的益处。

中文能力 VS 价格

在中文能力方面，DeepSeek-V2 在 AlignBench 排名中全球领先，同时提供极具竞争力的 API 价格。

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

模型和论文双开源

DeepSeek-V2，不只是一款模型，它是通往更智能世界的钥匙。它以更低的成本，更高的性能，开启了 AI 应用的新篇章。DeepSeek-V2 的开源，是对这一信念的最好证明，它将激发更多人的创新精神，共同推动人类智能的未来。

模型权重：https://huggingface.co/deepseek-ai
开源地址：https://github.com/deepseek-ai/DeepSeek-V2

在 AI 不断进化的今天，你认为 DeepSeek-V2 将如何改变我们的世界？让我们拭目以待，感兴趣的话，可以访问 chat.deepseek.com 亲自体验 DeepSeek-V2 带来的技术变革。

参考资料

[1]

DeepSeek-V2: https://www.php.cn/link/b2651c9921723afdfd04ed61ec302a6b

以上是全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

一个提示可以绕过每个主要LLM的保障措施

一个提示可以绕过每个主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隐藏者的开创性研究暴露了领先的大语言模型（LLM）的关键脆弱性。他们的发现揭示了一种普遍的旁路技术，称为“政策木偶”，能够规避几乎所有主要LLMS

5个错误，大多数企业今年将犯有可持续性

5个错误，大多数企业今年将犯有可持续性Apr 25, 2025 am 11:15 AM

对环境责任和减少废物的推动正在从根本上改变企业的运作方式。这种转变会影响产品开发，制造过程，客户关系，合作伙伴选择以及采用新的

H20芯片禁令震撼中国人工智能公司，但长期以来一直在为影响

H20芯片禁令震撼中国人工智能公司，但长期以来一直在为影响Apr 25, 2025 am 11:12 AM

最近对先进AI硬件的限制突出了AI优势的地缘政治竞争不断升级，从而揭示了中国对外国半导体技术的依赖。 2024年，中国进口了价值3850亿美元的半导体

如果Openai购买Chrome，AI可能会统治浏览器战争

如果Openai购买Chrome，AI可能会统治浏览器战争Apr 25, 2025 am 11:11 AM

从Google的Chrome剥夺了潜在的剥离，引发了科技行业中的激烈辩论。 OpenAI收购领先的浏览器，拥有65％的全球市场份额的前景提出了有关TH的未来的重大疑问

AI如何解决零售媒体的痛苦

AI如何解决零售媒体的痛苦Apr 25, 2025 am 11:10 AM

尽管总体广告增长超过了零售媒体的增长，但仍在放缓。这个成熟阶段提出了挑战，包括生态系统破碎，成本上升，测量问题和整合复杂性。但是，人工智能

'AI是我们，比我们更多'

'AI是我们，比我们更多'Apr 25, 2025 am 11:09 AM

在一系列闪烁和惰性屏幕中，一个古老的无线电裂缝带有静态的裂纹。这堆积不稳定的电子设备构成了“电子废物土地”的核心，这是身临其境展览中的六个装置之一，＆qu＆qu

Google Cloud在下一个2025年对基础架构变得更加认真

Google Cloud在下一个2025年对基础架构变得更加认真Apr 25, 2025 am 11:08 AM

Google Cloud的下一个2025：关注基础架构，连通性和AI Google Cloud的下一个2025会议展示了许多进步，太多了，无法在此处详细介绍。有关特定公告的深入分析，请参阅我的文章

IR的秘密支持者透露，Arcana的550万美元的AI电影管道说话，Arcana的AI Meme，Ai Meme的550万美元。

IR的秘密支持者透露，Arcana的550万美元的AI电影管道说话，Arcana的AI Meme，Ai Meme的550万美元。Apr 25, 2025 am 11:07 AM

本周在AI和XR中：一波AI驱动的创造力正在通过从音乐发电到电影制作的媒体和娱乐中席卷。让我们潜入头条新闻。 AI生成的内容的增长影响：技术顾问Shelly Palme

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

热门文章

刺客信条阴影：贝壳谜语解决方案

4 周前ByDDD

Windows 11 KB5054979中的新功能以及如何解决更新问题

3 周前ByDDD

在哪里可以找到原子中的起重机控制钥匙卡

4 周前ByDDD

<🎜>：死铁路 - 如何完成所有挑战

1 个月前ByDDD

如何修复KB5055523无法在Windows 11中安装？

2 周前ByDDD

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具，用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新（2018.2.1 ）专业的PHP集成开发工具

热门话题

gmail邮箱登陆入口在哪里

7719

15

1641

14

1396

52

1289

25

1233

29