全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一

May 07, 2024 pm 04:13 PM

gitgpt-4模型moe

想像一下，一個人工智慧模型，不僅擁有超越傳統運算的能力，還能以更低的成本實現更有效率的效能。這不是科幻，DeepSeek-V2^[1]，全球最強開源 MoE 模型來了。

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

DeepSeek-V2 是一個強大的專家混合（MoE）語言模型，具有訓練經濟、推理高效的特點。它由 236B 個參數組成，其中 21B 個參數用於啟動每個標記。 與 DeepSeek 67B 相比，DeepSeek-V2 性能更強，同時節省了 42.5% 的訓練成本，減少了 93.3% 的 KV 緩存，最大生成吞吐量提高到 5.76 倍。

DeepSeek 是一家探索通用人工智慧（AGI）本質的公司，並致力於將研究、工程和商業三者融為一體。

DeepSeek-V2 的綜合能力

#在目前大模型主流榜單中，DeepSeek-V2 都表現出色：

#中文綜合能力（AlignBench）開源模型中最強：與GPT-4-Turbo，文心4.0 等閉源模型在評測中處於同一梯隊
英文綜合能力（MT-Bench）處於第一梯隊：英文綜合能力（MT-Bench）與最強的開源模型LLaMA3-70B 處於同一梯隊，超過最強MoE 開源模型Mixtral 8x22B
知識、數學、推理、編程等榜單結果位居前列
支援128K 上下文視窗

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

全新的模型結構

當AI 的潛力被不斷挖掘，我們不禁要問：什麼是推動智慧進步的關鍵？ DeepSeek-V2 給了答案 —— 創新架構與成本效益的完美結合。

"DeepSeek-V2是一種改進版本，以236B的總參數和21B的激活，最終達到了70B~110B Dense模型的能力，同時顯存消耗僅為同級別模型的1/5~ 1/100。 ##在AI技術快速發展的今天，DeepSeek-V2的出現，不僅代表了技術的突破，也預示著智慧應用的普及化。它將AI的門檻降低，讓更多企業和個人能夠享受高效率智慧服務的益處。同時，它也更預示著智慧應用的普及化。它將AI的門檻降低，讓更多企業和個人能夠享受高效率智慧服務的益處。

中文能力 VS 價格

在中文能力方面，DeepSeek-V2 在 AlignBench 排名中全球領先，同時提供極具競爭力的 API 價格。

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

模型與論文雙開源

DeepSeek-V2，不只是一個模型，它是通往更智慧世界的鑰匙。它以更低的成本，更高的效能，開啟了 AI 應用的新篇章。 DeepSeek-V2 的開源，是對這項信念的最佳證明，它將激發更多人的創新精神，共同推動人類智慧的未來。

模型權重：https://huggingface.co/deepseek-ai

#開源位址：https://github.com/deepseek-ai/DeepSeek-V2
在AI 不斷進化的今天，你認為DeepSeek-V2 將如何改變我們的世界？讓我們拭目以待，有興趣的話，可以造訪

chat.deepseek.com 親自體驗 DeepSeek-V2 帶來的技術變革。

參考資料

[1]

#DeepSeek-V2:

https: //www.php.cn/link/b2651c9921723afdfd04ed61ec302a6b

#

以上是全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

一個提示可以繞過每個主要LLM的保障措施

一個提示可以繞過每個主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隱藏者的開創性研究暴露了領先的大語言模型（LLM）的關鍵脆弱性。他們的發現揭示了一種普遍的旁路技術，稱為“政策木偶”，能夠規避幾乎所有主要LLMS

5個錯誤，大多數企業今年將犯有可持續性

5個錯誤，大多數企業今年將犯有可持續性Apr 25, 2025 am 11:15 AM

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。這種轉變會影響產品開發，製造過程，客戶關係，合作夥伴選擇以及採用新的

H20芯片禁令震撼中國人工智能公司，但長期以來一直在為影響

H20芯片禁令震撼中國人工智能公司，但長期以來一直在為影響Apr 25, 2025 am 11:12 AM

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級，從而揭示了中國對外國半導體技術的依賴。 2024年，中國進口了價值3850億美元的半導體

如果Openai購買Chrome，AI可能會統治瀏覽器戰爭

如果Openai購買Chrome，AI可能會統治瀏覽器戰爭Apr 25, 2025 am 11:11 AM

從Google的Chrome剝奪了潛在的剝離，引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器，擁有65％的全球市場份額的前景提出了有關TH的未來的重大疑問

AI如何解決零售媒體的痛苦

AI如何解決零售媒體的痛苦Apr 25, 2025 am 11:10 AM

儘管總體廣告增長超過了零售媒體的增長，但仍在放緩。這個成熟階段提出了挑戰，包括生態系統破碎，成本上升，測量問題和整合複雜性。但是，人工智能

'AI是我們，比我們更多'

'AI是我們，比我們更多'Apr 25, 2025 am 11:09 AM

在一系列閃爍和惰性屏幕中，一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心，這是沉浸式展覽中的六個裝置之一，＆qu＆qu

Google Cloud在下一個2025年對基礎架構變得更加認真

Google Cloud在下一個2025年對基礎架構變得更加認真Apr 25, 2025 am 11:08 AM

Google Cloud的下一個2025：關注基礎架構，連通性和AI Google Cloud的下一個2025會議展示了許多進步，太多了，無法在此處詳細介紹。有關特定公告的深入分析，請參閱我的文章

IR的秘密支持者透露，Arcana的550萬美元的AI電影管道說話，Arcana的AI Meme，Ai Meme的550萬美元。

IR的秘密支持者透露，Arcana的550萬美元的AI電影管道說話，Arcana的AI Meme，Ai Meme的550萬美元。Apr 25, 2025 am 11:07 AM

本週在AI和XR中：一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。讓我們潛入頭條新聞。 AI生成的內容的增長影響：技術顧問Shelly Palme

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱門文章

刺客信條陰影：貝殼謎語解決方案

4 週前ByDDD

Windows 11 KB5054979中的新功能以及如何解決更新問題

3 週前ByDDD

在哪裡可以找到原子中的起重機控制鑰匙卡

4 週前ByDDD

<🎜>：死鐵路 - 如何完成所有挑戰

1 個月前ByDDD

Atomfall指南：項目位置，任務指南和技巧

1 個月前ByDDD

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合，這些清單在安全評估過程中經常使用，而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表，幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上，他就可以存取所需的每種類型的清單。

mPDF

mPDF

mPDF是一個PHP庫，可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件，並處理不同的語言。與原始腳本如HTML2FPDF相比，它的速度較慢，並且在使用Unicode字體時產生的檔案較大，但支援CSS樣式等，並進行了大量增強。支援幾乎所有語言，包括RTL（阿拉伯語和希伯來語）和CJK（中日韓）。支援嵌套的區塊級元素（如P、DIV），

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序，非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具，幫助Web開發人員更好地理解保護網路應用程式的過程，並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞，難度各不相同。請注意，該軟體中

熱門話題

gmail信箱登陸入口在哪裡

7706

15

1640

14

1394

52

1288

25

1231

29