搜尋
首頁科技週邊人工智慧國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一

最新國產開源MoE大模型,剛亮相就火了。

DeepSeek-V2效能達GPT-4級別,但開源、可免費商用、API價格僅為GPT-4-Turbo的百分之一。

因此一經發布,立刻引發不小討論。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

透過公佈的效能指標來看,DeepSeek V2的中文綜合能力超越一眾開源模型,同時GPT-4 Turbo、文字快4.0等閉源模型同處第一梯隊。

英文綜合能力也和LLaMA3-70B同處第一梯隊,並且超過了同是MoE的Mixtral 8x22B。

在知識、數學、推理、程式設計等方面也表現出不錯性能。並支援128K上下文。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

這些能力,一般使用者都能直接免費使用。現在內測已開啟,註冊後立刻就能體驗。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

API更是骨折價:每百萬tokens輸入1元、輸出2元(32K上下文)。價格僅為GPT-4-Turbo的近百分之一。

同時在模型架構也進行創新,採用了自研的MLA(Multi-head Latent Attention)和Sparse結構,可大幅減少模型計算量、推理顯存。

網友感嘆:DeepSeek總是給人驚喜!

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

具體效果如何,我們已搶先體驗!

實測一下

目前V2內測版可以體驗通用對話和程式碼助理。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

在通用對話中可以測試大模型的邏輯、知識、生成、數學等能力。

例如可以要求它模仿《甄嬛傳》的文風寫口紅種草文案。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

還可以簡單解釋什麼是量子糾纏。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

數學方面,能回答高數微積分問題,例如:

使用微積分證明自然對數的底e 的無窮級數表示。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

也能規避一些語言邏輯陷阱。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

測試顯示,DeepSeek-V2的知識內容更新到2023年。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

程式碼方面,內測頁面顯示是使用DeepSeek-Coder-33B回答問題。

在產生較簡單程式碼上,實測幾次都沒有出錯。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

也能針對給定的程式碼做出解釋和分析。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

不過測試中也有回答錯誤的情況。

如下邏輯題目,DeepSeek-V2在計算過程中,錯誤將一支蠟燭從兩端同時點燃、燃燒完的時間,計算成了從一端點燃燒完的四分之一。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

帶來哪些升級?

根據官方介紹,DeepSeek-V2以236B總參數、21B激活,大致達到70B~110B Dense的模型能力。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

和先前的DeepSeek 67B相比,它的表現更強,同時訓練成本更低,可節省42.5%訓練成本,減少93.3%的KV緩存,最大吞吐量提高到5.76倍。

官方表示這意味著DeepSeek-V2消耗的顯存(KV Cache)只有同級Dense模型的1/5~1/100,每token成本大幅降低。

專門針對H800規格做了大量通訊優化,實際部署在8卡H800機器上,輸入吞吐量超過每秒10萬tokens,輸出超過每秒5萬tokens。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

在某些基礎Benchmark上,DeepSeek-V2基礎模型表現如下:

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

DeepSeek-V2 採用了創新的架構。

提出MLA(Multi-head Latent Attention)架構,大幅減少運算量與推理顯存。

同時自研了Sparse結構,使其計算量進一步降低。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

有人就表示,這些升級對於資料中心大型運算可能非常有幫助。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

而且在API定價上,DeepSeek-V2幾乎低於市面上所有明星大模型。

國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一圖片

團隊表示,DeepSeek-V2模型和論文也將完全開源。模型權重、技術報告都給。

現在登入DeepSeek API開放平台,註冊即贈送1000萬輸入/500萬輸出Tokens。普通試玩則完全免費。

#

以上是國產開源MoE指標爆炸:GPT-4等級能力,API價格僅百分之一的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
前十名必須閱讀機器學習研究論文前十名必須閱讀機器學習研究論文Apr 19, 2025 am 09:53 AM

本文探討了十個徹底改變人工智能(AI)和機器學習(ML)的開創性出版物。 我們將研究神經網絡和算法的最新突破,並解釋驅動現代AI的核心概念。 Th

替換SEO機構的11個AI工具 - 分析Vidhya替換SEO機構的11個AI工具 - 分析VidhyaApr 19, 2025 am 09:49 AM

AI在SEO中的崛起:超過SEO代理商的前11個工具 AI的快速發展已深刻地重塑了SEO景觀。 旨在提高頂級搜索引擎排名的企業正在利用AI優化其在線策略的能力。 來自AU

前10個免費的AI遊樂場供您在2025年嘗試-Analytics Vidhya前10個免費的AI遊樂場供您在2025年嘗試-Analytics VidhyaApr 19, 2025 am 09:45 AM

探索2024年最好的免費AI遊樂場:綜合指南 訪問正確的工具和平台是在不斷發展的人工智能(AI)領域學習和創新的關鍵。 AI遊樂場提供了絕佳的機會

矢量數據庫中索引算法的詳細指南矢量數據庫中索引算法的詳細指南Apr 19, 2025 am 09:41 AM

介紹 向量數據庫是專門的數據庫,旨在有效地存儲和檢索高維矢量數據。 這些向量代表數據點的特徵或屬性,範圍從數十到數千個維度,具體取決於

反向擴散過程是什麼? - 分析Vidhya反向擴散過程是什麼? - 分析VidhyaApr 19, 2025 am 09:40 AM

穩定的擴散:揭示反向擴散的魔力 穩定的擴散是一種強大的生成模型,能夠從噪聲中產生高質量的圖像。此過程涉及兩個關鍵步驟:正向擴散過程(在上一個A中詳細介紹

掌握及時工程中的字典技術鏈掌握及時工程中的字典技術鏈Apr 19, 2025 am 09:38 AM

解鎖AI潛力:詞典鏈,用於增強及時工程 在人工智能和自然語言處理的快速發展的景觀中,速度和效率至關重要。 詞典方法e

如何使用Pyvista進行交互式3D醫療可視化如何使用Pyvista進行交互式3D醫療可視化Apr 19, 2025 am 09:31 AM

Pyvista:3D醫學和科學可視化的強大工具 想像一下可能性:一名醫學專業的學生毫不費力地探索複雜的解剖結構或數據科學家製作交互式3D模型。 Pyvista賦予了這樣的努力

什麼是及時工程中的符號鏈? - 分析Vidhya什麼是及時工程中的符號鏈? - 分析VidhyaApr 19, 2025 am 09:27 AM

使用符號鏈方法的及時工程:綜合指南 使用大型語言模型(LLM)(例如GPT-3或GPT-4)通常受益於復雜的及時工程。 符號方法鏈提供了一種結構化方法

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器