今年3月,面對洶湧而來的AI潮,「矽谷刀王」一改往日本色,主動站到台前,宣布推出DGX雲,把AI專用的GPU放到雲上「出租」 。
以往,出售算力這種事都是雲端運算公司在幹。它們購買多種型號顯示卡與人工智慧加速器,根據硬體性能或使用時長等方式定價,然後租給下游客戶。
這個過程中,英偉達將GPU要麼賣給雲端運算平台,要麼直接出售給AI公司,例如第一台NVIDIA DGX超級電腦就是2016年老黃親自交付給OpenAI的,並沒有直接出售算力,頂多算「賣鏟人」。
而DGX上雲這個事,雖然英偉達仍需要將其託管到雲端平台,但本質上已經是跨越邊界了。
一向屈居幕後的英偉達,這次為何要走向台前?
本輪AI潮英偉達毫無疑問是最大的受益者,甚至可以沒有之一。
用於訓練AI的GPU晶片價格瘋長,海外A100和H100的每片價格分別漲到了1.5萬美元和4萬美元,國內一台配置8顆A100和80G儲存空間的AI伺服器,價格也從去年中旬的8萬/台飆升至目前的165萬/台。
但這些錢並沒有都流入英偉達的口袋,溢價都被渠道拿走了,關鍵是這種倒買倒賣英偉達還一點辦法沒有。
DGX雲就在這種情況下應運而生,關鍵價格看似還很便宜。配備8個H100 GPU模組的DGX雲,每月套餐費只要3.7萬美元,相當於單片H100的價格。
對於急需算力資金又捉襟見肘的AI公司來說,DGX雲無疑是渴睡時天降的一個枕頭;對英偉達而言,出售雲算力既能賺錢又綁定了客戶。
而看似雙贏的背後,卻隱藏著一場始於AI的秘密戰爭。
算力平權
#從產業特徵來看,今天基於雲端算力的AIGC和曾經的加密資產挖礦極為相似,但所需的資源遠高於後者。
國盛證券曾在《Web3 視角下的AIGC算力進化論》中,比較了加密資產挖礦和AIGC產業的異同點:
1 AIGC產業耗電量大約會在1.6-7.5年間超過當前比特幣挖礦產業耗電量,主要驅動因素是GPT類大語言模型在模型參數、日活和模型數量上的高速增長;
2 和比特幣挖礦類似,AIGC產業由算力驅動的內容處於高強度競爭中,參與者只有持續、快速生產出高品質內容,才能保證自己獲取到的用戶注意力不會下降。
這就導致AIGC產業的兩大特徵:高成本和持續性。
其中,成本側不只耗電量,當然耗電量可以作為一個非常直覺的證據。例如百度用於訓練推理文心一言的陽泉超算中心,每小時耗電64000kW·h(度),以0.45元/kW·h的商業用電標準,一年電費就達到2.5億。
而更大的成本則是來自算力投入。
以ChatGPT為例,不考慮與日活高度相關推理過程所需的算力,只考慮訓練過程,根據測算,1750億參數的GPT-3訓練一次大約需要6000張英偉達A100顯卡,如果考慮互聯損失,大約需要上萬張A100。
以單張A100晶片10萬計算,大規模訓練就需要投入約10億,一般廠商根本承擔不起。而GPT-4的模型參數較大,訓練的識別符較多,所需算力較為可觀。
並且,隨著更多AIGC大模型的發布,其所需算力直線狂飆。
根據OpenAI測算,自2012年至2018年,用於訓練AI所需的算力大約每隔3-4個月翻倍,總共增長了30萬倍(而摩爾定律在相同時間只有7倍的成長), 每年頭部訓練模型所需算力成長幅度高達10倍,整體呈現指數級上升。
這個時候就體現出雲端算力的優勢了,總結下來可以歸結為8個字:化整為零,按需付費。
雲算力能讓AIGC大模型廠商無需購買英偉達A100顯卡等硬件,而直接按需租用雲算力平台提供的算力,這使得初創企業或非頭部模型廠商也能嘗試進入AIGC領域。
甚至這種「化整為零」的方式,對產業鏈各方都有好處:
1)對上游算力生產商而言,在算力硬體進入淡季、庫存趨增時,能透過販賣雲算力的方式,平滑收入的波動,並為旺季儲備「有生」力量,及時滿足回彈的市場需求;
2)對中游雲服務廠商而言,則有助於增加客流;
3) 對下游算力需求方而言,能最大化降低使用算力的門檻,驅動全民AIGC 時代降臨。
如果AIGC大模型廠商願意讓渡更多資源,還可以更深入地與雲端平台合作。這方面的典型案例是微軟雲端與OpenAI的合作,兩者的合作並沒有停留在算力租用上,而深入了股權與產品的整合。
另外,在大模型競賽中,除了顯性的硬體投入成本,還有一個隱形的時間成本。
一般而言,大模型對於算力的需求分為兩個階段,一是訓練出類ChatGPT大模型的過程;二是將這個模型商業化的推理過程。
而且這個過程越持續大模型就越好。所以現在再來看英偉達DGX雲,就不難搞懂老黃做了一件什麼事。
用雲端的方式把用於AI訓練的GPU價格打下來,算力平權籠絡中小公司,再基於大模型訓練的持續性因素綁定客戶,「矽谷刀王」一舉兩得。
受益的未必是英偉達
從去年12月開始,英偉達A100的價格5個月累計漲幅達到37.5%,同期A800價格累計漲幅也達到了20.0%。
GPU價格暴漲無疑增加了AIGC訓練大模型的門檻,但對於頭部廠商而言,漲多少價GPU都是要買的。但對腰部公司來說,不漲價可能咬咬牙還能下單,一漲價就只能望GPU興嘆了,王慧文創業拿到的5000萬美金融資,可能連訓練所需的顯卡都買不全。
所以,老黃在這個時候拿出DGX雲,就像開了一家豪車租賃公司,讓買不起的人也能租用。
當然,這背後英偉達的另一層考量,即搶在競爭對手前面,綁定更多的中小客戶。
本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是AI繪圖應用,最近與QQ頻道合作開啟了國內業務,後者的創辦人則是出自OpenAI,其對話機器人Claude直接對標ChatGPT。
這兩家公司有一個相同點,就是都沒有購買英偉達GPU搭建超算,而是使用Google的算力服務。
此服務由一個整合4096塊TPU v4的超算系統提供,重點在於Google自研。
另外一家搞自研晶片的巨頭是本輪AI浪潮的領導者微軟,傳聞這款名叫Athena的晶片採用5nm先進製程,由台積電代工,研發團隊人數已經接近300人。
很明顯,這款晶片目標就是取代昂貴的A100/H100,給OpenAI提供算力引擎,並最終一定會透過微軟的Azure雲端服務來搶奪英偉達的蛋糕。
除了雲端運算公司的背刺,英偉達的大客戶特斯拉也要自己單幹。
2021年8月,馬斯克就向外界展示了用3000塊自家D1晶片搭建的超算Dojo ExaPOD。其中D1晶片由台積電代工,採用7nm工藝,3000塊D1晶片直接讓Dojo成為全球第五大算力規模的計算機。
相較之下,受禁令影響的國內公司雖也有替代計劃,但短期內仍嚴重依賴英偉達。
國產晶片可以做對資訊顆粒度要求沒有那麼高的雲端推理工作,但大多目前無法處理超高算力需求的雲端訓練。
燧原科技、壁仞科技、天數智芯、寒武紀等公司都推出了自己的雲端產品,且理論性能指標不弱。
据此前曝光的信息,百度用于训练推理文心一言的阳泉超算中心,除了A100还用了一些国产化的产品,比如百度自研的昆仑芯和寒武纪的思元590,其中有消息显示2023年采购计划思元大概占10%-20%。
其中,文心一言的芯片层核心能力来自昆仑芯2代AI芯片,其采用自研XPU-R架构、7nm工艺和GDDR6高速显存,通用性和性能显著提升;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提升2-3倍。
今年3月,李彦宏也在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。
尾声
从RIVA128开始,英伟达就展示了自己惊人的市场观察能力。过去的十几年里,从加密货币挖矿到元宇宙,再到AI潮,英伟达顺势将显卡的客户从游戏玩家拓展到了科技巨头。
伴随着战火蔓延,英伟达市值也一路高歌,从一个二线芯片公司变成了全行业的No.1。只是,黄仁勋说AI的iPhone时刻已到来,那么诺基亚都被苹果打败,英伟达又怎能是无敌的呢。
参考资料
[1] AIGC的看多期权:AI云算力,国盛证券
[2] Web3 视角下的AIGC 算力进化论,国盛证券
[3] 英伟达帝国的一道裂缝,远川研究所
[4] 云算力挖矿可能是现在入场比特币最稳的路,Odaily星球日报
[5] 百度“文心一言”专家解读,独角兽智库
[6] 大模型时代,国产GPU加速「狂飙」,数字时氪
[7] 英伟达黄仁勋:将通过中国云服务商提供AI超算能力,AI的iPhone时刻到来! 第一财经
[8] AI算力产业链梳理:技术迭代推动瓶颈突破,AIgc场景增多驱动算力需求提升,安信证券
以上是雲算力之外,一場始於AI的秘密戰爭的詳細內容。更多資訊請關注PHP中文網其他相關文章!

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版
中文版,非常好用

WebStorm Mac版
好用的JavaScript開發工具