搜尋
首頁科技週邊人工智慧雲算力之外,一場始於AI的秘密戰爭

雲算力之外,一場始於AI的秘密戰爭

May 30, 2023 pm 06:10 PM
雲端運算、人工智慧、秘密戰爭

雲算力之外,一場始於AI的秘密戰爭

今年3月,面對洶湧而來的AI潮,「矽谷刀王」一改往日本色,主動站到台前,宣布推出DGX雲,把AI專用的GPU放到雲上「出租」 。

以往,出售算力這種事都是雲端運算公司在幹。它們購買多種型號顯示卡與人工智慧加速器,根據硬體性能或使用時長等方式定價,然後租給下游客戶。

這個過程中,英偉達將GPU要麼賣給雲端運算平台,要麼直接出售給AI公司,例如第一台NVIDIA DGX超級電腦就是2016年老黃親自交付給OpenAI的,並沒有直接出售算力,頂多算「賣鏟人」。

而DGX上雲這個事,雖然英偉達仍需要將其託管到雲端平台,但本質上已經是跨越邊界了。

一向屈居幕後的英偉達,這次為何要走向台前?

本輪AI潮英偉達毫無疑問是最大的受益者,甚至可以沒有之一。

用於訓練AI的GPU晶片價格瘋長,海外A100和H100的每片價格分別漲到了1.5萬美元和4萬美元,國內一台配置8顆A100和80G儲存空間的AI伺服器,價格也從去年中旬的8萬/台飆升至目前的165萬/台。

但這些錢並沒有都流入英偉達的口袋,溢價都被渠道拿走了,關鍵是這種倒買倒賣英偉達還一點辦法沒有。

DGX雲就在這種情況下應運而生,關鍵價格看似還很便宜。配備8個H100 GPU模組的DGX雲,每月套餐費只要3.7萬美元,相當於單片H100的價格。

雲算力之外,一場始於AI的秘密戰爭

對於急需算力資金又捉襟見肘的AI公司來說,DGX雲無疑是渴睡時天降的一個枕頭;對英偉達而言,出售雲算力既能賺錢又綁定了客戶。

而看似雙贏的背後,卻隱藏著一場始於AI的秘密戰爭。

算力平權

#從產業特徵來看,今天基於雲端算力的AIGC和曾經的加密資產挖礦極為相似,但所需的資源遠高於後者。

國盛證券曾在《Web3 視角下的AIGC算力進化論》中,比較了加密資產挖礦和AIGC產業的異同點:

1 AIGC產業耗電量大約會在1.6-7.5年間超過當前比特幣挖礦產業耗電量,主要驅動因素是GPT類大語言模型在模型參數、日活和模型數量上的高速增長;

2 和比特幣挖礦類似,AIGC產業由算力驅動的內容處於高強度競爭中,參與者只有持續、快速生產出高品質內容,才能保證自己獲取到的用戶注意力不會下降。

這就導致AIGC產業的兩大特徵:高成本和持續性。

其中,成本側不只耗電量,當然耗電量可以作為一個非常直覺的證據。例如百度用於訓練推理文心一言的陽泉超算中心,每小時耗電64000kW·h(度),以0.45元/kW·h的商業用電標準,一年電費就達到2.5億。

而更大的成本則是來自算力投入。

以ChatGPT為例,不考慮與日活高度相關推理過程所需的算力,只考慮訓練過程,根據測算,1750億參數的GPT-3訓練一次大約需要6000張英偉達A100顯卡,如果考慮互聯損失,大約需要上萬張A100。

雲算力之外,一場始於AI的秘密戰爭

以單張A100晶片10萬計算,大規模訓練就需要投入約10億,一般廠商根本承擔不起。而GPT-4的模型參數較大,訓練的識別符較多,所需算力較為可觀。

並且,隨著更多AIGC大模型的發布,其所需算力直線狂飆。

根據OpenAI測算,自2012年至2018年,用於訓練AI所需的算力大約每隔3-4個月翻倍,總共增長了30萬倍(而摩爾定律在相同時間只有7倍的成長), 每年頭部訓練模型所需算力成長幅度高達10倍,整體呈現指數級上升。

雲算力之外,一場始於AI的秘密戰爭

這個時候就體現出雲端算力的優勢了,總結下來可以歸結為8個字:化整為零,按需付費。

雲算力能讓AIGC大模型廠商無需購買英偉達A100顯卡等硬件,而直接按需租用雲算力平台提供的算力,這使得初創企業或非頭部模型廠商也能嘗試進入AIGC領域。

甚至這種「化整為零」的方式,對產業鏈各方都有好處:

1)對上游算力生產商而言,在算力硬體進入淡季、庫存趨增時,能透過販賣雲算力的方式,平滑收入的波動,並為旺季儲備「有生」力量,及時滿足回彈的市場需求;

2)對中游雲服務廠商而言,則有助於增加客流;

3) 對下游算力需求方而言,能最大化降低使用算力的門檻,驅動全民AIGC 時代降臨。

如果AIGC大模型廠商願意讓渡更多資源,還可以更深入地與雲端平台合作。這方面的典型案例是微軟雲端與OpenAI的合作,兩者的合作並沒有停留在算力租用上,而深入了股權與產品的整合。

另外,在大模型競賽中,除了顯性的硬體投入成本,還有一個隱形的時間成本。

一般而言,大模型對於算力的需求分為兩個階段,一是訓練出類ChatGPT大模型的過程;二是將這個模型商業化的推理過程。

而且這個過程越持續大模型就越好。所以現在再來看英偉達DGX雲,就不難搞懂老黃做了一件什麼事。

用雲端的方式把用於AI訓練的GPU價格打下來,算力平權籠絡中小公司,再基於大模型訓練的持續性因素綁定客戶,「矽谷刀王」一舉兩得。

受益的未必是英偉達

從去年12月開始,英偉達A100的價格5個月累計漲幅達到37.5%,同期A800價格累計漲幅也達到了20.0%。

GPU價格暴漲無疑增加了AIGC訓練大模型的門檻,但對於頭部廠商而言,漲多少價GPU都是要買的。但對腰部公司來說,不漲價可能咬咬牙還能下單,一漲價就只能望GPU興嘆了,王慧文創業拿到的5000萬美金融資,可能連訓練所需的顯卡都買不全。

所以,老黃在這個時候拿出DGX雲,就像開了一家豪車租賃公司,讓買不起的人也能租用。

當然,這背後英偉達的另一層考量,即搶在競爭對手前面,綁定更多的中小客戶。

本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是AI繪圖應用,最近與QQ頻道合作開啟了國內業務,後者的創辦人則是出自OpenAI,其對話機器人Claude直接對標ChatGPT。

這兩家公司有一個相同點,就是都沒有購買英偉達GPU搭建超算,而是使用Google的算力服務。

雲算力之外,一場始於AI的秘密戰爭

此服務由一個整合4096塊TPU v4的超算系統提供,重點在於Google自研。

另外一家搞自研晶片的巨頭是本輪AI浪潮的領導者微軟,傳聞這款名叫Athena的晶片採用5nm先進製程,由台積電代工,研發團隊人數已經接近300人。

很明顯,這款晶片目標就是取代昂貴的A100/H100,給OpenAI提供算力引擎,並最終一定會透過微軟的Azure雲端服務來搶奪英偉達的蛋糕。

除了雲端運算公司的背刺,英偉達的大客戶特斯拉也要自己單幹。

2021年8月,馬斯克就向外界展示了用3000塊自家D1晶片搭建的超算Dojo ExaPOD。其中D1晶片由台積電代工,採用7nm工藝,3000塊D1晶片直接讓Dojo成為全球第五大算力規模的計算機。

相較之下,受禁令影響的國內公司雖也有替代計劃,但短期內仍嚴重依賴英偉達。

國產晶片可以做對資訊顆粒度要求沒有那麼高的雲端推理工作,但大多目前無法處理超高算力需求的雲端訓練。

燧原科技、壁仞科技、天數智芯、寒武紀等公司都推出了自己的雲端產品,且理論性能指標不弱。

据此前曝光的信息,百度用于训练推理文心一言的阳泉超算中心,除了A100还用了一些国产化的产品,比如百度自研的昆仑芯和寒武纪的思元590,其中有消息显示2023年采购计划思元大概占10%-20%。

雲算力之外,一場始於AI的秘密戰爭

其中,文心一言的芯片层核心能力来自昆仑芯2代AI芯片,其采用自研XPU-R架构、7nm工艺和GDDR6高速显存,通用性和性能显著提升;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提升2-3倍。

今年3月,李彦宏也在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。

尾声

从RIVA128开始,英伟达就展示了自己惊人的市场观察能力。过去的十几年里,从加密货币挖矿到元宇宙,再到AI潮,英伟达顺势将显卡的客户从游戏玩家拓展到了科技巨头。

伴随着战火蔓延,英伟达市值也一路高歌,从一个二线芯片公司变成了全行业的No.1。只是,黄仁勋说AI的iPhone时刻已到来,那么诺基亚都被苹果打败,英伟达又怎能是无敌的呢。

参考资料

[1] AIGC的看多期权:AI云算力,国盛证券

[2] Web3 视角下的AIGC 算力进化论,国盛证券

[3] 英伟达帝国的一道裂缝,远川研究所

[4] 云算力挖矿可能是现在入场比特币最稳的路,Odaily星球日报

[5] 百度“文心一言”专家解读,独角兽智库

[6] 大模型时代,国产GPU加速「狂飙」,数字时氪

[7] 英伟达黄仁勋:将通过中国云服务商提供AI超算能力,AI的iPhone时刻到来! 第一财经

[8] AI算力产业链梳理:技术迭代推动瓶颈突破,AIgc场景增多驱动算力需求提升,安信证券

以上是雲算力之外,一場始於AI的秘密戰爭的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
一個提示可以繞過每個主要LLM的保障措施一個提示可以繞過每個主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

5個錯誤,大多數企業今年將犯有可持續性5個錯誤,大多數企業今年將犯有可持續性Apr 25, 2025 am 11:15 AM

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響Apr 25, 2025 am 11:12 AM

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

如果Openai購買Chrome,AI可能會統治瀏覽器戰爭如果Openai購買Chrome,AI可能會統治瀏覽器戰爭Apr 25, 2025 am 11:11 AM

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

AI如何解決零售媒體的痛苦AI如何解決零售媒體的痛苦Apr 25, 2025 am 11:10 AM

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

'AI是我們,比我們更多''AI是我們,比我們更多'Apr 25, 2025 am 11:09 AM

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud在下一個2025年對基礎架構變得更加認真Google Cloud在下一個2025年對基礎架構變得更加認真Apr 25, 2025 am 11:08 AM

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。Apr 25, 2025 am 11:07 AM

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具