英偉達的GPU為什麼昂貴?
作者:江月
##編輯:陶力 盧陶然
圖源:圖蟲
"CPU擴張的時代已經過去了"是英偉達創始人兼CEO黃仁勳在5月29日台北國際電腦展上宣布的話。 「整場持續了2小時的演講中,他圍繞著生成式AI帶來的“觸發點”,將英偉達近期的硬體、軟體、系統新品進行了一番兜底式介紹。
黃仁勳稱,GPU塑造的「新電腦」到來了。由英偉達打造的新型“電腦”,型態已經不同以往,它的單台售價高達20萬美元。在「昂貴」的爭議之中,黃仁勳又稱,GPU是每個電力預算有限的公司之不二選擇,也是最「省錢」的基礎建設選擇。
黃仁勳近期在公開演講中稱,面對AI時代,人們需要「奔跑、而不是慢慢地走」。在生成式AI的花園裡,英偉達顯然正在奮力挖掘中。
解碼GPU資料中心成本
#「大家總是說GPU資料中心很貴,讓我來算給你看。」5月29日,英偉達創辦人兼執行長黃仁勳在台北國際電腦展上,向公眾具體地介紹了GPU資料中心的成本。
英偉達在與供應商和客戶會面時帶來了全新的AI電腦DGX GH200。這是一款整合了256個英偉達最高性能CPU和GPU的超級計算機,能滿足「超大大模型」的訓練需求。
DGX GH200使用英偉達NVLink-C2C互連技術,將基於Arm的Grace架構CPU和Hopper架構GPU進行架構互聯,實現了高達900GB/s的總頻寬,比傳統加速系統中的標準PCIe Gen5通道高出7倍,此算力能夠滿足眼下要求最苛刻的生成式AI和HPC應用。
圖為英偉達於5月29日公佈的GH200 Grace Hopper超級晶片
英偉達公司供圖
隨著市場對資料中心基礎建設需求的成長,英偉達眼下也需要向市場施展一些「銷售手段」。最迫切的需求,就是化解人們對其設備「昂貴」的恐懼。
簡單來說,「使用GPU資料中心,你可以獲得150倍的效能,並省下2/3的成本。」黃仁勳稱。
黃仁勳介紹,以同樣的1000萬美元預算為例,AIGC開發人員可以搭建一個由960個CPU伺服器組成的資料中心,這足以訓練1個大語言模型,最終的營運消耗是11千兆瓦時電力(GWh,相當於1100萬度電)。
但若換做GPU,則可搭建一個由48個GPU伺服器組成的資料中心,不過這個資料中心可以訓練44個大語言模型,總共消耗3.2千兆瓦時(相當於320萬度電) 。
按照上面的計算方法,以單片價格計算,一片GPU晶片的價格是一片CPU的20倍,似乎「更貴」。 不過,如果依照資料中心TCO成本計算法,則GPU資料中心更「省錢」。
黃仁勳甚至直接在演示PPT中列出了一個公式:資料中心持有成本=f{硬體成本(晶片、系統、硬體生態系統),吞吐量(GPU、AIgo軟體、網路、系統軟體、軟體生態系統),使用率(AIgo Lib、軟體生態系統),採購運營,生命週期優化,算力},從而解釋了資料中心的TCO成本問題。
「為什麼這非常重要?因為現實生活中大多數企業都有電力限制。」黃仁勳再次強調。在投入AIGC之時,考慮到這一客觀因素,企業必須選擇更有效率、低功耗的資料中心產品。
為何GPU在資料中心的效能如此強大?黃仁勳介紹,這主要歸功於三大功能:光線追蹤(模擬光的特性)、以張量計算為核心的人工智慧和全新的演算法。
自 2017 年起,英偉達開始在 GPU 上同時實現這三個功能,並且其使用 GPU 生成圖片的效果首次引起市場的驚艷。當時,使用CPU伺服器「無中生有」一張圖片需要花費數個小時(這個過程用專業說法叫做「渲染」),但英偉達使用GPU只花了15秒。
然而,新型GPU電腦所謂的「便宜」並不是針對消費級市場而言的。目前,個人電腦市場上的CPU為核心的PC、筆記型電腦等因其價格更為實惠,無法被取代。
黃仁勳在演講中展示了一台由8個H100晶片構成的全新GPU電腦。 「它是全球最昂貴的電腦。」黃仁勳說。
這台新型電腦重達65磅(約29.5公斤),必須藉助機器人才能達到平穩、精確的安裝。 「這台電腦售價20萬美元。」黃仁勳說。
啟動AIGC產業變革
#這是一種重寫方式:英偉達攻占AIGC龍頭地位的第一步是透過使用硬體淘汰「CPU時代」。眼下,英偉達已經在軟體生態圈中進行精心佈局,除了將CUDA計算模型推廣給400萬名軟體開發者以外,還推出了遊戲AI模型代工服務,並深入到製造業中支援虛擬工廠、機器人仿真技術和自動化檢測。
「為什麼這麼多年來,人們無法創造一種新的運算方法?」黃仁勳談到CPU時代時說。他指出,這是因為硬體與軟體、消費市場與開發商供應者之間存在著「雞生蛋、蛋生雞」的關係,導致互相牽制,令基於CPU的計算方法得以持續甚久。
因此,為了打破「CPU時代」的桎梏,英偉達除了大力設計晶片硬件,也十分關注搭建軟體生態環境。 CUDA計算模型就是英偉達為這個長遠佈局落下的一枚關鍵棋子。
目前已有超過3000個應用程式和400萬開發者使用英偉達Cuda計算模型。光是去年,Cuda的下載量就達到了2500萬次,總下載量已經達到了4000萬次。 」黃仁勳說。他指出,在擁有如此龐大規模的軟體基礎上,GPU取代CPU才實現可能。
總結黃仁勳兩個小時的演講內容,可以看到英偉達對AIGC領域的挖掘,涵蓋了核心的超級晶片、到互連技術再到演算法引擎的優化、以及配套軟體的升級。
事實上,AIGC所涉及的文生文、文生圖、2D圖生3D圖等,正在經過多種大模型或應用進行實現,包括英偉達旗下的對話式AI 模型開源框架NeMo、Meta旗下的大模型LLaMa、使用GPT模型的應用ChatGPT、以及文生圖應用Stable Diffusion等。
目前,全球最有影響力的AIGC科技龍頭都在深度使用英偉達所提供的工具,也推動英偉達在美股市場上攀爬“1萬億美元”市值的高峰,很快就要和蘋果、微軟、谷歌、亞馬遜一起處於「萬億俱樂部」。
英偉達這次帶給AIGC產業的工具之多,令市場感到十分吃驚。除了以上的產品,英偉達在大型遊戲創作和數位化工廠的介入,也十分引人注目。
在遊戲創作方面,黃仁勳展示了一段遊戲片段。這個片段中,除了現實感的逼真畫面製作外,遊戲玩家和NPC之間的對話也是完全由AIGC產生的。換句話說,以後的遊戲可以“千人千面”,玩家面對的不再是只會吐露模式化回复的NPC。 ACE遊戲開發版是英偉達提供的AI模型代工服務,它可以幫助遊戲開發商輕鬆使用該功能。
英偉達又介紹,現在一些領先的電子製造商已經使用英偉達的AIGC和元宇宙平台omniverse實現工廠的「數位化」。
在製造業,全球約有1000萬家工廠,它們是工業數位化的重點領域。
黃仁勳表示:「工業製造的都是實物,如果能先以數字的方式製造產品,可以節省數十億美元。」
#眼下,在工業領域,英偉達主要打造了Omniverse和生成式AI來幫助工廠進行虛擬工廠的設計,也推出了Isaac Sim模擬和測試機器人、Metropolis光學檢測自動化工具。
據了解,富士康、和碩、廣達等電子設備製造商已經在利用英偉達上述工具加快筆記型電腦、智慧型手機的生產和組裝。
21Tech
南財集團特色專欄
往期推薦
#從工業互聯網到AIGC:智慧製造如何躍遷?
05-30
榮耀CEO趙明:按需制定晶片策略 2023年研發佔比維持10%
05-30
手機廠商競逐影像與折疊螢幕 華為詳解技術密碼
05-29
英偉達呼籲「以跑代走」做AI,發力超級運算、淘汰CPU時代
05-29
以上是生成式AI的花園裡 英偉達如何做“挖掘工”的詳細內容。更多資訊請關注PHP中文網其他相關文章!