商湯科技於2022年1月24日在上海自貿區臨港新片區啟動了人工智慧運算中心AIDC的營運。當時這家人工智慧公司未必能精準預測,2022年即成為了所謂的AIGC(AI Generated Content)元年。
「今天,我們的臨港AIDC已經有接近3萬塊的GPU(圖形處理器),我們目前的算力已經達到5000 PetaFLOPS(1 PetaFLOPS等於每秒1千萬億次浮點運算),在這之上我們相信未來可以有更好的開發者效率,並且都能夠支援更多千億規模的大模型算力訓練。」在6月2日的「AI引領時代,算力驅動未來」— —臨港新片區智算大會上,商湯科技董事長兼CEO 徐立如是表示。
商湯方面告訴澎湃新聞(www.thepaper.cn)記者,仍有許多需求排隊等待處理。而在商湯科技聯合創始人、大裝置事業群總裁楊帆看來,人工智慧對於更大數據、更大規模、更大算力的追求並不是“始於今天”,“整個人工智慧技術迭代、進步的歷史,我們可以把它看成是一個對於'暴力美學'的追求,以及算法、算力、數據三要素由量變產生質變的一個技術迭代的過程。”
聚焦前沿產業的臨港新片區對這種新的熱潮迅速做出了回應。 6月2日當天,臨港新片區黨工委副書記吳曉華在上述大會上發布了《臨港新片區加速建構算力產業生態行動方案》。該《方案》的藍圖之下,至2025年,臨港將成為具有全國影響力的算力產業集聚區,含相關硬體、軟體、應用、服務等的算力產業整體規模將突破100億元。
臨港新片區黨工委副書記吳曉華發布《臨港新片區加速建構算力產業生態行動方案》。
「我們看到AI大爆發的時代已經來臨了,AI進入到我們生產和生活的各個領域,那麼隨著AI應用的大爆發,它其實也驅動了算力需求的大爆發。」對於上述《方案》的出台,臨港新片區管委會高科處處長陸瑜對澎湃新聞(www.thepaper.cn)在內的媒體表示,臨港前期已具備了很好的優勢,「就是我們的算力資源非常豐富。 ”
更重要的是,在人工智慧公司選擇是否落地臨港時,算力資源已成為尤為重要的決策因素。
算力是新時代的能源,而成功又不只在於「暴力美學」
#何謂算力?徐立認為,算力其實是整個模型能力的表達,「算力等於演算法或是說大模型的參數,去乘上它所處理的資料量。大模型時代參數越大,乘上的資料量越大,所需的算力就越大。」算力已然成為新時代的能源,「某種程度上,算力決定了市場的競爭力。」
楊帆也談到,從去年到今年整個人工智慧領域非常火紅的一個概念叫內容生成,同時大家都熟悉了一個名詞即大模型。簡單來看,這是一種“暴力美學”,例如,GPT-3模型使用了超過1750億個參數,需要高性能的處理器來支援訓練,使用V100訓練耗卡量為10000張卡訓練14.8天,整體算力需求約625 PetaFLOPS。
楊帆認為,這種「暴力美學」也可以理解為量變產生質變,「其實人工智慧從它誕生的第一天起到今天,一直都在追求透過規模化帶來更強的智慧化。 」他提到,實際上就人工智慧領域來說,在過去的5-6年時間裡,業界最頂級的人工智慧模型對算力的消耗量,「每4-6個月就要翻一番,也就是說過去的這幾年時間翻了近30萬倍。」
當然,「暴力」和「智慧」並不是完全成正比,「擁有更大的資源、更大的規模,它只是一個必要而非充分的條件。」楊帆強調,真正在「暴力美學「背後支撐著產生重大的技術創新和成果的,恰恰又是在於對每一個環節的持續性的優化和改進。
以數據為例,「GPT-4所用的數據其實只是OpenAI收集到的所有數據的1%,因為他發現當把更多的數據去灌給機器人的時候,有可能反而不那麼聰明,應該把更有效、更有價值的數據提供給這個演算法,然後才能去創造出一個更聰明的大腦。」
其認為,至少在今天,數據的有效性遠比數據的總量更加重要。而如何定義有效的數據,「這其實就需要數據科學家大量的努力,OpenAI其實讓他們最優秀的科學家去做數據了,並非大家覺得的去搞演算法了。」
這種每個環節的最佳化同樣包括算力,在英偉達缺貨的情況下,為什麼沒人在用國產晶片做商業化的大規模訓練?為什麼最新這波浪潮到來後,第一時間錢都被英偉達賺走了?這些問句背後的解釋是,「並不是我們把算力量堆到一個數值就能夠產生最終的價值,1000張卡100台伺服器放在一起跑同一個任務,這中間還需要大量的配套軟體、通信網絡,它是一系列軟硬體聯合調優的過程,這樣的工作積累我們過去沒有做,我們今天就需要去補課。 ”
順勢而為,臨港加速形成多元算力供給體系
根據吳曉華介紹,臨港新片區算力產業已在上游軟硬體、中游的資料中心、調度平台,下游應用進行了相應佈局,目前臨港總算力超過3EFLOPS(FP32,1 EFLOPS等於每秒1百億億次浮點運算),其中智慧算力佔近80%,總算力規模約佔上海市近20%。
前述《方案》提出,目標到2025年,新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32), AI算力佔比達80%,算力產業整體規模(含相關硬體、軟體、應用、服務等)突破100億元,建成公共算力服務平台,規範算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,打造一批算力示範應用標竿場景。
「智能算力也就是當下最火熱的AI企業所需要的,我們也發現,AI企業落地到臨港來,他們不再是僅僅關注給他他多少政策支持,給他多少補貼,他會專注於落地在這邊,能不能解決他的算力需求,因為現在市場上算力是非常緊缺的。」陸瑜提到了這個顯著變化。
商湯方面說,截至今年5月,商湯大裝置已為40多個核心客戶提供服務。 「特別是在大模型的浪潮之下,我們現在支撐了10家以上的單位機構在臨港的智慧運算中心中去訓練他們的大模型。」楊帆也提及。
成立於2018年的深勢科技是算力需求方之一。該公司核心團隊由中國科學院院士鄂維南等人領銜,是「AI Science」科學研究範式的先驅者,其首創的「多尺度建模機器學習高效能運算」範式,突破性地實現了多尺度分子模擬中精度與效率的統一。
據澎湃新聞(www.thepaper.cn)記者先前報道,深勢科技已推出Lebesgue科學計算平台、Hermite藥物設計平台以及Bohrium微觀計算與設計平台等。例如在醫藥領域,深勢科技與多家客戶攜手,將物理建模AI的計算範式與臨床前藥物研發更廣泛的結合,透過Hermite Uni-FEP、Uni-Fold、RiD等模組,將自由能微擾理論、分子動力學、增強採樣演算法與高效能運算結合,精準預測蛋白質結構及構象變化,並以化學精度高效評估蛋白與配體的結合自由能,為藥物研發人員提供高效精準的理論指導,提升藥物設計與優化效率。
去年12月29日,總部位於北京的深勢科技在臨港註冊成立了深度勢能生物科技(上海)有限公司。深勢科技政企事務副總裁劉會師在接受澎湃新聞(www.thepaper.cn)記者採訪時表示,公司在臨港佈局新一代分子模擬演算法研發中心和AI輔助藥物設計業務中心,主要也是因為看到臨港正在大力發展算力,「我們在訓練模型過程中,對算力是有需求的,另外臨港尤其是要大力發展國產化算力,我們也想為這方面添磚加瓦。」
我們主要在臨港進行藥物研發業務的佈局,包括自有藥品管線的研發工作。 」劉會師提到,深勢科技的業務和臨港甚至上海的人工智慧、生物醫藥這樣的先導產業有正相關的直接合作關係,「我們願意把我們的研發以及產品納入到臨港的大的生態圈裡來。 ”
上述《方案》同時提及,臨港新片區也制定了一系列保障措施,包括加強人才保障、完善支持政策、推動開放合作等。根據陸瑜介紹,如果AI企業到臨港來,將優先提供臨港的智能算力,同時透過發放算力券等形式,讓企業優惠使用算力,「甚至對重點的AI企業,政府對它的算力成本直接可以給予不超過30%的補貼,這些政策我們都會出來。」
在這次大會上,中國電信臨港公共智算服務平台和國產GPU聯合創新基地也正式推出,值得注意。中國電信成立臨港算力(上海)科技有限公司,將開展臨港算力園區建設,並將分批次投放4萬個適用於智算、超算的高功率機架。
上海市經濟與資訊化委員會副主任湯文侃當天表示,目前,以「網路為基礎、數據為核心、算力為關鍵、安全為底線」的新一代資訊基礎設施已成為建立現代化產業的重要基礎支撐。上海已提出建構「2 (3 6) (4 5)」的現代化產業架構,這對以算力為代表的新型資訊基礎設施建設提出了更高需求。
而就在5月16日,上海市經濟與資訊化委員會公佈了透過《上海市資料中心建設導則》符合性評估的資料中心項目名單,共支持了16個項目,其中位於臨港的項目有2個。 「截至目前,我委共支持新片區包括,商湯AIDC、有孚網路、資訊飛魚等8個項目,合計2.8萬個6kW標準機櫃,佔全市已批機櫃數量近1/5。」
湯文侃建議充分利用港口的算力資源,建立公共算力服務。 「目前,臨港的商湯AIDC已經接入了公共算力服務平台。在此也希望今天參加的各單位,特別是電信運營商,結合臨港的網絡特點,積極在臨港建設極速算力承載網,協助實現網路無所不達、算力無所不在、智能無所不及,推動算力成為與水電一樣的公共服務。」
成立智算產業聯盟,商湯當產業鏈鍊主
#臨港的目標是創造一個上中下游一體化的算力產業聯盟,該聯盟能夠以協同式、體系化的方式滿足當前和未來的需求,利用現有優勢實現發展。
陸瑜將臨港的算力供給視作整條產業鏈的“中間一段”,一端為落地到臨港的AI企業提供算力保障,另一端則涉及到對算力來說極為關鍵的“晶片、軟體、系統”,“我們希望有了需求端,也有了這樣一個平台端,那麼我們把計算的晶片企業、軟體企業、系統企業集聚在這裡,讓他們深度地參與到這樣一個系統的建設過程當中。 ”
楊帆也強調,「今天看到的大模型所有的成績的發展,它既是暴力出奇蹟,透過人工智慧三要素的持續規模上升帶來的技術價值的提升,同時也是基礎的研發能力和系統的工程化能力之間的深度結合,演算法最佳化、資料的整理與選取、平台性算力的最佳化提供,這三者往往是互相連通的,很難把它變成割裂的環節獨自去做。 ”
他表示,智能算力產業鏈的重要價值在於,「只有鏈上有更多的企業,大家去促進彼此的交流思考,更深度地去進行一些合作,才能夠在這樣新的關鍵性的重大科技浪潮中,去做到更好的技術進步與支援。 」
在大會現場,新片區智算產業聯盟正式成立,並任命聯通為聯盟首任輪值理事長單位。據悉,未來聯通將在新片區成立長三角創新研究院,進一步協助新片區智算產業發展。
新片區智算產業聯盟成員代表由智算算力、基本算力和超算算力中心等算力提供企業,GPU、FPGA、ASIC等算力晶片企業,以及大模型、AI for science等算力需求企業,共25家企業,以及中國信通院華東分院、西安電子科技大學、電子科技大學共計3所大學與科學研究院所共同組成,後續將進行資源共享、技術交流及專案合作。商湯科技則被授予「新片區智算產業鏈鍊主」。
GPU晶片廠商沐曦當天即表示,分別滿足AI推理運算、AI訓練/通用運算、高效能渲染功能的三類GPU產品,應用於AI推理、AI訓練、資料中心、元宇宙、雲端遊戲等領域,將賦能各領域轉型發展。
湯文侃也對臨港新片區此次智算產業聯盟的成立寄予厚望,「依托商湯科技這樣的鍊主企業,結合自身優勢,探索產業鏈上下游全要素協同,形成數位經濟新的爆發點。 ”
12家企業在當天的大會上共同簽署了新片區智慧運算產業上下游企業協同採購協議。陸瑜提到,新片區也將推出協同採購正面清單,「如果企業在建設國產化算力平台的過程當中,購買國產GPU等上游產品,我們就會給予補貼,這樣也是鼓勵上下游企業去更好地合作。」
以上是特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當“鏈主”的詳細內容。更多資訊請關注PHP中文網其他相關文章!