搜尋
首頁科技週邊人工智慧特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當'鏈主”

商湯科技於2022年1月24日在上海自貿區臨港新片區啟動了人工智慧運算中心AIDC的營運。當時這家人工智慧公司未必能精準預測,2022年即成為了所謂的AIGC(AI Generated Content)元年。

「今天,我們的臨港AIDC已經有接近3萬塊的GPU(圖形處理器),我們目前的算力已經達到5000 PetaFLOPS(1 PetaFLOPS等於每秒1千萬億次浮點運算),在這之上我們相信未來可以有更好的開發者效率,並且都能夠支援更多千億規模的大模型算力訓練。」在6月2日的「AI引領時代,算力驅動未來」— —臨港新片區智算大會上,商湯科技董事長兼CEO 徐立如是表示。

商湯方面告訴澎湃新聞(www.thepaper.cn)記者,仍有許多需求排隊等待處理。而在商湯科技聯合創始人、大裝置事業群總裁楊帆看來,人工智慧對於更大數據、更大規模、更大算力的追求並不是“始於今天”,“整個人工智慧技術迭代、進步的歷史,我們可以把它看成是一個對於'暴力美學'的追求,以及算法、算力、數據三要素由量變產生質變的一個技術迭代的過程。”

聚焦前沿產業的臨港新片區對這種新的熱潮迅速做出了回應。 6月2日當天,臨港新片區黨工委副書記吳曉華在上述大會上發布了《臨港新片區加速建構算力產業生態行動方案》。該《方案》的藍圖之下,至2025年,臨港將成為具有全國影響力的算力產業集聚區,含相關硬體、軟體、應用、服務等的算力產業整體規模將突破100億元。

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

臨港新片區黨工委副書記吳曉華發布《臨港新片區加速建構算力產業生態行動方案》。

「我們看到AI大爆發的時代已經來臨了,AI進入到我們生產和生活的各個領域,那麼隨著AI應用的大爆發,它其實也驅動了算力需求的大爆發。」對於上述《方案》的出台,臨港新片區管委會高科處處長陸瑜對澎湃新聞(www.thepaper.cn)在內的媒體表示,臨港前期已具備了很好的優勢,「就是我們的算力資源非常豐富。 ”

更重要的是,在人工智慧公司選擇是否落地臨港時,算力資源已成為尤為重要的決策因素。

算力是新時代的能源,而成功又不只在於「暴力美學」

#何謂算力?徐立認為,算力其實是整個模型能力的表達,「算力等於演算法或是說大模型的參數,去乘上它所處理的資料量。大模型時代參數越大,乘上的資料量越大,所需的算力就越大。」算力已然成為新時代的能源,「某種程度上,算力決定了市場的競爭力。」

楊帆也談到,從去年到今年整個人工智慧領域非常火紅的一個概念叫內容生成,同時大家都熟悉了一個名詞即大模型。簡單來看,這是一種“暴力美學”,例如,GPT-3模型使用了超過1750億個參數,需要高性能的處理器來支援訓練,使用V100訓練耗卡量為10000張卡訓練14.8天,整體算力需求約625 PetaFLOPS。

楊帆認為,這種「暴力美學」也可以理解為量變產生質變,「其實人工智慧從它誕生的第一天起到今天,一直都在追求透過規模化帶來更強的智慧化。 」他提到,實際上就人工智慧領域來說,在過去的5-6年時間裡,業界最頂級的人工智慧模型對算力的消耗量,「每4-6個月就要翻一番,也就是說過去的這幾年時間翻了近30萬倍。」

當然,「暴力」和「智慧」並不是完全成正比,「擁有更大的資源、更大的規模,它只是一個必要而非充分的條件。」楊帆強調,真正在「暴力美學「背後支撐著產生重大的技術創新和成果的,恰恰又是在於對每一個環節的持續性的優化和改進。

以數據為例,「GPT-4所用的數據其實只是OpenAI收集到的所有數據的1%,因為他發現當把更多的數據去灌給機器人的時候,有可能反而不那麼聰明,應該把更有效、更有價值的數據提供給這個演算法,然後才能去創造出一個更聰明的大腦。」

其認為,至少在今天,數據的有效性遠比數據的總量更加重要。而如何定義有效的數據,「這其實就需要數據科學家大量的努力,OpenAI其實讓他們最優秀的科學家去做數據了,並非大家覺得的去搞演算法了。」

這種每個環節的最佳化同樣包括算力,在英偉達缺貨的情況下,為什麼沒人在用國產晶片做商業化的大規模訓練?為什麼最新這波浪潮到來後,第一時間錢都被英偉達賺走了?這些問句背後的解釋是,「並不是我們把算力量堆到一個數值就能夠產生最終的價值,1000張卡100台伺服器放在一起跑同一個任務,這中間還需要大量的配套軟體、通信網絡,它是一系列軟硬體聯合調優的過程,這樣的工作積累我們過去沒有做,我們今天就需要去補課。 ”

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

順勢而為,臨港加速形成多元算力供給體系

根據吳曉華介紹,臨港新片區算力產業已在上游軟硬體、中游的資料中心、調度平台,下游應用進行了相應佈局,目前臨港總算力超過3EFLOPS(FP32,1 EFLOPS等於每秒1百億億次浮點運算),其中智慧算力佔近80%,總算力規模約佔上海市近20%。

前述《方案》提出,目標到2025年,新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32), AI算力佔比達80%,算力產業整體規模(含相關硬體、軟體、應用、服務等)突破100億元,建成公共算力服務平台,規範算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,打造一批算力示範應用標竿場景。

「智能算力也就是當下最火熱的AI企業所需要的,我們也發現,AI企業落地到臨港來,他們不再是僅僅關注給他他多少政策支持,給他多少補貼,他會專注於落地在這邊,能不能解決他的算力需求,因為現在市場上算力是非常緊缺的。」陸瑜提到了這個顯著變化。

商湯方面說,截至今年5月,商湯大裝置已為40多個核心客戶提供服務。 「特別是在大模型的浪潮之下,我們現在支撐了10家以上的單位機構在臨港的智慧運算中心中去訓練他們的大模型。」楊帆也提及。

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

成立於2018年的深勢科技是算力需求方之一。該公司核心團隊由中國科學院院士鄂維南等人領銜,是「AI Science」科學研究範式的先驅者,其首創的「多尺度建模機器學習高效能運算」範式,突破性地實現了多尺度分子模擬中精度與效率的統一。

據澎湃新聞(www.thepaper.cn)記者先前報道,深勢科技已推出Lebesgue科學計算平台、Hermite藥物設計平台以及Bohrium微觀計算與設計平台等。例如在醫藥領域,深勢科技與多家客戶攜手,將物理建模AI的計算範式與臨床前藥物研發更廣泛的結合,透過Hermite Uni-FEP、Uni-Fold、RiD等模組,將自由能微擾理論、分子動力學、增強採樣演算法與高效能運算結合,精準預測蛋白質結構及構象變化,並以化學精度高效評估蛋白與配體的結合自由能,為藥物研發人員提供高效精準的理論指導,提升藥物設計與優化效率。

去年12月29日,總部位於北京的深勢科技在臨港註冊成立了深度勢能生物科技(上海)有限公司。深勢科技政企事務副總裁劉會師在接受澎湃新聞(www.thepaper.cn)記者採訪時表示,公司在臨港佈局新一代分子模擬演算法研發中心和AI輔助藥物設計業務中心,主要也是因為看到臨港正在大力發展算力,「我們在訓練模型過程中,對算力是有需求的,另外臨港尤其是要大力發展國產化算力,我們也想為這方面添磚加瓦。」

我們主要在臨港進行藥物研發業務的佈局,包括自有藥品管線的研發工作。 」劉會師提到,深勢科技的業務和臨港甚至上海的人工智慧、生物醫藥這樣的先導產業有正相關的直接合作關係,「我們願意把我們的研發以及產品納入到臨港的大的生態圈裡來。 ”

上述《方案》同時提及,臨港新片區也制定了一系列保障措施,包括加強人才保障、完善支持政策、推動開放合作等。根據陸瑜介紹,如果AI企業到臨港來,將優先提供臨港的智能算力,同時透過發放算力券等形式,讓企業優惠使用算力,「甚至對重點的AI企業,政府對它的算力成本直接可以給予不超過30%的補貼,這些政策我們都會出來。」

在這次大會上,中國電信臨港公共智算服務平台和國產GPU聯合創新基地也正式推出,值得注意。中國電信成立臨港算力(上海)科技有限公司,將開展臨港算力園區建設,並將分批次投放4萬個適用於智算、超算的高功率機架。

上海市經濟與資訊化委員會副主任湯文侃當天表示,目前,以「網路為基礎、數據為核心、算力為關鍵、安全為底線」的新一代資訊基礎設施已成為建立現代化產業的重要基礎支撐。上海已提出建構「2 (3 6) (4 5)」的現代化產業架構,這對以算力為代表的新型資訊基礎設施建設提出了更高需求。

而就在5月16日,上海市經濟與資訊化委員會公佈了透過《上海市資料中心建設導則》符合性評估的資料中心項目名單,共支持了16個項目,其中位於臨港的項目有2個。 「截至目前,我委共支持新片區包括,商湯AIDC、有孚網路、資訊飛魚等8個項目,合計2.8萬個6kW標準機櫃,佔全市已批機櫃數量近1/5。」

湯文侃建議充分利用港口的算力資源,建立公共算力服務。 「目前,臨港的商湯AIDC已經接入了公共算力服務平台。在此也希望今天參加的各單位,特別是電信運營商,結合臨港的網絡特點,積極在臨港建設極速算力承載網,協助實現網路無所不達、算力無所不在、智能無所不及,推動算力成為與水電一樣的公共服務。」

成立智算產業聯盟,商湯當產業鏈鍊主

#臨港的目標是創造一個上中下游一體化的算力產業聯盟,該聯盟能夠以協同式、體系化的方式滿足當前和未來的需求,利用現有優勢實現發展。

陸瑜將臨港的算力供給視作整條產業鏈的“中間一段”,一端為落地到臨港的AI企業提供算力保障,另一端則涉及到對算力來說極為關鍵的“晶片、軟體、系統”,“我們希望有了需求端,也有了這樣一個平台端,那麼我們把計算的晶片企業、軟體企業、系統企業集聚在這裡,讓他們深度地參與到這樣一個系統的建設過程當中。 ”

楊帆也強調,「今天看到的大模型所有的成績的發展,它既是暴力出奇蹟,透過人工智慧三要素的持續規模上升帶來的技術價值的提升,同時也是基礎的研發能力和系統的工程化能力之間的深度結合,演算法最佳化、資料的整理與選取、平台性算力的最佳化提供,這三者往往是互相連通的,很難把它變成割裂的環節獨自去做。 ”

他表示,智能算力產業鏈的重要價值在於,「只有鏈上有更多的企業,大家去促進彼此的交流思考,更深度地去進行一些合作,才能夠在這樣新的關鍵性的重大科技浪潮中,去做到更好的技術進步與支援。 」

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

在大會現場,新片區智算產業聯盟正式成立,並任命聯通為聯盟首任輪值理事長單位。據悉,未來聯通將在新片區成立長三角創新研究院,進一步協助新片區智算產業發展。

新片區智算產業聯盟成員代表由智算算力、基本算力和超算算力中心等算力提供企業,GPU、FPGA、ASIC等算力晶片企業,以及大模型、AI for science等算力需求企業,共25家企業,以及中國信通院華東分院、西安電子科技大學、電子科技大學共計3所大學與科學研究院所共同組成,後續將進行資源共享、技術交流及專案合作。商湯科技則被授予「新片區智算產業鏈鍊主」。

GPU晶片廠商沐曦當天即表示,分別滿足AI推理運算、AI訓練/通用運算、高效能渲染功能的三類GPU產品,應用於AI推理、AI訓練、資料中心、元宇宙、雲端遊戲等領域,將賦能各領域轉型發展。

湯文侃也對臨港新片區此次智算產業聯盟的成立寄予厚望,「依托商湯科技這樣的鍊主企業,結合自身優勢,探索產業鏈上下游全要素協同,形成數位經濟新的爆發點。 ”

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

12家企業在當天的大會上共同簽署了新片區智慧運算產業上下游企業協同採購協議。陸瑜提到,新片區也將推出協同採購正面清單,「如果企業在建設國產化算力平台的過程當中,購買國產GPU等上游產品,我們就會給予補貼,這樣也是鼓勵上下游企業去更好地合作。」

以上是特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當'鏈主”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
AI內部部署的隱藏危險:治理差距和災難性風險AI內部部署的隱藏危險:治理差距和災難性風險Apr 28, 2025 am 11:12 AM

Apollo Research的一份新報告顯示,先進的AI系統的不受檢查的內部部署構成了重大風險。 在大型人工智能公司中缺乏監督,普遍存在,允許潛在的災難性結果

構建AI測謊儀構建AI測謊儀Apr 28, 2025 am 11:11 AM

傳統測謊儀已經過時了。依靠腕帶連接的指針,打印出受試者生命體徵和身體反應的測謊儀,在識破謊言方面並不精確。這就是為什麼測謊結果通常不被法庭採納的原因,儘管它曾導致許多無辜者入獄。 相比之下,人工智能是一個強大的數據引擎,其工作原理是全方位觀察。這意味著科學家可以通過多種途徑將人工智能應用於尋求真相的應用中。 一種方法是像測謊儀一樣分析被審問者的生命體徵反應,但採用更詳細、更精確的比較分析。 另一種方法是利用語言標記來分析人們實際所說的話,並運用邏輯和推理。 俗話說,一個謊言會滋生另一個謊言,最終

AI是否已清除航空航天行業的起飛?AI是否已清除航空航天行業的起飛?Apr 28, 2025 am 11:10 AM

航空航天業是創新的先驅,它利用AI應對其最複雜的挑戰。 現代航空的越來越複雜性需要AI的自動化和實時智能功能,以提高安全性,降低操作

觀看北京的春季機器人比賽觀看北京的春季機器人比賽Apr 28, 2025 am 11:09 AM

機器人技術的飛速發展為我們帶來了一個引人入勝的案例研究。 來自Noetix的N2機器人重達40多磅,身高3英尺,據說可以後空翻。 Unitree公司推出的G1機器人重量約為N2的兩倍,身高約4英尺。比賽中還有許多體型更小的類人機器人參賽,甚至還有一款由風扇驅動前進的機器人。 數據解讀 這場半程馬拉松吸引了超過12,000名觀眾,但只有21台類人機器人參賽。儘管政府指出參賽機器人賽前進行了“強化訓練”,但並非所有機器人均完成了全程比賽。 冠軍——由北京類人機器人創新中心研發的Tiangong Ult

鏡子陷阱:人工智能倫理和人類想像力的崩潰鏡子陷阱:人工智能倫理和人類想像力的崩潰Apr 28, 2025 am 11:08 AM

人工智能以目前的形式並不是真正智能的。它擅長模仿和完善現有數據。 我們不是在創造人工智能,而是人工推斷 - 處理信息的機器,而人類則

新的Google洩漏揭示了方便的Google照片功能更新新的Google洩漏揭示了方便的Google照片功能更新Apr 28, 2025 am 11:07 AM

一份報告發現,在谷歌相冊Android版7.26版本的代碼中隱藏了一個更新的界面,每次查看照片時,都會在屏幕底部顯示一行新檢測到的面孔縮略圖。 新的面部縮略圖缺少姓名標籤,所以我懷疑您需要單獨點擊它們才能查看有關每個檢測到的人員的更多信息。就目前而言,此功能除了谷歌相冊已在您的圖像中找到這些人之外,不提供任何其他信息。 此功能尚未上線,因此我們不知道谷歌將如何準確地使用它。谷歌可以使用縮略圖來加快查找所選人員的更多照片的速度,或者可能用於其他目的,例如選擇要編輯的個人。我們拭目以待。 就目前而言

加固芬特的指南 - 分析Vidhya加固芬特的指南 - 分析VidhyaApr 28, 2025 am 09:30 AM

增強者通過教授模型根據人類反饋進行調整來震撼AI的開發。它將監督的學習基金會與基於獎勵的更新融合在一起,使其更安全,更準確,真正地幫助

讓我們跳舞:結構化運動以微調我們的人類神經網讓我們跳舞:結構化運動以微調我們的人類神經網Apr 27, 2025 am 11:09 AM

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。