搜尋
首頁科技週邊人工智慧特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當'鏈主”

商湯科技於2022年1月24日在上海自貿區臨港新片區啟動了人工智慧運算中心AIDC的營運。當時這家人工智慧公司未必能精準預測,2022年即成為了所謂的AIGC(AI Generated Content)元年。

「今天,我們的臨港AIDC已經有接近3萬塊的GPU(圖形處理器),我們目前的算力已經達到5000 PetaFLOPS(1 PetaFLOPS等於每秒1千萬億次浮點運算),在這之上我們相信未來可以有更好的開發者效率,並且都能夠支援更多千億規模的大模型算力訓練。」在6月2日的「AI引領時代,算力驅動未來」— —臨港新片區智算大會上,商湯科技董事長兼CEO 徐立如是表示。

商湯方面告訴澎湃新聞(www.thepaper.cn)記者,仍有許多需求排隊等待處理。而在商湯科技聯合創始人、大裝置事業群總裁楊帆看來,人工智慧對於更大數據、更大規模、更大算力的追求並不是“始於今天”,“整個人工智慧技術迭代、進步的歷史,我們可以把它看成是一個對於'暴力美學'的追求,以及算法、算力、數據三要素由量變產生質變的一個技術迭代的過程。”

聚焦前沿產業的臨港新片區對這種新的熱潮迅速做出了回應。 6月2日當天,臨港新片區黨工委副書記吳曉華在上述大會上發布了《臨港新片區加速建構算力產業生態行動方案》。該《方案》的藍圖之下,至2025年,臨港將成為具有全國影響力的算力產業集聚區,含相關硬體、軟體、應用、服務等的算力產業整體規模將突破100億元。

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

臨港新片區黨工委副書記吳曉華發布《臨港新片區加速建構算力產業生態行動方案》。

「我們看到AI大爆發的時代已經來臨了,AI進入到我們生產和生活的各個領域,那麼隨著AI應用的大爆發,它其實也驅動了算力需求的大爆發。」對於上述《方案》的出台,臨港新片區管委會高科處處長陸瑜對澎湃新聞(www.thepaper.cn)在內的媒體表示,臨港前期已具備了很好的優勢,「就是我們的算力資源非常豐富。 ”

更重要的是,在人工智慧公司選擇是否落地臨港時,算力資源已成為尤為重要的決策因素。

算力是新時代的能源,而成功又不只在於「暴力美學」

#何謂算力?徐立認為,算力其實是整個模型能力的表達,「算力等於演算法或是說大模型的參數,去乘上它所處理的資料量。大模型時代參數越大,乘上的資料量越大,所需的算力就越大。」算力已然成為新時代的能源,「某種程度上,算力決定了市場的競爭力。」

楊帆也談到,從去年到今年整個人工智慧領域非常火紅的一個概念叫內容生成,同時大家都熟悉了一個名詞即大模型。簡單來看,這是一種“暴力美學”,例如,GPT-3模型使用了超過1750億個參數,需要高性能的處理器來支援訓練,使用V100訓練耗卡量為10000張卡訓練14.8天,整體算力需求約625 PetaFLOPS。

楊帆認為,這種「暴力美學」也可以理解為量變產生質變,「其實人工智慧從它誕生的第一天起到今天,一直都在追求透過規模化帶來更強的智慧化。 」他提到,實際上就人工智慧領域來說,在過去的5-6年時間裡,業界最頂級的人工智慧模型對算力的消耗量,「每4-6個月就要翻一番,也就是說過去的這幾年時間翻了近30萬倍。」

當然,「暴力」和「智慧」並不是完全成正比,「擁有更大的資源、更大的規模,它只是一個必要而非充分的條件。」楊帆強調,真正在「暴力美學「背後支撐著產生重大的技術創新和成果的,恰恰又是在於對每一個環節的持續性的優化和改進。

以數據為例,「GPT-4所用的數據其實只是OpenAI收集到的所有數據的1%,因為他發現當把更多的數據去灌給機器人的時候,有可能反而不那麼聰明,應該把更有效、更有價值的數據提供給這個演算法,然後才能去創造出一個更聰明的大腦。」

其認為,至少在今天,數據的有效性遠比數據的總量更加重要。而如何定義有效的數據,「這其實就需要數據科學家大量的努力,OpenAI其實讓他們最優秀的科學家去做數據了,並非大家覺得的去搞演算法了。」

這種每個環節的最佳化同樣包括算力,在英偉達缺貨的情況下,為什麼沒人在用國產晶片做商業化的大規模訓練?為什麼最新這波浪潮到來後,第一時間錢都被英偉達賺走了?這些問句背後的解釋是,「並不是我們把算力量堆到一個數值就能夠產生最終的價值,1000張卡100台伺服器放在一起跑同一個任務,這中間還需要大量的配套軟體、通信網絡,它是一系列軟硬體聯合調優的過程,這樣的工作積累我們過去沒有做,我們今天就需要去補課。 ”

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

順勢而為,臨港加速形成多元算力供給體系

根據吳曉華介紹,臨港新片區算力產業已在上游軟硬體、中游的資料中心、調度平台,下游應用進行了相應佈局,目前臨港總算力超過3EFLOPS(FP32,1 EFLOPS等於每秒1百億億次浮點運算),其中智慧算力佔近80%,總算力規模約佔上海市近20%。

前述《方案》提出,目標到2025年,新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32), AI算力佔比達80%,算力產業整體規模(含相關硬體、軟體、應用、服務等)突破100億元,建成公共算力服務平台,規範算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,打造一批算力示範應用標竿場景。

「智能算力也就是當下最火熱的AI企業所需要的,我們也發現,AI企業落地到臨港來,他們不再是僅僅關注給他他多少政策支持,給他多少補貼,他會專注於落地在這邊,能不能解決他的算力需求,因為現在市場上算力是非常緊缺的。」陸瑜提到了這個顯著變化。

商湯方面說,截至今年5月,商湯大裝置已為40多個核心客戶提供服務。 「特別是在大模型的浪潮之下,我們現在支撐了10家以上的單位機構在臨港的智慧運算中心中去訓練他們的大模型。」楊帆也提及。

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

成立於2018年的深勢科技是算力需求方之一。該公司核心團隊由中國科學院院士鄂維南等人領銜,是「AI Science」科學研究範式的先驅者,其首創的「多尺度建模機器學習高效能運算」範式,突破性地實現了多尺度分子模擬中精度與效率的統一。

據澎湃新聞(www.thepaper.cn)記者先前報道,深勢科技已推出Lebesgue科學計算平台、Hermite藥物設計平台以及Bohrium微觀計算與設計平台等。例如在醫藥領域,深勢科技與多家客戶攜手,將物理建模AI的計算範式與臨床前藥物研發更廣泛的結合,透過Hermite Uni-FEP、Uni-Fold、RiD等模組,將自由能微擾理論、分子動力學、增強採樣演算法與高效能運算結合,精準預測蛋白質結構及構象變化,並以化學精度高效評估蛋白與配體的結合自由能,為藥物研發人員提供高效精準的理論指導,提升藥物設計與優化效率。

去年12月29日,總部位於北京的深勢科技在臨港註冊成立了深度勢能生物科技(上海)有限公司。深勢科技政企事務副總裁劉會師在接受澎湃新聞(www.thepaper.cn)記者採訪時表示,公司在臨港佈局新一代分子模擬演算法研發中心和AI輔助藥物設計業務中心,主要也是因為看到臨港正在大力發展算力,「我們在訓練模型過程中,對算力是有需求的,另外臨港尤其是要大力發展國產化算力,我們也想為這方面添磚加瓦。」

我們主要在臨港進行藥物研發業務的佈局,包括自有藥品管線的研發工作。 」劉會師提到,深勢科技的業務和臨港甚至上海的人工智慧、生物醫藥這樣的先導產業有正相關的直接合作關係,「我們願意把我們的研發以及產品納入到臨港的大的生態圈裡來。 ”

上述《方案》同時提及,臨港新片區也制定了一系列保障措施,包括加強人才保障、完善支持政策、推動開放合作等。根據陸瑜介紹,如果AI企業到臨港來,將優先提供臨港的智能算力,同時透過發放算力券等形式,讓企業優惠使用算力,「甚至對重點的AI企業,政府對它的算力成本直接可以給予不超過30%的補貼,這些政策我們都會出來。」

在這次大會上,中國電信臨港公共智算服務平台和國產GPU聯合創新基地也正式推出,值得注意。中國電信成立臨港算力(上海)科技有限公司,將開展臨港算力園區建設,並將分批次投放4萬個適用於智算、超算的高功率機架。

上海市經濟與資訊化委員會副主任湯文侃當天表示,目前,以「網路為基礎、數據為核心、算力為關鍵、安全為底線」的新一代資訊基礎設施已成為建立現代化產業的重要基礎支撐。上海已提出建構「2 (3 6) (4 5)」的現代化產業架構,這對以算力為代表的新型資訊基礎設施建設提出了更高需求。

而就在5月16日,上海市經濟與資訊化委員會公佈了透過《上海市資料中心建設導則》符合性評估的資料中心項目名單,共支持了16個項目,其中位於臨港的項目有2個。 「截至目前,我委共支持新片區包括,商湯AIDC、有孚網路、資訊飛魚等8個項目,合計2.8萬個6kW標準機櫃,佔全市已批機櫃數量近1/5。」

湯文侃建議充分利用港口的算力資源,建立公共算力服務。 「目前,臨港的商湯AIDC已經接入了公共算力服務平台。在此也希望今天參加的各單位,特別是電信運營商,結合臨港的網絡特點,積極在臨港建設極速算力承載網,協助實現網路無所不達、算力無所不在、智能無所不及,推動算力成為與水電一樣的公共服務。」

成立智算產業聯盟,商湯當產業鏈鍊主

#臨港的目標是創造一個上中下游一體化的算力產業聯盟,該聯盟能夠以協同式、體系化的方式滿足當前和未來的需求,利用現有優勢實現發展。

陸瑜將臨港的算力供給視作整條產業鏈的“中間一段”,一端為落地到臨港的AI企業提供算力保障,另一端則涉及到對算力來說極為關鍵的“晶片、軟體、系統”,“我們希望有了需求端,也有了這樣一個平台端,那麼我們把計算的晶片企業、軟體企業、系統企業集聚在這裡,讓他們深度地參與到這樣一個系統的建設過程當中。 ”

楊帆也強調,「今天看到的大模型所有的成績的發展,它既是暴力出奇蹟,透過人工智慧三要素的持續規模上升帶來的技術價值的提升,同時也是基礎的研發能力和系統的工程化能力之間的深度結合,演算法最佳化、資料的整理與選取、平台性算力的最佳化提供,這三者往往是互相連通的,很難把它變成割裂的環節獨自去做。 ”

他表示,智能算力產業鏈的重要價值在於,「只有鏈上有更多的企業,大家去促進彼此的交流思考,更深度地去進行一些合作,才能夠在這樣新的關鍵性的重大科技浪潮中,去做到更好的技術進步與支援。 」

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

在大會現場,新片區智算產業聯盟正式成立,並任命聯通為聯盟首任輪值理事長單位。據悉,未來聯通將在新片區成立長三角創新研究院,進一步協助新片區智算產業發展。

新片區智算產業聯盟成員代表由智算算力、基本算力和超算算力中心等算力提供企業,GPU、FPGA、ASIC等算力晶片企業,以及大模型、AI for science等算力需求企業,共25家企業,以及中國信通院華東分院、西安電子科技大學、電子科技大學共計3所大學與科學研究院所共同組成,後續將進行資源共享、技術交流及專案合作。商湯科技則被授予「新片區智算產業鏈鍊主」。

GPU晶片廠商沐曦當天即表示,分別滿足AI推理運算、AI訓練/通用運算、高效能渲染功能的三類GPU產品,應用於AI推理、AI訓練、資料中心、元宇宙、雲端遊戲等領域,將賦能各領域轉型發展。

湯文侃也對臨港新片區此次智算產業聯盟的成立寄予厚望,「依托商湯科技這樣的鍊主企業,結合自身優勢,探索產業鏈上下游全要素協同,形成數位經濟新的爆發點。 ”

特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當鏈主”

12家企業在當天的大會上共同簽署了新片區智慧運算產業上下游企業協同採購協議。陸瑜提到,新片區也將推出協同採購正面清單,「如果企業在建設國產化算力平台的過程當中,購買國產GPU等上游產品,我們就會給予補貼,這樣也是鼓勵上下游企業去更好地合作。」

以上是特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當'鏈主”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
AI大模型非常昂贵 只有大企业和超级富豪才能玩得转AI大模型非常昂贵 只有大企业和超级富豪才能玩得转Apr 15, 2023 pm 07:34 PM

ChatGPT大火带动AI又一波热潮,不过业界普遍认为,当AI步入大模型时代,只有大企业和超级富有的企业才玩得起AI,因为AI大模型的打造非常昂贵。首先是计算昂贵。多伦多大学市场营销教授AviGoldfarb说:“如果你想创办一家企业,自己开发大语言模型,自己计算,成本太高了。OpenAI是很贵的,要数以十亿计的美元。”租赁计算当然会便宜不少,但企业仍然要向AWS等企业支付昂贵费用。其次是数据昂贵。训练模型需要海量数据,有时数据是现成的,有时不是。CommonCrawl和LAION等数据可以免费

AI大模型浪潮下算力需求爆增,商汤“大模型+大算力”赋能多产业发展AI大模型浪潮下算力需求爆增,商汤“大模型+大算力”赋能多产业发展Jun 09, 2023 pm 07:35 PM

近日,以“AI引领时代,算力驱动未来”为主题的“临港新片区智算大会”举行。会上,新片区智算产业联盟正式成立,商汤科技作为算力提供企业成为联盟一员,同时商汤科技被授予“新片区智算产业链链主”企业。作为临港算力生态的积极参与者,商汤目前已建设了亚洲目前最大的智能计算平台之一——商汤AIDC,可以输出5000Petaflops的总算力,可支持20个千亿参数量的超大模型同时训练。以AIDC为底座、前瞻打造的商汤大装置SenseCore,致力于打造高效率、低成本、规模化的下一代AI基础设施与服务,赋能人工

面向AI的数据治理体系如何构建?面向AI的数据治理体系如何构建?Apr 12, 2024 pm 02:31 PM

近年来,随着新技术模式的出现,各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等领域,向制造、能源、电力等传统行业辐射。各行业企业在设计、采购、生产、管理、销售等经济生产活动主要环节的人工智能技术和应用成熟度在不断提升,加速人工智能在各环节的落地覆盖,逐渐将其与主营业务相结合,以实现产业地位提高或经营效益优化,进一步扩大自身优势。人工智能技术创新应用的大规模落地,推动了大数据智能市场的蓬勃发展,同样也为底层的数据治理服务注入了市场活力。伴随着大数据、云计算以及算

科普:什么是AI大模型科普:什么是AI大模型Jun 29, 2023 am 08:37 AM

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。AI大模型的训练需要大量的数据和计算资源,通常需要使用分布式计算框架来加速训练过程。这些模型的训练过程非常复杂,需要对数据的分布、特征的选择、模型的结构等方面进行深入的研究和优化。AI大模型的应用范围非常广泛,可以用于各种场景,如智能客服、智能家居、自动驾驶等。在这些应用中,AI大模型可以帮助人们更快速、更准确地完成各种任务,提高工

AI大模型时代,数据存储新基座助推教科研数智化跃迁AI大模型时代,数据存储新基座助推教科研数智化跃迁Jul 21, 2023 pm 09:53 PM

生成式AI(AIGC)开启了人工智能通用化的新纪元,围绕大模型的百舸争流蔚为壮观,算力基础设施是首要的竞逐焦点,而存力觉醒也日益成为业界共识。在新的时代,大模型从单模态走向多模态,参数和训练数据集的规模呈几何级数增长,海量的非结构化数据需要高性能混合负载能力的支撑;与此同时,数据密集型范式大行其道,超算、高性能计算(HPC)等应用场景迈向纵深,既有的数据存储基座已难以满足不断升级的需求。如果说算力、算法、数据是驱动人工智能发展的“三驾马车”,那么在外部环境发生巨大变化的背景下,三者亟需重新达成动

vivo推出自主研发的通用AI大模型——蓝心大模型vivo推出自主研发的通用AI大模型——蓝心大模型Nov 01, 2023 pm 02:37 PM

vivo于11月1日在2023年的开发者大会上发布了自主研发的通用人工智能大模型矩阵——蓝心大模型vivo宣布,蓝心大模型将推出5款不同参数量级的模型,分别包含十亿、百亿、千亿三个级别的参数,覆盖核心场景,模型能力在行业中处于领先地位。vivo认为,一个好的自研大模型需要满足以下5点要求:规模大,功能全面,算法强劲,安全可靠,自主进化,并且要广泛开源重写后的内容如下:其中,首先是蓝心大模型7B,这是一个70亿级别的模型,旨在为手机端和云端提供双重服务。vivo表示,该模型在语言理解、文本创作等场

参照人类大脑,学会忘记会让AI大模型变得更好?参照人类大脑,学会忘记会让AI大模型变得更好?Mar 12, 2024 pm 02:43 PM

最近,一支计算机科学家团队研发了一种更灵活、更具弹性的机器学习模型,它们具有周期性遗忘已知信息的能力,这是现有大型语言模型所不具备的特点。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高目前主流的AI语言引擎大多采用人工神经网络技术。这种网络结构中的每个“神经元”实际上是一个数学函数,它们之间相互连接,接收和传递信息

荣耀CEO赵明:AI大模型等创新技术为智能终端发展带来新机遇荣耀CEO赵明:AI大模型等创新技术为智能终端发展带来新机遇Nov 10, 2023 pm 02:29 PM

(全球TMT2023年11月10日讯)11月9日,荣耀终端有限公司CEO赵明受邀参加2023年世界互联网大会乌镇峰会,出席“全球发展倡议数字合作论坛”并进行主题发言。“影响消费电子行业最大因子不是经济周期,而是创新周期。”尽管智能手机市场持续承压、用户换机周期延长为产业链带来巨大挑战,但赵明认为,“AI大模型、5G+等创新技术正在催生智能终端的新特性、新形态、新品类和新服务生态,为智能终端发展带来新的机遇。”在今年三季度,荣耀先后发布了引领折叠屏进入毫米时代的荣耀MagicV2;极致纤薄与时尚的

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

倉庫:如何復興隊友
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。