首页  >  文章  >  科技周边  >  特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

WBOY
WBOY转载
2023-06-04 12:07:461503浏览

商汤科技于2022年1月24日在上海自贸区临港新片区启动了人工智能计算中心AIDC的运营。当时这家人工智能公司未必能精准预测,2022年即成为了所谓的AIGC(AI Generated Content)元年。

“今天,我们的临港AIDC已经有接近3万块的GPU(图形处理器),我们目前的算力已经达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),在这之上我们相信未来可以有更好的开发者效率,并且都能够支持更多千亿规模的大模型算力训练。”在6月2日的“AI引领时代,算力驱动未来”——临港新片区智算大会上,商汤科技董事长兼CEO 徐立如是表示。

商汤方面告诉澎湃新闻(www.thepaper.cn)记者,仍有许多需求排成长队等待处理。而在商汤科技联合创始人、大装置事业群总裁杨帆看来,人工智能对于更大数据、更大规模、更大算力的追求并不是“始于今天”,“整个人工智能技术迭代、进步的历史,我们可以把它看成是一个对于‘暴力美学’的追求,以及算法、算力、数据三要素由量变产生质变的一个技术迭代的过程。”

聚焦前沿产业的临港新片区对这种新的热潮迅速做出了响应。6月2日当天,临港新片区党工委副书记吴晓华在上述大会上发布了《临港新片区加快构建算力产业生态行动方案》。该《方案》的蓝图之下,至2025年,临港将成为具有全国影响力的算力产业集聚区,含相关硬件、软件、应用、服务等的算力产业总体规模将突破100亿元。

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

临港新片区党工委副书记吴晓华发布《临港新片区加快构建算力产业生态行动方案》。

“我们看到AI大爆发的时代已经来临了,AI进入到我们生产和生活的各个领域,那么随着 AI应用的大爆发,它其实也驱动了算力需求的大爆发。”对于上述《方案》的出台,临港新片区管委会高科处处长陆瑜对澎湃新闻(www.thepaper.cn)在内的媒体表示,临港前期已具备了很好的优势,“就是我们的算力资源非常丰富。”

更为重要的是,在人工智能公司选择是否落地临港时,算力资源已经成为尤为重要的决策因素。

算力是新时代的能源,而成功又不仅仅在于“暴力美学”

何谓算力?徐立认为,算力其实是整个模型能力的表达,“算力等于算法或者说大模型的参数,去乘上它所处理的数据量。大模型时代参数越大,乘上的数据量越大,所需要的算力就越大。”算力已然成为新时代的能源,“某种程度上,算力决定了市场的竞争力。”

杨帆也谈到,从去年到今年整个人工智能领域非常火的一个概念叫内容生成,同时大家都熟悉了一个名词即大模型。简单来看,这是一种“暴力美学”,例如,GPT-3模型使用了超过1750亿个参数,需要高性能的处理器来支持训练,使用V100训练耗卡量为10000张卡训练14.8天,整体算力需求约625 PetaFLOPS。

杨帆认为,这种“暴力美学”也可以理解为量变产生质变,“其实人工智能从它诞生的第一天起到今天,一直都在追求通过规模化带来更强的智能化。”他提到,实际上就人工智能领域来说,在过去的5-6年时间里,业内最顶级的人工智能模型对算力的消耗量,“每4-6个月就要翻一番,也就是说过去的这几年时间里翻了近30万倍。”

当然,“暴力”和“智能”并不是完全成正比,“拥有更大的资源、更大的规模,它仅仅是一个必要而非充分的条件。”杨帆强调,真正在“暴力美学”背后支撑产生重大的技术创新和成果的,恰恰又是在于对每一个环节的持续性的优化和改进。

以数据为例,“GPT-4所用的数据其实只是OpenAI收集到的所有数据的1%,因为他发现当把更多的数据去灌给机器人的时候,有可能反而不那么聪明,应该把更加有效、更加高价值的数据提供给这个算法,然后才能去创造出一个更加聪明的大脑。”

其认为,至少在今天,数据的有效性远比数据的总量更加重要。而如何定义有效的数据,“这其实就需要数据科学家大量的努力,OpenAI其实让他们最优秀的科学家去做数据了,并非大家觉得的去搞算法了。”

这种每个环节的优化同样包括算力,在英伟达缺货的情况下,为什么没人在用国产芯片做商业化的大规模训练?为什么最新这波浪潮到来后,第一时间钱都被英伟达挣走了?这些问句背后的解释是,“并不是我们把算力量堆到一个数值就能够产生最终的价值,1000张卡100台服务器放在一起跑同一个任务,这中间还需要大量的配套软件、通信网络,它是一系列软硬件联合调优的过程,这样的工作积累我们过去没有做,我们今天就需要去补课。”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

顺势而为,临港加快形成多元算力供给体系

据吴晓华介绍,临港新片区算力产业已在上游软硬件、中游的数据中心、调度平台,下游应用进行了相应布局,目前临港总算力超过3EFLOPS(FP32,1 EFLOPS等于每秒1百亿亿次浮点运算),其中智能算力占比近80%,总算力规模约占上海市近20%。

前述《方案》提出,目标到2025年,新片区将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系,总算力超过5EFLOPS(FP32),AI算力占比达到80%,算力产业总体规模(含相关硬件、软件、应用、服务等)突破100亿元,建成公共算力服务平台,规范算力交易机制,实现区域算力调度,打造具有全国影响力的算力产业集聚区,建设一批算力示范应用标杆场景。

“智能算力也就是当下最为火热的AI企业所需要的,我们也发现,AI企业落地到临港来,他们不再是仅仅关注给他他多少政策支持,给他多少补贴,他会关注落地在这边,能不能解决他的算力需求,因为现在市场上算力是非常紧缺的。”陆瑜提到了这一显著变化。

商汤方面说,截至今年5月,商汤大装置已为40多个核心客户提供过服务。“特别是在大模型的浪潮之下,我们现在支撑了10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。”杨帆也提及。

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

成立于2018年的深势科技是算力需求方之一。该公司核心团队由中国科学院院士鄂维南等人领衔,是“AI+Science”科学研究范式的先行者,其首创的“多尺度建模+机器学习+高性能计算”范式,突破性地实现了多尺度分子模拟中精度与效率的统一。

据澎湃新闻(www.thepaper.cn)记者此前报道,深势科技已推出Lebesgue科学计算平台、Hermite药物设计平台以及Bohrium微观计算与设计平台等。例如在医药领域,深势科技与多家客户携手,将物理建模+AI的计算范式与临床前药物研发更广泛的结合,通过Hermite Uni-FEP、Uni-Fold、RiD等模块,将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,精准预测蛋白质结构及构象变化,并以化学精度高效评估蛋白与配体的结合自由能,为药物研发人员提供高效精准的理论指导,提升药物设计与优化效率。

去年12月29日,总部位于北京的深势科技在临港注册成立了深度势能生物科技(上海)有限公司。深势科技政企事务副总裁刘会师在接受澎湃新闻(www.thepaper.cn)记者采访时表示,公司在临港布局新一代分子模拟算法研发中心和AI辅助药物设计业务中心,主要也是因为看到临港正在大力发展算力,“我们在训练模型过程中,对算力是有需求的,另外临港尤其是要大力发展国产化算力,我们也想为这方面添砖加瓦。”

我们主要在临港进行药物研发业务的布局,包括自有药品管线的研发工作。”刘会师提到,深势科技的业务和临港甚至上海的人工智能、生物医药这样的先导产业有正相关的直接合作关系,“我们愿意把我们的研发以及产品纳入到临港的大的生态圈里来。”

上述《方案》同时提及,临港新片区也制定了一系列保障措施,包括加强人才保障、完善支持政策、推动开放合作等。据陆瑜介绍,如果AI企业到临港来,将优先提供临港的智能算力,同时通过发放算力券等形式,让企业优惠使用算力,“甚至对重点的AI企业,政府对它的算力成本直接可以给予不超过30%的补贴,这些政策我们都会出来。”

在这次大会上,中国电信临港公共智算服务平台和国产GPU联合创新基地也正式推出,值得注意。中国电信成立临港算力(上海)科技有限公司,将开展临港算力园区建设,并将分批次投放4万个适用于智算、超算的高功率机架。

上海市经济和信息化委员会副主任汤文侃当天表示,当前,以“网络为基础、数据为核心、算力为关键、安全为底线”的新一代信息基础设施已成为建设现代化产业的重要基础支撑。上海已提出构建“2+(3+6)+(4+5)”的现代化产业架构,这对以算力为代表的新型信息基础设施建设提出了更高需求。

而就在5月16日,上海市经济和信息化委员会公布了通过 《上海市数据中心建设导则》符合性评估的数据中心项目名单,共支持了16个项目,其中位于临港的项目有2个。“截至目前,我委共支持新片区包括,商汤AIDC、有孚网络、信息飞鱼等8个项目,合计2.8万个6kW标准机柜,占全市已批机柜数量近1/5。”

汤文侃建议充分利用临港的算力资源,建立公共算力服务。“目前,临港的商汤AIDC已经接入了公共算力服务平台。在此也希望今天参会的各单位,特别是电信运营商,结合临港的网络特点,积极在临港建设极速算力承载网,助力实现网络无所不达、算力无所不在、智能无所不及,推动算力成为与水电一样的公共服务。”

成立智算产业联盟,商汤当产业链链主

临港的目标是创建一个上中下游一体化的算力产业联盟,该联盟能够以协同式、体系化的方式满足当前和未来的需求,利用现有优势实现发展。

陆瑜将临港的算力供给视作整条产业链的“中间一段”,一端为落地到临港的AI企业提供算力保障,另一端则涉及到对算力来说极为关键的“芯片、软件、系统”,“我们希望有了需求端,也有了这样一个平台端,那么我们把计算的芯片企业、软件企业、系统企业集聚在这里,让他们深度地参与到这样一个系统的建设过程当中。”

杨帆也强调,“今天看到的大模型所有的成绩的发展,它既是暴力出奇迹,通过人工智能三要素的持续规模上升带来的技术价值的提升,同时也是基础的研发能力和系统的工程化能力之间的深度结合,算法优化、数据的整理和选取、平台性算力的优化提供,这三者往往是互相连通的,很难把它变成割裂的环节独自去做。”

他表示,智能算力产业链的重要价值在于,“只有链上有更多的企业,大家去促进彼此的交流思考,更深度地去进行一些合作,才能够在这样新的关键性的重大技术浪潮中,去做到更好的技术进步和支持。”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

在大会现场,新片区智算产业联盟正式成立,并任命联通为联盟首任轮值理事长单位。据悉,未来联通将在新片区成立长三角创新研究院,进一步助力新片区智算产业发展。

新片区智算产业联盟成员代表由智算算力、基础算力和超算算力中心等算力提供企业,GPU、FPGA、ASIC等算力芯片企业,以及大模型、AI for science等算力需求企业,共计25家企业,以及中国信通院华东分院、西安电子科技大学、电子科技大学共计3所高校与科研院所共同组成,后续将开展资源共享、技术交流和项目合作。商汤科技则被授予“新片区智算产业链链主”。

GPU芯片厂商沐曦当天即表示,分别满足AI推理计算、AI训练/通用计算、高性能渲染功能的三类GPU产品,应用于AI推理、AI训练、数据中心、元宇宙、云游戏等领域,将赋能各领域转型发展。

汤文侃也对临港新片区此次智算产业联盟的成立寄予厚望,“依托商汤科技这样的链主企业,结合自身优势,探索产业链上下游全要素协同,形成数字经济新的爆发点。”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

12家企业在当天的大会上共同签署了新片区智能计算产业上下游企业协同采购协议。陆瑜提到,新片区也将出台协同采购正面清单,“如果企业在建设国产化算力平台的过程当中,购买国产GPU等上游产品,我们就会给予补贴,这样也是鼓励上下游企业去更好地合作。”

以上是特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:sohu.com。如有侵权,请联系admin@php.cn删除