商汤科技于2022年1月24日在上海自贸区临港新片区启动了人工智能计算中心AIDC的运营。当时这家人工智能公司未必能精准预测,2022年即成为了所谓的AIGC(AI Generated Content)元年。
“今天,我们的临港AIDC已经有接近3万块的GPU(图形处理器),我们目前的算力已经达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),在这之上我们相信未来可以有更好的开发者效率,并且都能够支持更多千亿规模的大模型算力训练。”在6月2日的“AI引领时代,算力驱动未来”——临港新片区智算大会上,商汤科技董事长兼CEO 徐立如是表示。
商汤方面告诉澎湃新闻(www.thepaper.cn)记者,仍有许多需求排成长队等待处理。而在商汤科技联合创始人、大装置事业群总裁杨帆看来,人工智能对于更大数据、更大规模、更大算力的追求并不是“始于今天”,“整个人工智能技术迭代、进步的历史,我们可以把它看成是一个对于‘暴力美学’的追求,以及算法、算力、数据三要素由量变产生质变的一个技术迭代的过程。”
聚焦前沿产业的临港新片区对这种新的热潮迅速做出了响应。6月2日当天,临港新片区党工委副书记吴晓华在上述大会上发布了《临港新片区加快构建算力产业生态行动方案》。该《方案》的蓝图之下,至2025年,临港将成为具有全国影响力的算力产业集聚区,含相关硬件、软件、应用、服务等的算力产业总体规模将突破100亿元。
临港新片区党工委副书记吴晓华发布《临港新片区加快构建算力产业生态行动方案》。
“我们看到AI大爆发的时代已经来临了,AI进入到我们生产和生活的各个领域,那么随着 AI应用的大爆发,它其实也驱动了算力需求的大爆发。”对于上述《方案》的出台,临港新片区管委会高科处处长陆瑜对澎湃新闻(www.thepaper.cn)在内的媒体表示,临港前期已具备了很好的优势,“就是我们的算力资源非常丰富。”
更为重要的是,在人工智能公司选择是否落地临港时,算力资源已经成为尤为重要的决策因素。
算力是新时代的能源,而成功又不仅仅在于“暴力美学”
何谓算力?徐立认为,算力其实是整个模型能力的表达,“算力等于算法或者说大模型的参数,去乘上它所处理的数据量。大模型时代参数越大,乘上的数据量越大,所需要的算力就越大。”算力已然成为新时代的能源,“某种程度上,算力决定了市场的竞争力。”
杨帆也谈到,从去年到今年整个人工智能领域非常火的一个概念叫内容生成,同时大家都熟悉了一个名词即大模型。简单来看,这是一种“暴力美学”,例如,GPT-3模型使用了超过1750亿个参数,需要高性能的处理器来支持训练,使用V100训练耗卡量为10000张卡训练14.8天,整体算力需求约625 PetaFLOPS。
杨帆认为,这种“暴力美学”也可以理解为量变产生质变,“其实人工智能从它诞生的第一天起到今天,一直都在追求通过规模化带来更强的智能化。”他提到,实际上就人工智能领域来说,在过去的5-6年时间里,业内最顶级的人工智能模型对算力的消耗量,“每4-6个月就要翻一番,也就是说过去的这几年时间里翻了近30万倍。”
当然,“暴力”和“智能”并不是完全成正比,“拥有更大的资源、更大的规模,它仅仅是一个必要而非充分的条件。”杨帆强调,真正在“暴力美学”背后支撑产生重大的技术创新和成果的,恰恰又是在于对每一个环节的持续性的优化和改进。
以数据为例,“GPT-4所用的数据其实只是OpenAI收集到的所有数据的1%,因为他发现当把更多的数据去灌给机器人的时候,有可能反而不那么聪明,应该把更加有效、更加高价值的数据提供给这个算法,然后才能去创造出一个更加聪明的大脑。”
其认为,至少在今天,数据的有效性远比数据的总量更加重要。而如何定义有效的数据,“这其实就需要数据科学家大量的努力,OpenAI其实让他们最优秀的科学家去做数据了,并非大家觉得的去搞算法了。”
这种每个环节的优化同样包括算力,在英伟达缺货的情况下,为什么没人在用国产芯片做商业化的大规模训练?为什么最新这波浪潮到来后,第一时间钱都被英伟达挣走了?这些问句背后的解释是,“并不是我们把算力量堆到一个数值就能够产生最终的价值,1000张卡100台服务器放在一起跑同一个任务,这中间还需要大量的配套软件、通信网络,它是一系列软硬件联合调优的过程,这样的工作积累我们过去没有做,我们今天就需要去补课。”
顺势而为,临港加快形成多元算力供给体系
据吴晓华介绍,临港新片区算力产业已在上游软硬件、中游的数据中心、调度平台,下游应用进行了相应布局,目前临港总算力超过3EFLOPS(FP32,1 EFLOPS等于每秒1百亿亿次浮点运算),其中智能算力占比近80%,总算力规模约占上海市近20%。
前述《方案》提出,目标到2025年,新片区将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系,总算力超过5EFLOPS(FP32),AI算力占比达到80%,算力产业总体规模(含相关硬件、软件、应用、服务等)突破100亿元,建成公共算力服务平台,规范算力交易机制,实现区域算力调度,打造具有全国影响力的算力产业集聚区,建设一批算力示范应用标杆场景。
“智能算力也就是当下最为火热的AI企业所需要的,我们也发现,AI企业落地到临港来,他们不再是仅仅关注给他他多少政策支持,给他多少补贴,他会关注落地在这边,能不能解决他的算力需求,因为现在市场上算力是非常紧缺的。”陆瑜提到了这一显著变化。
商汤方面说,截至今年5月,商汤大装置已为40多个核心客户提供过服务。“特别是在大模型的浪潮之下,我们现在支撑了10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。”杨帆也提及。
成立于2018年的深势科技是算力需求方之一。该公司核心团队由中国科学院院士鄂维南等人领衔,是“AI+Science”科学研究范式的先行者,其首创的“多尺度建模+机器学习+高性能计算”范式,突破性地实现了多尺度分子模拟中精度与效率的统一。
据澎湃新闻(www.thepaper.cn)记者此前报道,深势科技已推出Lebesgue科学计算平台、Hermite药物设计平台以及Bohrium微观计算与设计平台等。例如在医药领域,深势科技与多家客户携手,将物理建模+AI的计算范式与临床前药物研发更广泛的结合,通过Hermite Uni-FEP、Uni-Fold、RiD等模块,将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,精准预测蛋白质结构及构象变化,并以化学精度高效评估蛋白与配体的结合自由能,为药物研发人员提供高效精准的理论指导,提升药物设计与优化效率。
去年12月29日,总部位于北京的深势科技在临港注册成立了深度势能生物科技(上海)有限公司。深势科技政企事务副总裁刘会师在接受澎湃新闻(www.thepaper.cn)记者采访时表示,公司在临港布局新一代分子模拟算法研发中心和AI辅助药物设计业务中心,主要也是因为看到临港正在大力发展算力,“我们在训练模型过程中,对算力是有需求的,另外临港尤其是要大力发展国产化算力,我们也想为这方面添砖加瓦。”
我们主要在临港进行药物研发业务的布局,包括自有药品管线的研发工作。”刘会师提到,深势科技的业务和临港甚至上海的人工智能、生物医药这样的先导产业有正相关的直接合作关系,“我们愿意把我们的研发以及产品纳入到临港的大的生态圈里来。”
上述《方案》同时提及,临港新片区也制定了一系列保障措施,包括加强人才保障、完善支持政策、推动开放合作等。据陆瑜介绍,如果AI企业到临港来,将优先提供临港的智能算力,同时通过发放算力券等形式,让企业优惠使用算力,“甚至对重点的AI企业,政府对它的算力成本直接可以给予不超过30%的补贴,这些政策我们都会出来。”
在这次大会上,中国电信临港公共智算服务平台和国产GPU联合创新基地也正式推出,值得注意。中国电信成立临港算力(上海)科技有限公司,将开展临港算力园区建设,并将分批次投放4万个适用于智算、超算的高功率机架。
上海市经济和信息化委员会副主任汤文侃当天表示,当前,以“网络为基础、数据为核心、算力为关键、安全为底线”的新一代信息基础设施已成为建设现代化产业的重要基础支撑。上海已提出构建“2+(3+6)+(4+5)”的现代化产业架构,这对以算力为代表的新型信息基础设施建设提出了更高需求。
而就在5月16日,上海市经济和信息化委员会公布了通过 《上海市数据中心建设导则》符合性评估的数据中心项目名单,共支持了16个项目,其中位于临港的项目有2个。“截至目前,我委共支持新片区包括,商汤AIDC、有孚网络、信息飞鱼等8个项目,合计2.8万个6kW标准机柜,占全市已批机柜数量近1/5。”
汤文侃建议充分利用临港的算力资源,建立公共算力服务。“目前,临港的商汤AIDC已经接入了公共算力服务平台。在此也希望今天参会的各单位,特别是电信运营商,结合临港的网络特点,积极在临港建设极速算力承载网,助力实现网络无所不达、算力无所不在、智能无所不及,推动算力成为与水电一样的公共服务。”
成立智算产业联盟,商汤当产业链链主
临港的目标是创建一个上中下游一体化的算力产业联盟,该联盟能够以协同式、体系化的方式满足当前和未来的需求,利用现有优势实现发展。
陆瑜将临港的算力供给视作整条产业链的“中间一段”,一端为落地到临港的AI企业提供算力保障,另一端则涉及到对算力来说极为关键的“芯片、软件、系统”,“我们希望有了需求端,也有了这样一个平台端,那么我们把计算的芯片企业、软件企业、系统企业集聚在这里,让他们深度地参与到这样一个系统的建设过程当中。”
杨帆也强调,“今天看到的大模型所有的成绩的发展,它既是暴力出奇迹,通过人工智能三要素的持续规模上升带来的技术价值的提升,同时也是基础的研发能力和系统的工程化能力之间的深度结合,算法优化、数据的整理和选取、平台性算力的优化提供,这三者往往是互相连通的,很难把它变成割裂的环节独自去做。”
他表示,智能算力产业链的重要价值在于,“只有链上有更多的企业,大家去促进彼此的交流思考,更深度地去进行一些合作,才能够在这样新的关键性的重大技术浪潮中,去做到更好的技术进步和支持。”
在大会现场,新片区智算产业联盟正式成立,并任命联通为联盟首任轮值理事长单位。据悉,未来联通将在新片区成立长三角创新研究院,进一步助力新片区智算产业发展。
新片区智算产业联盟成员代表由智算算力、基础算力和超算算力中心等算力提供企业,GPU、FPGA、ASIC等算力芯片企业,以及大模型、AI for science等算力需求企业,共计25家企业,以及中国信通院华东分院、西安电子科技大学、电子科技大学共计3所高校与科研院所共同组成,后续将开展资源共享、技术交流和项目合作。商汤科技则被授予“新片区智算产业链链主”。
GPU芯片厂商沐曦当天即表示,分别满足AI推理计算、AI训练/通用计算、高性能渲染功能的三类GPU产品,应用于AI推理、AI训练、数据中心、元宇宙、云游戏等领域,将赋能各领域转型发展。
汤文侃也对临港新片区此次智算产业联盟的成立寄予厚望,“依托商汤科技这样的链主企业,结合自身优势,探索产业链上下游全要素协同,形成数字经济新的爆发点。”
12家企业在当天的大会上共同签署了新片区智能计算产业上下游企业协同采购协议。陆瑜提到,新片区也将出台协同采购正面清单,“如果企业在建设国产化算力平台的过程当中,购买国产GPU等上游产品,我们就会给予补贴,这样也是鼓励上下游企业去更好地合作。”
以上是特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”的详细内容。更多信息请关注PHP中文网其他相关文章!

ChatGPT大火带动AI又一波热潮,不过业界普遍认为,当AI步入大模型时代,只有大企业和超级富有的企业才玩得起AI,因为AI大模型的打造非常昂贵。首先是计算昂贵。多伦多大学市场营销教授AviGoldfarb说:“如果你想创办一家企业,自己开发大语言模型,自己计算,成本太高了。OpenAI是很贵的,要数以十亿计的美元。”租赁计算当然会便宜不少,但企业仍然要向AWS等企业支付昂贵费用。其次是数据昂贵。训练模型需要海量数据,有时数据是现成的,有时不是。CommonCrawl和LAION等数据可以免费

近日,以“AI引领时代,算力驱动未来”为主题的“临港新片区智算大会”举行。会上,新片区智算产业联盟正式成立,商汤科技作为算力提供企业成为联盟一员,同时商汤科技被授予“新片区智算产业链链主”企业。作为临港算力生态的积极参与者,商汤目前已建设了亚洲目前最大的智能计算平台之一——商汤AIDC,可以输出5000Petaflops的总算力,可支持20个千亿参数量的超大模型同时训练。以AIDC为底座、前瞻打造的商汤大装置SenseCore,致力于打造高效率、低成本、规模化的下一代AI基础设施与服务,赋能人工

近年来,随着新技术模式的出现,各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等领域,向制造、能源、电力等传统行业辐射。各行业企业在设计、采购、生产、管理、销售等经济生产活动主要环节的人工智能技术和应用成熟度在不断提升,加速人工智能在各环节的落地覆盖,逐渐将其与主营业务相结合,以实现产业地位提高或经营效益优化,进一步扩大自身优势。人工智能技术创新应用的大规模落地,推动了大数据智能市场的蓬勃发展,同样也为底层的数据治理服务注入了市场活力。伴随着大数据、云计算以及算

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。AI大模型的训练需要大量的数据和计算资源,通常需要使用分布式计算框架来加速训练过程。这些模型的训练过程非常复杂,需要对数据的分布、特征的选择、模型的结构等方面进行深入的研究和优化。AI大模型的应用范围非常广泛,可以用于各种场景,如智能客服、智能家居、自动驾驶等。在这些应用中,AI大模型可以帮助人们更快速、更准确地完成各种任务,提高工

生成式AI(AIGC)开启了人工智能通用化的新纪元,围绕大模型的百舸争流蔚为壮观,算力基础设施是首要的竞逐焦点,而存力觉醒也日益成为业界共识。在新的时代,大模型从单模态走向多模态,参数和训练数据集的规模呈几何级数增长,海量的非结构化数据需要高性能混合负载能力的支撑;与此同时,数据密集型范式大行其道,超算、高性能计算(HPC)等应用场景迈向纵深,既有的数据存储基座已难以满足不断升级的需求。如果说算力、算法、数据是驱动人工智能发展的“三驾马车”,那么在外部环境发生巨大变化的背景下,三者亟需重新达成动

vivo于11月1日在2023年的开发者大会上发布了自主研发的通用人工智能大模型矩阵——蓝心大模型vivo宣布,蓝心大模型将推出5款不同参数量级的模型,分别包含十亿、百亿、千亿三个级别的参数,覆盖核心场景,模型能力在行业中处于领先地位。vivo认为,一个好的自研大模型需要满足以下5点要求:规模大,功能全面,算法强劲,安全可靠,自主进化,并且要广泛开源重写后的内容如下:其中,首先是蓝心大模型7B,这是一个70亿级别的模型,旨在为手机端和云端提供双重服务。vivo表示,该模型在语言理解、文本创作等场

最近,一支计算机科学家团队研发了一种更灵活、更具弹性的机器学习模型,它们具有周期性遗忘已知信息的能力,这是现有大型语言模型所不具备的特点。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高目前主流的AI语言引擎大多采用人工神经网络技术。这种网络结构中的每个“神经元”实际上是一个数学函数,它们之间相互连接,接收和传递信息

最近一段时间,人工智能再次成为人类创新的焦点,围绕AI的军备竞争比以往任何时候都更加激烈。不仅科技巨头纷纷扎堆加入大模型之战,生怕错过了新风口,就连包括北京、上海、深圳等地也纷纷出台政策举措,致力于开展大模型创新算法及关键技术研究,打造人工智能创新高地。AI大模型蓬勃发展,各大科技巨头纷纷加入近日,在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国人工智能大模型正呈现蓬勃发展态势,出现了多个在行业有影响力的大模型。百度创始人、董事长兼CEO李彦宏更是直言,我们正处在全新起点


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

Dreamweaver Mac版
视觉化网页开发工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

SublimeText3汉化版
中文版,非常好用

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),