AI产业中的核心技术是大模型,而基础模型的质量很大程度上决定了AI产业化的前景。训练大模型需要包括算力底座、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,只有强大的云计算体系才能训练出高质量的大模型
在2009年,阿里云的周靖人提出了“数据中心是一台计算机”的理念。如今,在AI时代,更需要这样的技术体系。作为一台超级计算机,云计算可以高效地连接异构计算资源,突破单一性能芯片的瓶颈,并协同完成大规模智能计算任务
为了确保大型模型训练的稳定互联和高效并行计算,阿里云对人工智能平台PAI进行了全新升级。PAI底层采用了HPN 7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%,远远超过业界水平。在大型模型训练任务中,它可以节省超过50%的算力资源,性能在全球领先
阿里云全面升级 AI 基础设施阿里云通义大模型系列是通过人工智能平台PAI进行训练而成的。除了通义大模型外,中国的许多大型公司,如百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等一批头部企业和机构也在阿里云上训练大型模型
百川智能创始人兼 CEO 王小川表示,“百川成立仅半年便发布了 7 款大模型,快速迭代背后离不开云计算的支持。” 百川智能和阿里云进行了深入合作,在双方的共同努力下,百川很好地完成了千卡大模型训练任务,有效降低了模型推理成本,提升了模型部署效率。
阿里云已成为中国大模型的公共 AI 算力底座。截至目前,中国众多头部主流大模型都已通过阿里云对外提供 API 服务,包括通义系列、Baichuan 系列、智谱 AI ChatGLM 系列、姜子牙通用大模型等。
随着人工智能产业的逐步发展,将会迎来大规模智能算力需求的爆发。阿里云已经在全球30个地区建立了89个云计算数据中心,并提供了3000多个边缘计算节点。云计算的低延迟和高弹性优势将得到充分发挥。今年,阿里云成功支持了妙鸭相机在短时间内高强度流量的爆发
周靖人说:“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”
根据消息,据悉阿里云上有超过30款云产品已经接入了大模型能力。例如,阿里云的大数据治理平台DataWorks新增了一种全新的交互形式——Copilot。用户只需使用自然语言输入,就可以生成SQL并自动执行相应的数据ETL操作。这将使整个开发和分析过程的效率提高30%以上,可媲美“自动驾驶”
阿里云的容器、数据库等产品也提供类似的开发体验,可以实现NL2SQL、SQL注释生成/纠错/优化等功能。未来,这些能力还将整合到阿里云的其他产品中
在 2023 云栖大会现场,周靖人公布了阿里自研大模型的最新进展,发布千亿级参数规模的通义千问 2.0。通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2,加速追赶 GPT-4。
通义千问 2.0 千亿级参数规模大模型发布千行百业都想借助大模型实现生产和服务方式的变革,但大模型使用的高门槛把大部分人挡在了技术浪潮之外。不论是定制专属大模型,还是基于大模型构建创新应用,都有很高的人才、技术、资金要求。
在云栖大会现场,周靖人发布了一款一站式大模型应用开发平台——阿里云百炼。该平台集成了国内外主流优质的大模型,并提供了模型选型、微调训练、安全套件、模型部署等服务以及全链路的应用开发工具。这样一来,用户就能够简化底层算力部署、模型预训练和工具开发等复杂工作。开发者只需要花费5分钟的时间就可以开发一个大模型应用,并在几小时内“炼”出一个企业专属模型。这样一来,开发者就可以将更多的精力专注于应用创新
为了推动大规模模型在各行各业的集成和应用,阿里云基于通用目标开发了八个行业大规模模型,并在现场宣布了进展:个性化角色创作平台通用星尘、智能投研助手通用点金、AI阅读助手通用智文等首次亮相;智能编码助手通用灵码已在阿里云内部广泛采用,获得了广泛好评;工作学习AI助手通用听悟每天处理超过五万个音视频,累计用户超过一百万
大型模型的开发正引发各行各业的新一轮创新。目前,央视网、朗新科技、亚信科技等企业已经率先在阿里云百炼平台上开发了专属模型和应用。朗新科技在云端训练出了电力专属大型模型,并开发了“电力账单解读智能助手”和“电力行业政策解析/数据分析助手”。这些应用已经为客户的接待效率提高了50%,投诉率降低了70%
“促进中国 AI 生态繁荣,是阿里云的首要目标。阿里云将坚定打造 AI 时代最开放的大模型平台,我们欢迎所有大模型接入阿里云百炼,共同向开发者提供 AI 服务。” 周靖人表示。
阿里云是中国最早开源自研大模型的科技公司,引领了中国大模型开源的潮流。目前,阿里云已经开源了通义千问7B和14B版本,下载量已经突破了百万。在现场,周靖人宣布通义千问72B模型即将开源,将成为中国参数最大的开源模型
除了与开发者共享自研新技术,阿里云还大力支持三方大模型的发展。在阿里云魔搭社区上,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家,都将他们的核心大模型开源首发,而阿里云则为开发者们提供免费的GPU算力,以供他们体验和使用这些大模型,截至目前已经累计超过3000万小时
阿里云魔搭社区模型下载量突破 1 亿根据周靖人透露,魔搭社区目前已经聚集了超过2300款人工智能模型,吸引了280万名人工智能开发者。人工智能模型的下载量已经突破了1亿次,使其成为中国规模最大、开发者最活跃的人工智能社区
在2023年的云栖大会上,阿里云宣布了一项重大计划:“云工开物计划”,旨在为中国所有大学生每人提供一台云服务器。此外,阿里云还将为签约高校提供更大规模的算力资源支持,助力中国青年学者和学子攀登科研高峰。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已经成为该计划的首批合作伙伴
以上是阿里云全面升级AI基础设施,通义千问2.0正式亮相,中国大模型公司一半部署在阿里云上的详细内容。更多信息请关注PHP中文网其他相关文章!