首页 >科技周边 >人工智能 >华为推出全新架构升腾 AI 计算集群,支持超万亿参数大模型训练

华为推出全新架构升腾 AI 计算集群,支持超万亿参数大模型训练

WBOY
WBOY转载
2023-09-22 21:49:01633浏览

IT之家9 月20 日消息,在今日举行的华为全联接大会2023 期间,华为常务董事、ICT 基础设施业务管理委员会主任、企业BG 总裁汪涛正式发布全新架构的升腾AI 计算集群—— Atlas 900 SuperCluster,可支持超万亿参数的大模型训练。

华为推出全新架构昇腾 AI 计算集群,支持超万亿参数大模型训练

新集群采用华为星河AI智算交换机CloudEngine XH16800,该交换机具备高密度的800GE端口能力,使得两层交换网络可以实现2250个节点(相当于18000张卡)的超大规模无收敛集群组网

新集群同时使用了创新的超节点架构,大大提升了大模型训练能力。此外,发挥华为在计算、网络、存储、能源等领域的综合优势,从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。

华为发布了更开放、更易用的CANN 7.0异构计算架构。该架构不仅全面兼容业界的AI框架、加速库和主流大模型,还深度开放底层能力,使得AI框架和加速库可以更直接地调用和管理计算资源。这使得开发者可以自定义高性能算子,让大模型具备差异化的竞争力

华为推出全新架构昇腾 AI 计算集群,支持超万亿参数大模型训练

华为还对Ascend C编程语言进行了升级,以更高效的编程方式简化算子实现逻辑,大幅缩短融合算子的开发周期,为AI模型与应用的快速开发提供支持

华为推出全新架构昇腾 AI 计算集群,支持超万亿参数大模型训练

华为云官网今日正式上线升腾 AI 云服务“百模千态”专区,面向全球企业和开发者。该专区收录了业界主流的开源大模型,并全面基于升腾 AI 云服务进行适配和优化。同时,提供了应用开发的工具链,所有开发工具都已实现云化,省去了繁琐的配置流程,实现了一键接入,即开即用

华为推出全新架构昇腾 AI 计算集群,支持超万亿参数大模型训练

华为推出全新架构昇腾 AI 计算集群,支持超万亿参数大模型训练

需要进行改写的内容是:▲ 升腾 AI 云服务百模千态专区

根据IT之家查询获悉,截至今年7月,升腾AI集群已经支持了全国25个城市的人工智能计算中心建设。其中,有7个城市的公共算力平台被选为首批国家“新一代人工智能公共算力开放创新平台”

同时,升腾 AI 已发展 30 多家硬件伙伴、1200 多家 ISV,联合推出了 2500 多个行业 AI 解决方案,规模服务于运营商、互联网、金融等行业。

以上是华为推出全新架构升腾 AI 计算集群,支持超万亿参数大模型训练的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:sohu.com。如有侵权,请联系admin@php.cn删除