騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 16, 2023 pm 01:28 PM

人工智慧騰訊

新一代 HCC 高效能運算集群，採用最新一代星星海自研伺服器，搭載英偉達 H800 Tensor Core GPU。

騰訊官方稱，該叢集基於自研網路、儲存架構，帶來 3.2T 超高連網頻寬、TB 級吞吐能力和千萬級 IOPS。實測結果顯示，新一代集群算力效能較前代提升 3 倍。

騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍

去年 10 月，騰訊完成首個萬億參數的 AI 大模型 —— 混元 NLP 大模型訓練。在同等資料集下，將訓練時間由 50 天縮短至 11 天。如果基於新一代集群，訓練時間將進一步縮短至 4 天。

運算層面，伺服器單機效能是叢集算力的基礎，騰訊雲新一代叢集的單 GPU 卡在不同精確度下，支援輸出最高 1979 TFlops 的算力。

針對大模型場景，星星海自研伺服器採用6U 超高密度設計，相較業界可支援的上架密度提高30%；利用平行運算概念，透過CPU 與GPU 節點的一體化設計，將單點算力效能提升至更高。

騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍

網路層面，計算節點間，存在著海量的資料互動需求。隨著叢集規模擴大，通訊效能會直接影響訓練效率，需要實現網路和運算節點的最大協同。

騰訊自研的星脈高效能運算網絡，號稱具備業界最高的 3.2T RDMA 通訊頻寬。實測結果顯示，搭載同等數量的 GPU，3.2T 星脈網絡相較 1.6T 網絡，集群整體算力提升 20%。

同時，騰訊自研的高效能集合通訊庫 TCCL，融入客製化設計的解決方案。相對業界開源集合通訊庫，為大模型訓練優化 40% 負載效能，消除多個網路原因導致的訓練中斷問題。

騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍

儲存層面，大模型訓練中，大量運算節點會同時讀取一批資料集，需要盡可能縮短資料載入時長，避免運算節點產生等待。

騰訊雲端自研的儲存架構，具備 TB 級吞吐能力和千萬級 IOPS，支援不同場景下對儲存的需求。 COS GooseFS 物件儲存方案和 CFS Turbo 高效能檔案儲存方案，充分滿足大模型場景下高效能、大吞吐和海量儲存需求。

騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍

此外，新一代叢集整合了騰訊雲自研的TACO 訓練加速引擎，對網路協定、通訊策略、AI 框架、模式編譯進行大量系統級最佳化，大幅節約訓練調優和算力成本。

騰訊混元大模型背後的訓練架構 AngelPTM，也已透過騰訊雲端 TACO 提供服務，幫助企業加速大模式落地。

透過騰訊雲端 TI 平台的大模型能力和工具箱，企業可結合產業場景資料進行精調訓練，提升生產效率、快速創建和部署 AI 應用。

騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍

依托分散式雲端原生的治理能力，騰訊雲智算平台提供 16 EFLOPS 的浮點算力。

以上是騰訊發布新一代超強算力集群：面向大模型訓練，效能提升 3 倍的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

2023年机器学习的十大概念和技术Apr 04, 2023 pm 12:30 PM

机器学习是一个不断发展的学科，一直在创造新的想法和技术。本文罗列了2023年机器学习的十大概念和技术。本文罗列了2023年机器学习的十大概念和技术。2023年机器学习的十大概念和技术是一个教计算机从数据中学习的过程，无需明确的编程。机器学习是一个不断发展的学科，一直在创造新的想法和技术。为了保持领先，数据科学家应该关注其中一些网站，以跟上最新的发展。这将有助于了解机器学习中的技术如何在实践中使用，并为自己的业务或工作领域中的可能应用提供想法。2023年机器学习的十大概念和技术：1. 深度神经网

人工智能自动获取知识和技能，实现自我完善的过程是什么Aug 24, 2022 am 11:57 AM

实现自我完善的过程是“机器学习”。机器学习是人工智能核心，是使计算机具有智能的根本途径；它使计算机能模拟人的学习行为，自动地通过学习来获取知识和技能，不断改善性能，实现自我完善。机器学习主要研究三方面问题：1、学习机理，人类获取知识、技能和抽象概念的天赋能力；2、学习方法，对生物学习机理进行简化的基础上，用计算的方法进行再现；3、学习系统，能够在一定程度上实现机器学习的系统。

超参数优化比较之网格搜索、随机搜索和贝叶斯优化Apr 04, 2023 pm 12:05 PM

本文将详细介绍用来提高机器学习效果的最常见的超参数优化方法。译者 | 朱先忠审校 | 孙淑娟简介通常，在尝试改进机器学习模型时，人们首先想到的解决方案是添加更多的训练数据。额外的数据通常是有帮助（在某些情况下除外）的，但生成高质量的数据可能非常昂贵。通过使用现有数据获得最佳模型性能，超参数优化可以节省我们的时间和资源。顾名思义，超参数优化是为机器学习模型确定最佳超参数组合以满足优化函数（即，给定研究中的数据集，最大化模型的性能）的过程。换句话说，每个模型都会提供多个有关选项的调整“按钮

得益于OpenAI技术，微软必应的搜索流量超过谷歌Mar 31, 2023 pm 10:38 PM

截至3月20日的数据显示，自微软2月7日推出其人工智能版本以来，必应搜索引擎的页面访问量增加了15.8%，而Alphabet旗下的谷歌搜索引擎则下降了近1%。 3月23日消息，外媒报道称，分析公司Similarweb的数据显示，在整合了OpenAI的技术后，微软旗下的必应在页面访问量方面实现了更多的增长。截至3月20日的数据显示，自微软2月7日推出其人工智能版本以来，必应搜索引擎的页面访问量增加了15.8%，而Alphabet旗下的谷歌搜索引擎则下降了近1%。这些数据是微软在与谷歌争夺生

荣耀的人工智能助手叫什么名字Sep 06, 2022 pm 03:31 PM

荣耀的人工智能助手叫“YOYO”，也即悠悠；YOYO除了能够实现语音操控等基本功能之外，还拥有智慧视觉、智慧识屏、情景智能、智慧搜索等功能，可以在系统设置页面中的智慧助手里进行相关的设置。

人工智能在教育领域的应用主要有哪些Dec 14, 2020 pm 05:08 PM

人工智能在教育领域的应用主要有个性化学习、虚拟导师、教育机器人和场景式教育。人工智能在教育领域的应用目前还处于早期探索阶段，但是潜力却是巨大的。

30行Python代码就可以调用ChatGPT API总结论文的主要内容Apr 04, 2023 pm 12:05 PM

阅读论文可以说是我们的日常工作之一，论文的数量太多，我们如何快速阅读归纳呢？自从ChatGPT出现以后，有很多阅读论文的服务可以使用。其实使用ChatGPT API非常简单，我们只用30行python代码就可以在本地搭建一个自己的应用。阅读论文可以说是我们的日常工作之一，论文的数量太多，我们如何快速阅读归纳呢？自从ChatGPT出现以后，有很多阅读论文的服务可以使用。其实使用ChatGPT API非常简单，我们只用30行python代码就可以在本地搭建一个自己的应用。使用 Python 和 C

人工智能在生活中的应用有哪些Jul 20, 2022 pm 04:47 PM

人工智能在生活中的应用有：1、虚拟个人助理，使用者可通过声控、文字输入的方式，来完成一些日常生活的小事；2、语音评测，利用云计算技术，将自动口语评测服务放在云端，并开放API接口供客户远程使用；3、无人汽车，主要依靠车内的以计算机系统为主的智能驾驶仪来实现无人驾驶的目标；4、天气预测，通过手机GPRS系统，定位到用户所处的位置，在利用算法，对覆盖全国的雷达图进行数据分析并预测。

See all articles