英偉達發布AI晶片H200：效能飆升90%，Llama 2推理速度翻倍

英偉達發布AI晶片H200：效能飆升90%，Llama 2推理速度翻倍

Nov 14, 2023 pm 12:09 PM

DoNews11月14日消息，英伟达北京时间13日发布了下一代人工智能超级计算机芯片，这些芯片将在深度学习和大型语言模型（LLM）方面发挥重要作用，比如 OpenAI 的 GPT-4。

英伟达发布AI芯片H200：性能飙升90%，Llama 2推理速度翻倍

新一代芯片相较于上一代有了显著的进步，将被广泛应用于数据中心和超级计算机，用于处理天气和气候预测、药物研发、量子计算等复杂任务

发布的关键产品是基于英伟达的“Hopper”架构的HGX H200 GPU，它是H100 GPU的继任者，并且是该公司首款采用HBM3e内存的芯片。HBM3e内存具有更快的速度和更大的容量，因此非常适合大型语言模型的应用

英伟达表示：“借助HBM3e技术，英伟达H200内存速度达到每秒4.8TB，容量为141GB，几乎是A100的两倍，带宽也增加了2.4倍。”

在人工智能领域，英伟达宣称HGX H200在Llama 2（700亿参数LLM）上的推理速度比H100快了一倍。HGX H200将提供4路和8路的配置，与H100系统中的软件和硬件兼容

它将适用于每一种类型的数据中心（本地、云、混合云和边缘），并由 Amazon Web Services、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 等部署，将于 2024 年第二季度推出。

英伟达此次发布的另一个关键产品是 GH200 Grace Hopper“超级芯片（superchip）”，其将 HGX H200 GPU 和基于 Arm 的英伟达 Grace CPU 通过该公司的 NVLink-C2C 互连结合起来，官方称其专为超级计算机设计，让“科学家和研究人员能够通过加速运行 TB 级数据的复杂 AI 和 HPC 应用程序，来解决世界上最具挑战性的问题”。

GH200 将被用于“全球研究中心、系统制造商和云提供商的 40 多台 AI 超级计算机”，其中包括戴尔、Eviden、惠普企业（HPE）、联想、QCT 和 Supermicro。

值得注意的是，HPE 的 Cray EX2500 超级计算机将采用四路 GH200，可扩展到数万个 Grace Hopper 超级芯片节点

以上是英偉達發布AI晶片H200：效能飆升90%，Llama 2推理速度翻倍的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：搜狐。如有侵權，請聯絡admin@php.cn刪除

如何使用Huggingface Smollm建立個人AI助手

如何使用Huggingface Smollm建立個人AI助手Apr 18, 2025 am 11:52 AM

利用“設備” AI的力量：建立個人聊天機器人CLI 在最近的過去，個人AI助手的概念似乎是科幻小說。想像一下科技愛好者亞歷克斯（Alex）夢見一個聰明的本地AI同伴 - 不依賴

通過斯坦福大學激動人心的新計劃，精神健康的AI專心分析

通過斯坦福大學激動人心的新計劃，精神健康的AI專心分析Apr 18, 2025 am 11:49 AM

他們的首屆AI4MH發射於2025年4月15日舉行，著名的精神科醫生兼神經科學家湯姆·因斯爾（Tom Insel）博士曾擔任開幕式演講者。 Insel博士因其在心理健康研究和技術方面的傑出工作而聞名

2025年WNBA選秀課程進入聯盟成長並與在線騷擾作鬥爭

2025年WNBA選秀課程進入聯盟成長並與在線騷擾作鬥爭Apr 18, 2025 am 11:44 AM

恩格伯特說：“我們要確保WNBA仍然是每個人，球員，粉絲和公司合作夥伴，感到安全，重視和授權的空間。” anno

Python內置數據結構的綜合指南 - 分析Vidhya

Python內置數據結構的綜合指南 - 分析VidhyaApr 18, 2025 am 11:43 AM

介紹 Python擅長使用編程語言，尤其是在數據科學和生成AI中。在處理大型數據集時，有效的數據操作（存儲，管理和訪問）至關重要。我們以前涵蓋了數字和ST

與替代方案相比，Openai新型號的第一印象

與替代方案相比，Openai新型號的第一印象Apr 18, 2025 am 11:41 AM

潛水之前，一個重要的警告：AI性能是非確定性的，並且特定於高度用法。簡而言之，您的里程可能會有所不同。不要將此文章（或任何其他）文章作為最後一句話 - 目的是在您自己的情況下測試這些模型

AI投資組合|如何為AI職業建立投資組合？

AI投資組合|如何為AI職業建立投資組合？Apr 18, 2025 am 11:40 AM

建立杰出的AI/ML投資組合：初學者和專業人士指南創建引人注目的投資組合對於確保在人工智能（AI）和機器學習（ML）中的角色至關重要。本指南為建立投資組合提供了建議

代理AI對安全操作可能意味著什麼

代理AI對安全操作可能意味著什麼Apr 18, 2025 am 11:36 AM

結果？倦怠，效率低下以及檢測和作用之間的差距擴大。這一切都不應該令任何從事網絡安全工作的人感到震驚。不過，代理AI的承諾已成為一個潛在的轉折點。這個新課

Google與Openai：AI為學生打架

Google與Openai：AI為學生打架Apr 18, 2025 am 11:31 AM

直接影響與長期夥伴關係？兩週前，Openai提出了強大的短期優惠，在2025年5月底之前授予美國和加拿大大學生免費訪問Chatgpt Plus。此工具包括GPT-4O，A A A A A

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

1 個月前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳圖形設置

1 個月前By尊渡假赌尊渡假赌尊渡假赌

刺客信條陰影：貝殼謎語解決方案

3 週前ByDDD

Windows 11 KB5054979中的新功能以及如何解決更新問題

2 週前ByDDD

威爾R.E.P.O.有交叉遊戲嗎？

1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中，你可以繼續在那裡關注我們。 MinGW：GNU編譯器集合（GCC）的本機Windows移植版本，可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔；包括對MSVC執行時間的擴展，以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序，非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具，幫助Web開發人員更好地理解保護網路應用程式的過程，並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞，難度各不相同。請注意，該軟體中

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合，這些清單在安全評估過程中經常使用，而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表，幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上，他就可以存取所需的每種類型的清單。

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

熱門話題

gmail信箱登陸入口在哪裡

7555

15

1384

52

steam的賬戶名稱是什麼格式

83

11

win11激活密鑰永久

59

19

NYT連接提示和答案

28

96