英偉達打臉AMD：H100在軟體加持下，AI效能比MI300X快47%！-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

英偉達打臉AMD：H100在軟體加持下，AI效能比MI300X快47%！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Dec 15, 2023 pm 06:15 PM

amd英偉達 (nvidia)ai性能 (ai performance)

英偉達打臉AMD：H100在軟體加持下，AI效能比MI300X快47%！

12月14日消息，AMD於本月初推出了其最強的AI晶片Instinct MI300X，其8-GPU伺服器的AI性能比英偉達H100 8-GPU高出了60%。對此，英偉達於近日發布了一組最新的H100與MI300X的性能對比數據，展示了H100如何使用正確的軟體提供比MI300X更快的AI性能。

根據AMD先前發表的數據顯示，MI300X的FP8/FP16性能都達到了英偉達（NVIDIA）H100的1.3倍，運行Llama 2 70B和FlashAttention 2 模型的速度比H100均快了20%。在8v8 伺服器中，運行Llama 2 70B模型，MI300X比H100快了40%；運行Bloom 176B模型，MI300X比H100快了60%。

但是，需要指出的是，AMD在將MI300X 與英偉達H100 進行比較時，AMD使用了最新的ROCm 6.0 套件中的優化庫（可支援最新的計算格式，例如FP16、Bf16 和FP8，包括Sparsity等），才得到了這些數字。相較之下，對於英偉達H100則並未沒有使用英偉達的 TensorRT-LLM 等優化軟體加持情況下進行測試。

AMD對英偉達H100測試的隱含聲明顯示，使用vLLM v.02.2.2推理軟體和英偉達DGX H100系統，Llama 2 70B查詢的輸入序列長度為2048，輸出序列長度為128

#英偉達最新發布的對於DGX H100（帶有8個NVIDIA H100 Tensor Core GPU，帶有80 GB HBM3）的測試結果顯示，使用了公開的NVIDIA TensorRT LLM軟體，其中v0.5.0用於Batch-1測試，v0.6.1用於延遲閾值測量。測試的工作量詳細資訊與先前進行的AMD測試相同

英偉達打臉AMD：H100在軟體加持下，AI效能比MI300X快47%！

根據結果顯示，英偉達DGX H100伺服器在使用最佳化的軟體後，其效能提高了超過2倍，比AMD展示的MI300X 8-GPU伺服器快了47%

DGX H100 在1.7秒內可以處理單一推理任務。為了優化回應時間和資料中心的吞吐量，雲端服務為特定的服務設定了固定的回應時間。這樣他們可以將多個推理請求組合成更大的“Batch”，從而增加伺服器每秒的總體推理次數。 MLPerf 等業界標準基準測試也使用這個固定的反應時間指標來衡量效能

回應時間的微小權衡可能會導致伺服器可以即時處理的推理請求數量產生不確定因素。使用固定的 2.5 秒回應時間預算，英偉達DGX H100 伺服器每秒可以處理超過 5 個 Llama 2 70B 推理，而Batch-1每秒處理不到一個。

顯然，英偉達使用這些新的基準測試是相對公平的，畢竟AMD也使用其優化的軟體來評估其GPU的性能，所以為什麼不在測試英偉達H100時也這樣做呢？

要知道英偉達的軟體堆疊圍繞著CUDA生態系統，經過多年的努力和開發，在人工智慧市場擁有非常強大的地位，而AMD的ROCm 6.0是新的，尚未在現實場景中進行測試。

根據AMD先前透露的資訊顯示，已與微軟、Meta等大公司達成了很大一部分交易，這些公司將其MI300X GPU視為英偉達H100解決方案的替代品。

AMD最新的Instinct MI300X預計將在2024年上半年大量出貨，但是，屆時英偉達更強的H200 GPU也將出貨，2024下半年英偉達還將推出新一代的Blackwell B100。另外，英特爾也將會推出其新一代的AI晶片Gaudi 3。接下來，人工智慧領域的競爭似乎會變得更加激烈。

編輯：芯智訊-浪客劍

以上是英偉達打臉AMD：H100在軟體加持下，AI效能比MI300X快47%！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：搜狐。如有侵權，請聯絡admin@php.cn刪除

Gemma範圍：Google＆＃039;用於凝視AI的顯微鏡Apr 17, 2025 am 11:55 AM

使用Gemma範圍探索語言模型的內部工作了解AI語言模型的複雜性是一個重大挑戰。 Google發布的Gemma Scope是一種綜合工具包，為研究人員提供了一種強大的探索方式

誰是商業智能分析師以及如何成為一位？Apr 17, 2025 am 11:44 AM

解鎖業務成功：成為商業智能分析師的指南想像一下，將原始數據轉換為驅動組織增長的可行見解。這是商業智能（BI）分析師的力量 - 在GU中的關鍵作用

如何在SQL中添加列？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQL的Alter表語句：動態地將列添加到數據庫在數據管理中，SQL的適應性至關重要。需要即時調整數據庫結構嗎？ Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

業務分析師與數據分析師Apr 17, 2025 am 11:38 AM

介紹想像一個繁華的辦公室，兩名專業人員在一個關鍵項目中合作。業務分析師專注於公司的目標，確定改進領域，並確保與市場趨勢保持戰略一致。 simu

什麼是Excel中的Count和Counta？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excel 數據計數與分析：COUNT 和 COUNTA 函數詳解精確的數據計數和分析在 Excel 中至關重要，尤其是在處理大型數據集時。 Excel 提供了多種函數來實現此目的，其中 COUNT 和 COUNTA 函數是用於在不同條件下統計單元格數量的關鍵工具。雖然這兩個函數都用於計數單元格，但它們的設計目標卻針對不同的數據類型。讓我們深入了解 COUNT 和 COUNTA 函數的具體細節，突出它們獨特的特性和區別，並學習如何在數據分析中應用它們。要點概述理解 COUNT 和 COU