終於,最後一張 RTX 40 SUPER 系顯卡它來了,主打 4K 高刷遊戲體驗,並且首發價相比 RTX 4080 直降 1499 元,也就是 8099 元。如果你最近剛好有升級或裝機需求,預算充裕且希望各方面表現均衡,一步到位。那麼今天這期 NVIDIA GeForce RTX 4080 SUPER 顯示卡的評測內容一定能幫到你。
評測前,先依照慣例先來介紹一下本次的測試平台,具體配置如下:
##外觀設計這次公版卡所有型號都改成了黑色塗裝,可以說是外觀上最大的變化。也因為這個細節的差別,讓新版 NVIDIA GeForce RTX 4080 SUPER 的外觀更加帥氣。 開箱公版卡本身也是一件令人興奮的事,包裝做的非常精緻,把它如上圖這樣放在桌面時,說是一個金屬科技感滿滿的「擺飾」也不為過。 NVIDIA GeForce RTX 4080 SUPER 的正面依舊採用X 型設計,還有佔據幾乎一半面積的超大風扇,左側的RTX 4080 SUPER 型號文字分別採用陰刻和陽刻處理,實際觀感頗為精緻。不過尺寸上變成了一張 3.5 槽卡,因此體積比較大,重量也增加了不少,即使裝機時還是建議大家上顯示卡支架。 右側的散熱鰭片和風扇均採用全黑化處理,拿在手中很有分量,也有利於更有效率地散熱。 同樣的,背部左側也有一個一模一樣的風扇,彼此能夠形成垂直風道,更好帶走顯示卡內部的熱量。 NVIDIA GeForce RTX 4080 SUPER 顯示卡的側面也同樣做了黑化處理,視覺上非常統一,中間還微微做了一點凹陷弧度處理,增強質感。供電介面採用 12 4pin 設計,供電更加穩定。 I / O 介面擋板採用深灰配色,接口方面配備了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支援 8K60Hz 輸出。 配件方面,NVIDIA GeForce RTX 4080 SUPER 配備了 16pin 轉 3*8pin 的轉接線,對電源供應器的兼容性更好。 核心解析GeForce RTX 4080 SUPER 雖然也是基於 AD103 核心所打造,但核心規格方面相當恐怖。例如配備了 10240 個 CUDA 核心,相較於 RTX 4080 的 9728 個 CUDA 核心,核心數提升了 5.2%。它還擁有 52 個 Shader Core TFLOPS 單元和 121 個 RT Core TFLOPS,圖形 / 遊戲性能再次升級。此外,它的 320 個 Tensor Cores 核心和 836 個 AI TOPS 將提供強大的 AI 算力和 DLSS 性能。 顯存規格上 GeForce RTX 4080 SUPER 還是 16GB GDDR6X,與 RTX 4080 保持一致。不過,64MB 的 L2 緩存,能夠讓 GeForce RTX 4080 SUPER 充分發揮 4K 解析度下的遊戲效能。 GPU 頻率方面,基礎頻率為 2295MHz,加速頻率為 2550MHz,分別比 RTX 4080 提升了 40MHz 和 80MHz。從顯示卡規格和官方的定位上看,GeForce RTX 4080 SUPER 是一張定位 4K 遊戲和擁有強大 AI 算力的高階顯示卡。當然,GeForce RTX 4080 SUPER 依舊採用了最新的 NVIDIA Ada 架構,基於 TSMC 4N NVIDIA 定制工藝打造,因此實現了高達 2 倍的性能功耗比飛躍。串流多處理器的吞吐量超過上一代產品 2 倍。第三代 RT Cores 的 DLSS 3 可讓光追效能提升 2 倍,第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的 Tensor 處理效能,DLSS 至多提升 4 倍效能。
測試效能之前,我們不妨先透過甜甜圈烤機測試,來看看它的功耗表現如何。烤機20 分鐘,GPU 功耗維持在320W 左右,核心溫度69℃左右,顯存溫度70℃,這個溫度表現還是比較均衡的,而此時的GPU 頻率可以來到2325MHz-2450MHz 之間,效能釋放還是有保障的。
烤機之後,我們又對GeForce RTX 4080 SUPER 進行了3D Mark 的Time Spy 壓力測試,來看看在連續高負載下的顯示卡效能釋放是否平穩和持久,最終GeForce RTX 4080 SUPER 得到了99.6% 的成績,持續的性能輸出表現非常出色。
接下來是GPU 理論效能測試環節,在3DMark TimeSpy Extreme DX12 測試中,GeForce RTX 4080 SUPER 的顯示卡分數為14401 分,相較於RTX 3080 的8602 分提升了67.4% 左右,也超越了上一代RTX 3090。
在3DMark Fire Strike Extreme DX11 測試中,GeForce RTX 4080 SUPER 的顯示卡分數為34894 分,對比RTX 3080 的20382 分提升了約71.2%,而相比上代RTX 3090 Ti 的27074 分,也有28.8% 的提升。
在3DMark Fire Strike Ultra DX11 測試中,GeForce RTX 4080 SUPER 的顯示卡分數達到了17395 分,對比RTX 3080 的10365 分提升了約67.8%,也領先於上代RTX 3090 Ti 的13855 分。
在3DMark Portal Royal 光追測試中,GeForce RTX 4080 SUPER 獲得了18439 分,相比RTX 3080 的11231 分提升了64.1%,光追遊戲性能提升明顯。
既然說到遊戲,就不得不提一下目前NVIDIA 平台已經擁有超500 款支援RTX 技術的遊戲和應用,而且隨著DLSS 3 技術的日益成熟和普及,支援DLSS 3 的遊戲數量也在源源不斷的上升。
例如今年14 款支援DLSS 3 技術的全新遊戲加入,包括《龍之信條2》《地平線: 西之絕境》《人中之龍8》《半條命2 RTX》等知名遊戲。另外,已經發布的《心靈殺手 2》《賽博朋克 2077:往日之影》《決勝時刻:現代戰爭 3》等,也在第一時間就支持了 DLSS 3 或 DLSS 3.5 的技術。同時,目前主流的熱門線上競技遊戲,都支援了 NVIDIA Reflex 技術,不管是對於低配玩家還是電競玩家,這兩項技術都能大幅提升遊戲體驗。
接下來的遊戲測試環節,我們將給大家測試6 款遊戲,包括2 款線上競技類遊戲,2 款傳統光柵遊戲以及2 款支援DLSS 3 /3.5 的光追遊戲,所有遊戲均採用4K 解析度測試,以此驗證它的4K / 4K 光追遊戲表現。
首先是兩款線上競技類遊戲,在《CS2》中我們採用預設高畫質選項,在4K 解析度下進行一局對戰,並透過Frame View 記錄平均幀數,GeForce RTX 4080 SUPER 在4K 解析度的平均幀數能夠達到305 幀。
另外,透過開啟遊戲設定中的NVIDIA Reflex 選項至開啟增強,即使來到4K 解析度下,遊戲的平均延遲也只有9ms,對玩家的影響可以說非常小。
第二款線上競技類遊戲我們選擇了人氣頗高的《虹彩六號:圍攻行動》,GeForce RTX 4080 SUPER 在4K 分辨率,最高畫質下的平均幀數達到了350 幀,也是完全能夠滿足高分高刷電競需求的。
至於延遲方面,《虹彩六號:圍攻行動》同樣支援NVIDIA Reflex 技術,在遊戲運行時選擇帶有Vukan 的選項,就能在遊戲中找到Reflex on 增強的選項,開啟之後透過Frame 進行抓取,4K 解析度下的平均延遲也才10.2ms,延遲表現相當可以。
接著是2 款傳統光柵遊戲,在經典敘事冒險遊戲《荒野大鏢客:救贖2》中,選擇最高畫質,4K 解析度下的平均幀數字可以達到平均99 幀,RTX 4080 為95 幀,提升了4.2%。
我們也測了育碧家的最新作《刺客教條:幻景》,在4K 解析度最高畫質下,運行遊戲自帶的效能基準測試, GeForce RTX 4080 SUPER 的平均幀數來到100 幀,RTX 4080 的平均幀數為92 幀,提升了約8.6%。從測試結果不難看出,在傳統光柵遊戲中,RTX 4080 SUPER 相比 RTX 4080 的提升比較有限。
那麼在光追遊戲中,GeForce RTX 4080 SUPER 的表現又如何呢?本站選擇了兩款支援DLSS 3/3.5 的光追遊戲,其中一款是優化非常出色的《極限競速:地平線5》,在遊戲中選擇極端畫質預設,並開啟DLSS 3 DLSS 2 質量檔,NVIDIA Reflex 選項也會預設打開,我們照例選擇Reflex ON BOOST,執行遊戲自帶的效能基準測試。
進入遊戲選擇 4K 解析度極端畫質,平均幀數可達 149 幀,遊戲的平均延遲僅為 16.4ms。 RTX 4080 的平均幀數是 132 幀,提升約 12.8%。
那如果我們只開光追,不開 DLSS 選項,且關閉 Reflex 低延遲選項時,GeForce RTX 4080 SUPER 的表現又如何呢?可以看到在優化出色的地平線 5 中,即使不開 DLSS,4K 光追下平均幀數依舊來到了 125 幀,不過沒有 Reflex 低延遲技術的加持,遊戲平均延遲飆升到了 24.1ms。
最後是對顯示卡性能要求非常高的《Cyberpunk:2077》,這次我們測試3 次,第一次選擇超級光追畫質,開啟DLSS 2 品質檔DLSS 3 幀生成,在4K 解析度下運行自帶基準性能測試,此時平均幀率能到83 幀,還不錯的表現。
第二次我們選擇超速光追畫質,開啟DLSS 2 品質檔DLSS 3 影格產生DLSS 3.5 光線重構,此時4K 解析度下,GeForce RTX 4080 SUPER 的平均幀數正好60 幀,算是守住了4K / 60 幀的底線。
當然,如果完全關閉DLSS,只開光追,4K 下的遊戲平均幀數就只有29 幀了,畢竟不是所有遊戲都能有地平線5 的優化水平,畫質對性能的負載也不同。透過對比不難發現,DLSS 技術對遊戲玩家來說絕對是最實用的技術。
關閉光線重建
開啟光線重建
那麼開不開DLSS 3.5 對於遊戲畫質到底有何影響呢?大家看這兩張圖,遊戲中同一個場景下雨後濕滑路面的倒影給了我們答案,在開啟光線重建後倒影的清晰度提昇明顯,以往畫面中常有的偽影也少了很多,顯而易見DLSS 3.5 可以說是高等級光追的潤滑劑,在保留最高畫面效果的同時,也能發揮最好的幀數表現。
創意生產
前面我們曾提到,GeForce RTX 4080 SUPER 的L2 快取也達到了64MB,顯存頻寬高達23Gbps,還有多達836 個AI TOPS 核心,這為GeForce RTX 4080 SUPER 的創意生產和AI 性能提供了有力保障。用戶還可透過安裝 NVIDIA Studio 驅動,以加速 110 多款最受歡迎的創意應用,如 Optix、DLSS 和 Maxine,還有 NVIDIA Studio 全套創意應用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
在建模和渲染類別軟體中,GeForce RTX 4080 SUPER 的 10240 個 CUDA 核心可以提供硬體加速,使得工作效率得以提高。幾乎所有的建模軟體都會對 NVIDIA 的 GPU 進行最佳化,因此在效率、穩定性和相容性方面都能夠兼顧。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光線追蹤功能,實現高效能的最終影格渲染。此外,搭載了 AI 降噪功能的 GPU 還可以進一步加速互動式渲染,提供更流暢的工作體驗。
實際看一下 GeForce RTX 4080 SUPER 的專業生產力表現。首先是 V-Ray Benchmark 這款建模軟體的基準測試部分,GPU CUDA 測試專案得分為 3103 分。
在 GPU RTX 的測試項目中,GeForce RTX 4080 SUPER 顯示卡的最終成績為 4292 分。
在另一款建模軟體blender 的Benchmark 測試中,GeForce RTX 4080 SUPER 顯示卡的三場景得分如圖所示,三場景得分則是4574,2162 ,2264,同樣有明顯提升。
接著咱們看看它在視訊渲染和編解碼方面的性能表現,GeForce RTX 4080 SUPER 配備了2 個NVENC 編碼器,且支援新一代AV1 視訊編碼技術,在相同視訊大小下能夠提供更快速的視訊編碼和更高品質的串流傳輸效能。國內的剪映專業版已經實現了對NVIDIA AV1 視訊編碼器的加速支持,我們也對此進行了測試,在剪映專業版中導入一段時長為2 分30 秒的4K 視訊素材,然後分別採用H .264 編碼和AV1 編碼進行導出。
#########可以看到同樣匯出4K / 60 幀規格的情況下,AV1 編碼匯出的影片大小為609MB,H.264 編碼匯出的影片大小為800MB,文件體積上採用AV1 編碼的影片相比H.264 編碼的影片小了近三分之一。 ###############而且在畫質方面,透過截取兩個影片的畫面細節進行觀察,兩種編碼方式也基本上看不出任何區別,又小又高清,AV1勢必會成為編碼格式中的新寵。 ############還有是 RTX 視訊超解析度技術,它可以透過 GPU 的 AI 計算,至多將線上 1080P 視訊提升到 4K 分辨率,實現以演算法提高清晰度的效果。我們只需在 NVIDIA 控制面板中找到視訊 —— 調整視訊影像設置,便可自訂調節,超分等級有 4 檔。
↑ 由左至右依序為480P、VSR1、VSR2、VSR3、VSR4
我們透過播放在本站B站帳號發布的一條視頻,並將分辨率調整為480P,然後依次提升超分等級進行截圖測試,能看出1-4 檔下人物變得更加清晰了。
最後我們也透過Stable Diffusion 簡單測試了一下這張卡在AIGC 方面的表現,模型我們採用了基於SDXL 開源模型的sd_xl_base_1.0_0. 9vae.safetensors,以文生圖的方式繪製21 張雪山上的女孩圖像,圖像分辨率為1024*1024,採樣方法為Euler a,迭代步數50,總批次數為10,最終花費1 分55 秒完成。
第二次我們在其它設定不變的情況下,打開TensorRT Engines 優化引擎後再跑一遍,這次時間僅花費了1 分01 秒,節省了近一半。
另外,在Stable Diffusion 跑圖時查看顯存的佔用情況,即使是目前評測中較為簡單的繪圖參數設定情況下,8GB 顯存佔用也是常態,瞬時顯存佔用還會飆到10GB\12GB 以上,更別提解析度更高,參數設定更複雜的繪圖條件了。如果這張卡的顯存只有 8GB,那麼對於專業 AI 創作者來說,爆顯存很可能經常發生,一旦顯存不夠出圖時間便會大大延長,非常耽誤事情。所以 GeForce RTX 4080 SUPER 的 16GB 大顯存在 AI 方面起到了非常重要的作用,它和 AI 內容生成的效率直接掛鉤,相同架構和近似性能下,顯存越大越有優勢。
和先前我們評測的GeForce RTX 4070 SUPER 相比,這張GeForce RTX 4080 SUPER 顯然瞄準了追求4K 極致遊戲體驗的用戶,也就是主流遊戲全畫質特效也能達到4K 100FPS 的遊戲效能,玩家不需在遊戲畫質與特效中取捨糾結,盡情享受遊戲就好。還在用 RTX 40 系列以前老卡的用戶,想要一步到位的遊戲體驗可以閉眼買。不過,如果你手上已經有任何一張 RTX 40 顯示卡,那麼升級顯示卡的週期都可以往後延。除此之外,有 AIGC 創作或其它 AI 需求的用戶,也可以考慮這張卡,目前來說,它也是最適合做 AI 相關工作的。
另一方面,公版 GeForce RTX 4080 SUPER 出色的做工和質感,獨特的外形設計,也是許多玩家追捧的原因之一。更別說這次首發價格比原版 RTX 4080 整整便宜了 1400 元。有趣的是,如果我們比較上一代RTX 3080Ti,那麼你會發現兩者的CUDA 核心,Tensors Cores,RT Cores 的數量都是一樣的,但是因為採用了Ada Lovelace 架構,各方面表現都強很多,功耗甚至也要低上30W。
以上是NVIDIA GeForce RTX 4080 SUPER 首發評測:性能更強悍,價格更美麗的詳細內容。更多資訊請關注PHP中文網其他相關文章!