首頁  >  文章  >  科技週邊  >  AMD Radeon顯示卡Stable Diffusion AI畫圖體驗測試

AMD Radeon顯示卡Stable Diffusion AI畫圖體驗測試

王林
王林轉載
2023-05-30 11:08:331989瀏覽

從Stable Diffusion這項AI應用出現之後,在極短時間內就迅速走紅,成為眾多玩家口耳相傳的「最美小姐姐」生成工具。不過這款AI計算畫圖工具在Stable Diffusion官方推出之初,無論是WEB UI的部署還是模型的訓練生成,都基本上是基於NVIDIA CUDA加速的演算法,因此A卡最初並不被Stable Diffusion官方支援。不過好在Stable Diffusion算是開源的產品,在眾多社群聚集玩家的支援下,也出現了許多支援A卡GPU加速運算的分支,像是我們今天要測試的基於DirectML的部署,就能實現AMD Radeon顯示卡的Stable Diffusion AI計算硬體加速。

AMD Radeon显卡Stable Diffusion AI画图体验测试

如果要自己在本地部署基於DirectML的Stable Diffusion話,相比便捷的基於CUDA的WEB UI部署要相對複雜一些,不過現在網上已經有比較成熟的整合包供玩家適用,玩家們只需要下載對應的整合包,就能一鍵實現在本地的傻瓜式安裝部署,可以為大家節省相當多的時間。

AMD Radeon显卡Stable Diffusion AI画图体验测试

AMD Radeon显卡Stable Diffusion AI画图体验测试

▲我們選擇這個用於測試的整合包安裝完畢之後,自動進入AMD GPU加速運算模式,在本地開啟http://127.0.0.1:7860即可開啟本機Stable Diffusion的AI繪圖介面。

AMD Radeon显卡Stable Diffusion AI画图体验测试

▲在本機WEB UI介面上可以自由設定相關的AI藝術圖產生參數,點選「生成」即可開始畫圖。具體請參考線上相關教程,在此我們不贅述。

那麼,基於DirectML的Stable Diffusion部署分支能不能實現對AMD顯示卡的硬體運算加速支援呢?它的效率到底如何?在先前A卡玩家經常只能在Linux系統下運行Stable Diffusion,透過ROCM(Radeon Open Compute)模擬CUDA加速,如今在Windows系統下直接實現A卡的AI加速計算,能否達到我們的預期目標呢?為此,我們選擇了AMD Radeon RX 5000系、RX 6000係以及RX 7000系的數款顯示卡,進行了一番詳細的體驗。

體驗平台

顯示卡:AMD Radeon RX 5500XT(8GB)、RX 5700(8GB)、RX 6500XT 4GB、RX 6600(8GB)、RX 6700XT(12GB)、RX 6750XT(12GB)、RX 6800(162GB)、RX 6750XT(12GB)、RX GB 6800(16009( 16GB)、RX 7900 XT(20GB)、RX 7900 XTX(24GB)

CPU:英特爾酷睿i9-13900K

主機板:英特爾Z790

記憶體:DDR5 6000 16GB×2

SSD:AORUS NVMe PCIe SSD 2TB

#作業系統:Windows 11 Pro 22H2

驅動程式:AMD Software Adrenalin Edition 23.4.3

通過測試,我們想知道:

AMD Radeon 5000系列、6000系列和7000系列之間,在Stable Diffusion的AI畫圖算力上有多大差別?

比起傳統的CPU AI運算加速,AMD GPU加速效能到底如何?

AMD Radeon显卡Stable Diffusion AI画图体验测试

▲我們所採用的網路開源共享的部署方案可以正確實現AMD顯示卡的硬體加速運算,可以看到在圖片產生的過程中GPU的佔用率一直保持在100%。

模型為Novel AI Final-runed(CKPT)

測試一:AI生成時尚美女

在第一部分的測試中,我們透過關鍵字生成一個大眼的時尚美女小姐姐,還要有一定的照片感。關鍵字設定如下(部分引用自網路開源共享關鍵字):

lora:koreanDollLikeness_v15:0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black chot, cute, (Keg id , (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium

解析度設定:512×512

採樣步進:20

提示字引導係數:7

產生批次-每批數量:1-1、4-1

AMD Radeon显卡Stable Diffusion AI画图体验测试

AMD Radeon显卡Stable Diffusion AI画图体验测试

AMD Radeon显卡Stable Diffusion AI画图体验测试

在測試中由於絕大部分顯示卡都擁有8GB以上的顯存,因此我們在運行參數上基本設定了正常的高顯存預設模式,只有4GB顯存版的RX 6500XT運行時採用了添加了--lowvram的低顯存運轉模式(否則就無法運作)。從整體測試結果來看,AMD從Radeon RX 5000係到RX 7000系的顯示卡幾乎都很好地實現了Stable Diffusion應用的AI計算加速性能,尤其是Radeon RX 7000系顯卡性能相比RX 6000系顯卡有了巨大的提升。例如RX 6900XT在該設定與模型演算法下的圖片產生率約為8.87張/秒,而RX 7900 XT則可達到15.76張/秒,效能提升接近100%。

而比起CPU來說,全系AMD顯示卡都佔有非常明顯的優勢,RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右,即使前兩代的入門級顯卡RX 5500XT,性能上也幾乎接近酷睿i9-13900K的5倍。

唯一有點異常的是RX 6500XT,按照核心規格來看,它應該是要強於RX 5500XT的,不過由於顯存配置僅為4GB,因此在測試中開啟了低顯存運行模式之後,其圖片上生成速度受到了極大影響,遠低於GPU加速的正常表現,僅能達到略高於CPU運算的水準。

測試二:AI產生較為複雜的水邊別墅風景照

在接下來的測試中,我們用一系列相對複雜的關鍵字來產生一座位於水邊的別墅,同時還伴隨著陽光、波紋、倒影等效果要求。關鍵字如下:

'beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, ullyautdif.color, ullybedif '

解析度設定:512×512

採樣步進:50

提示字引導係數:7.5

產生批次-每批數量:1-1、2-1、4-1

AMD Radeon显卡Stable Diffusion AI画图体验测试

AMD Radeon显卡Stable Diffusion AI画图体验测试

AMD Radeon显卡Stable Diffusion AI画图体验测试

#這部分的測試結果基本上與前一測試保持了一致性。仍是RX 7000系顯卡在效能上獨佔鰲頭,相對於RX 6000系顯卡的對位提昇在100%左右,與CPU的運算效能相比,GPU加速運算的效能提升仍非常顯著,RX 7900 XT的效能達到了酷睿i9-13900K的30倍左右,入門級顯示卡RX 5500XT,性能上也幾乎接近酷睿i9-13900K的5倍。

4GB顯存配置RX 6500XT由於僅能在低顯存模式下運行,因此圖片上生成速度還是受到了極大影響,遠低於GPU加速的正常表現,大致與酷睿i9-13900K相當。

寫在最後

#這是一個簡單但卻比較有趣的測試,透過這次體驗,我們認為有幾點參考意見可​​以總結給玩家們參考:

1.目前AMD顯示卡已經可以透過開源的部署方案實現在Windows系統下的Stable Diffusion AI運算加速,而且網路上也有許多的傻瓜式整合包,感興趣的玩家完全可以一試;

2.從測試結果來看,AMD顯示卡在Stable Diffusion的AI圖片生成計算中能夠發揮出遠勝於CPU計算的性能增幅,使用GPU加速計算能帶來事倍功半的效果;

3.從測試情況來看,測試中當渲染解析度設定超過512時(如768×768),就會出現爆顯存的情況,這與部署方案和模型有一定關係,但也反映了在正常模式下運作時,8GB記憶體幾乎是Stable Diffusion的硬式入門要求。如果顯存低於8GB,即使在512×512解析度下渲染,也會出現顯存不足的情況,此時就不得不採用--lowvram的低顯存運行方案,但會大大拖累計算速度,如測試中的RX 6500XT 4GB。所以要暢玩Stable Diffusion,我們建議顯示卡的顯存為8GB或更高為佳;

4.從整體結果來看,我們認為AMD GPU還有極大的演算法優化空間,憑不可靠經驗判斷,從RX 7900 XTX到酷睿i9-13900K的性能差距還不足夠大。這和我們部署的演算法方案以及模型都有一定關係,也希望各社群的程式設計師能發展出更多更優秀的針對AMD顯示卡的運算加速方案。

不管如何,AMD顯示卡對Stable Diffusion的硬體加速運算效能已經得到了展現,效果也比較明顯,對AMD顯示卡用戶來說毫無疑問是利好的福音消息,剩下的就是玩家與AMD需要堅持的繼續優化之路了。

以上是AMD Radeon顯示卡Stable Diffusion AI畫圖體驗測試的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:sohu.com。如有侵權,請聯絡admin@php.cn刪除