首頁 >科技週邊 >人工智慧 >人工智慧迫使資料中心重新思考設計

人工智慧迫使資料中心重新思考設計

WBOY
WBOY轉載
2023-09-23 09:25:011275瀏覽

人工智慧迫使資料中心重新思考設計

隨著人工智慧在企業中的大規模應用,其後果之一是其消耗了資料中心更大比例的工作負載。

人工智慧不僅將加速對資料中心的需求,為投資創造新的動力,而且還將對資料中心的永續性策略和要部署的基礎設施的性質產生影響。

例如,Tirias Research預測,依照目前的情況,到2028年,生成式人工智慧資料中心伺服器基礎設施加上營運成本將超過7,600萬美元,是Amazon AWS目前估計年度營運成本的兩倍多,佔全球雲端服務市場的三分之一。

硬體運算效能預計將提高400%,與Tirias估計的處理工作負載增加50倍相比,顯得相形見絀

更高的密度

根據Schneider Electric的一份新白皮書,大型訓練集群和小型邊緣推理伺服器的爆炸性增長,也將意味著向更高機架功率密度的轉變。

白皮書寫道:「人工智慧新創公司、企業、主機託管供應商和網路巨頭現在必須考慮這些密度對資料中心實體基礎設施的設計和管理的影響。」

#施耐德能源管理研究中心對人工智慧對能源需求的影響進行了預測。根據估計,目前人工智慧代表著4.3GW的電力需求,預計到2028年將以26%至36%的複合年增長率增長

這將導致總需求達到13.5GW至20GW,是數據中心整體電力需求成長的兩到三倍。到2028年,人工智慧工作負載將佔資料中心總能源的20%

Schneider指出,雖然預計會比訓練叢集消耗更多的電量,但推理工作負載可以在各種機架密度下運行。

「另一方面,人工智慧訓練工作負載一直以非常高的密度運行,每個機架的功率在20-100 kW或更高。」

網路需求和成本是促使這些訓練機架聚集在一起的原因。這些高功率密度的集群為資料中心的電源、冷卻、機架和軟體管理設計帶來了根本性的挑戰

動力系統的挑戰

Schneider概述了四個可能產生影響的關鍵領域:電源、冷卻、機架和軟體管理

在電力方面,人工智慧工作負載對開關設備和配電系統的動力系統提出了挑戰。

目前使用的一些電壓將被證明部署起來不切實際,而較小的配電塊尺寸可能會浪費IT空間。較高的機架溫度也會增加故障和危險的機會。 重寫後的內容:目前使用的某些電壓可能被證明在部署時不切實際,而較小的配電塊尺寸可能會浪費IT空間。同時,較高的機架溫度還會增加故障和危險發生的可能性

隨著資料中心過渡到液體冷卻,冷卻將是至關重要的,也是需要重大改變的領域之一,半個多世紀以來,液體冷卻一直用於專業高效能運算。

Schneider表示:“儘管在不久的將來,空氣冷卻仍將存在,但預測,從空氣冷卻到液體冷卻的轉變將成為具有人工智能集群的數據中心的首選或必要解決方案。” 改寫為:據Schneider所說,儘管在不久的將來仍會有空氣冷卻,但預測表明,將從空氣冷卻轉變為液體冷卻將成為具備人工智能集群的數據中心的首選或必要解決方案

與空氣冷卻相比,液體冷卻具有許多優點。首先,液體冷卻可以提高處理器的可靠性和效能。其次,液體冷卻可以節省空間並增加機架密度。此外,液體冷卻中的水俱有更大的熱慣性,並且可以減少用水量

對於人工智慧集群,伺服器需要更深入,電力需求更大,冷卻也更複雜。

為了滿足需求,機架必須具備更高的密度和承重能力

數位孿生

最終,DCIM、BMS和電氣設計工具等軟體工具將成為管理人工智慧叢集的關鍵

透過適當配置和實施軟體,可以實現資料中心的數位孿生,以便識別功率限制和冷卻資源的效能,並為優化佈局決策提供相關資訊

在日益動態的環境中,容錯空間越小,操作風險就越高。因此,Schneider建議創建整個IT空間的數位孿生,包括機架中的設備和虛擬機器。

透過數位化添加或移動IT負載,可以驗證是否有足夠的電力、冷卻和地板承重能力來支援。這為決策提供了信息,以避免資源擱淺,並最大限度地減少可能導致停機的人為錯誤

以上是人工智慧迫使資料中心重新思考設計的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除