首頁 >科技週邊 >人工智慧 >人工智慧如何改變資料中心設計

人工智慧如何改變資料中心設計

王林
王林轉載
2023-10-10 15:05:071236瀏覽

人工智慧如何改變資料中心設計

隨著 2023 年至 2026 年間全球人工智慧系統支出將翻一番,資料中心容量顯然將迅速增加以滿足需求。

然而,令人驚訝的是,過去一年許多資料中心營運商踩下了新專案的煞車並放緩了投資,2022-23 年間倫敦的空置容量下降了 6.3%。

這種反直覺的趨勢背後有什麼原因?為了解釋這一點,我們需要了解與人工智慧運算和支援其基礎設施相關的一些問題

人工智慧如何改變資料中心基礎設施

資料中心的建置一直都是圍繞著CPU供電展開的,以應對傳統的運算工作負載。然而,AI運算需要GPU驅動的機架,與同等容量的CPU相比,它會消耗更多的電量、散發更多的熱量並且佔用更多的空間

實際上,這意味著人工智慧運算能力通常需要更多的電源連接或替代冷卻系統。可以重新表述為:這實際上意味著,人工智慧運算能力通常需要更多的電源連接或替代冷卻系統

由於這是嵌入式基礎設施,因此它被建構在資料中心綜合體的結構中,即使在經濟上並非完全不可能,更換成本也往往極高。

在實踐中,運營商必須致力於在新的資料中心中劃分多少空間專門用於人工智慧和傳統計算

如果犯了這個錯誤並過度致力於人工智慧,可能會讓資料中心營運商面臨永久未充分利用和無利可圖的能力

由於人工智慧市場還處於起步階段,這個問題更加嚴重,Gartner 聲稱目前正處於炒作週期中預期過高的頂峰。因此,許多業者選擇在設計階段猶豫不決,而不是過早承諾人工智慧計算在新資料中心專案中的比例。

在設計階段採取整體方法

然而,營運商敏銳地意識到,如果他們不冒險推遲投資,就會失去市場份額和競爭優勢。然而,考慮到資料中心基礎設施的許多基本原理正在即時重寫,這是一項艱鉅的任務

為了平衡先行者的需求和抵消風險,營運商需要將其資料中心設計得在人工智慧運算時代具有最大的效率和彈性。這需要一種全新的、整體的設計方法。

1、讓更多利害關係人參與

無論營運商決定如何區分人工智慧和傳統運算,具有人工智慧運算能力的資料中心站點都將比傳統設施複雜得多。更高的複雜性通常意味著更多的故障點,特別是因為人工智慧運算比傳統運算有更多的需求。

因此,為了確保網站生命週期內的正常運作時間並降低出現代價高昂的問題的風險,團隊需要在資料中心的規劃階段更加徹底。

特別是,設計階段應在專案開始時尋求更多團隊和專業知識的意見。除了尋求電源和冷卻的專業知識外,設計人員還應該儘早與營運、佈線和安全團隊合作,以了解潛在的瓶頸或故障來源

2、將人工智慧融入資料中心營運

由於營運商現在在現場擁有人工智慧運算,他們應該利用自己的能力利用人工智慧來提高營運效率。人工智慧在資料中心的採用由來已久,該技術能夠以極高的精度和品質執行工作流程。例如,人工智慧可以幫助:

  • 溫濕度監測
  • #安全系統操作
  • 用電監控和分配
  • 硬體故障偵測和預測性維護

透過在資料中心生命週期的每個階段主動使用該技術,營運商可以顯著提高營運效率和穩健性。人工智慧非常適合幫助解決採用這些下一代資料中心新穎而複雜的佈局時遇到的新挑戰,例如透過故障檢測和預測性維護

3、避免虛假經濟

#在在高峰時段,人工智慧會為資料中心帶來更大的負載,例如在訓練運行期間或在生產中運行企業級模型時。在這個時候,人工智慧運算通常會遠遠超出傳統預期對功耗、冷卻需求和資料吞吐量的限制

從最基本的層面來看,這意味著資料中心的底層材料承受更大的壓力。如果這些底層材料或組件品質不高,這意味著它們更容易故障。由於人工智慧運算意味著站點中組件和連接數量的急劇增加,這意味著在傳統站點中運行良好的更便宜和質量較低的材料可能會導致運行人工智能計算的數據中心停止運行

為了避免節省資金的虛假經濟風險,業者應避免購買劣質材料,如不合格的電纜。這些材料容易故障,需要頻繁更換。更嚴重的是,不合格材料和組件的故障通常會導致工廠停機或減速,進而影響獲利能力

解決基礎設施難題

儘管人工智慧運算的基礎設施要求可能是營運商拖延投資的主要原因,但從長遠來看,情況不會如此

隨著市場的不確定性增加,企業將會在傳統運算和人工智慧運算之間分裂,朝著他們的「黃金領域」靠攏

在這種情況下,公司應確保在網站運作中具備一切可能的優勢,以便在學習和成長的過程中取得成功

這意味著從一開始就進行整體設計,利用人工智慧本身來發現其網站的新效率,並投資於能夠滿足人工智慧計算更大需求的優質材料。

以上是人工智慧如何改變資料中心設計的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除