首頁 >科技週邊 >人工智慧 >優化資料中心以適應AI工作負載的四種方法

優化資料中心以適應AI工作負載的四種方法

PHPz
PHPz轉載
2023-12-14 16:51:511215瀏覽

優化資料中心以適應AI工作負載的四種方法

AI有望以多種方式改變資料中心,例如改變資料中心就業市場以及改進資料中心監控和事件回應操作。

然而,人工智慧可能對資料中心產生的最大影響是改變資料中心的工作方式。對於那些想要充分利用現代人工智慧技術的企業來說,資料中心所容納的基礎設施及其管理方式必須有所改變

AI對資料中心的發展將帶來一系列值得期待的關鍵變化,然而具體的影響還有待觀察

AI對資料中心的獨特需求

要評估人工智慧對資料中心的影響,首先需要了解人工智慧工作負載與資料中心中其他類型的工作負載(如標準應用託管)之間的區別

雖然人工智慧(AI)的工作負載形式各不相同且要求各異,但大多數都具備以下獨特需求:

  • 需要大量的運算資源,尤其是在執行模型訓練的時候。
  • 運行在裸機硬體上使其從中受益,特別是那些可存取GPU資源的伺服器。
  • 資源消耗率可能會大幅波動。在訓練階段,AI工作負載需要大量的資源,但訓練完成之後,大多數情況下資源消耗會顯著下降,直到再一次訓練模型。
  • 需要超低延遲的網路才能即時做出決策並交付結果。

當然,還有其他類型的工作負載可能有這些要求。例如,運行人工智慧應用程式和服務並不是唯一可以從裸機伺服器中受益的案例。但總的來說,與其他類型的工作負載相比,人工智慧軟體對上述資源的需求更多

為了AI升級資料中心

為了優化AI工作負載的設施,許多資料中心營運商需要做出改變,以滿足AI獨特的需求。以下是資料中心在這方面的關鍵升級。

  1. 重新設計或更換裸機伺服器

虛擬機在過去十年一直是託管工作負載的首選基礎設施資源。然而,隨著人工智慧應用和服務對裸機硬體的需求增加,越來越多的資料中心營運商可能會意識到擴展裸機產品的重要性

在某些方面,這實際上是簡化了資料中心的運作。如果你在裸機上運行工作負載,最終會得到一個不太複雜的託管堆疊,因為你沒有混合使用虛擬機器管理程式和虛擬機器編排器。

另一方面,為了擴展託管工作負載的裸機基礎設施,可能需要對資料中心中的託管伺服器和機架進行更新和升級。傳統上,在資料中心中設定伺服器的最簡單方法是配置強大的裸機機器,並根據工作負載的需求將其分配給任意數量的虛擬機器。但是,如果需要直接在裸機上運行工作負載,可能需要更多的伺服器來隔離工作負載-這意味著資料中心需要將高功率伺服器替換為較小的伺服器,並相應地更新伺服器機架

  1. 共享支援GPU的伺服器

AI應用的日常操作並不一定需要GPU支持,儘管在進行AI工作負載的訓練時使用GPU伺服器是有益的。因此,許多企業只需要臨時存取支援GPU的基礎設施即可

為了滿足企業共享GPU基礎設施的需求,資料中心營運商應該考慮提供相關產品。有些企業僅在少數情況下需要配備GPU的伺服器,因此資料中心營運商可以透過GPU即服務的方式,臨時提供GPU資源的訪問,從而更好地吸引那些有AI工作負載需求的企業

  1. 增強的網路解決方案

大部分企業級資料中心已經能夠存取高效能網路基礎設施,並且提供了互連服務,以便快速將資料移至外部設施。然而,為了充分發揮人工智慧的作用,資料中心網路產品可能需要更強大的功能

那些具有人工智慧工作負載的企業需要具備兩個關鍵功能:首先,需要高頻寬的網路連接,能夠快速傳輸大量數據,在分散式基礎設施上訓練人工智慧模型時尤其重要。其次,網路需要提供低延遲,這對於希望實現即時執行的人工智慧應用和服務至關重要

  1. #更高的資料中心靈活性

由於AI工作負載的資源需求波動很大,因此可能需要在支援基礎設施數量方面更加靈活的資料中心。 AI也可能讓人們更需要能夠讓企業在其他資料中心內按需部署伺服器、而不是自己設定這些伺服器的服務,因為按需基礎架構是解決資源需求波動的一個好方法。

為此,那些想要優化AI的資料中心營運商應該考慮使其設施更加靈活的產品。短期合同,和那些不僅僅包括了客戶可以建立自己基礎設施的機架空間服務,二者的結合可能對於那些需要部署AI工作負載的組織來說是有吸引力的。

結論

AI變革仍在上演,現在想要確切地知道AI將如何改變資料中心的運作方式或其中部署的基礎設施類型,還為時過早。但可以相對肯定地是,支援GPU的伺服器和更靈活的解決方案等變化,可能在以AI為中心的世界中變得至關重要。想要分一杯羹的資料中心營運商應該確保更新他們的設施,以滿足AI工作負載的獨特要求。

以上是優化資料中心以適應AI工作負載的四種方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除