ホームページ >テクノロジー周辺機器 >AI >AI ワークロードに対応してデータセンターを最適化する 4 つの方法

AI ワークロードに対応してデータセンターを最適化する 4 つの方法

PHPz
PHPz転載
2023-12-14 16:51:511246ブラウズ

AI ワークロードに対応してデータセンターを最適化する 4 つの方法

AI は、データセンターの雇用市場の変化、データセンターの監視とインシデント対応業務の改善など、さまざまな方法でデータセンターを変革すると予想されています。

しかし、人工知能がデータセンターに与えると考えられる最大の影響は、データセンターの動作方法を変えることです。最新の人工知能テクノロジーを最大限に活用したい企業にとって、データセンターに含まれるインフラストラクチャとその管理方法は変わらなければなりません。

データセンターにおける AI の開発は、注目に値する一連の発展をもたらします。主な変更に進みますが、具体的な影響はまだわかりません 標準アプリケーション ホスティングなど、他のタイプのワークロードとの違い

人工知能 (AI) ワークロードにはさまざまな形式があり、さまざまな要件がありますが、ほとんどのワークロードは次のとおりです。固有の要件:

特にモデルのトレーニングを実行する場合、多くのコンピューティング リソースが必要です。

ベアメタル ハードウェア、特に GPU リソースにアクセスできるサーバーで実行するとメリットが得られます。
  • リソース消費率は大幅に変動する可能性があります。トレーニング段階では、AI ワークロードは大量のリソースを必要としますが、トレーニングが完了すると、ほとんどの場合、モデルが再度トレーニングされるまでリソース消費量は大幅に減少します。
  • 超低遅延ネットワークは、意思決定を行い、リアルタイムで結果を提供するために必要です。
  • もちろん、これらの要件を満たす可能性のある他のタイプのワークロードもあります。たとえば、人工知能のアプリケーションやサービスの実行だけが、ベア メタル サーバーのメリットを享受できるユースケースではありません。ただし、一般に、AI ソフトウェアは他のタイプのワークロードよりも多くの上記のリソースを必要とします
  • AI 用のデータ センターのアップグレード

AI ワークロードに合わせて施設を最適化するには、多くのデータ センター オペレーターが変更を加える必要があります。 AI 特有の要求に応えます。この点に関する主なデータセンターのアップグレードは次のとおりです。

ベア メタル サーバーの再設計または交換

  1. 過去 10 年間、仮想マシンはワークロードをホストするためのインフラストラクチャ リソースとして選ばれてきました。しかし、AI アプリケーションやサービス用のベア メタル ハードウェアの需要が高まるにつれ、ベア メタル製品の拡張の重要性を認識するデータ センター オペレーターが増えてくると考えられます。ベアメタルでワークロードを実行すると、ハイパーバイザーと VM オーケストレーターが混在しないため、ホスティング スタックの複雑さが軽減されます。
  2. 一方、ワークロードをホストするベアメタル インフラストラクチャを拡張するには、データ センター内のホスティング サーバーとラックを更新およびアップグレードする必要がある場合があります。従来、データセンターにサーバーをセットアップする最も簡単な方法は、強力なベアメタル マシンをプロビジョニングし、ワークロードのニーズに基づいて任意の数の仮想マシンに割り当てることでした。ただし、ワークロードをベアメタル上で直接実行する必要がある場合は、ワークロードを分離するためにより多くのサーバーが必要になる可能性があります。つまり、データセンターは高性能サーバーを小型サーバーに置き換え、それに応じてサーバー ラックを更新する必要があります。

共有 GPU 対応サーバー

    GPU サポートは、AI アプリケーションの日常的な操作には必ずしも必要ではありませんが、AI ワークロードのトレーニングが有益な場合には GPU サーバーが使用されます。 。したがって、多くの企業は GPU 対応インフラストラクチャへの一時的なアクセスのみを必要とするため、共有 GPU インフラストラクチャに対する企業のニーズを満たすために、データセンター運営者は関連製品の提供を検討する必要があります。一部の企業では、GPU を搭載したサーバーを必要とするケースが限られているため、データ センター オペレーターは、サービスとしての GPU を通じて一時的に GPU リソースへのアクセスを提供し、AI ワークロードのニーズを持つ企業をより適切に引き付けることができます
  1. 強化されたネットワーク ソリューション

ほとんどの企業データ センターはすでに高性能ネットワーク インフラストラクチャにアクセスしており、データを外部施設に迅速に移動するための相互接続サービスを提供しています。ただし、人工知能のパワーを完全に実現するには、データ センター ネットワーク製品には、より強力な機能が必要になる場合があります。人工知能ワークロードを持つ企業には、2 つの重要な機能が必要です。1 つは、高帯域幅のネットワーク接続が必要であることです。データ量は、分散インフラストラクチャ上で AI モデルをトレーニングする場合に特に重要です。次に、ネットワークは低遅延を実現する必要があります。これは、リアルタイム実行を実現したい人工知能アプリケーションやサービスにとって重要です

  1. データセンターの柔軟性の向上

AI ワークロードのリソース需要は大きく変動するため、サポートするインフラストラクチャの量に関してより柔軟なデータ センターが必要になる場合があります。また、オンデマンド インフラストラクチャはリソース需要の変動に対応する優れた方法であるため、AI により、企業が自社でサーバーをセットアップするのではなく、他のデータ センターにサーバーをオンデマンドで展開できるようにするサービスの需要も増加する可能性があります。

この目的を達成するために、AI 向けに最適化したいデータセンター運営者は、施設をより柔軟にする製品を検討する必要があります。短期契約と、顧客が独自のインフラストラクチャを構築できるラックスペース以上のものを含むサービスの組み合わせは、AI ワークロードを展開する必要がある組織にとって魅力的である可能性があります。

結論

AI 革命はまだ進行中であり、AI がデータセンターの運営方法やデータセンター内に導入されるインフラストラクチャの種類をどのように変えるかを正確に知るのは時期尚早です。しかし、比較的確実なことは、GPU 対応サーバーやより柔軟なソリューションなどの変化が、AI 中心の世界では重要になる可能性があるということです。このパイの一部を獲得したいデータセンター運営者は、AI ワークロードの固有の要件を満たすために施設を必ず更新する必要があります。

以上がAI ワークロードに対応してデータセンターを最適化する 4 つの方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。