Maison >Périphériques technologiques >IA >Gartner : l'IA générative pilotera la transformation de la conception des centres de données d'entreprise chinois
Le 15 avril 2024, une récente enquête 2024 des DSI et des dirigeants technologiques publiée par Gartner a montré que plus de 60 % des entreprises chinoises prévoient de déployer l'intelligence artificielle générative au cours des 12 à 24 prochains mois (GenAI). Étant donné que les entreprises chinoises ont tendance à déployer GenAI localement plutôt que via le cloud public, l’environnement d’infrastructure actuel ne peut pas prendre en charge les projets GenAI. Cela favorisera la transformation de la conception des centres de données des entreprises chinoises.
Zhang Lukeng, directeur de recherche chez Gartner, a déclaré : « En raison de problèmes de sécurité et de confidentialité des données et d'exigences réglementaires, certaines entreprises préfèrent déployer des solutions GenAl ou affiner les grands modèles de langage (LLM) sur site en déployant GenAl sur site. est critique pour les centres de données. Il ne s'agit pas d'une simple exigence d'hébergement, mais peut changer la stratégie des centres de données d'entreprise, car la formation du modèle nécessite des clusters GPU à grande échelle. " Gartner définit cinq méthodes de déploiement GenAI (voir Figure 1). En fonction de la méthode de déploiement de GenAI choisie par l'entreprise, les directeurs de l'information (CIO) et les responsables de l'infrastructure et des opérations (I&O) chinois doivent comprendre l'impact du déploiement de GenAI et comment agir.
Figure 1 : Cinq méthodes de déploiement de l'IA générative
Gartner : L'IA générative pilotera la transformation de la conception des centres de données d'entreprise chinoisLes DSI et les responsables I&O chinois doivent se préparer à cette technologie Se préparer aux impacts des centres de données .
Le déploiement de GenAI sur site obligera les responsables I&O à modifier la façon dont ils conçoivent les environnements d'hébergement.
L'impact du déploiement de GenAI sur le centre de données détermine les types de charges de travail exécutées, car certaines charges de travail GenAI nécessitent l'utilisation de graphiques haut de gamme. unités de traitement (GPU). En raison de l'offre limitée de GPU haut de gamme sur le marché chinois, les dirigeants I&O qui souhaitent déployer GenAI sur site devront modifier la façon dont leurs environnements d'hébergement sont conçus.
Les responsables I&O ne peuvent pas résoudre seuls les pénuries d'approvisionnement et doivent travailler avec l'entreprise, les ingénieurs en IA et les équipes fonctionnelles pour relever ce défi.
Zhang Yingling a déclaré : « Les DSI et responsables I&O chinois qui préparent les ressources d'infrastructure pour le déploiement de GenAl devraient travailler de manière proactive avec les équipes commerciales et associées pour prédire l'impact des différentes charges de travail sur le coût et le calendrier du centre de données, afin de préparer pour GenAl Développez une stratégie macro de centre de données pour le déploiement. Si les modèles de formation nécessitent des clusters GPU haut de gamme, vous devez bien comprendre les différentes options d'hébergement en équilibrant les coûts, les risques et les opportunités (comme l'achat de matériel alternatif ou la location de ressources GPU).
Déployer des GPU à grande échelle. Les clusters doivent transformer et mettre à niveau l'infrastructure et les équipements du centre de données.
Construire un modèle de base à partir de zéro ou affiner un modèle nécessite le déploiement d'un cluster GPU à grande échelle, qui bouleversera les centres de données existants. Parce que la formation des modèles GenAI nécessite un débit élevé, une faible latence et une infrastructure sans perte. Pour prendre en charge de tels clusters informatiques hautes performances, les systèmes de réseau, de stockage, d’alimentation électrique et de refroidissement doivent être mis à niveau. Dans certains cas, les installations existantes devront être modernisées pour accueillir l'infrastructure modernisée (voir Figure 2).
Figure 2 : L'impact des clusters GPU à grande échelle sur les centres de données
Gartner : L'IA générative pilotera la transformation de la conception des centres de données d'entreprise chinoisZhang Yingling a déclaré : "CIO et leaders I&O en Chine besoin Travailler avec des scientifiques de données et des ingénieurs pour clarifier la taille du cluster GPU et les exigences de performances GenAI afin de déterminer les exigences d'infrastructure pour le réseau et le stockage. Dans le même temps, les besoins en énergie, l'efficacité du refroidissement, les racks, l'espace, etc. doivent également être analysés pour déterminer. Le centre de données existant. Il existe des lacunes dans l'environnement lors du déploiement de grands clusters GPU. Équilibrez le temps et les coûts et choisissez la solution de transformation du centre de données la plus appropriée. "
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!