Heim >Technologie-Peripheriegeräte >KI >Gartner: Generative KI wird die Transformation des Rechenzentrumsdesigns chinesischer Unternehmen vorantreiben
Nachrichten vom 15. April 2024: Eine aktuelle von Gartner veröffentlichte Umfrage unter CIOs und Technologiemanagern für 2024 zeigt, dass mehr als 60 % der chinesischen Unternehmen planen, in den nächsten 12 bis 24 Monaten generative künstliche Intelligenz einzusetzen (GenAI). Da chinesische Unternehmen dazu neigen, GenAI lokal und nicht über die öffentliche Cloud bereitzustellen, kann die aktuelle Infrastrukturumgebung GenAI-Projekte nicht unterstützen. Dies wird die Designtransformation chinesischer Unternehmensrechenzentren fördern.
Zhang Lukeng, Forschungsdirektor bei Gartner, sagte: „Aufgrund von Sicherheits- und Datenschutzbedenken sowie regulatorischen Anforderungen bevorzugen einige Unternehmen die Bereitstellung von GenAl-Lösungen oder die Feinabstimmung großer Sprachmodelle (LLM) vor Ort ist für Rechenzentren von entscheidender Bedeutung. Es handelt sich nicht nur um eine einfache Hosting-Anforderung, sondern kann die Strategie von Unternehmensrechenzentren ändern, da für das Modelltraining umfangreiche GPU-Cluster erforderlich sind. „Gartner definiert fünf GenAI-Bereitstellungsmethoden (siehe Abbildung 1). Abhängig von der vom Unternehmen gewählten GenAI-Bereitstellungsmethode müssen Chinas Chief Information Officers (CIOs) und Infrastruktur- und Betriebsleiter (I&O) die Auswirkungen der GenAI-Bereitstellung verstehen und Maßnahmen ergreifen.
Abbildung 1: Fünf Methoden der generativen KI-Bereitstellung
Gartner: Generative KI wird die Transformation des Rechenzentrumsdesigns chinesischer Unternehmen vorantreibenChinas CIOs und I&O-Führungskräfte müssen sich auf diese Technologie vorbereiten. Bereiten Sie sich auf die Auswirkungen auf Rechenzentren vor .
Die Bereitstellung von GenAI vor Ort zwingt I&O-Verantwortliche dazu, die Art und Weise zu ändern, wie sie Hosting-Umgebungen entwerfen.
Die Auswirkungen der Bereitstellung von GenAI auf das Rechenzentrum bestimmen die Art der ausgeführten Arbeitslasten, da einige GenAI-Arbeitslasten die Verwendung von High-End-Grafiken erfordern Prozessoreinheiten (GPUs). Aufgrund des begrenzten Angebots an High-End-GPUs auf dem chinesischen Markt müssen I&O-Verantwortliche, die GenAI vor Ort bereitstellen möchten, die Gestaltung ihrer Hosting-Umgebungen ändern.
I&O-Führungskräfte können Lieferengpässe nicht allein lösen und müssen mit dem Unternehmen, KI-Ingenieuren und Funktionsteams zusammenarbeiten, um diese Herausforderung zu bewältigen.
Zhang Yingling sagte: „Chinesische CIOs und I&O-Führungskräfte, die Infrastrukturressourcen für den Einsatz von GenAl vorbereiten, sollten proaktiv mit Unternehmen und verwandten Teams zusammenarbeiten, um die Auswirkungen verschiedener Arbeitslasten auf die Kosten und den Zeitplan des Rechenzentrums vorherzusagen und sich vorzubereiten.“ für GenAl Entwickeln Sie eine Makrostrategie für das Rechenzentrum für die Bereitstellung. Wenn Trainingsmodelle High-End-GPU-Cluster erfordern, müssen Sie verschiedene Hosting-Optionen vollständig verstehen, indem Sie Kosten, Risiken und Chancen abwägen (z. B. den Kauf alternativer Hardware oder das Leasing von GPU-Ressourcen).
Der Einsatz großer GPUs muss die Infrastruktur und Ausrüstung des Rechenzentrums umgestalten und aktualisieren.
Der Aufbau eines Grundmodells von Grund auf oder die Feinabstimmung eines Modells erfordert den Einsatz eines großen GPU-Clusters, der bestehende Rechenzentren untergräbt. Denn das Training von GenAI-Modellen erfordert einen hohen Durchsatz, geringe Latenz und eine verlustfreie Infrastruktur. Um solche Hochleistungs-Computing-Cluster zu unterstützen, müssen Netzwerk-, Speicher-, Stromversorgungs- und Kühlsysteme aufgerüstet werden. In einigen Fällen müssen bestehende Einrichtungen nachgerüstet werden, um die verbesserte Infrastruktur aufzunehmen (siehe Abbildung 2).
Abbildung 2: Die Auswirkungen großer GPU-Cluster auf Rechenzentren
Gartner: Generative KI wird die Transformation des Rechenzentrumsdesigns chinesischer Unternehmen vorantreibenZhang Yingling sagte: „Chinas CIO- und I&O-Führungskräfte.“ Arbeiten Sie mit Datenwissenschaftlern und Ingenieuren zusammen, um die GPU-Clustergröße und die GenAI-Leistungsanforderungen zu klären, um die Infrastrukturanforderungen für Netzwerk und Speicher zu ermitteln. Gleichzeitig müssen auch Strombedarf, Kühleffizienz, Racks, Platz usw. analysiert werden Das bestehende Rechenzentrum weist Lücken bei der Bereitstellung großer GPU-Cluster auf und wählt die am besten geeignete Lösung für die Rechenzentrumstransformation aus
Das obige ist der detaillierte Inhalt vonGartner: Generative KI wird die Transformation des Rechenzentrumsdesigns chinesischer Unternehmen vorantreiben. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!