Heim > Artikel > Technologie-Peripheriegeräte > Der Boom der künstlichen Intelligenz hat zu einem Mangel an Rechenleistung geführt, und Microsoft führt einen neuen Servermietplan ein
Die anhaltende Beliebtheit von ChatGPT hat zu einem Chipmangel geführt: Es gibt nicht genügend Rechenleistung, um den Rechenbedarf von ChatGPT zu decken, was die Server von OpenAI überlastet hat. Der letzte groß angelegte Chipmangel wurde durch verrücktes Mining virtueller Währungen verursacht. Da die Nachfrage nach generativer künstlicher Intelligenz jedoch weiter steigt, könnte der Mangel an Rechenleistung dieses Mal noch eine ganze Weile anhalten.
Microsoft hofft, diese Lücke mit einem neuen virtuellen Maschinenprodukt namens ND H100 v5 zu schließen, das eine große Anzahl der neuesten H100-GPUs von Nvidia mit dem Codenamen Hopper für generative künstliche Intelligenzanwendungen enthält.
Die Idee besteht darin, Unternehmen, die an generativer KI arbeiten, höhere Rechengeschwindigkeiten zu bieten, die tiefer in Daten vordringen, Beziehungen aufbauen, Schlussfolgerungen ziehen und Antworten vorhersagen können. Generative KI steckt noch in den Kinderschuhen, aber die Beliebtheit von Apps wie ChatGPT zeigt bereits das Potenzial der Technologie.
Aber diese Technologie erfordert auch enorme Rechenleistung, und Microsoft bringt sie in die Azure-Cloud-Dienste.
Das Angebot der virtuellen Maschine passt sich der Größe generativer KI-Anwendungen an und lässt sich auf Tausende von H100-GPUs skalieren, die durch die Quantum-2-InfiniBand-Technologie des Chipherstellers miteinander verbunden sind.
Die Preise für virtuelle H100-Maschinen auf Azure wurden nicht sofort bekannt gegeben. Der Preis für virtuelle Maschinen variiert je nach Konfiguration. Eine voll ausgestattete virtuelle A100-Maschine mit 96 CPU-Kernen, 900 GB Speicher und acht A100-GPUs kostet fast 20.000 US-Dollar pro Monat.
Als ChatGPT letztes Jahr zum ersten Mal eingeführt wurde, stand die NVIDIA-GPU vor einer harten Prüfung. Die Berechnungen übernimmt der Supercomputer OpenAI, der mit Nvidia A100-GPUs ausgestattet ist.
Doch der Server war durch den wahnsinnigen Anstieg der Nachfrage nach ChatGPT schnell überlastet und Benutzer beschwerten sich darüber, dass der Server nicht rechtzeitig antworten und Abfrageaufgaben verarbeiten konnte.
Der H100 kann die Geschwindigkeitslücke schließen, die für generative KI erforderlich ist, die bereits im Gesundheitswesen, in der Robotik und anderen Branchen eingesetzt wird. Verschiedene Entwicklungsunternehmen versuchen ebenfalls, die Lücke auf der letzten Meile zu schließen und eine Schnittstelle bereitzustellen, um KI einfach und benutzerfreundlich zu machen, wie etwa ChatGPT.
Nvidia und Microsoft bauen bereits einen Supercomputer mit künstlicher Intelligenz auf Basis des H100. Die GPU ist so konzipiert, dass sie am besten mit in CUDA codierten Anwendungen funktioniert (CUDA ist Nvidias paralleles Programmier-Framework). Zu den Produkten gehört auch der Triton-Inferenzserver, der bei der Bereitstellung des künstlichen Intelligenzmodells GPT-3 in seiner GPU-Umgebung helfen wird.
Microsoft hat damit begonnen, künstliche Intelligenz vollständig in seine Produkte zu integrieren: Eine angepasste Version von GPT-3.5, dem großen Sprachmodell hinter ChatGPT, wurde in der Bing-Suchmaschine implementiert. Microsoft verfolgt einen iterativen Ansatz im DevOps-Stil (Development Operations) für Bing AI, bei dem Anwendungen schnell aktualisiert werden können, indem man mehr über Benutzer lernt, während sie das Modell verwenden. Microsoft 365 Copilot ist die ursprüngliche OFFICE-Suite mit eingebetteter künstlicher Intelligenz. Bekannte Software wie WORD, PPT und EXCEL wird traditionelle Arbeitsmethoden durch neue Funktionen verändern. Und dahinter steckt untrennbar die Unterstützung durch Rechenleistung.
Die neue Azure Virtual Machine-Basiskonfiguration kann acht H100 Tensor Core-GPUs über NVIDIAs proprietäre NVLink 4.0-Verbindung miteinander verbinden. Diese Konfiguration kann über die Quantum-2-Verbindung auf zusätzliche GPUs skaliert werden. Der Server verfügt über skalierbare Xeon-Prozessoren (Sapphire Rapids) der 4. Generation von Intel mit Datenübertragung zur und von der GPU über PCIe Gen5.
Das obige ist der detaillierte Inhalt vonDer Boom der künstlichen Intelligenz hat zu einem Mangel an Rechenleistung geführt, und Microsoft führt einen neuen Servermietplan ein. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!