Maison >Périphériques technologiques >IA >Dans le jardin de l'IA générative, comment NVIDIA agit en « creuseur »
Pourquoi les GPU NVIDIA sont-ils chers ?
Auteur : Jiang Yue
Editeur : Tao Li Lu Taoran
Source de l'image : Picture Chong
« L'ère de l'expansion des processeurs est révolue », c'est ce qu'a annoncé le fondateur et PDG de NVIDIA, Jen-Hsun Huang, au Salon international de l'informatique de Taipei le 29 mai. "Au cours du discours qui a duré 2 heures, il a donné une introduction approfondie aux récents matériels, logiciels et nouveaux produits système de NVIDIA autour des "points déclencheurs" apportés par l'IA générative.
Huang Renxun a déclaré que le « nouvel ordinateur » façonné par GPU était arrivé. Le nouvel « ordinateur » construit par Nvidia a une forme différente de celle d'avant et son unité individuelle se vend jusqu'à 200 000 dollars américains. Au milieu de la controverse « coûteuse », Huang Renxun a également déclaré que GPU est le seul choix pour toute entreprise ayant un budget énergétique limité, et c'est également l'option d'infrastructure la plus « économe ».
Huang Renxun a récemment déclaré dans un discours public que face à l'ère de l'IA, les gens doivent « courir, pas marcher lentement ». Dans le jardin de l’IA générative, Nvidia creuse clairement fort.
Décodage des données GPU coût cardiaque
"Tout le monde dit toujours que les centres de données GPU sont chers, laissez-moi le calculer pour vous." Le 29 mai, le fondateur et PDG de NVIDIA, Jen-Hsun Huang, a présenté en détail le centre de données GPU au public au Salon international de l'informatique de Taipei.
NVIDIA a présenté son nouvel ordinateur IA DGX GH200 lors de réunions avec des fournisseurs et des clients. Il s’agit d’un supercalculateur intégrant 256 CPU et GPU les plus performants de Nvidia, capables de répondre aux besoins de formation des « très gros modèles ».
DGX GH200 utilise la technologie d'interconnexion NVIDIA NVLink-C2C pour interconnecter le processeur à architecture Grace basée sur Arm et le GPU à architecture Hopper, atteignant une bande passante totale allant jusqu'à 900 Go/s, soit 7 fois plus élevée que la voie PCIe Gen5 standard dans les systèmes d'accélération traditionnels. Aujourd’hui, ce type de puissance de calcul peut répondre aux applications génératives d’IA et HPC les plus exigeantes.
La photo montre la super puce GH200 Grace Hopper annoncée par NVIDIA le 29 mai
Photo gracieuseté de NVIDIA
À mesure que la demande du marché en matière d'infrastructure de centre de données augmente, NVIDIA doit désormais également utiliser certaines « méthodes de vente » sur le marché. Le besoin le plus urgent est de dissiper la crainte des gens que leur équipement soit « cher ».
En termes simples, « En utilisant les centres de données GPU, vous pouvez obtenir des performances 150 fois supérieures et économiser les 2/3 du coût. »
Huang Renxun a présenté qu'en prenant le même budget de 10 millions de dollars comme exemple, les développeurs d'AIGC peuvent construire un centre de données composé de 960 serveurs CPU, ce qui est suffisant pour former un grand modèle de langage, et la consommation de fonctionnement finale est de 11 gigawattheures de électricité (GWh, équivalent à 11 millions de kilowattheures d’électricité).
Mais si vous passez au GPU, vous pouvez construire un centre de données composé de 48 serveurs GPU. Cependant, ce centre de données peut former 44 grands modèles de langage, consommant un total de 3,2 gigawattheures (équivalent à 3,2 millions de kilowattheures d'électricité).
Selon la méthode de calcul ci-dessus, basée sur le prix d'une puce unique, le prix d'une puce GPU est 20 fois supérieur à celui d'un CPU, ce qui semble être « plus cher ». Cependant, selon la méthode de calcul du coût TCO du centre de données, le centre de données GPU permet davantage d'« économiser de l'argent ».
Huang Renxun a même répertorié une formule directement dans la démonstration PPT : coût de détention du centre de données = f {coût matériel (puce, système, écosystème matériel), débit (GPU, logiciel AIgo, réseau, logiciel système, écosystème logiciel)), utilisation ( AIgo Lib, écosystème logiciel), opérations d'approvisionnement, optimisation du cycle de vie, puissance de calcul}, expliquant ainsi la problématique du coût TCO du data center.
"Pourquoi est-ce important ? Parce que dans la vraie vie, la plupart des entreprises ont des restrictions de pouvoir." a encore souligné Huang Renxun. Lorsqu'elles investissent dans AIGC, en tenant compte de ce facteur objectif, les entreprises doivent choisir des produits de centre de données plus efficaces et à faible consommation d'énergie.
Pourquoi les GPU sont-ils si puissants dans les centres de données ? Selon Huang Renxun, cela est principalement dû à trois fonctions principales : le traçage de rayons (simulant les caractéristiques de la lumière), l'intelligence artificielle avec le calcul tensoriel comme noyau et de nouveaux algorithmes.
Depuis 2017, NVIDIA a commencé à implémenter ces trois fonctions sur GPU en même temps, et son utilisation du GPU pour générer des images a surpris le marché pour la première fois. A cette époque, il fallait plusieurs heures pour "créer" une image à partir de rien à l'aide d'un serveur CPU (ce processus est appelé "rendu" dans le langage professionnel), mais Nvidia ne prenait que 15 secondes à l'aide d'un GPU.Cependant, le soi-disant « bon marché » des nouveaux ordinateurs GPU ne s'adresse pas au marché grand public. Actuellement, les PC et ordinateurs portables dotés d'un processeur central sur le marché des ordinateurs personnels ne peuvent pas être remplacés car ils sont plus abordables.
Dans son discours, Jen-Hsun Huang a présenté un nouvel ordinateur GPU composé de 8 puces H100. "C'est l'ordinateur le plus cher du monde", a déclaré Huang Renxun.
Ce nouvel ordinateur pèse 65 livres (environ 29,5 kilogrammes) et nécessite l'aide d'un robot pour réaliser une installation fluide et précise. "Cet ordinateur se vend 200 000 dollars américains", a déclaré Huang Renxun.
Démarrer les changements dans l'industrie AIGC
Il s'agit d'une réécriture : la première étape de Nvidia pour conquérir la position de leader de l'AIGC est d'éliminer « l'ère des processeurs » en utilisant du matériel. À l'heure actuelle, NVIDIA a pris des dispositions minutieuses dans l'écosystème logiciel. En plus de promouvoir le modèle informatique CUDA auprès de 4 millions de développeurs de logiciels, elle a également lancé des services OEM de modèles d'IA de jeu et s'est approfondie dans l'industrie manufacturière pour prendre en charge les usines virtuelles et. simulations de robots. Technologie et détection automatisée.
"Pourquoi les gens ont-ils été incapables de créer une nouvelle méthode informatique pendant tant d'années ?", a déclaré Huang Renxun en parlant de l'ère du CPU. Il a souligné que Cela est dû au fait qu'il existe une relation « de la poule et de l'œuf » entre le matériel et les logiciels, le marché de consommation, les développeurs et les fournisseurs, ce qui conduit à une retenue mutuelle et permet à la méthode informatique basée sur le CPU de continuer pendant un certain temps. longue durée.
Par conséquent, afin de briser les chaînes de « l'ère du CPU », NVIDIA conçoit non seulement vigoureusement le matériel des puces, mais accorde également une grande attention à la création d'un environnement écologique logiciel. Le modèle informatique CUDA est un élément clé créé par NVIDIA pour cette configuration à long terme.
Plus de 3 000 applications et 4 millions de développeurs utilisent actuellement le modèle informatique NVIDIA Cuda. Rien qu'au cours de la dernière année, Cuda a été téléchargé 25 millions de fois et son nombre total de téléchargements a atteint 40 millions. " a déclaré Huang Renxun. Il a souligné qu'avec une si grande échelle de logiciels, il n'est possible que pour le GPU de remplacer le CPU.
Résumé du discours de deux heures de Huang Renxun, nous pouvons voir l'exploration par Nvidia du domaine AIGC, couvrant les superpuces de base, la technologie d'interconnexion, l'optimisation du moteur d'algorithme et la prise en charge des mises à niveau logicielles.
En fait, les textes, images, images 2D et images 3D impliqués dans AIGC sont implémentés via une variété de grands modèles ou applications, y compris le cadre open source de modèle d'IA conversationnel de NVIDIA NeMo et les grands modèles de Meta LLaMa, ChatGPT, une application en utilisant le modèle GPT et Stable Diffusion, une application graphique Vincent, etc.
Actuellement, les leaders technologiques AIGC les plus influents au monde utilisent en profondeur les outils fournis par NVIDIA, ce qui a également poussé NVIDIA à grimper le sommet de « 1 000 milliards de dollars américains » en valeur marchande sur le marché boursier américain, et sera bientôt en concurrence avec Apple, Microsoft, Google et Amazon font ensemble partie du « club du billion ».
Le marché a été surpris par le nombre d'outils que NVIDIA a apporté cette fois-ci à l'industrie de l'AIGC. En plus des produits ci-dessus, l'implication de NVIDIA dans la création de jeux à grande échelle et dans les usines numériques est également très accrocheuse.
En termes de création de jeu, Huang Jenxun a montré un clip de jeu. Dans ce clip, en plus de la production d'images réalistes, le dialogue entre les joueurs et les PNJ a également été entièrement généré par l'AIGC. En d’autres termes, les futurs jeux pourront avoir « des milliers de visages » et les joueurs ne seront plus confrontés à des PNJ qui ne donnent que des réponses structurées. ACE Game Development Edition est un service de fonderie de modèles d'IA fourni par NVIDIA, qui peut aider les développeurs de jeux à utiliser facilement cette fonctionnalité.
NVIDIA a également annoncé que certains grands fabricants d'électronique utilisent désormais l'AIGC et la plate-forme omniverse de NVIDIA pour réaliser la « numérisation » des usines.
Dans le secteur manufacturier, il existe environ 10 millions d’usines dans le monde, et ce sont des domaines clés pour la numérisation industrielle.
Huang Renxun a déclaré :"La fabrication industrielle est composée uniquement d'objets physiques. Si les produits peuvent d'abord être fabriqués numériquement, des milliards de dollars peuvent être économisés."
À l'heure actuelle, dans le domaine industriel, NVIDIA crée principalement l'IA Omniverse et générative pour aider les usines à concevoir des usines virtuelles. Elle lance également les robots de simulation et de test Isaac Sim et les outils d'automatisation de l'inspection optique Metropolis.
Il est entendu que les fabricants d'équipements électroniques tels que Foxconn, Pegatron et Quanta utilisent déjà les outils de NVIDIA mentionnés ci-dessus pour accélérer la production et l'assemblage d'ordinateurs portables et de smartphones.
21Tech
Chronique spéciale du Groupe Nancai
Recommandations précédentes
De l’Internet industriel à l’AIGC : comment la fabrication intelligente franchit-elle le pas ?
05-30
Honorez le PDG Zhao Ming : Développer une stratégie de puces à la demande et maintenir le ratio de R&D à 10 % en 2023
05-30
Les fabricants de téléphones mobiles rivalisent pour l'imagerie et les écrans pliables. Huawei explique les secrets techniques en détail
.05-29
NVIDIA appelle à « courir au lieu de marcher » dans l'IA, à faire des efforts en matière de supercalcul et à éliminer l'ère du CPU
05-29
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!