Maison >Périphériques technologiques >IA >Les puces IA sont en rupture de stock dans le monde !
Le PDG de Google a comparé la révolution de l’IA à l’utilisation du feu par l’humanité, mais désormais, le feu numérique qui alimente l’industrie – les puces IA – est difficile à trouver.
La nouvelle génération de puces avancées qui pilotent les opérations d'IA sont presque toutes fabriquées par NVIDIA. Alors que ChatGPT sort du cercle, la demande du marché pour les puces de traitement graphique (GPU) NVIDIA dépasse de loin l'offre.
Sharon Zhou, co-fondatrice et PDG de Lamini, une startup qui aide les entreprises à créer des modèles d'IA tels que des chatbots, a déclaré :
« Parce qu’il y a une pénurie, tout tourne autour de votre cercle d’amis
."Comme le papier toilette pendant la pandémie."
En raison de l'existence de cette situation, des clients comme OpenAI, le créateur de ChatGPT, sont limités par la puissance de calcul des fournisseurs de services cloud comme Amazon et Microsoft. Pour développer et exploiter des modèles de plus en plus complexes et aider d’autres entreprises à créer des services d’IA, les développeurs d’IA doivent avoir accès à la puissance de calcul des serveurs.
Même les entrepreneurs technologiques les mieux connectés au monde travaillent dur pour garantir l’approvisionnement. Lors de l'audience du Congrès sur l'IA le 16 mai, le PDG d'OpenAI, Sam Altman, a déclaré qu'en raison des goulots d'étranglement de la puissance de calcul, il serait préférable que moins de personnes utilisent ChatGPT.
Le 23 mai, le PDG de Tesla, Musk, a déclaré lors du sommet du Conseil des PDG du Wall Street Journal :
"Actuellement, les GPU sont plus difficiles à obtenir que les médicaments. "
Cependant, Musk va toujours bien mieux.
Les startups qui ont déclaré qu'elles recherchaient la puissance de calcul d'Oracle plus tôt cette année se sont soudainement fait dire qu'un acheteur avait accaparé une grande partie de l'espace serveur disponible d'Oracle, a rapporté le Wall Street Journal. Selon des sources proches du dossier, ces nouvelles startups ont été informées que l’acheteur est Musk, qui développe un produit concurrent appelé X.AI pour contester la position d’OpenAI sur le marché.
Les startups tentent différentes manières de résoudre la pénurie
Sans puces de traitement graphique avancées, la vitesse d'exécution des modèles de langage à grande échelle en intelligence artificielle sera considérablement réduite. C'est un point de vue courant parmi les fondateurs de start-up. Les puces de traitement graphique avancées de Nvidia disposent d'excellentes capacités de calcul parallèle, ce qui est très critique pour le fonctionnement de l'IA.
Les analystes d'UBS estiment que la première version de ChatGPT nécessitera environ 10 000 puces de traitement graphique NVIDIA ; tandis que Musk estime que le nombre de processeurs avancés requis pour la version mise à jour est de 3 à 5 fois supérieur.
Nvidia a récemment déclaré que la société élargissait son offre pour répondre à la demande croissante. Le PDG de NVIDIA, Jensen Huang, a déclaré dimanche que la société avait augmenté la production de sa nouvelle puce phare H100 pour l'intelligence artificielle générative.
Les startups et les investisseurs en IA font de leur mieux pour résoudre le problème de la pénurie de puces. Certains investisseurs examinent leurs réseaux informatiques pour trouver de la puissance de calcul disponible, tandis que d'autres organisent des commandes de processeurs et de serveurs haute capacité à partager avec d'autres startups d'IA.
Certaines startups réduisent leurs modèles d'IA pour améliorer leur efficacité ; d'autres fondateurs cherchent à établir des relations avec les vendeurs d'Amazon et de Microsoft.
Sharon Zhou de Lamini a déclaré qu'ils disposaient des jetons nécessaires.. Lamini a été cofondée par lui et un ancien ingénieur NVIDIA. Mais elle et de nombreux autres fondateurs ont refusé de dire comment ils avaient obtenu les puces.
De nombreux fondateurs d'IA s'attendent à ce que la pénurie de puces IA dure au moins jusqu'à l'année prochaine.
Les fondateurs et les investisseurs déclarent Même s'il existe des entreprises établies dans le domaine des puces IA, elles doivent encore attendre des semaines pour les utiliser. Un PDG d'une startup d'IA a déclaré :
"Même si vous avez prépayé, cela ne veut pas dire que le GPU vous sera livré le lendemain ou la semaine prochaine, vous ne pouvez qu'attendre
."
Le PDG de Supermicro, l'un des plus grands fabricants de serveurs au monde, a déclaré que le retard de l'entreprise en matière de systèmes de puces graphiques a atteint un niveau record et que l'entreprise se précipite pour augmenter sa capacité de production.
Le marché secondaire est en plein essor, et NVIDIA devient aussi fou
La situation de rupture de stock a déclenché le marché secondaire des puces d'IA, dont certaines impliquent de grandes sociétés de cryptage Ces sociétés ont acheté des puces pour l'exploitation minière pendant le boom du cercle monétaire, mais n'en ont plus besoin maintenant pendant le. ralentissement du marché des devises numériques.
La demande pour les produits Nvidia a fait grimper les stocks de l’entreprise d’environ 167 % cette année. Les coûts des puces IA varient. Certains détaillants vendent les puces IA avancées de Nvidia pour environ 33 000 $, bien qu'elles puissent se vendre plus cher sur le marché secondaire en raison de la forte demande.
Kanjun Qiu, PDG de la société de recherche en intelligence artificielle General Intelligent, achète depuis l'année dernière des puces graphiques avancées pour ses serveurs, lui permettant ainsi de faire face à la pénurie actuelle.
Un investisseur en capital-risque lui a récemment envoyé un message lui demandant s'il existait une capacité excédentaire qui pourrait être louée à d'autres startups. Qiu n'a pas encore décidé d'abandonner ou non sa puce.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!