Maison  >  Article  >  Périphériques technologiques  >  Le centre informatique intelligent Moore Thread Kua'e s'est étendu à l'échelle de 10 000 cartes, avec 10 000 capacités de calcul à virgule flottante de niveau P.

Le centre informatique intelligent Moore Thread Kua'e s'est étendu à l'échelle de 10 000 cartes, avec 10 000 capacités de calcul à virgule flottante de niveau P.

WBOY
WBOYoriginal
2024-07-17 05:55:45373parcourir

Selon les informations de ce site Web du 3 juillet, Moore Thread a annoncé aujourd'hui que sa solution de cluster informatique intelligent, produit phare d'IA, KUAE, a été étendue du niveau actuel de kilo-cartes à l'échelle de 10 000 cartes. Le cluster informatique intelligent Moore Thread Kua'e Wanka utilise un GPU complet comme base pour créer une plate-forme informatique accélérée nationale à usage général capable de supporter l'échelle Wanka et des capacités de calcul à virgule flottante de niveau 10 000 P. Il est spécialement conçu pour les complexes de formation. de grands modèles avec des milliards de paramètres et de conception.

摩尔线程夸娥智算中心扩展至万卡规模,具备万 P 级浮点运算能力

La solution informatique intelligente Kuae Wanka présente les fonctionnalités de base suivantes :

Wanka WanP : le cluster informatique intelligent Kuae atteint une échelle de cluster unique de plus de 10 000 cartes, avec une puissance de calcul en virgule flottante atteignant 10 Exa-Flops, atteignant le niveau de mémoire vidéo totale. capacité, bande passante totale d'interconnexion inter-cartes ultra-haute vitesse de niveau PB par seconde et bande passante totale d'interconnexion de nœuds ultra-haute vitesse de niveau PB.

Entraînement stable et à long terme : Moore Thread se vante que la durée moyenne de fonctionnement sans problème du cluster Wanka dépasse 15 jours et peut réaliser un entraînement stable de grands modèles jusqu'à 30 jours. L'efficacité d'entraînement hebdomadaire moyenne est supérieure à 99. %, dépassant largement la moyenne du secteur.

MFU élevé : le cluster Kua'e Wanka a subi une série d'optimisations au niveau du logiciel système, du cadre, de l'algorithme et à d'autres niveaux pour obtenir une formation à haute efficacité des grands modèles (un indicateur commun pour évaluer l'efficacité de la formation des grands modèles). ) peut atteindre jusqu'à 60 %.

Ecologique : peut accélérer de grands modèles de différentes architectures et modes tels que LLM, MoE, multimodal, Mamba, etc. Basé sur le langage de programmation MUSA, entièrement compatible avec les capacités CUDA et l'outil de migration automatisé Musify, il accélère la migration « Day0 » des nouveaux modèles.

Ce site a appris que Moore Thread réalisera trois projets de cluster Wanka, à savoir :

  • Projet de cluster Wanka du parc industriel zéro carbone du Qinghai
  • Projet de cluster Kua'e Wanka du plateau Qinghai
  • Projet de cluster Wanka du Guangxi ASEAN

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn