Maison  >  Article  >  La disponibilité du service Azure OpenAI sera étendue comme Microsoft l'a annoncé hier

La disponibilité du service Azure OpenAI sera étendue comme Microsoft l'a annoncé hier

PHPz
PHPzavant
2023-08-12 11:45:131107parcourir

Microsoft a annoncé hier la disponibilité étendue du service Azure OpenAI. Grâce à cette expansion, les clients de l'Australie Est, du Canada Est, des États-Unis Est 2, du Japon Est et du Sud du Royaume-Uni pourront accéder aux modèles OpenAI populaires GPT-4 et GPT-35-Turbo. Avant cette expansion, le service Azure OpenAI était disponible dans l’Est des États-Unis, le Centre de la France, le Centre-Sud des États-Unis et l’Europe occidentale. Lors de sa récente conférence téléphonique sur les résultats, Microsoft a annoncé que le service Azure OpenAI dessert désormais plus de 11 000 clients, attirant en moyenne 100 nouveaux clients par jour.

Microsoft a également annoncé la sortie officielle de la série de machines virtuelles (VM) Azure ND H100 v5, qui comprend le dernier GPU NVIDIA H100 Tensor Core et la mise en réseau NVIDIA Quantum-2 InfiniBand. Cette nouvelle série de machines virtuelles est conçue pour les charges de travail d’IA et est désormais disponible dans les régions Azure USA Est et Centre Sud des États-Unis. Même si une VM est officiellement publiée, les clients doivent manifester leur intérêt pour accéder à la nouvelle VM.

Les VM ND H100 v5 incluent les fonctionnalités suivantes :

  • Équipées de huit GPU NVIDIA H100 Tensor Core, ces VM promettent des performances de modèle d'IA plus rapides que les générations précédentes.
  • Les processeurs Intel Xeon Scalable de 4ème génération constituent la base de ces machines virtuelles, garantissant des vitesses de traitement optimales.
  • NVIDIA Quantum-2 ConnectX-7 InfiniBand 400 Gb/s par GPU et 3,2 Tb/s de bande passante entre nœuds par machine virtuelle garantissent des performances transparentes sur tous les GPU, correspondant aux capacités des meilleurs supercalculateurs du monde.
  • Avec PCIe Gen5 fournissant 64 Go/s de bande passante par GPU, Azure permet des avantages de performances significatifs entre les processeurs et les GPU.
  • La mémoire DDR5 est au cœur de ces machines virtuelles, offrant des vitesses et une efficacité de transfert de données plus élevées, ce qui la rend idéale pour les charges de travail avec des ensembles de données plus volumineux.
  • Les opérations de multiplication matricielle sont accélérées d'un facteur six lors de l'utilisation du nouveau type de données à virgule flottante FP16 8 bits par rapport au FP8 des générations précédentes.
  • A obtenu une accélération 2x dans les grands modèles de langage comme l'inférence de modèle de bout en bout BLOOM 175B, démontrant leur potentiel pour optimiser davantage les applications d'IA.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer