Maison >Périphériques technologiques >IA >Une seule carte A100 peut réaliser des millions d'inférences de jetons, ce qui est 10 fois plus rapide. Il s'agit de l'accélération d'inférence officielle de Microsoft.
Cette recherche Microsoft permet aux développeurs de traiter plus d'un million de textes saisis 10 fois plus rapidement sur une seule machine à carte.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!