Maison >Périphériques technologiques >IA >545%! Deepseek Expert de la marge bénéficiaire de Deepseek pour la première fois: si elle est déjà une entreprise d'une valeur de plus de 10 milliards de dollars aux États-Unis

545%! Deepseek Expert de la marge bénéficiaire de Deepseek pour la première fois: si elle est déjà une entreprise d'une valeur de plus de 10 milliards de dollars aux États-Unis

original: 2025-03-12 13:30:02840parcourir

Deepseek, une startup de l'IA chinoise, a été "open source" samedi dernier (1er), il y a eu une plus grande surprise.

Deepseek a publié son premier article sur la plate-forme de Zhihu, annonçant les détails de l'inférence du modèle pour les prix des coûts et les informations clés divulguées sur les tarifs à but lucratif.

Selon la divulgation officielle de Deepseek, tous les services de Deepseek V3 et R1 utilisent le GPU H800, en utilisant une précision cohérente avec la formation, c'est-à-dire, le calcul de la matrice et la transmission de répartition adoptent le format FP8 cohérent avec une formation cohérente, et le calcul de l'attention centrale et combinent le transmission adoptent le BF16 cohérent avec une formation cohérente, assurant l'effet de service à la grande étendue.

Dans le cycle statistique des dernières 24 heures (12h00 le 27 février 2025 à 12h00 le 28 février), si le coût de location du GPU est calculé à 2 $ US, le coût quotidien moyen est de 87,072 $, et si tous 18,65 millions), et le taux d'intérêt des coûts atteint 545%.

Après avoir lu les données ci-dessus, l'investisseur de Menloventures Deedy a souligné que l'efficacité commerciale du taux de bénéfices dépassant 500% sera une entreprise d'une valeur de plus de 10 milliards de dollars aux États-Unis.

Yuan Jinhui, fondateur du téléphone portable chinois basé en silicium, a également exprimé ses sentiments à la première fois: "La divulgation officielle de Deepseek du coût et des avantages du déploiement à grande échelle a à nouveau renversé les perceptions de nombreuses personnes".

Le taux de bénéfices élevé de Deepseek provient de sa conception innovante du système d'inférence, avec trois piliers techniques: parallélisme d'experts à nœuds à grande échelle (EP), chevauchement de la communication informatique et optimisation d'équilibrage de la charge. L'EP améliore la vitesse du débit et de la réponse.

En bref, l'EP est comme une "collaboration multi-personnes", dispersant les "experts" dans le modèle à plusieurs GPU pour les calculs, améliorant considérablement la taille des lots, en serrant la puissance de calcul du GPU et en dispersant les experts, en réduisant la pression de la mémoire et en répondant plus rapidement.

Deepseek comprime les coûts d'ingénierie, plus l'allocation de ressources de jour et de nuit, prend en charge les services d'inférence pendant les jours de pointe, et les nœuds inactifs sont transférés pour la R&D et la formation, la maximisation de l'utilisation du matériel, et le taux de hit du cache atteint 56,3%. consommation.

Certains analystes disent que les données divulguées par Deepseek vérifient non seulement la faisabilité commerciale de sa voie technique, mais établit également une référence pour une rentabilité efficace pour l'industrie. En termes de tarification d'inférence, les avantages de la tarification de Deepseek-R1 ne sont que d'environ une septième à la moitié de l'Openai O3-MinI, et les stratégies à faible coût accélèrent la pénétration du marché.

D'autres analystes ont souligné que la divulgation "transparente" de Deepseek démontre non seulement sa force technique et son potentiel commercial, mais envoie également un signal clair à l'industrie, c'est-à-dire que le cycle de profit des modèles d'IA a brillé des idéaux en réalité, représentant un tournant clé dans la technologie d'IA, du laboratoire à l'industrialisation.

Cependant, Deepseek a officiellement admis qu'il n'y avait en fait pas tant de revenus, car V3 était inférieur à un prix plus bas et que les services payants ne représentaient qu'une partie du temps, et il y avait des remises la nuit.

CITIC Securities estime que les meilleures pratiques de Deepseek pour réduire les coûts de formation des modèles devraient stimuler les géants de la technologie à adopter un moyen plus économique d'accélérer l'exploration et la recherche de modèles de pointe, et en même temps, cela permettra à un grand nombre d'applications d'IA d'être déverrouillées et mises en œuvre. L'effet croissant des rendements à l'échelle apporté par la formation des algorithmes, ainsi que le paradoxe des Jevins correspondant à la réduction des coûts de puissance de calcul unitaire, tous représentent que les géants de la technologie dimensionnelle à court et à court terme continuent de faire des investissements continus dans le domaine de la puissance de calcul de l'IA, et les investissements à l'échelle seront toujours un événement à haut débit.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

batch Token 循环事件算法负载均衡

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Quelle est la différence entre le pain aux haricots et la profondeurArticle suivant：Quelle est la différence entre le pain aux haricots et la profondeur

Articles Liés

Voir plus