Maison  >  Article  >  Périphériques technologiques  >  La demande de puissance de calcul a explosé sous la vague des grands modèles d'IA. Le « grand modèle + grande puissance de calcul » de SenseTime permet le développement de plusieurs industries.

La demande de puissance de calcul a explosé sous la vague des grands modèles d'IA. Le « grand modèle + grande puissance de calcul » de SenseTime permet le développement de plusieurs industries.

WBOY
WBOYavant
2023-06-09 19:35:53863parcourir

Récemment, la « Conférence sur l'informatique intelligente de la nouvelle zone de Lingang » a eu lieu sur le thème « L'IA mène l'ère, la puissance de calcul conduit l'avenir ». Lors de la réunion, la New Area Intelligent Computing Industry Alliance a été officiellement créée. SenseTime est devenu membre de l'alliance en tant que fournisseur de puissance de calcul. Dans le même temps, SenseTime a reçu le titre d'entreprise de « New Area Intelligent Computing Industry Chain Master ».

En tant que participant actif de l'écosystème de puissance de calcul Lingang, SenseTime a actuellement construit l'une des plus grandes plates-formes informatiques intelligentes d'Asie - SenseTime AIDC, qui peut produire une puissance de calcul totale de 5 000 pétaflops et prendre en charge 20 projets avec des centaines de milliards de paramètres. De très grands modèles sont entraînés simultanément. SenseCore, un dispositif à grande échelle basé sur AIDC et construit de manière tournée vers l'avenir, s'engage à créer une infrastructure et des services d'IA de nouvelle génération à haute efficacité, à faible coût et à grande échelle, permettant un nouveau paradigme de production d'intelligence artificielle, et deviendra un service d'infrastructure à l'ère de l'AGI.

Sous la vague des grands modèles d'IA, la demande en puissance de calcul a explosé

Les trois éléments majeurs de l’intelligence artificielle comprennent principalement les données, les algorithmes et la puissance de calcul. Selon des données récemment publiées par OpenAI, la puissance de calcul utilisée dans les tâches de formation à l'intelligence artificielle a augmenté de façon exponentielle depuis 2012, avec un taux de croissance doublant tous les 3,5 mois. Jusqu'à présent, la demande de puissance de calcul a été multipliée par plus de 300 000. La popularité de ChatGPT a déclenché de nouvelles demandes de puissance de calcul sur le marché.

La demande de puissance de calcul a explosé sous la vague des grands modèles dIA. Le « grand modèle + grande puissance de calcul » de SenseTime permet le développement de plusieurs industries.

À l'heure actuelle, le marché de la puissance de calcul de mon pays continue de croître. Selon les estimations de l'Académie des technologies de l'information et des communications, la puissance de calcul totale des équipements informatiques de mon pays atteindra 202 EFlops en 2021, avec un taux de croissance d'environ 50 %. , ce qui est supérieur au taux de croissance mondial.

Dans ce contexte, Shanghai Lingang exploite activement les avantages et l'attrait écologique de l'industrie informatique locale et a publié le « Plan d'action de la nouvelle zone de Lingang pour accélérer la construction d'un écosystème de l'industrie informatique » (ci-après dénommé le « Plan »).

Selon les rapports, l'industrie de la puissance de calcul dans la nouvelle zone de Lingang a pris des dispositions correspondantes en matière de logiciels et de matériel en amont, de centres de données intermédiaires, de plates-formes de répartition et d'applications en aval. À l'heure actuelle, la puissance de calcul totale de Lingang dépasse 3EFLOPS (FP32) et. la proportion de puissance de calcul intelligente est de près de 80 % et la puissance de calcul totale représente près de 20 % de Shanghai.

Le « Plan » propose que d'ici 2025, la nouvelle zone de Lingang formera un système d'alimentation en énergie de calcul diversifié qui se concentrera sur la puissance de calcul intelligente et coordonnera la puissance de calcul de base et la puissance de calcul totale. La puissance de calcul totale dépasse 5EFLOPS (FP32), IA La proportion. La puissance de calcul a atteint 80 % et la taille globale de l'industrie de la puissance de calcul a dépassé 10 milliards de yuans. Une plate-forme publique de services de puissance de calcul a été construite, le mécanisme d'échange de puissance de calcul a été standardisé et la répartition régionale de la puissance de calcul a été réalisée. et un cluster industriel de puissance de calcul avec une influence nationale a été construit. Un lot de scénarios de référence d'applications de démonstration de puissance de calcul.

La demande de puissance de calcul a explosé sous la vague des grands modèles dIA. Le « grand modèle + grande puissance de calcul » de SenseTime permet le développement de plusieurs industries.

Xu Li, président-directeur général de SenseTime, a déclaré que la puissance de calcul est la source d'énergie de la nouvelle ère. Dans une certaine mesure, la puissance de calcul détermine la compétitivité du marché. "La puissance de calcul est une expression des capacités de l'ensemble du modèle, qui est égale aux paramètres de l'algorithme ou du grand modèle multipliés par la quantité de données qu'il traite. À l'ère des grands modèles, plus les paramètres sont grands, plus la quantité de données est grande. les données se multiplient, et plus la puissance de calcul requise est grande.

Dans le même temps, la Lingang New Area Intelligent Computing Industry Alliance a été officiellement créée. Les membres de l'alliance industrielle sont représentés par 25 entreprises et 3 universités et instituts de recherche. À l'avenir, le partage des ressources, les échanges techniques et la coopération sur les projets seront assurés. réalisée pour promouvoir de nouveaux films. L'application de l'industrie informatique intelligente dans le district favorise le développement économique.

SenseTime a reçu le titre de « Leader de la chaîne industrielle de l'informatique intelligente dans la nouvelle zone ». Le centre de calcul intelligent SenseTime situé dans la nouvelle zone de Lingang assume la tâche importante de mener à bien la recherche, le développement et l'industrialisation de l'intelligence artificielle. dans le delta du fleuve Yangtze et participera activement à l’avenir à l’intégration collaborative et au développement groupé de la chaîne industrielle de l’informatique intelligente de Hong Kong.

Grand modèle + innovation d'intégration de grande puissance de calcul

L'intégration de grands modèles et d'une grande puissance de calcul provoque un changement majeur dans le paradigme de production, poussant la recherche scientifique et les applications industrielles vers l'ère de l'intelligence artificielle générale (AGI) pilotée par l'informatique intelligente. Aux premiers stades d’une itération technologique rapide, l’industrie doit de toute urgence construire une nouvelle génération d’infrastructures pour abaisser les seuils d’application, raccourcir les cycles de R&D et améliorer l’efficacité de l’innovation.

SenseTime Technology a présenté ses plans à l'avance et a passé cinq ans à construire SenseCore, un grand appareil de SenseTime. Sur cette base, elle a construit le système de grands modèles « SenseTime New SenseNova » pour fournir à l'industrie des services d'algorithmes de grands modèles, des formations et des services. inférence. Infrastructure AGI qui combine des logiciels et du matériel tels que des services d'optimisation et de données.

Selon les rapports, SenseCore, un grand appareil de SenseTime, utilise le centre de calcul d'intelligence artificielle SenseTime (appelé « SenseTime Intelligent Computing Center ou SenseTime AIDC ») comme base de puissance de calcul. Il contient 27 000 GPU et peut produire une puissance de calcul totale. puissance de 5 000 pétaflops. Avec des capacités de puissance de calcul de pointe, une formation de modèles ultra-larges et des capacités de raisonnement à grande échelle, il s'agit actuellement de l'une des plus grandes plates-formes informatiques intelligentes d'Asie.

La puissance de calcul actuelle de SenseCore, un grand appareil de SenseTime, peut prendre en charge la formation simultanée de 20 modèles ultra-larges avec des centaines de milliards de paramètres et fournit un système de services d'infrastructure de grands modèles unique couvrant les données, les outils de formation, l'inférence. déploiement et optimisation des performances.

Le grand appareil de SenseTime possède d'excellentes capacités de calcul parallèle et peut effectuer une formation à une seule tâche avec un cluster de 3 200 cartes maximum, et peut réaliser une formation stable et ininterrompue pendant plus de sept jours. Il prend non seulement en charge les grands projets de formation de modèles de SenseTime, mais également les formations. modèles personnalisés par d’autres sociétés.

De plus, les appareils à grande échelle SenseTime intègrent les capacités de base de l'IA, du supercalcul et du Big Data, grâce à un calcul haute performance, un stockage et une mise en cache hautes performances et des réseaux hautes performances optimisés pour l'IA, permettant ainsi de séparer le stockage et l'informatique. , une élasticité à grande échelle, une planification tolérante aux pannes et d'autres fonctionnalités, prenant en charge de grands modèles sur des milliers de cartes et un stockage au niveau PB pour compléter la formation de grands modèles avec des milliards de paramètres.

Les produits de la plateforme SenseCore AI fournissent également des capacités de données, de formation et de raisonnement modulaires et complètes. Il peut réaliser des dizaines de milliards de gestion et de récupération de données, des services d'annotation manuelle et accélérer l'efficacité du développement de grands modèles d'IA. La quantification en un clic, le déploiement en un clic et l'application en un clic fournissent des outils permettant une vérification en ligne rapide des grands modèles et accélèrent l'innovation.

De plus, Big Device fournit également à ses clients et partenaires écologiques un grand modèle en tant que service MaaS complet, accélérant l'innovation et l'efficacité des applications des grands modèles.

Parmi eux, le service d'annotation de données automatisé peut multiplier par cent l'efficacité de l'annotation intelligente ; le service de déploiement d'inférence de grands modèles peut augmenter l'efficacité de l'inférence de grands modèles de 600 % ; le service de formation parallèle de grands modèles prend en charge une seule carte cluster 3200 ; Formation de modèles de paramètres denses de 500 milliards ; augmentation importante du modèle. Le service de formation en volume peut réduire les coûts de réglage fin supplémentaires de 90 %.

Le grand modèle SenseTime AI permet le développement multi-industriel

Permis par les gros appareils, SenseTime a connu un développement rapide dans le domaine des grands modèles.

Selon Xu Li, le grand modèle multimodal « Scholar 2.5 », qui a été open source en mars de cette année, a pris la tête de plus de 20 ensembles de données faisant autorité dans les trois tâches visuelles principales de détection, de segmentation et de classification. a offert des opportunités pour la conduite autonome, les robots, etc. Les tâches de scène courantes fournissent un soutien efficace et précis aux capacités de perception et de compréhension.

Pour la science fondamentale de l'intelligence artificielle (AI For Science), parmi les tâches de prévision météorologique et climatique, la prévision météorologique mondiale à moyen terme est l'une des tâches de prévision les plus importantes. Le grand modèle d'IA de prévisions météorologiques mondiales à moyen terme « Fengwu », lancé en avril de cette année, a permis pour la première fois de prévoir efficacement les principales variables atmosphériques à haute résolution pendant plus de 10 jours et a surpassé le modèle GraphCast dans 80 % des indicateurs d'évaluation. . Grâce à la modélisation des données atmosphériques mondiales à haute résolution, « Fengwu » peut également simuler des conditions météorologiques extrêmes telles que les typhons et prédire avec précision les trajectoires des typhons.

UniAD, la première solution de conduite autonome de bout en bout du secteur avec perception et prise de décision intégrées construite par SenseTime, surpasse la méthode SOTA dans un certain nombre d'ensembles de données et d'indicateurs clés, améliorant de 30 % la précision de la prédiction des lignes de voie et prédisant les mouvements. . L'erreur de déplacement est réduite de près de 40 % et l'erreur de planification est réduite de près de 30 %.

De plus, le grand modèle de télédétection SenseEarth 3.0 lancé par SenseTime le mois dernier possède non seulement les catégories d'interprétation les plus complètes du secteur, mais a également réalisé des percées technologiques dans de nombreux indicateurs tels que l'efficacité de l'interprétation, la capacité de généralisation et la précision de l'interprétation.

Xu Li a déclaré : « À l'ère AGI, la capacité d'un modèle peut être mesurée par la puissance de calcul. Nous utilisons SenseCore, un grand appareil de SenseTime, pour construire l'infrastructure de l'ère AGI. Nous mettons constamment à jour la vitesse d'itération du modèle. et des capacités de résolution de problèmes. Débloquez plus de possibilités avec AGI. »

Il est rapporté qu'en mai de cette année, SenseTime comptait plus de 40 clients principaux, dont plus de 10 grands clients modèles, couvrant des domaines de pointe tels que la conduite intelligente, les produits biopharmaceutiques, la conception de puces, les affaires intelligentes et la recherche scientifique universitaire. , et a Réalisé une livraison de grands modèles dans plus de 20 scénarios d'atterrissage.

Yang Fan, co-fondateur de SenseTime et président du groupe d'affaires des grands appareils, a déclaré que le développement des performances des grands modèles observé aujourd'hui est l'amélioration de la valeur technique apportée par l'augmentation continue de l'échelle des trois éléments de l'intelligence artificielle. , et c'est aussi la base de cette combinaison parfaite de capacités de R&D et de capacités d'ingénierie systématique. Ces trois éléments sont souvent réglés conjointement. L'optimisation des algorithmes, le tri et la sélection des données, et les plates-formes de puissance de calcul sont souvent interconnectées. Il est difficile de les transformer en liens séparés et de les réaliser seuls. C'est pourquoi nous devons construire une chaîne industrielle intelligente de l'énergie de calcul, car ce n'est que si davantage d'entreprises de la chaîne favorisent les échanges, la coopération, la réflexion et une coopération plus approfondie que nous pourrons faire mieux dans la nouvelle vague critique de progrès technologiques majeurs. et du soutien.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer