Maison > Article > Périphériques technologiques > Le « partenaire en or » des grands modèles est là ! Tencent Cloud lance officiellement une base de données vectorielles native d'IA, offrant des capacités de récupération de vecteurs de niveau 1 milliard
Le 4 juillet, Tencent Cloud a officiellement publié la base de données vectorielles AI Native (AI Native) Tencent Cloud VectorDB. Cette base de données peut être largement utilisée dans des scénarios tels que la formation de grands modèles, le raisonnement et la supplémentation de la base de connaissances. Il s'agit de la première base de données vectorielle en Chine qui fournit une IA sur le cycle de vie complet, depuis la couche d'accès, la couche informatique jusqu'à la couche de stockage.
Connues dans l'industrie comme « l'hippocampe » des grands modèles, les bases de données vectorielles sont spécifiquement conçues pour stocker et interroger des données vectorielles. Selon les rapports, la base de données vectorielles de Tencent Cloud prend en charge une échelle de récupération allant jusqu'à 1 milliard de vecteurs, avec une latence contrôlée au niveau de la milliseconde. Par rapport à l'échelle de récupération de base de données de plug-in autonome traditionnelle, l'échelle de récupération est multipliée par 10, et elle également. a une capacité de requête maximale d’un million de niveaux par seconde (QPS).
Tencent Cloud définit la base de données vectorielles AI Native
Avec l'arrivée de l'ère des grands modèles, adopter les grands modèles est devenu une nécessité pour les entreprises.
Les bases de données vectorielles peuvent améliorer considérablement l'efficacité et réduire les coûts en vectorisant les données. Il peut résoudre les problèmes liés aux coûts élevés de pré-formation pour les grands modèles, à l'absence de « mémoire à long terme », aux mises à jour insuffisantes des connaissances et à l'ingénierie complexe des mots d'invite, à briser les limitations temporelles et spatiales des grands modèles et à accélérer la mise en œuvre de grands modèles. modèles dans des scénarios industriels.
Les statistiques montrent que l'utilisation de Tencent Cloud Vector Database pour la classification, la déduplication et le nettoyage des données de pré-entraînement de grands modèles peut atteindre une efficacité 10 fois supérieure par rapport aux méthodes traditionnelles si la base de données vectorielle est utilisée comme base de connaissances externe pour le raisonnement du modèle. cela peut réduire les coûts de 2 à 4 ordres de grandeur.
Il convient de noter que Tencent Cloud a redéfini le paradigme de développement d'AI Native et a fourni une solution d'IA complète pour la couche d'accès, la couche informatique et la couche de stockage, permettant aux utilisateurs de l'appliquer à l'ensemble du cycle de vie de l'utilisation des bases de données vectorielles. capacités.
Plus précisément, au niveau de la couche d'accès, Tencent Cloud Vector Database prend en charge la saisie de texte en langage naturel, adopte la méthode de requête « scalaire + vecteur », prend en charge l'indexation complète de la mémoire et prend en charge jusqu'à un million de requêtes par seconde (QPS) ; couche informatique, le paradigme de développement AI Native peut réaliser des calculs d'IA de données à grande échelle et résoudre des problèmes tels que la segmentation de texte (segmentation) et la vectorisation (intégration) lorsque les entreprises construisent des bases de connaissances du domaine privé au niveau de la couche de stockage, Tencent ; Cloud Vector La base de données prend en charge la distribution intelligente du stockage des données, aidant les entreprises à réduire les coûts de stockage de 50 %.
Auparavant, il fallait environ un mois aux entreprises pour accéder à un grand modèle. Après avoir utilisé Tencent Cloud Vector Database, cela peut être complété en 3 jours, ce qui réduit considérablement les coûts d'accès de l'entreprise.
Il est entendu que la capacité de vectorisation (intégration) de Tencent Cloud Vector Database a été reconnue à plusieurs reprises par des organisations faisant autorité. En 2021, elle était en tête de la liste MS MARCO et les résultats associés ont été publiés dans le NLP Summit ACL.
Luo Yun, directeur général adjoint de Tencent Cloud Database, a déclaré que l'ère de l'IA Native est arrivée. « Base de données vectorielle + grand modèle + données » produira un « effet volant » et aidera conjointement les entreprises à entrer dans l'ère de l'IA Native. )ère.
La base de données vectorielles Tencent Cloud contribue à améliorer de 10 fois l'efficacité de l'accès aux données
Tencent Cloud Vector Database est basé sur le moteur vectoriel du groupe Tencent (OLAMA) qui traite des centaines de milliards de recherches chaque jour. Après une pratique dans les scénarios massifs internes de Tencent, l'efficacité de l'accès aux données de l'IA est également 10 fois supérieure à celle des solutions traditionnelles. , et la stabilité opérationnelle atteint 99,99 %, a été utilisé dans plus de 30 produits au niveau national tels que Tencent Video, QQ Browser et QQ Music.
La base de données vectorielles Tencent Cloud peut aider efficacement les produits à améliorer leur efficacité opérationnelle. Les données montrent qu'après avoir utilisé Tencent Cloud Vector Database, la durée d'écoute par habitant de QQ Music a augmenté de 3,2 %, la durée d'exposition effective par habitant de Tencent Video a augmenté de 1,74 % et le coût du navigateur QQ a diminué de 37,9 %.
Prenons l'exemple de l'application Tencent Video. Les images, l'audio, le texte du titre et d'autres contenus de la vidéothèque utilisent la base de données vectorielles Tencent Cloud. Le volume mensuel moyen de récupération et de calcul atteint 20 milliards de fois, ce qui répond efficacement aux exigences du droit d'auteur. protection, identification originale, similarité, etc. Récupération sexuelle et autres besoins de la scène.
Les bases de données vectorielles accélérées de grands modèles sont entrées dans une période de développement rapide. Selon Northeast Securities, le marché mondial des bases de données vectorielles devrait atteindre 50 milliards de dollars américains d'ici 2030, et le marché national des bases de données vectorielles devrait dépasser 60 milliards de RMB.
La base de données vectorielles peut aider les entreprises à utiliser les grands modèles de manière plus efficace et plus pratique, en maximisant la valeur des données. Avec le développement et la vulgarisation continus des grands modèles, la base de données vectorielles AI Native deviendra la norme pour le traitement des données d'entreprise.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!