Maison > Article > Périphériques technologiques > La plate-forme de grands modèles Baidu Intelligent Cloud Qianfan a de nouveau été mise à niveau : 5 grands modèles et 55 nouveaux composants d'outils ont été publiés !
Sert 80 000 utilisateurs d'entreprise, a aidé les utilisateurs à affiner 13 000 grands modèles et a aidé les utilisateurs à développer 160 000 applications de grands modèles. Depuis décembre 2023, les appels d'API quotidiens de la plateforme de grands modèles Baidu Smart Cloud Qianfan ont augmenté de mois en mois. .97%... Du "pionnier" de la plate-forme nationale de grands modèles il y a un an à la "super usine" de grands modèles d'aujourd'hui, la plate-forme de grands modèles Baidu Intelligent Cloud Qianfan occupe fermement une position de leader sur le marché national des grands modèles, mais Bend Les pas ne se sont pas arrêtés.
Le 21 mars, Baidu Intelligent Cloud a organisé une conférence de lancement de produit Qianfan dans le parc Shougang de Pékin, a annoncé lors de la conférence :
1 Joignez-vous à celui du district de Pékin Shijingshan pour construire le premier du pays. Baidu Intelligent Cloud Qianfan Large Model Industry Innovation Base favorise le décollage des industries régionales ;
2 Pour répondre aux exigences fondamentales des entreprises en matière de « rentabilité », les services de grands modèles Qianfan ModelBuilder sont entièrement mis à niveau, avec 3 légers. grands modèles, 2 Le grand modèle de scène verticale est récemment publié
3. Le seuil de développement d'applications natives d'IA est considérablement réduit et les capacités des composants Qianfan AppBuilder sont entièrement mises à niveau.
(Baidu Intelligent Cloud Qianfan Large Model Industry (Beijing) Innovation Base Started Construction)
Pendant l'événement, Cao Shihui, membre du groupe du parti gouvernemental du district de Shijingshan et gouverneur adjoint du district, et le comité de gestion du parc Zhongguancun Shijingshan Cui Mingming, directeur adjoint de l'association, Xie Guangjun, vice-président de Baidu, et Shi Qinghua, vice-président de Baidu, ont lancé conjointement la cérémonie de lancement de la première grande industrie modèle Baidu Intelligent Cloud Ganfan du pays (Pékin). Base d'innovation.
La base d'innovation s'engage à promouvoir l'intégration profonde de la technologie des grands modèles et de l'innovation industrielle. Les deux parties se concentreront sur l'amélioration de l'offre de puissance de calcul, l'optimisation des algorithmes de modèles, la promotion de l'ouverture des données, la création de scénarios de démonstration, et en approfondissant l'introduction et la formation des talents, les gouvernements et les entreprises travaillent ensemble pour créer un nouveau plateau pour l'industrie de l'intelligence artificielle. Le gouverneur adjoint du district, Cao Shihui, a déclaré que le district de Shijingshan travaillerait main dans la main avec Baidu pour se concentrer sur la recherche et le développement et l'application innovante de l'intelligence artificielle et de la technologie des grands modèles, construire et améliorer l'écosystème industriel de l'IA et soutenir la transformation numérique régionale. et la mise à niveau intelligente industrielle, et fournir un soutien à une nouvelle productivité de qualité. La culture et le développement sont imprégnés d'un élan croissant. (Xie Guangjun, vice-président de Baidu) entreprises technologiques Se concentrant sur « l'ontologie » de grands modèles avec des instituts de recherche scientifique, une « involution » folle.
Xie Guangjun, vice-président de Baidu, a déclaré que la technologie des grands modèles s'est développée rapidement au cours de l'année écoulée et qu'avec sa mise en œuvre progressive dans diverses industries, 2024 sera la première année de l'explosion des grands modèles nationaux. applications industrielles. En réponse aux quatre défis majeurs qui préoccupent le plus les entreprises, notamment les scénarios de mise en œuvre de grands modèles, les coûts d'utilisation, le développement d'applications et les effets des applications, Baidu Intelligent Cloud Qianfan a fourni les dernières « idées de résolution de problèmes » sous deux aspects : les grands modèles et développement d’applications natives d’IA.
La plate-forme de grands modèles Baidu Intelligent Cloud Qianfan lance un nouveau package de modèles "3+2" : améliorer la "rentabilité" des grands modèles d'applications d'entreprise
L'effet des grands modèles est "technique " La recherche incessante des avantages économiques est le but ultime de la « faction du marché ». En communiquant avec des clients de nombreux secteurs, Xie Guangjun a constaté qu'à l'exception de quelques grands clients qui recherchent l'effet ultime des grands modèles, davantage d'entreprises et d'institutions doivent souvent considérer de manière globale l'effet d'utilisation, les performances et le coût des grands modèles, c'est-à-dire "valence" Comparer". Cette fois, la matrice modèle de la plate-forme Qianfan a subi une série de mises à niveau en réponse à l’attrait principal de l’entreprise en matière de « rentabilité ».
(Matrice de modèles de plate-forme à grand modèle Baidu Intelligent Cloud Qianfan)
Le grand modèle Wenxin ERNIE 3.5 est actuellement l'un des grands modèles de base les plus populaires sur la plate-forme de grands modèles Baidu Intelligent Cloud Qianfan. Pour les scénarios de dialogue courants des utilisateurs, ERNIE 3.5 a amélioré ses capacités sous trois aspects : suivi des instructions, apprentissage du contexte et capacités de raisonnement logique. La version mise à niveau d'ERNIE 3.5 a considérablement amélioré les performances de ses applications de 24 %, 27 % et 22 % dans trois scénarios d'application d'entreprise majeurs, tels que la création de rédaction, l'extraction d'informations et l'invocation d'outils.
Deuxièmement, par rapport aux grands modèles avec des paramètres ultra-larges, les grands modèles légers ont des paramètres plus petits, ce qui permet aux clients d'affiner plus facilement le modèle pour des scénarios d'utilisation spécifiques, ce qui facilite l'obtention des effets d'utilisation attendus. tout en économisant de l'argent. Lors de cette conférence, Baidu Intelligent Cloud a lancé trois grands modèles légers, dont ERNIE Speed, ERNIE Lite et ERNIE Tiny, avec des paramètres allant de grand à petit, pour aider les clients à « réduire le volume sans réduire l'efficacité » et à économiser des investissements inutiles.
Plus précisément, ERNIE Speed, en tant que « grand » parmi les trois grands modèles légers, a une longueur de contexte allant jusqu'à 128 000 dans les scénarios de raisonnement et peut mieux gérer des tâches telles que la gestion des questions et réponses de connaissances. dépendances du contexte pour générer des prédictions ou des réponses plus cohérentes et précises. Dans le même temps, ERNIE Speed peut être utilisé comme modèle de base pour affiner des scénarios spécifiques. L'effet du modèle peut égaler ou même dépasser le modèle phare à grande échelle à grands paramètres, et la rentabilité est considérablement améliorée. .
Par rapport à ERNIE Speed, ERNIE Lite a des paramètres plus petits et est plus adapté pour être installé sur des cartes accélératrices d'IA à faible puissance de calcul pour gérer les tâches d'inférence. Tout en prenant en compte l'effet du modèle et les performances d'inférence, il est grandement adapté. réduit les coûts de mise en œuvre pour le client. En tant que version améliorée du modèle ERNIE-Bot-turbo, les effets d'application d'ERNIE Lite dans des scénarios tels que l'analyse des sentiments, l'apprentissage multitâche et le raisonnement naturel se sont améliorés de 20 %. Le coût des appels d’inférence a considérablement baissé de 53 % !
ERNIE Tiny, qui possède le plus petit nombre de paramètres parmi les trois modèles légers, offre aux clients le meilleur choix pour un coût extrêmement faible et une faible latence. Dans les scénarios d'applications à haute concurrence et à faible latence tels que la récupération, la recommandation et la reconnaissance d'intention, les excellentes performances d'ERNIE Tiny montrent des performances exceptionnelles. Dans un certain scénario commercial de recommandation de dialogue, l'ERNIE Tiny affiné a augmenté le nombre de cycles de dialogue de 3,5 % et a réduit le coût de 32 % par rapport à ERNIE 3.5 pour stimuler les mots recommandés par les moteurs de recherche.
De plus, les entreprises ont des exigences plus élevées en ce qui concerne les effets des grands modèles dans le jeu de personnages et les appels d'outils externes dans les applications pratiques. Cette plate-forme de grands modèles Qianfan, ModelBuilder, a également lancé deux grands modèles de scène verticale, ERNIE Character et ERNIE Functions, basés sur des informations approfondies sur les scénarios d'entreprise et les meilleures pratiques commerciales de Baidu, pour s'adapter aux scénarios d'application de jeu de rôle des clients (tels que le jeu NPC, dialogue service client, etc.) et des scénarios d'appel d'outils (utilisation d'outils externes dans le dialogue, appel de fonctions métiers, etc.).
Dans la pratique en entreprise, un fabricant de matériel intelligent a créé un assistant intelligent basé sur le personnage d'ERNIE. Après avoir appliqué ce modèle, l'effet a été considérablement amélioré en termes de cohérence des personnages, de stimulation et d'augmentation du désir des utilisateurs de discuter, etc. . Une application de voyage et de voyage utilise les fonctions ERNIE pour créer un assistant de service client intelligent, avec une précision de 85 % dans l'exécution de plusieurs appels de fonctions tels que la réservation de billets et la vérification de l'état des vols.
Qianfan AppBuilder a été entièrement mis à niveau : abaisser considérablement le seuil de développement d'applications natives d'IA
Qianfan AppBuilder, en tant que plate-forme de développement d'applications natives d'IA de qualité industrielle, est une partie importante de Qianfan. La couche inférieure d'AppBuilder se compose de grands composants de modèle basés sur les années de technologie et d'expérience pratique de Baidu, de composants de base de composants de capacité d'IA et d'une série de composants avancés qui sont réglés et construits en profondeur pour des scénarios d'application typiques. Les composants de base et les composants avancés soutiennent conjointement l'agent. D'une part, une logique métier plus complexe peut être mise en œuvre via l'orchestration des flux de travail. D'autre part, l'agent dispose également de solides capacités de planification de tâches autonomes et peut comprendre les intentions des utilisateurs et planifier automatiquement les chemins d'exécution. pour réaliser une intégration multi-outils. Ces fonctionnalités sont fournies via deux méthodes de développement, l'état zéro code et l'état code, pour mieux répondre aux besoins des différents développeurs.
Une fois le développement terminé, l'application peut être distribuée et intégrée via plusieurs canaux. AppBuilder prend en charge la distribution en un clic d'applications vers les canaux grand public tels que le service client WeChat, le compte officiel WeChat, le client Web/H5, et la matrice Baidu Lingjing. Basées sur la matrice du royaume spirituel de Baidu, les applications peuvent être distribuées et montées dans des scénarios courants tels que la recherche Baidu et le flux d'informations Baidu. Une fois l’application véritablement développée, elle atteindra directement les utilisateurs et ouvrira l’ensemble du processus, de la création d’applications natives d’IA au développement jusqu’à la distribution.
(Baidu Smart Cloud Qianfan AppBuilder)
L'AppBuilder mis à niveau comprend jusqu'à 55 composants d'outils ouverts. Il comprend de grands composants de modèle et des composants de capacité d'IA basés sur les années d'accumulation technologique de Baidu et sa propre accumulation commerciale, ainsi que des composants commerciaux spécifiques à Baidu tels que la recherche et des outils API tiers pour plusieurs scénarios. RAG (questions et réponses de récupération de connaissances), composants de capacités avancés tels que GBI (Generative Data Analysis) qui sont réglés en profondeur selon des scénarios d'application typiques.
Le développement d'applications natives d'IA est indissociable de l'infrastructure cloud. Les composants de base publiés cette fois incluent également la nouvelle base de données vectorielle VDB 1.0 de Baidu Smart Cloud. La base de données vectorielle est un composant essentiel indispensable de la base de connaissances pour les entreprises. Elle fournit une solution puissante aux goulots d'étranglement en matière de performances, aux défis de maintenance et aux limitations d'échelle rencontrés par les systèmes de questions et réponses de base de connaissances traditionnels. La nouvelle base de données vectorielles Baidu, VDB 1.0, intègre non seulement des capacités complètes de contrôle d'exploitation et de maintenance et de protection de la sécurité, mais est également compatible avec les écosystèmes traditionnels tels que Qianfan et LangChain, qui peuvent aider les entreprises à gérer facilement des dizaines de millions de connaissances documentaires et à prendre en charge jusqu'à Échelle de stockage de vecteurs de 100 milliards et vitesse de récupération de vecteurs au niveau de la milliseconde. Dans le même temps, par rapport à des produits open source similaires, les performances de VDB 1.0 sont améliorées jusqu'à 10 fois.
En plus des composants, le cadre d'application Agent (intelligent) lancé par Qianfan AppBuilder dispose de capacités de planification de tâches indépendantes précises, et le taux de précision de l'orchestration automatique pour plusieurs outils d'application dépasse 90 %, et ce nombre est toujours il s'améliore constamment. AppBuilder aide également les développeurs à accéder à des outils personnalisés et à combiner l'orchestration automatique avec l'orchestration manuelle pour personnaliser les besoins d'applications de scénarios plus complexes. La capacité d'interprétation de code au sein du framework Agent a également considérablement amélioré les performances de 40 % dans cette mise à niveau, et le taux d'acceptation des résultats générés dans des scénarios d'analyse de données complexes atteint 95 %, ce qui facilite la gestion de diverses analyses de données et informations. scénarios de traitement.
De plus, les outils de développement basés sur le code d'AppBuilder sont également ajoutés. AppBuilder SDK publie cette fois l'API Agent, permettant aux développeurs d'intégrer facilement Agent dans leurs systèmes d'entreprise. Dans le même temps, AppBuilder SDK fournit une multitude d'exemples d'applications pour les scénarios d'applications natives d'IA grand public. Il est actuellement open source sur Github et prend en charge diverses applications. Une orchestration flexible avec appel gratuit de composants aide les développeurs à réaliser un développement secondaire et une intégration pratique des applications.
La conférence a également montré comment créer une application d'agent "English Composition Helper" (intelligente) en seulement 1 minute en mode de développement sans code. Il vous suffit de saisir le nom de l'application ou d'espérer dans AppBuilder With. Grâce à la fonction d'application développée, la plate-forme peut générer automatiquement l'application en ajustant simplement les instructions de rôle et en ajoutant les composants d'outils requis, un assistant de correction de composition en anglais peut être rapidement généré. Vous pouvez l'utiliser directement après la publication et terminer la création et la distribution de l'application en trois étapes.
(Créer un assistant de correction de composition anglaise en 1 minute)
De l'avis de Baidu Intelligent Cloud, avec l'évolution continue et la percée de la technologie des grands modèles, la pratique de l'ingénierie s'adapte aux besoins des utilisateurs. devenant de plus en plus importante. Ce n'est qu'en approfondissant le scénario, en découvrant et en répondant aux besoins réels des clients que le meilleur moyen de libérer les dividendes de la technologie innovante.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!