Maison >Périphériques technologiques >IA >Wen Xinyiyan ouvre officiellement les invitations internes ! Robin Li : L'expérience n'est pas parfaite !
Auteur | Xu Jiecheng
Critique | Yun Zhao
La sortie anticipée de GPT4 met vraiment la pression sur Baidu ! Quelques mois après que ChatGPT ait fait exploser le domaine des chatbots, nous avons finalement inauguré le premier produit de dialogue génératif de Chine.
Le 16 mars à 14h00, la conférence de presse de Baidu Wenxinyiyan a eu lieu officiellement au siège de Baidu à Pékin. Robin Li, fondateur, président et PDG de Baidu, a également tenu sa promesse précédente et transformé une technologie cool en un produit dont tout le monde a besoin.
Il est rapporté que Wenxin Yiyan (nom anglais : ERNIE Bot) est un produit de dialogue génératif lancé par Baidu basé sur la technologie grand modèle Wenxin, qui peut réaliser une interaction homme-machine naturelle et fluide. En tant que l'une des technologies de base de Baidu, le grand modèle Wenxin ERNIE possède des capacités de compréhension et de génération sémantiques approfondies multimodales et multilingues. Wenxinyiyan, basé sur la technologie ERNIE, a intégré avec succès la technologie de l'intelligence artificielle aux capacités de communication en langage humain et peut offrir aux utilisateurs une expérience interactive intelligente de haute qualité.
Actuellement, les modèles de langage à grande échelle et l'IA générative représentent un nouveau paradigme technologique. et sont au cœur de chaque entreprise dans le monde. Une opportunité à ne pas manquer. Baidu Wenxinyiyan se positionne comme une plateforme habilitante pour les modèles de base d'intelligence artificielle et contribuera à la transformation intelligente de milliers de secteurs tels que la finance, l'énergie, les médias et les affaires gouvernementales.
Lors de la conférence de presse, Robin Li a démontré les cinq capacités principales de Wen Xin Yi Yan et ses performances dans cinq scénarios d'utilisation, notamment la création littéraire, la création de rédaction commerciale, le calcul mathématique, la compréhension du chinois et la génération multimodale.
Dans le contexte de la création littéraire, Wen Xinyiyan a résumé le contenu principal du célèbre roman de science-fiction « Le problème des trois corps » sur la base de questions et réponses de dialogue, et a proposé un certain nombre de suggestions et d'idées pour continuer pour écrire "Le problème à trois corps". En outre, Wen Xinyiyan a également répondu avec précision aux informations factuelles telles que l'auteur de « The Three-Body Problem » et l'acteur de la série télévisée « Three-Body Problem » sur la base du contenu de la question.
Le principal inconvénient de l'IA générative actuelle est qu'il est difficile de garantir l'exactitude des réponses aux questions. Wen Xinyiyan poursuit le concept de grand modèle amélioré par les connaissances de Baidu et améliore considérablement l'exactitude des questions factuelles. Face à des questions telles que « Qu'est-ce que Yu Hewei et Zhang Luyi ont en commun ? » et « Qui est le plus grand, Yu Hewei ou Zhang Luyi ? », Wen Xinyiyan s'est également appuyé sur sa capacité de recherche d'informations et sa capacité de raisonnement pour obtenir la bonne réponse.
Sur la scène de la rédaction commerciale, Wen Xinyiyan a accompli avec succès les tâches créatives telles que nommer l'entreprise, rédiger le slogan de l'entreprise et rédiger le communiqué de presse de la création de l'entreprise. Au cours de trois créations de contenu consécutives, Wen Xinyiyan a non seulement compris avec précision les intentions des utilisateurs, mais a également formulé des expressions claires des commentaires des utilisateurs.
Il s'agit de « l'émergence du renseignement » qui se produit sur la base d'une énorme échelle de données. Selon les rapports, les données de formation du grand modèle Wenxin Yiyan comprennent des milliards de données de pages Web, des milliards de données de recherche et de données d'images, des dizaines de milliards de données d'appels vocaux quotidiens et un graphique de connaissances de 550 milliards de faits, etc., qui En termes de compréhension et de traitement de la langue chinoise, il est meilleur que presque tous les autres grands modèles dans le monde.
En termes de calculs mathématiques, Wen Xinyiyan s'est appuyé sur sa capacité de réflexion, sa capacité de déduction mathématique et sa capacité de raisonnement logique pour réussir les exemples classiques de « poulet et lapin dans la même cage » qui exercent la logique humaine. en pensant.
Au cours de cette session, Wen Xinyiyan a non seulement identifié les problèmes de la question, mais a également réussi à trouver la solution au problème comme un être humain, et a déduit la réponse précise à la question étape par étape selon les étapes correctes.
Si nous disons que la création littéraire, la rédaction commerciale et le calcul mathématique sont des avantages et des capacités communs des grands modèles de langage. Ensuite, la particularité de Wenxinyiyan réside dans sa meilleure compréhension du chinois et ses capacités de génération multimodale.
En tant que grand modèle linguistique ancré dans le marché chinois, Wenxinyiyan possède les capacités de traitement du langage naturel les plus avancées dans le domaine chinois et a de meilleures performances en langue chinoise et en culture chinoise. Lors de la quatrième série de manifestations, Wen Xinyiyan a correctement expliqué le sens de l'idiome « Le papier Luoyang est cher », combiné avec la connotation de l'idiome pour analyser la théorie économique correspondante de « Le papier Luoyang est cher », et a même réussi à créer un poème en utilisant les quatre mots "Le papier Luoyang est cher" Le premier poème acrostiche.
En termes de génération multimodale, Robin Li a démontré la capacité de Wen Xin Yi Yan à générer du texte, des images, de l'audio et de la vidéo. Il est intéressant de noter que Wenxinyiyan peut même générer de la parole dans des dialectes tels que le dialecte du Sichuan ; la capacité de génération vidéo de Wenxinyiyan n'est pas actuellement ouverte à tous les utilisateurs en raison de son coût élevé et sera progressivement accessible à l'avenir.
Wenxinyiyan, en tant que nouvelle génération de grand modèle de langage amélioré par les connaissances, est développé sur la base des modèles des séries ERNIE et PLATO. Ses technologies clés comprennent le réglage fin supervisé, l'apprentissage par renforcement avec rétroaction humaine, les invites, l'amélioration des connaissances, l'amélioration de la récupération et l'amélioration du dialogue.
Les trois premiers sont des technologies utilisées par de si grands modèles de langage. Ils ont également été appliqués et accumulés dans ERNIE et PLATO, et ont été encore renforcés et peaufinés dans Wen Xinyiyan ; les trois derniers sont des technologies déjà utilisées par Baidu Re ; -L'innovation dotée d'avantages technologiques est également la base permettant à Wenxinyiyan de devenir de plus en plus fort à l'avenir.
L'amélioration des connaissances de Wen Xinyiyan passe principalement par l'intériorisation des connaissances et l'application externe des connaissances. L'internalisation des connaissances est basée sur l'apprentissage d'unités sémantiques à partir de connaissances à grande échelle et de données non étiquetées, en utilisant les connaissances pour construire des données de formation et en apprenant les connaissances dans les paramètres du modèle. L'application externe des connaissances consiste à introduire des connaissances externes hétérogènes multi-sources pour effectuer un raisonnement sur les connaissances, une construction rapide, etc.
L'amélioration de la recherche de Wen Xinyiyan provient d'une nouvelle génération d'architecture de recherche avec la compréhension sémantique et la correspondance sémantique comme technologie de base. En introduisant des résultats de recherche, des informations de référence précises et opportunes peuvent être fournies pour les grands modèles afin de mieux répondre aux besoins des utilisateurs.
Et l'amélioration du dialogue de Wen Xin Yiyan est basée sur la technologie de dialogue et l'accumulation d'applications. Wen Xin Yiyan possède un mécanisme de mémoire, une compréhension du contexte et des capacités de planification du dialogue pour obtenir une meilleure cohérence, rationalité et logique du dialogue.
Robin Li a mentionné que la technologie de l'IA d'aujourd'hui a atteint un point critique et que tous les horizons seront inévitablement modifiés. Le marché chinois de l'IA est sur le point de connaître une croissance explosive de la demande, et la libération de sa valeur commerciale sera sans précédent et exponentielle.
Depuis que Baidu a officiellement annoncé « Wen Xin Yi Yan » en février, plus de 650 entreprises ont annoncé leur accès à l'écosystème Wen Xin Yi Yan. Cela signifie que de nombreuses entreprises ont compris que Wenxinyiyan et l’IA générative représentent un nouveau paradigme technologique qui affectera chaque entreprise. Selon les prédictions de Robin Li, les grands modèles linguistiques apporteront trois opportunités majeures à l'industrie.
La première catégorie est la nouvelle société de cloud computing, dont le modèle économique principal passera de l'IaaS au MaaS. Les paroles de Wen Xin changeront fondamentalement les règles du jeu dans l'industrie du cloud computing. Dans le passé, les entreprises choisissaient des fournisseurs de cloud computing davantage en fonction des services cloud de base tels que la puissance de calcul et le stockage. À l'avenir, nous accorderons plus d'attention à la qualité du framework, à la qualité du modèle et à la collaboration entre les quatre couches du modèle, du framework, de la puce et de l'application.
La deuxième catégorie est celle des entreprises qui affinent les modèles industriels. Il s'agit de la couche intermédiaire entre le grand modèle général et les entreprises. Sur la base de leur connaissance du secteur, elles peuvent utiliser les capacités générales du grand modèle pour fournir des solutions à l'industrie. clients. À cet égard, Baidu Wenxin Model a publié plus de 10 modèles industriels dans les domaines de l'énergie électrique, de la finance, des médias et d'autres domaines.
La troisième catégorie concerne les entreprises qui développent des applications basées sur de grandes bases de modèles, c'est-à-dire les fournisseurs de services applicatifs. Robin Li a affirmé que pour la plupart des entrepreneurs et des entreprises, la véritable opportunité n'est pas de créer à partir de zéro des modèles de base à grande échelle comme ChatGPT et Wenxinyiyan. Cela pourrait constituer une réelle opportunité de développer de manière préventive d’importants services d’application basés sur un grand modèle de langage général. À l'heure actuelle, sur la base de la génération de texte, de la génération d'images, de la génération audio, de la génération vidéo, des personnes numériques, de la 3D et d'autres scénarios, de nombreuses entreprises vedettes entrepreneuriales ont émergé, qui pourraient devenir de nouveaux géants à l'avenir.
Wen Xinyiyan fournira des services externes via Baidu Intelligent Cloud pour aider les entreprises à créer leurs propres modèles et applications. Des domaines clés tels que l'agriculture, l'industrie, la finance, l'éducation, les soins médicaux, les transports et l'énergie amélioreront considérablement l'efficacité, et de nouveaux domaines. des espaces industriels se forment rapidement dans chaque secteur pour contribuer à la réalisation de la Chine numérique. Robin Li a annoncé que Baidu Smart Cloud tiendrait prochainement une conférence de presse, dont le thème serait centré sur les services cloud et les produits d'application de Wen Xinyiyan, qui incluent à la fois des services cloud publics et un déploiement privatisé.
À la fin de la conférence de presse, Wang Haifeng a déclaré que Wen Xinyiyan était désormais ouvert aux tests internes. À partir de maintenant, le premier groupe d'utilisateurs peut découvrir les produits Wenxinyiyan sur le site officiel en invitant des codes de test. Baidu Smart Cloud ouvrira bientôt les services d'appel de l'interface API Wenxinyiyan aux entreprises clientes. Vous pouvez postuler pour rejoindre le test du service cloud Wenxinyiyan sur le site officiel. site web.
Robin a également admis que lors de sa sortie cette fois, Wenxinyiyan n'était pas complètement prêt.
Récemment, de nombreux amis m'ont demandé : « Pourquoi aujourd'hui ? Es-tu vraiment prêt ? En fait, d'une certaine manière, nous nous y préparons depuis de nombreuses années. Nous avons commencé à investir dans la recherche sur l'IA il y a plus de dix ans et avons lancé le Wenxin Big Language Model en 2019. Le Wenxinyiyan d'aujourd'hui s'inscrit dans la continuité des efforts des nombreux passés. années. Mais on ne peut pas dire que nous soyons complètement prêts. Le seuil permettant à Wen Xinyiyan de se comparer à ChatGPT et même à GPT-4 est très élevé. Aucun grand fabricant mondial n'a encore réussi, et Baidu est le premier. D'après mes propres tests, j'ai l'impression qu'il y a encore de nombreuses imperfections. Choix individuel.
Après avoir regardé cette conférence de presse, je crois que chacun a ses propres sentiments. En dernière analyse, pour les utilisateurs, en particulier dans le domaine du contenu culturel, nous avons encore besoin que les entreprises technologiques nationales utilisent un corpus chinois massif pour former de grands modèles localisés de haute qualité, mieux adaptés à l'environnement chinois.
Maintenant, en tant que pionnier de l'AIGC en Chine, Baidu a fait le premier pas dans ce domaine. Baidu peut-il aller de plus en plus loin sur cette voie à l'avenir ? De plus en plus d'entreprises technologiques nationales de premier plan mettront-elles le pied sur ce sol ? Quels changements l'écologie chinoise de l'AIGC subira-t-elle sous l'accumulation de ces pionniers ? Attendons et voyons.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!