Maison >Périphériques technologiques >IA >Robin Li, fondateur de Baidu : Nous sommes sur le point d'entrer dans l'ère de l'IA native
"Caijing" écrivain nouveaux médias Wang Jingya/texte Gao Suying/éditeur
"Nous sommes sur le point d'entrer dans une ère où l'IA est native et où les humains et les machines interagissent via des invites. L'avenir sera généré par nous ensemble.". Le 17 octobre, le fondateur, président et PDG de Baidu, Robin Li, a déclaré lors de la conférence mondiale Baidu 2023.
Il a annoncé sur place que Baidu Wenxin avait été officiellement mis à niveau vers la version 4.0. Par rapport à la version précédente, la nouvelle version a réalisé des améliorations significatives dans les quatre capacités majeures de compréhension, de génération, de logique et de mémoire, et son niveau global n'est pas inférieur à GPT4. Il s'agit actuellement du grand modèle Wenxin le plus puissant de Baidu, qui a réalisé une mise à niveau complète du modèle de base.
Li Yanhong a démontré les caractéristiques et les scénarios d'application des quatre capacités majeures de Wen Xinyiyan : compréhension, génération, logique et mémoire. Robin Li estime que ces capacités n'étaient pas disponibles dans le passé et qu'elles peuvent donc ouvrir un espace illimité à l'innovation.
Plus précisément, en termes de capacité de compréhension, l'IA est passée d'un « retard artificiel » qui ne peut pas comprendre la parole humaine à la capacité de comprendre presque toutes les paroles, et comprend même mieux ce que dit l'utilisateur que ses amis et collègues. En termes de capacités de génération, sur la base d'une image et de plusieurs mots clés fournis par Robin Li, Wen Xinyiyan a généré 1 vidéo publicitaire, 5 textes publicitaires et 1 affiche en seulement 3 minutes. Sur la base de cette capacité, Baidu a lancé Qingduo, une plateforme de création marketing AIGC.
En termes de capacité logique, l'application du grand modèle Wenxin est particulièrement évidente dans des scénarios tels que la résolution de problèmes mathématiques et la synthèse de points de connaissance. Robin Li a déclaré qu'en plus de la résolution de problèmes, des capacités logiques sont nécessaires pour la planification d'itinéraires sur des cartes intelligentes, les tâches complexes gérées par des assistants intelligents, le contrôle des feux de circulation dans les systèmes de transport intelligents, etc. Robin Li a souligné qu'en termes de capacité de mémoire, le fait que l'IA se souvienne de ce que l'utilisateur a dit et si le contenu généré par l'IA est incohérent avant et après est un indicateur important pour distinguer l'intelligence d'un grand modèle Multiple. les cycles de dialogue sont l’incarnation de la capacité de mémoire.
Il ne faut pas ignorer que les quatre capacités majeures du grand modèle n'existent pas indépendamment, mais se complètent dans des scénarios spécifiques. Selon Robin Li, les capacités de compréhension, de génération, de logique et de mémoire sont la base de la survie de toutes les applications natives de l'IA. Par exemple, lors de la création de textes publicitaires, vous devez comprendre le thème créatif, clarifier la logique créative et maintenir la cohérence grâce à la mémoire. Lors de la résolution de problèmes, ces quatre capacités doivent également être appliquées de manière globale.
Il convient de mentionner que l'objectif ultime de la technologie à grande échelle dans tous les horizons est toujours de servir les gens, et que l'application pratique est la clé du développement de l'IA. « Les applications natives d'IA sont des applications développées sur la base des capacités de compréhension, de génération, de logique et de mémoire des grands modèles. » Robin Li estime que sans de riches applications natives d'IA construites sur le modèle de base, le modèle de base n'a aucune valeur.
Robin Li a présenté plus de 10 cas d'applications natives d'IA basés sur la reconstruction par Wen Xinyiyan de Baidu Search, Ruliu, Maps, Netdisk et Wenku, dans l'espoir d'inspirer les développeurs à travailler ensemble pour créer des applications natives d'IA plus étonnantes. Selon lui, « la Chine dispose de riches scénarios d'application et les utilisateurs chinois sont prêts à adopter les nouvelles technologies. Avec des modèles de base avancés à grande échelle, nous pouvons construire un écosystème d'IA prospère et créer conjointement un nouveau cycle de croissance économique
».Lors du développement d'applications natives d'IA, les capacités de base des grands modèles sont cruciales. Robin Li a déclaré que l'API est le principal moyen permettant aux applications natives d'IA d'appeler de grands modèles de base. Actuellement, il existe 42 grands modèles grand public installés sur la plate-forme de grands modèles Qianfan, couvrant près de 500 scènes dans diverses industries.
Il convient de noter que la reconstruction à grande échelle de modèles affectera non seulement les applications en ligne, mais également le travail et la vie hors ligne. Un grand nombre d’applications natives de l’IA continueront d’émerger, favorisant l’intégration profonde de la technologie numérique et de l’économie réelle. À l'heure actuelle, la technologie des grands modèles est appliquée dans les domaines de la fabrication, de l'énergie, de l'énergie électrique, de l'industrie chimique, des transports et d'autres industries réelles, et devient un moteur important pour la nouvelle industrialisation.
Robin Li pense qu'un nouveau monde et un nouvel avenir seront générés grâce aux invites de chaque entreprise, de chaque développeur et de chaque utilisateur. Les futures applications natives de l’IA doivent être multimodales et reconstruiront le monde physique en plus du monde de l’information.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!