Maison  >  Article  >  Périphériques technologiques  >  L'application ChatGPT avec "yeux" est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture d'images et le chat.

L'application ChatGPT avec "yeux" est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture d'images et le chat.

王林
王林avant
2023-04-11 13:55:031763parcourir

L'application ChatGPT avec

Dans l’esprit de beaucoup de gens, ChatGPT est un « monstre » tout-puissant.

Il peut écrire de la poésie, coder et même générer directement de longs articles... De plus, ChatGPT est également très émotionnel et expressif. Il suffit de quelques tours de conversations pour conquérir tout le monde.

Mais ChatGPT est-il vraiment tout-puissant ?

En tant que chatbot, ChatGPT possède d'excellentes capacités de compréhension du langage et de traitement de texte, mais en raison du modèle de formation, ChatGPT ne prend pas en charge les conversations d'images. Imaginez, lorsque vous discutez avec des amis en semaine, si vous ne pouvez pas envoyer de photos, vous perdrez naturellement une partie du plaisir.

En Chine, il existe une telle équipe de R&D en IA. L'application « Yuanchengxiang Chatlmg » qu'ils ont lancée peut identifier avec précision les images et discuter avec les utilisateurs. C'est comme ajouter une paire d'« yeux » à ChatGPT, comprendre le texte, il peut également parfaitement reconnaître les images.

Il y a quelques jours, Magike.com a appris de l'équipe R&D de Yuanchengxiang que « Yuanchengxiang Chatlmg » vient d'être lancé récemment. Vous pouvez découvrir l'application en suivant le Compte public WeChat « Yuanchengxiang ». (Remarque : limitée par la puissance de calcul, la méthode d'accès initiale est sur invitation uniquement)

Alors, quelle est l'expérience d'utilisation de « Yuancheng Xiang Chatlmg », et sa fonction de reconnaissance d'image est-elle vraiment magique ? A la veille du lancement du produit, Magike.com a réalisé un résumé d'évaluation complet.

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

Photo | Yuan Cheng Xiang Chatlmg Logo

Regardez la photo et parlons ? Cette application ChatGPT est incroyable

Entrez "Yuancheng Xiang Chatlmg", vous pouvez voir que l'interface de l'application est très simple et claire - la boîte de dialogue de texte en bas, la disposition symétrique de l'avatar, divers éléments combinés dans notre chat commun interface logicielle.

En bas à gauche de l'application, vous pouvez voir un bouton bien visible "Télécharger une photo".

Actuellement, l'application prend en charge trois méthodes pour télécharger des images, à savoir la galerie de photos, la prise de photos et l'importation de fichiers, une à la fois.

Cela coïncide avec la Journée de la femme. Magike.com a également sélectionné deux articles et les a remis à "Yuanchengxiang Chatlmg" pour l'aider à déterminer s'ils conviennent. L'un est une image de rouge à lèvres téléchargée à partir du ​​moteur de recherche​. , l'autre est une photo de bloc-notes prise par téléphone portable :

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

On peut voir que "Yuancheng Xiang Chatlmg" a identifié avec précision les produits dans les deux photos, et a également étendu quelques autres descriptions, comme l'ours mignon sur le bloc-notes, le rouge à lèvres devant un fond blanc, etc.

Dans le même temps, il a également donné son propre jugement sur la question de savoir si ces deux articles conviennent comme cadeaux pour les filles, et a également avancé des suggestions rationnelles quant à savoir si les cadeaux conviennent en fonction des préférences du destinataire.

Après que "Yuan Cheng Xiang Chatlmg" ait donné la réponse, nous avons posé une autre question  :

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

Eh bien, les suggestions sont très pertinentes, et la logique de compréhension contextuelle est également cohérente.

De plus, Meike.com a également téléchargé quelques autres photos pour "Yuan Cheng Xiang Chatlmg" afin de l'identifier.

Par exemple, celui-ci :

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

Et celui-ci :

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

Et ceux-ci :

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

Lapplication ChatGPT avec yeux est là ! Soutenu par un grand modèle multimodal avec 15 milliards de paramètres, il est polyvalent dans la lecture dimages et le chat.

On peut voir que la capacité de reconnaissance de "Yuancheng Xiang Chatlmg" est assez précise et peut Décrire le contenu de l'image que vous voyez à travers le texte.

Par rapport à ChatGPT, qui est basé sur une interaction textuelle pure, en plus des interactions de base telles que l'écriture de poèmes et d'articles, "Yuancheng Xiang Chatlmg" avec une paire d'"yeux" supplémentaires a évidemment découvert plusieurs nouvelles fonctions, et la reconnaissance des éléments est sa fonction importante.

Après cela, Avec l'expansion continue du volume de données et l'optimisation continue des produits, Meike.com espère également que "Yuanchengxiang Chatlmg" pourra nous apporter des performances plus exceptionnelles.

Propulsé par un grand modèle avec des dizaines de milliards de paramètres, il continuera à être mis à niveau à l'avenir

Essentiellement, ChatGPT est un produit chatbot qui offre des capacités de génération de texte à l'aide du grand modèle GPT-3. La puissance de ChatGPT est précisément due à GPT-3.

En tant que modèle de ​traitement du langage naturel​​développé par OpenAI, il comporte trop de points de discussion. Bien avant le lancement de ChatGPT, GPT-3 avait déjà émergé avec succès dans le domaine de l'IA.

Il est rapporté que le modèle atteint 175 milliards de paramètres et qu'une seule formation nécessite des dizaines de milliers de GPU, ce qui coûte près de 4,6 millions de dollars. Une telle « capacité à avaler de l’or » peut naturellement prendre en charge des applications folles comme ChatGPT.

Alors, quelles sont les lacunes de ChatGPT ? La réponse est oui !

Selon l'équipe R&D de Yuanchengxiang, "Yuanchengxiang Chatlmg" est équipé d'un grand modèle multimodal auto-développé de dizaines de milliards de paramètres, ce qui équivaut à mettre des "yeux" sur ChatGPT pour le rendre plus humain- comme Allez avoir une conversation.

La soi-disant multimodalité dans le domaine de l'IA fait souvent référence à la collaboration d'informations sensorielles, telles que images, texte, voix, etc., pour aider l'intelligence artificielle à comprendre plus précisément le monde extérieur.

C'est aussi avec l'appui de grands modèles multimodaux que "Yuancheng Xiang Chatlmg" a la capacité de comprendre les images.

Selon l'équipe R&D de Yuanchengxiang, l'échelle actuelle des paramètres du grand modèle d'IA de Yuanchengxiangest d'environ 15 milliards ; les données comprennent actuellement principalement des données image-texte, données VQA, etc. Pendant le processus de formation, le modèle libère le moins de paramètres apprenables possible pour garantir une formation efficace sur une puissance de calcul limitée.

Interrogée sur le chemin de développement futur du modèle, l'équipe R&D de Yuanchengxiang a révélé à Meike.com qu'en plus de l'interaction actuelle entre l'image et le texte, le grand modèle intégrera également la capacité de génération d'image à l'avenir, afin que vous puissiez également répondre avec des images auto-générées lorsque vous répondez, rendant la conversation plus vivante.

De plus, ce mode comprendra également plus de modes, tels que vidéo, audio, etc., et sera même combiné avec des technologies telles que Digital Human pour développer une image plus vive et tridimensionnelle.

Il est concevable qu'avec le soutien des dizaines de milliards de paramètres multimodaux à grande échelle de Yuanchengxiang, nos conversations avec les chatbots ressembleront davantage à de vraies personnes, et la technologie de l'IA nous apportera de plus en plus de surprises à l'avenir.

Les fabricants chinois d’IA se déchaînent, jusqu’où en est le ChatGPT national ?

Lors de la "Chaîne ministérielle" de la première session de la 14e Assemblée populaire nationale qui s'est tenue ce mois-ci, ​Ministre de la Science et de la Technologie​​Wang ZhigangEn parlant de ChatGPT, il a salué les progrès qu'il a apportés à IA et industries associées.

Parallèlement, diverses discussions déclenchées par ChatGPT ont également été introduites dans les deux sessions par les représentants et les membres du comité.

En fait, avant même que mon pays n'élève le développement de l'intelligence artificielle au rang de stratégie nationale en 2017, l'IA était déjà un « invité fréquent » aux deux sessions nationales. De nos jours, ChatGPT est populaire dans le monde entier, et les gens ne peuvent s’empêcher de se demander à nouveau : Comment l’industrie chinoise de l’IA peut-elle saisir la tendance de ChatGPT ?

Profitant de la sortie d'un nouveau produit, Magike.com a également eu une discussion sur cette question avec Dr Gao Yizhao, chef de l'équipe R&D de Yuanchengxiang.

Selon lui,

La construction de grands modèles d'IA en Chine nécessite une planification à long terme et une continuité de travail afin de développer une technologie véritablement innovante.

Lorsque nous regardons «l'histoire du développement» de ChatGPT, nous pouvons constater qu'il n'est pas facile de construire un grand modèle d'IA. Derrière cela se cache un investissement en capital à long terme et une itération de la technologie de puissance de calcul. Considérez également l'optimisation des données de formation et de la puissance de calcul, ainsi que d'autres aspects.

En d'autres termes,

Si vous souhaitez créer une application de type ChatGPT, vous ne pouvez pas le faire par un simple « sprint de 100 mètres », mais vous devez courir patiemment une « course longue distance de 10 000 mètres » avant de pouvoir participer à la "course parmi les meilleurs".

Cependant, à en juger par l'état de développement actuel, les grands modèles d'IA des fabricants nationaux sont encore au stade de la recherche et du développement, et les équipes capables d'atteindre le niveau d'application comme "Yuancheng Xiang Chatlmg" sont encore très rares - tout d'abord, la recherche et le développement de grands modèles d'IA nationaux commencent généralement tardivement, et il existe un sérieux manque de talents. Deuxièmement, la formation de grands modèles dans le contexte chinois est plus difficile et prend beaucoup plus de temps que l'anglais.

Ces problèmes auraient dû nécessiter de la « patience » pour être résolus, mais alors que la dernière vague d'investissement dans l'IA s'est calmée, de nombreuses entreprises ont été contraintes de réduire leurs budgets, conduisant finalement à un goulot d'étranglement dans le développement des activités liées à l'IA.

En revanche, l'équipe R&D de Yuanchengxiang s'est relativement bien déroulée, d'une part, l'équipe a une exploration à long terme dans le domaine des applications de l'IA, et d'autre part, elle bénéficie également de son jugement correct sur le multimodal. modèles de pré-formation. Avec prévoyance et prévoyance, au final, avec la persévérance de toute l'équipe, nous avons finalement inauguré "

Blooming and Fruiting

" dans l'ère ChatGPT.

En parlant de l'exploration future des entreprises d'IA, le Dr Gao a également donné certaines de ses propres opinions : « En termes de construction écologique, la Chine peut promouvoir ​

​l'open source​

​. Après tout, il y a de la force dans chiffres. " Conclusion

Depuis sa sortie l'année dernière, ChatGPT est passé d'un "

produit phénoménal

" à un "

symbole technologique". Les fabricants de technologies nationaux se précipitent pour lancer des produits de type ChatGPT, dans l'espoir de gagner. dans cette compétition. Obtenez la soi-disant « victoire ». Dans le même temps, avec la popularité de ChatGPT, l'industrie nationale de l'IA a de nouveau déclenché une nouvelle vague de nouveaux produits. C'est au cours de cette période que « Yuancheng Xiang Chatlmg » s'est démarqué.

A en juger par l'évaluation de l'application "Yuancheng Xiang Chatlmg", son expérience est déjà très conviviale, et elle dispose même de fonctions de "reconnaissance d'image" que ChatGPT n'a pas.

Bien sûr, en tant que première version de "Yuanchengxiang Chatlmg", il y a encore des lacunes dans certains détails, mais je pense qu'avec les efforts et la persévérance de l'équipe R&D de Yuanchengxiang, l'application domestique ChatGPT peut également surprendre l'industrie à l'avenir.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer