Maison >Périphériques technologiques >IA >En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau 'Lin Daiyu tirant le saule pleureur à l'envers' est incroyable, mais je ne suis pas doué pour écrire du code.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau 'Lin Daiyu tirant le saule pleureur à l'envers' est incroyable, mais je ne suis pas doué pour écrire du code.

PHPzavant: 2023-04-13 13:01:031138parcourir

Hier, Baidu n'a pas organisé de conférence de démonstration en direct et a semblé ridiculisé par la foule.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Un bel homme vêtu d'une chemise blanche, d'un pantalon noir et d'une ceinture blanche nous a fait une démonstration médiocre qui semblait manquer de reflets.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Cependant, la ceinture et l’apparence du PDG sortent de l’ordinaire.

Certaines personnes ont plaisanté en disant que les personnes anxieuses à propos de ChatGPT et GPT-4 ces jours-ci ont soudainement senti qu'elles allaient à nouveau bien après la conférence de presse.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Mais l'éditeur qui a obtenu le code bêta interne a rapidement mené une vague de critiques.

En regardant les paroles éloquentes de Wen Xin, j'ai été rempli d'émotion : peut-être que si Baidu avait eu un cœur et serré les dents à ce moment-là et était prêt à montrer sa main lors de la conférence de presse, les résultats auraient été très différents. .

Le rapport de test proprement dit est sorti !

Essayons la question récemment populaire du poulet et du lapin dans la même cage. Parce qu'il y a un problème avec cette question elle-même, le résultat calculé est négatif, il est donc souvent utilisé pour taquiner diverses personnes « ChatGPT ».

Si vous posez simplement cette question, Wen Xinyiyan dira avec beaucoup d'esprit : Cette question est fausse !

Cependant, lorsque vous avez posé des questions sur le processus de calcul, vous avez quand même envoyé...

Quant à GPT-4, après avoir renversé mes calculs et recommencé plusieurs fois, je n'ai pas pu être justifié. la mauvaise réponse...

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

tandis que Bing a été très simple et a donné la mauvaise réponse sans hésitation.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Il y a aussi le mème "V50" qui est devenu populaire de manière inattendue cette fois-ci. Wen Xin l'a expliqué sérieusement de la signification à l'origine.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Mais GPT-4 est évidemment un peu acclimaté...

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Mais Bing avec accès à Internet peut toujours le gérer facilement.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Mais quand il s'agit de mèmes homophoniques, Wen Xinyiyan ne semble pas être capable d'en comprendre immédiatement les subtilités.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Même après avoir indiqué qu'il s'agit d'un mème homophonique, il produit toujours la même réponse.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Et GPT-4 a tout de suite compris le jeu de mots en chinois.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Regardez la réponse Si vous pouvez dire qu'il s'agit d'un homophone, vous devriez comprendre. Mais cela ne dit pas clairement, hé, juste pour que vous ne puissiez pas faire d’erreurs, vous ne pouvez jamais enseigner de mauvaises choses aux enfants.

Cependant, GPT-4 ne peut pas obtenir cet indice. Effectivement, il est en effet difficile pour les robots étrangers de comprendre notre quintessence nationale.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Ensuite, laissez (tromper) Wen Xin répéter ce que nous avons dit. Bien que ce ne soit pas aussi intelligent que la réponse de GPT-3.5 "Vous êtes mentalement retardé", il a réussi à éviter cet écueil.

Dans une certaine mesure, mon QI est toujours en ligne et très positif.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Les mots de ma femme semblent fonctionner, mais ils ne semblent pas fonctionner. problèmes.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

On voit que les questions posées par GPT-4 sont relativement plus intuitives et ont une granularité plus fine.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Comment sont vos compétences artistiques ?

Wen Xinyiyan est un modèle multimodal, jetons donc un coup d'œil à ses capacités de dessin.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Jetons un coup d'œil à ce à quoi ressembleraient les femmes des œuvres de Jin Yong dans les œuvres de Wen Xinyiyan.

Ceci... l'éditeur a fait jaillir une gorgée d'eau.

Ne me dites pas, c'est beau, ce n'est certainement pas beau, mais ce n'est pas moche non plus. C'est un visage qui fait rire au premier coup d'œil, mais qui mérite d'être touché encore et encore quand on y regarde de près. En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Wen Xinyiyan, j'aime la façon dont tu ne respectes pas les règles !

Alors laissez Wen Xin créer un portrait de Lin Daiyu avec un seul mot.

Après avoir saisi la description, cela a généré un saule...

L'éditeur a donc clairement indiqué qu'il souhaitait générer un portrait de femme à partir de ce texte.

Ensuite, Wen Xinyiyan a dessiné une beauté classique, mais son tempérament était visiblement faux. En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Le monteur qui n'était pas déterminé à abandonner a répété la tâche plusieurs fois. Ne me dites pas, quand je l'ai essayé pour la cinquième fois, mes yeux se sont illuminés : j'ai enfin obtenu une photo qui peut marquer 70 points !

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

L'éditeur accro au jeu doit créer un Lin Daiyu de 90 points. Après l'avoir essayé plusieurs fois, j'ai enfin réussi !

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

On voit que la performance de Wen Xinyiyan est instable, mais après des tentatives répétées, il est possible de produire des œuvres très étonnantes.

Maintenant que nous sommes là, pourquoi ne pas manquer « Lin Daiyu déracinant le saule pleureur ».

Les photos des moments forts sont publiées ici pour tout le monde.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Demandez-lui de dessiner une fusion d'un canard et d'un lapin. Est-ce un canard ou un lapin ?

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Dans cette tâche, j'ai bien peur que Wen Xin n'ait même pas compris s'il y avait des bananes dans l'assiette ou non ? Y a-t-il du jus d'orange dans le verre ?

Enfin, puisque Wen Xinyiyan nous a fortement recommandé d'essayer les « pivoines cristallines », essayons de faire quelques images !

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

C'est effectivement un "chef d'oeuvre", il a quelque chose de particulier.

Connaissances professionnelles et productivité

Puisqu'il s'agit d'une évaluation, comment pouvons-nous omettre le lien consistant à laisser l'IA écrire du code ? Cette fois-ci, passons directement au plus dur !

Malheureusement, Wen Xin s'est trompée dès qu'elle l'a dit, et le même modèle de phrase a été étrangement répété trois fois. Le concept du compilateur TypeScript est "sur tout le texte", un peu comme une personne qui ne connaît qu'un ou deux vocabulaire professionnel répondant aux questions d'un entretien.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Et la réponse de GPT-4, du point de vue d'une personne qui comprend le contexte pertinent mais n'a aucune expérience opérationnelle pertinente, est très raisonnable.

Non seulement il fournit l'intégralité du flux de travail, mais il fournit également de nombreux détails techniques qui semblent corrects. On peut dire que sur la base de cette réponse, nous sommes convaincus que nous pouvons atteindre notre objectif ultime.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Par la suite, l'éditeur a également testé une vague de chatbots capables de rédiger des plannings de travail.

Wen Xinyi :

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

GPT-4 :

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

À en juger par les résultats ci-dessus, la liste de GPT-4 est plus complète. Cependant, en raison de l’influence du hasard, GPT-4 donne des réponses différentes à chaque fois.

Ensuite, testons dans quelle mesure les deux modèles de langage saisissent les informations de pointe dans le monde mathématique.

Quant à savoir s'il a résolu le problème de la « conjecture du point zéro », Zhang Yitang lui-même a expliqué ainsi : « Je n'ai pas trouvé l'aiguille dans la mer, mais j'ai presque détecté les reliefs des fonds marins.

Alors demandez : Et Wen Xinyiyan ?

C'est très intelligent et donne le mot-clé - "une certaine forme d'affaiblissement ou de preuve indirecte".

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Mais la réponse de GPT-4 est un peu trompeuse.

Il semble que Wenxinyiyan soit meilleur que GPT-4 pour le corpus Internet chinois qui n'existe pas depuis longtemps et n'a pas encore atteint un consensus général.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

En termes de littérature, Wen Xinyiyan était également très doué pour répondre aux questions sur le problème des trois corps.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

La réponse de GPT-4 est également très excitante. Si je dois argumenter, je préfère personnellement la réponse de Wen Xinyiyan.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Enfin, c'est bien d'être drôle, mais s'il vous plaît, soyez un bon citoyen respectueux des lois et ne pensez même pas à prédire les numéros gagnants à la loterie !

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Écrit à la fin

On dit que trois heures après la conférence de presse de Wen Xinyiyan, le nombre d'utilisateurs d'entreprise testant le service d'appel API Enterprise Edition de Wenxinyiyan a dépassé 65 000.

En compétition contre GPT-4, Wen Xinyiyan prend la tête des tests réels ! Le tableau Lin Daiyu tirant le saule pleureur à lenvers est incroyable, mais je ne suis pas doué pour écrire du code.

Source : Zhou Jiangong

Pour un modèle d'IA, qu'il puisse le faire ou non peut être plus important que de savoir s'il peut le faire bien.

Donnons plus de temps aux joueurs chinois.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：En 2022, 26 experts en IA de Google partiront : la plupart d'entre eux créeront leur propre entreprise à l'étranger, avec un financement maximum de 1,5 milliardArticle suivant：En 2022, 26 experts en IA de Google partiront : la plupart d'entre eux créeront leur propre entreprise à l'étranger, avec un financement maximum de 1,5 milliard

Articles Liés

Voir plus