Maison >Tutoriel matériel >Examen du matériel >Les grands fabricants de modèles ont fait des efforts intensifs, et Google a également ouvert un « volume » : le robot de discussion Gemini a été remplacé par un nouveau modèle, et il peut également vérifier le contenu de sortie en un seul clic.
Alors que les grands fabricants de modèles tels que Meta et OpenAI déploient des efforts intensifs, Google a également annoncé une mise à jour majeure :
Désormais, le robot de discussion Gemini sera piloté par Gemini 1.5 Flash.
Par rapport à la version précédente, la longueur de la fenêtre a été augmentée jusqu'à 4 fois et la vitesse de réponse est également plus rapide.
Selon l'introduction de Google, le modèle Flash 1.5 derrière la nouvelle version du chatbot se concentre sur l'allègement et l'amélioration de la vitesse.
Bien sûr, la qualité de la réponse du modèle a également été améliorée et la fenêtre contextuelle a été augmentée de l'original (basé sur 1.0 Pro) de 8k à 32k.
De plus, la nouvelle version du chatbot ajoute également une fonction de « vérification des faits », qui peut détecter si le contenu généré est vrai en un seul clic, réduisant ainsi les effets néfastes des illusions de modèle.
Certains internautes ont d'abord déploré que les performances de Google aient été très bonnes aujourd'hui, puis Gemini a également publié une mise à jour.
Certaines personnes ont activé le mode souhait et ont hâte d'ajouter des fonctions d'IA à la recherche universitaire de Google Scholar.
Fenêtre contextuelle plus longue et vitesse plus rapide
Le contenu principal de cette mise à jour est de changer le modèle derrière la version gratuite de 1.0Pro à 1.5 Flash.
Gemini 1.5 Flash a été dévoilé pour la première fois lors de la conférence des développeurs Google I/O en mai.
Grâce à la « distillation » des données d'entraînement, Gemini 1.5 Flash atteint une qualité de génération supérieure avec une taille plus légère.
Et la petite taille rend également le modèle plus rapide et plus efficace, et il prend également en charge le raisonnement multimodal.
Google a annoncé qu'après ce changement de modèle, le chatbot deviendra plus rapide et la fenêtre contextuelle de l'ancienne version de 8k sera étendue à 32k.
Cependant, 1.5 Flash lui-même prend en charge 1 million de contextes. Cette réduction n'est certes pas minime, mais c'est une version gratuite après tout.
En plus de la mise à niveau du modèle, une autre mise à jour importante est la fonction de vérification des faits.
Dans le dernier chatbot Gemini, vous pouvez utiliser cette fonction pour vérifier le contenu de sortie en un seul clic.
Le système recherchera et comparera le contenu de la sortie sur Google, puis marquera les correspondances et les divergences.
Certains internautes ont commenté que lorsqu'ils ont vu OpenAI lancer GPT-4o mini, ils ont estimé que ce n'était qu'une question de temps avant que Google ne lance la nouvelle version.
En effet, non seulement OpenAI et Google, mais aussi Meta, Mistral et d'autres fabricants qui fabriquent de grands modèles ont fait de fréquents mouvements ces derniers temps.
Quant aux performances du modèle, cet internaute a également déclaré qu'il avait essayé 1.0 Pro et 1.5 Flash. Les performances des deux sont presque les mêmes, et le 1.5 Flash est plus rapide.
Ainsi, cette vague d'opérations de Google s'adapte également dans une certaine mesure à la tendance récente de « l'allègement des modèles ».
Alors, quelles sont les performances du chatbot Gemini après le remplacement de Flash 1.5 ?
Vérifiez la sortie du modèle en un clic
Qubit a effectué un test simple sur la nouvelle version du chatbot.
Tout d'abord, jetons un coup d'œil à la fonction de vérification des faits de cette mise à jour. La première étape consiste à poser une question comme une conversation normale, et les Gémeaux y répondront normalement.
Vous pouvez voir qu'il y a un logo Google sous la réponse. Il s'agit du bouton de la fonction de vérification des faits.
Après avoir cliqué, le système recherchera automatiquement sur Google puis le comparera avec sa propre sortie.
比对完成后,能够搜索到信源且相符的内容会被高亮为绿色,如果与搜索结果存在出入,则会以浅红底色标注。
点击标注的位置,可以看到 Gemini 用于对比的内容链接。
需要注意的是,这样的标注并不意味着输出的内容是错误的,比如这里引用的对比资料中,汤姆克鲁斯的母亲是 Marry Lee South。
由于文本不匹配,导致答案中这一部分被系统标注,但实际上两个都是正确答案。
由于这个事实核查依靠的是互联网搜索,对比资料的质量也是参差不齐,不一定能做到 100% 的准确。
比如关于 " 林黛玉倒拔垂杨柳 " 这个经典段子,Gemini 明明给出了正确答案,结果却被标红了。
再一看引用的对比信息,属实是有些难绷了。
所以这个功能的作用,主要是提供了一个更便捷的核查途径,但具体应当如何采信,还是要依靠多方查证,以及用户自己的判断。
另外,关于模型本身,我们也测试了几个最近流行的让大模型屡屡碰壁的难题。
比如,Gemini 甚至把两个数字换算成了钱,但一通操作之后最后的结果是……错的。
自从这个问题被发现以来,如果这个是第二搞笑的答案的话,应该没有哪个模型敢称第一了。
还有一开始给了个错误答案,后面分析过程中纠正过来的。
但如果用英语提问,还是有希望直接答对的。
还有的问题,这个回答竟然能从中文里数出字母来……也是把人给整不会了,完全不在预判之内。
最后,关于此次更新中提到的速度提升,经测试发现,Gemini 1.5 Flash 输出第一个字的耗时要短于 Claude 3 Haiku,后续的速度用肉眼观察区别不是很明显。
以上就是 Gemini 1.5 Flash 在聊天机器人中的表现,感兴趣的读者可以自行尝试。
参考链接:
[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/
[ 2 ] https://x.com/GeminiApp/status/1816512086232731696
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!