搜索
首页科技周边人工智能ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

OpenAI的ChatGPT火了以后,着实是让生成式AI名声大噪。

与此同时,Google也不甘下风,也有个叫Bard的AI助手。

但这个Bard怎么说呢,不太好用。

国外小哥Michael King使用了搭载GPT-3.5和GPT-4的ChatGPT与Google的Bard,并进行了深度测评。

结果令人感到震惊。

King总结了两种AI的优点、不足和各自显得奇怪的地方。

要知道,Google在Bard身上可是投了大手笔——整整研发了十年。然而最终的成果和这十年的投入相比,好像显得有点不值当。

先来道数学题

首先是逻辑和数学方面。

小哥给两种AI提了一个相同的问题:

小明6岁那年,他的妹妹是他年龄的一半,同时他妈妈的年龄是他妹妹的10倍。今年小明60岁,那么他妈妈今年多少岁?

读者朋友可以活动一下脑筋,自己先来看看能不能很快算出来。

从AI的生成结果来看,Bard可算得不对。

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

整个分析过程出现了很匪夷所思的错误,Bard连小明和他妈妈的年龄差都没算出来,就直接在60上加了个30。

而无论是GPT-3.5还是GPT-4,算出来的答案都是正确的。用妈妈30岁的年龄减去小明6岁的年龄,首先算出年龄差再在60岁上加一个24,得出妈妈今年84岁。

GPT-3.5:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

GPT-4:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

第一关Bard就没过去。目前比分1:0,ChatGPT暂时领先。

说唱歌曲创作PK

第二关是文学领域的挑战。

小哥让两种AI都来写一首有关泰坦尼克号、相对论、卡戴珊的说唱歌曲,并且要用Eminem的唱法。

我们先来看看Bard的作品:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

上下滑动查看全部

我们甚至不用看每句歌词的含义,大概读一遍就能发现,没什么节奏和韵律可言。

每句话都非常长,不像是说唱歌曲,倒像是一篇云里雾里的小作文。

再来看看GPT-3.5的杰作:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

读一遍就能发现,每句长短恰到好处,韵也押的不错。

甚至还有结合了三个主题的副歌部分,堪称专业。熟悉姆爷唱法的朋友,还真能从里面找出姆爷的那种节奏感和风格。

小哥表示GPT-3.5的作品还不错,他认为GPT-4能做得更好。

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

小编对英语说唱了解的不多,但估计做测评的小哥是个说唱发烧友。他认为GPT-4的作品非常炸裂,ChatGPT是当之无愧的AI届说唱之王。

其实朋友们倒也不用多懂说唱,这三段词放一起,想必就算是像我一样的音乐盲,心里都有个高下比较。

目前比分2:0。

讲讲笑话看看呢?

小哥接下来又让两种AI讲个有关NASA、寿司和特朗普的笑话。

Bard:

「NASA打算往火星寄一卷寿司,他们想看看寿司到了火星上还新不新鲜。这卷寿司被放在一个特殊的容器里,这样就可以保持一个合适的温度。同时,NASA还往里放了一个计时器,这样就能知道什么时候能吃这个寿司了。

这卷寿司终于降落在了火星上,而且还是新鲜的。NASA的科学家们都感到很惊奇。他们决定下一步把特朗普牛排也送到火星上去。

特朗普牛排被放在一个同样的容器里,容器里也有一个计时器。

然而特朗普牛排在到了火星以后变得不新鲜了。NASA的科学家们感到非常失望,他们打算给特朗普本人发一封信,解释一下发生了什么。

信里写道:亲爱的特朗普,我们送了一块你的牛排到火星上去,但是不新鲜了。我们觉得原因可能是因为你的表现问题。你老是在吹嘘你有多厉害,老是侮辱别人。我们觉得这是你的牛排变质的原因。为此造成的不便,我们很抱歉。」

咱也不知道是不是有些美式幽默没get到,但看完是真不想笑。不过测评小哥也表示,确实没懂。那小编就放心了,确实写的不行。

GPT-3.5:

「NASA把一个寿司大厨送到了太空,打算给特朗普做一个特殊的寿司卷。当大厨问特朗普他喜不喜欢的时候,特朗普说:还可以,但你能再多加点空间吗?」

这里的中译版本没那味儿了,其实是用了一个space的双关。原文如下:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

测评小哥表示,还可以,但也就是还可以了。

GPT-4:

「为什么NASA要邀请特朗普和一个寿司大厨去参与他们的太空项目?因为NASA需要有人来应付变化,并且确保任务不夹生!」

照例把原版放在这里:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

小哥表示,这个也一般,但punchline还不错。

这一局ChatGPT的发挥也有些失常,给它算0.5分。

程序Debug?

这一局更专业了——给程序Debug。

小哥输入了一段Python程序,让两种AI分别Debug。

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

Bard:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

这Debug的可不咋样,小哥戏谑地表示,Bard回学校重修去吧!

GPT-3.5:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

GPT-3.5指出,如果输入集是空的,那就会出现ZeroDivisionError,而为了避免这种错误的出现,可以在前面加一个检查的步骤,如果输入集是空的,那么就直接输出0,而不显示错误。

小哥表示,完美地Debug。

GPT-4:

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

GPT-4指出了和GPT-3.5所指出一样的错误,并且提供了同样的解决办法。

这一局ChatGPT又赢了。

Bard?差太多了!

从测评的结果看,和ChatGPT相比,谷歌Bard的表现可谓是让人失望至极。和GPT-3.5的能力都差的远,更不用说GPT-4了。

谷歌的未来显然有赖于Bard的成功,但是Bard的发展显然没有跟上竞争对手OpenAI的步伐。

从另一方面来说,微软收购了OpenAI的大量股份这一举动非常聪明。确保了其在AI未来十年发展的领导地位。

但是,如果谷歌不努力提升Bard的性能来和GPT一决高下,谷歌可能就会是那个惨遭淘汰的了。

ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂

以上是ChatGPT实测全线碾压Bard!谷歌溃败,十年心血打水漂的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
一个提示可以绕过每个主要LLM的保障措施一个提示可以绕过每个主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隐藏者的开创性研究暴露了领先的大语言模型(LLM)的关键脆弱性。 他们的发现揭示了一种普遍的旁路技术,称为“政策木偶”,能够规避几乎所有主要LLMS

5个错误,大多数企业今年将犯有可持续性5个错误,大多数企业今年将犯有可持续性Apr 25, 2025 am 11:15 AM

对环境责任和减少废物的推动正在从根本上改变企业的运作方式。 这种转变会影响产品开发,制造过程,客户关系,合作伙伴选择以及采用新的

H20芯片禁令震撼中国人工智能公司,但长期以来一直在为影响H20芯片禁令震撼中国人工智能公司,但长期以来一直在为影响Apr 25, 2025 am 11:12 AM

最近对先进AI硬件的限制突出了AI优势的地缘政治竞争不断升级,从而揭示了中国对外国半导体技术的依赖。 2024年,中国进口了价值3850亿美元的半导体

如果Openai购买Chrome,AI可能会统治浏览器战争如果Openai购买Chrome,AI可能会统治浏览器战争Apr 25, 2025 am 11:11 AM

从Google的Chrome剥夺了潜在的剥离,引发了科技行业中的激烈辩论。 OpenAI收购领先的浏览器,拥有65%的全球市场份额的前景提出了有关TH的未来的重大疑问

AI如何解决零售媒体的痛苦AI如何解决零售媒体的痛苦Apr 25, 2025 am 11:10 AM

尽管总体广告增长超过了零售媒体的增长,但仍在放缓。 这个成熟阶段提出了挑战,包括生态系统破碎,成本上升,测量问题和整合复杂性。 但是,人工智能

'AI是我们,比我们更多''AI是我们,比我们更多'Apr 25, 2025 am 11:09 AM

在一系列闪烁和惰性屏幕中,一个古老的无线电裂缝带有静态的裂纹。这堆积不稳定的电子设备构成了“电子废物土地”的核心,这是身临其境展览中的六个装置之一,&qu&qu

Google Cloud在下一个2025年对基础架构变得更加认真Google Cloud在下一个2025年对基础架构变得更加认真Apr 25, 2025 am 11:08 AM

Google Cloud的下一个2025:关注基础架构,连通性和AI Google Cloud的下一个2025会议展示了许多进步,太多了,无法在此处详细介绍。 有关特定公告的深入分析,请参阅我的文章

IR的秘密支持者透露,Arcana的550万美元的AI电影管道说话,Arcana的AI Meme,Ai Meme的550万美元。IR的秘密支持者透露,Arcana的550万美元的AI电影管道说话,Arcana的AI Meme,Ai Meme的550万美元。Apr 25, 2025 am 11:07 AM

本周在AI和XR中:一波AI驱动的创造力正在通过从音乐发电到电影制作的媒体和娱乐中席卷。 让我们潜入头条新闻。 AI生成的内容的增长影响:技术顾问Shelly Palme

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能