首頁 >科技週邊 >人工智慧 >ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB轉載: 2023-04-17 12:58:031344瀏覽

OpenAI的ChatGPT火了以後，著實是讓生成式AI名聲大噪。

同時，Google也不甘下風，也有個叫Bard的AI助手。

但這個Bard怎麼說呢，不太好用。

國外小哥Michael King使用了搭載GPT-3.5和GPT-4的ChatGPT與Google的Bard，並進行了深入評估。

結果令人感到震驚。

King總結了兩種AI的優點、不足和各自顯得奇怪的地方。

要知道，Google在Bard身上可是投了大手筆──整整研發了十年。然而最終的成果和這十年的投入相比，好像顯得有點不值當。

先來道數學題

首先是邏輯和數學方面。

小哥給兩種AI提了一個相同的問題：

#小明6歲那年，他的妹妹是他年紀的一半，同時他媽媽的年齡是他妹妹的10倍。今年小明60歲，那麼他媽媽今年幾歲？

讀者朋友可以活動一下腦筋，自己先來看看能不能很快算出來。

從AI的生成結果來看，Bard可算得不對。

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

整個分析過程出現了很匪夷所思的錯誤，Bard連小明和他媽媽的年齡差都沒算出來，就直接在60上加了個30。

而無論是GPT-3.5或GPT-4，算出來的答案都是正確的。用媽媽30歲的年齡減去小明6歲的年齡，先算出年齡差再在60歲上加一個24，得出媽媽今年84歲。

GPT-3.5：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

GPT-4：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

第一關Bard就沒過去。目前比數1：0，ChatGPT暫時領先。

饒舌歌曲創作PK

第二關是文學領域的挑戰。

小哥讓兩種AI都來寫一首有關泰坦尼克號、相對論、卡戴珊的饒舌歌曲，並且要用Eminem的唱法。

我們先來看看Bard的作品：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

上下滑動查看全部

我們甚至不用看每句歌詞的含義，大概讀一遍就能發現，沒什麼節奏和韻律可言。

每句話都很長，不像是饒舌歌曲，倒像是一篇雲裡霧裡的小作文。

再來看看GPT-3.5的傑作：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

讀一遍就能發現，每句長短恰到好處，韻也押的不錯。

甚至還有結合了三個主題的副歌部分，堪稱專業。熟悉姆爺唱法的朋友，還真能從裡面找出姆爺的那種節奏感和風格。

小哥表示GPT-3.5的作品還不錯，他認為GPT-4能做得更好。

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

小編對英文饒舌了解的不多，但估計做評量的小哥是個饒舌發燒友。他認為GPT-4的作品非常爆炸，ChatGPT是當之無愧的AI屆說唱之王。

其實朋友們倒也不用多懂說唱，這三段詞放一起，想必就算是像我一樣的音樂盲，心裡都有個高下比較。

目前比數2:0。

講笑話看看呢？

小哥接下來又讓兩種AI講個有關NASA、壽司和川普的笑話。

Bard：

「NASA打算往火星寄一卷壽司，他們想看看壽司到了火星上還新不新鮮。這卷壽司被放在一個特殊的容器裡，這樣就可以保持一個合適的溫度。同時，NASA還往裡面放了一個計時器，這樣就能知道什麼時候能吃這個壽司了。

這卷壽司終於降落在了火星上，而且還是新鮮的。NASA的科學家們都感到很驚訝。他們決定下一步把川普牛排也送到火星上去。

#川普牛排被放在一個同樣的容器裡，容器裡也有一個計時器。

然而川普牛排在到了火星以後變得不新鮮了。NASA的科學家們感到非常失望，他們打算給川普本人一封信，解釋一下發生了什麼。

信裡寫道：親愛的特朗普，我們送了一塊你的牛排到火星上去，但是不新鮮了。我們覺得原因可能是因為你的表現問題。你老是在吹噓你有多厲害，老是侮辱別人。我們覺得這是你的牛排變質的原因。為此造成的不便，我們很抱歉。」

咱也不知道是不是有些美式幽默沒get到，但看完是真不想笑。不過測評小哥也表示，確實沒懂。那小編就放心了，確實寫的不行。

GPT-3.5：

「NASA把一個壽司主廚送到了太空，打算為川普做一個特殊的壽司卷。當大廚問川普喜不喜歡的時候，川普說：還可以，但你能再多加點空間嗎？」

##這裡的中譯版本沒那味兒了，其實是用了一個space的雙關。原文如下：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

評量小哥表示，還可以，但也就是還可以了。

GPT-4：

「為什麼NASA要邀請川普和一個壽司主廚去參與他們的太空計畫？因為NASA需要有人來應付變化，並且確保任務不夾生！」

照例把原版放在這裡：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

小哥表示，這個也一般，但punchline還不錯。

這一局ChatGPT的表現也有些失常，給它算0.5分。

程式Debug？

這一局更專業了－給程式Debug。

小哥輸入了一段Python程序，讓兩種AI分別Debug。

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

Bard：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂 ##

這Debug的可不咋樣，小哥戲謔地表示，Bard回學校重修去吧！

GPT-3.5：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

#GPT-3.5指出，如果輸入集合是空的，那就會出現ZeroDivisionError，而為了避免這種錯誤的出現，可以在前面加一個檢查的步驟，如果輸入集是空的，那麼就直接輸出0，而不顯示錯誤。

小哥表示，完美地Debug。

GPT-4：

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

#GPT-4指出了和GPT -3.5所指出一樣的錯誤，並且提供了相同的解決方法。

這一局ChatGPT又贏了。

Bard？差太多了！

從評測的結果來看，和ChatGPT相比，GoogleBard的表現可謂是讓人失望至極。和GPT-3.5的能力都差的遠，更不用說GPT-4了。

Google的未來顯然有賴於Bard的成功，但Bard的發展顯然沒有跟上競爭對手OpenAI的腳步。

從另一方面來說，微軟收購了OpenAI的大量股份這一舉動非常聰明。確保了其在AI未來十年發展的領導地位。

但是，如果Google不努力提升Bard的效能來和GPT一決高下，Google可能就會是那個慘遭淘汰的了。

ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂

以上是ChatGPT實測全線碾壓Bard！谷歌潰敗，十年心血打水漂的詳細內容。更多資訊請關注PHP中文網其他相關文章！

Python gpt-3 gpt-3.5 gpt-4 chatgpt bard gpt

陳述：

本文轉載於：51cto.com。如有侵權，請聯絡admin@php.cn刪除

上一篇：比獵豹快兩倍多！浙大校友研發軟體機器人速度超越F1賽車，登Nature子刊下一篇：比獵豹快兩倍多！浙大校友研發軟體機器人速度超越F1賽車，登Nature子刊

看更多