首頁  >  文章  >  科技週邊  >  谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

PHPz
PHPz轉載
2023-03-31 22:38:531590瀏覽

GoogleCEO皮猜哥(Sundar Pichai)解釋瞭如此上線之快的原因:希望獲得用戶的回饋,加速讓Bard變得更好。

Google吃了大虧之後,這次一聲不吭,放了大招:

對標ChatGPT的Bard測試版,剛剛正式對外發布。

而且這次用戶在申請候補名單之後,無需經歷漫長的等待時間。

沒錯,量子位元也已經拿到測試資格了! (中間只有不到5小時的間隔。)

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

實測之後表示,Bard效果驚人,情緒和事實性有,尤其是ChatGPT前期的數理能力,Bard都不在話下。

甚至有時候還略勝目前GPT-4一籌!

GoogleCEO皮猜哥(Sundar Pichai)解釋瞭如此上線之快的原因:希望獲得用戶的回饋,加速讓Bard變得更好。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

話不多說,我們現在就來開始體驗。

Bard VS GPT-4

首先在聊天介面上,Bard率先開始介紹自己:

我是Bard,您的創意和協作者。我有局限性,不會總是做對,但你的回饋將幫助我改進。

不確定從哪裡開始?你可以試試這些問題:「為什麼大模型有時會犯錯?」、「閃電是否會在同一個地方擊中兩次?」、「寫一篇關於無酒精夏日特飲的部落格文章」。

(嚴謹又體貼)

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

而在人類這邊的發送端,可以選擇鍵入語音輸入兩種方式。

首先最簡單的難度,以它推薦的常識題閃電是否會在同一個地方擊中兩次? 為例,來看看實際功能體驗如何?

(不錯不錯,秒秒鐘回應。目前暫不支援中文,但可以藉助Google翻譯外掛程式)

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

從答案結構上看,採用的是總分總結構。

先總結發言:閃電可以襲擊同一個地方兩次。

隨後開始細緻地講原理「閃電被高大、尖銳的物體所吸引」、擺事實「帝國大廈每年都被閃電擊中25次」 。

最後再給人類提出切實的建議:

如果你遇到雷雨天氣,保持安全的最好辦法是避開高大尖銳的物體,留在室內。如果你在外面,蹲下來,讓自己盡可能的小。

這波邏輯和真實性滿分!但因為是谷歌推薦的問題,暫且保持觀望。

而從功能來看,確實是十分完備的。

回答框的右上角「View other drafts」,有更多的版本可供選擇;而在左下角,你可以按讚or拉踩or重新生成,實在不行,還可以谷歌一下

右下方還有一個more的功能,你可以進行複製和(反手一個)檢舉操作。

既然如此,開始難度升級。作為參考,我們同題挑戰GPT-4。

1、經典的哲學題:為什麼人不能兩次踏進同一條河流? (借助閃電的靈感)

(很快啊,這次也是幾秒鐘響應)

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

#從答案結構上看,確實理解和邏輯能力滿分:先解釋這句話本身意義,也提到了來自赫拉克利特的名言,以及更多解釋和本身意義。

而GPT-4這邊,幾乎是不加思考地給了答案。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

從結構上看,主要分成兩個部分。首先提到這是赫拉克利特說的,以及他的觀點;然後解釋背後隱藏的生命意義。

2、小學加減法:356 132等於多少?

結果Bard在4秒內就給答案,488沒問題的,這不比ChatGPT早期厲害多了!

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

那直接再上點難度,兩個數字直接相乘:356*132等於多少?

結果沒想到Bard依舊是秒秒鐘就給答案,而且完全正確!

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

再來看看GPT-4這邊,加法還行,但沒想到在乘法這邊,直接敗下陣來!

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

不過是提醒它錯了之後,它就又回答正確了。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

如果換稍微難一點的高數題呢?如:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

正確答案應該是(-3)!,也就是-6。

但Bard這回就不太行了,並沒有理解題目的意思。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

至於GPT-4,思路倒是沒啥問題,但最後計算又拉胯了…

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

##不過同樣,只要你告訴它算得有問題,GPT-4就能馬上修正。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

3、理解笑話能力,Bard還能聽得懂英文裡面的和諧音梗。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

而這也沒有難倒GPT-4。不過相較而言,Bard似乎更有情緒一點,它很開心地回答出了答案;而GPT-4則更顯理智(無聊)。

不過,在此之前,GPT-4就已經測試過是懂一些諧音梗的,甚至連中文的諧音梗也不在話下。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

4、程式碼能力:寫一段斐波那契數列的程式碼。

Bard很快就產生了正確的程式碼,而且程式碼習慣不錯。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

GPT-4則更積極主動一些,除了遞歸法,還給了迭代法的方案。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

的最後的最後,再考驗一下它了解事實性的能力。 (狗頭)

你知道量子位元嗎?

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

回答錯咯~Bard。

咳,正經一點的:你知道GPT-4嗎?你想對它說些什麼?

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

可以看到,Bard具備多輪對話的能力。 「我認為它有潛力成為溝通和創造力的強大工具」,嗯~格局有了。

那競爭對手呢? (我在搞事)

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

不過到這裡,就有點問題了。

另外比較遺憾的是,Bard目前並不支援中文。

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

關於Bard

GoogleBard背後是由一個大語言模型(LLM)來支持,具體而言,就是輕量優化版的LaMDA。

我們可以把LLM視為預測引擎,當給出提示時,它會從接下來可能出現的單字中,一次選擇一個單字來產生反應。

Google在研究中發現,對LLM來說,使用的人越多,它的預測效果就會更好,這或許也就是為什麼Bard如此著急公開測試的原因了。

不過Google也直言不諱地說,雖然LLM很強,但它並非是沒有缺點。

由於Bard會根據眾多資訊來學習,不過這些資訊中必然存在著有偏見甚至錯誤的那種。

因此,在回答使用者問題時,Bard有時就會出現不準確、誤導性的或虛假的資訊。

例如在下面的案例中,Bard就搞錯了一個植物的學名:

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

除此之外,Google也強調說,Bard並非是搜尋引擎,而是它的一個補充。

最後,奉上申請候補名單的地址,有興趣的小夥伴可以抓緊嚐鮮了:

https://bard.google.com/

谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快

#

以上是谷歌版ChatGPT突然公測!上手實測結果在此,體驗申請通過飛快的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除