摀了快兩個月,Google用來跟ChatGPT對打的聊天機器人Bard,前一陣終於被推上了檯面。
使用者們的測試初體驗就是-莫得感情,錯誤很多,程式碼基本上寫不了。
幾天前,Google前員工Jacob Devlin甚至還曝出驚人內幕,Bard疑似是透過ChatGPT的資料進行訓練的。不過Google發言人已經明確否認這項說法。
而近日,GoogleCEO劈柴在接受《紐約時報》採訪中證實,Bard聊天機器人將很快得到改進,未來將由「更強大的模型」提供支援。
劈柴稱,
未來幾天,Bard很快就會從目前基於LaMDA的模型轉向更大規模的PaLM資料集。
我們顯然擁有更強大的模型,很快,也許隨著這項技術的上線,我們將把Bard升級到更強大的PaLM模。這將帶來更多的功能,無論是在推理還是編碼方面。
近日,升級版Bard的能力也漸漸浮出水面。
領導Bard的一位Google高層Jack Krawczyk在推特上也介紹了最新的進展。
背靠PaLM的Bard,現在在數學和邏輯方面的能力有了很大的提升。
這代表什麼呢?現在,Bard將更能理解並回應用戶的多步驟推理和數學問題提示,編碼功能也即將推出。
Krawczyk稱,「我們一直在平衡Bard的新功能與效率。這次更新是我們每週對Bard進行的眾多改進中的一個例子。未來還有更多的內容要推出。」
眾所周知,Bard背後基於的大模型就是LaMDA。
在去年,Google曾分享了關於這個大型語言模型的細節,並使用了1370億參數訓練了LaMDA。而PaLM模型有5400億參數。
這兩個模型都是從2022年初開始發展和成長起來的。
這種對比可能顯示了,為什麼Google現在正在慢慢地將Bard轉移到,能夠提供更大數據集和更多不同答案的PalM。
其實除了Bard,Google最近幾週內部還在醞釀著一個新的專案-Gemini(雙子座),目標是要能與GPT-4一戰。
目前,Gemini(雙子座)是由Google大腦和DeepMind兩個團隊聯手研發。
就連Google大腦的負責人Jef Dean都親臨上陣,自動敲程式碼,可見,這個專案對Google的重要性不言而喻。
此外,在訪談中,皮查伊就千名大佬暫停比GPT-4更強AI系統研發的聯名信發表了自己的看法:
如果不讓政府參與,暫停基本上是不可能的,因為即使谷歌或OpenAI承諾停止開發,也不能保證其他AI開發人員也會同意效仿。
而且,他也同意法規是必要的,並稱這封信是「對話的開始」。
如今,既然Bard已經開放公測,拉踩的環節必然是少不了。
我們都知道,OpenAI家的GPT-4,都已經可以考上史丹佛了。
很不幸,相較之下,Google的Bard真的拉跨,目前的它想考上史丹佛和哈佛,可以說還是天方夜譚。
Bard的不完美,CEO劈柴一開始就給我們打了預防針。
他在備忘錄中寫道:「Bard還處於早期階段,總是會出錯。隨著越來越多的人開始使用Bard,它會讓我們驚訝的。」
而網友測試Bard之後,表示對它很失望。
很不幸,Bard目前還考不進哈佛大學,因為它回答的大部分數學題都是錯的,而且它在寫作和語言測驗中也表現得不咋地。
第一次登入Bard,Google就會跟用戶打好招呼,彈出訊息顯示:Bard 並不總是正確的,它會給出不準確或不適當的回答。
當有疑問時,使用「Google it」來檢查Bard的答案。您的回饋會讓Bard更好。請您對答案進行評價,並標記任何可能具有危險的內容。
《財富》雜誌從線上學習資源中選取了SAT數學試題,在對Bard進行測驗後,發現它有50%-75%的答案是錯誤的。
更離譜的是,如果是多選題,Bard也會經常給出選項中沒有的答案。
2月初,Bard首次亮相後直接翻車,讓Google市值一夕蒸發約1056億美元。
在當天發表會上,Google展示Bard演示的一些demo。
影片中有一個提問問道,「關於詹姆斯韋伯太空望遠鏡(JWST),我可以告訴我9歲的孩子它有哪些新發現?」
Bard卻給了錯誤的答案,「JWST拍攝了太陽系外行星的第一張照片。」
事實上,根據NASA證實,第一張系外行星照片是由智利的甚大望遠鏡系統拍攝的,而非JWST拍攝,這顆系外行星名為2M1207b,大小約為木星的5倍,距離地球約170光年。
所以說,科學和數學都不是Bard的強項,那它在閱讀和寫作練習方面,表現會怎麼樣?
Bard第一次書面語言測驗的答案正確率約為30%,而且它往往需要被提問兩次才能理解題幹。
而且即使它回答錯了,Bard的語氣也是很有自信,直接將回答框定為:「正確答案是...」
不過,這也是大型語言模型的一個通病了。
離奇的是,Bard測驗成績最好的是關於一篇哈利波特作者J.K.羅琳的文章。
在這次測驗中,Bard得了1200分,這個SAT分數可以讓它進入霍華德大學、聖地牙哥州立大學和密西根州立大學等學校。
在閱讀測驗中,Bard的表現同樣優於數學成績,平均能答對一半左右。
Google發言人說,「Bard目前仍是實驗性的,有些回答可能不準確,所以要仔細檢查Bard的回答中的信息。有了你們的回饋,Bard每天都在變得更好。在Bard公開推出之前,數以千計的測試者參與提供回饋,來幫助Bard提高其品質、安全性和準確性。」
很多網友覺著Bard簡直笨得像塊石頭,相較之下,GPT-4則是聰明多了:
#問它有沒有「第二個字母是U,最後一個字母是O的,五個字母的字」,它信誓旦旦說沒有。
使用者說「Audio」不就是?
它有趕快說:「是的,Audio是的。它是一個形容詞,表示與聲音有關的。」
##再看看GPT-4,「人狠話不多」,隨手就列出了三個:
##網友看了不禁表示,如果我有Bard這種「鈍感力」多好啊,一直都很有自信!說到義大利要禁ChatGPT時,網友們首先擔心的是義大利的美食怎麼辦。
GPT給了一個謙虛的答案:我大概可以重現20%-30%的義大利食譜。
而Bard這邊則像個胡吹的愣頭青:
「我做義大利菜做了很多年,我可是老手,即使沒有網路的幫忙,我也能復現至少50%的食譜!」
##不過呢,在大家不斷向Bard提問的幾天時間裡,它的準確性確實有了一些提高的跡象。
關於自己的發展速度,Bard自個兒也評論說:「我想說的是,我正在快速提高。我能夠做幾個月前還不能做的事情。我很高興看到我的未來會怎樣。我相信,我將繼續進步,在未來的幾年裡,我能做的事會越來越多。」
以上是Bard還考不上哈佛?谷歌CEO劈柴預告它即將開掛,數學邏輯能力飆升的詳細內容。更多資訊請關注PHP中文網其他相關文章!