Google腸子都悔青了。
多年來一心一意崇拜的VR,目前看來是個假神。
現在眼看著對手微軟和OpenAI憑ChatGPT賺足了眼球,Google趕緊轉換策略,加速AI的研發。
諷刺的是,這一切之所以發生,是因為Google先前篤定地認為,自己已經壟斷了AI的市場。
Google確實有理由這麼認為。
在2017年,Google的研究人員發布了著名的論文“Attention is all you need”,引入了Transformer的概念,並大大提升了機器學習模型的潛在能力。
要概括Transformer巨大的影響力,只要說這句話就夠了:它就是GPT中的“ T」。
你可能會問:這麼好的東西,為什麼Google會免費開源呢?
大型私人研究機構過去常常被批隱瞞自己的工作,不過這幾年,開源已成一種趨勢。
因為,這是一場攸關聲望的遊戲,也是對研究人員的讓步──他們更希望雇主別把自己的光芒掩蓋起來。
當然,這其中也有傲慢的成分:作為這項技術的發明者,谷歌怎麼可能不是它最好的利用者呢?
後來的故事,我們都知道了。
這股ChatGPT熱,來得猝不及防。
學會理解並利用新工具,都需要時間。現在,每家大型科技公司都在探索,AI的新時代會帶來什麼,而它們為此需要做些什麼。
而做出ChatGPT基礎架構Transformer的谷歌,腸子都悔青了。
可以理解,Google不想過早地將搜尋與他們現有的半生不熟的通用LLM模型合併,來宰殺金鵝。他們已經成為部署高度專業化的AI任務模型的專家,這些模型可以完成一兩件事。
但當涉及到大動作時,他們舒適的位置讓他們背上了惰性。
所以Google垮台了嗎?當然沒有,在不久的將來,它仍將大家預設的一家利潤豐厚的大科技公司。只是看起來有點好笑。
毫無疑問,Google為AI領域做出了非凡的貢獻。
這幾年裡,它在設計AI運算硬體方面取得了重大進展,為開發人員建立了有用的平台,來測試和開發機器學習模型,並發表了大量論文,從模型的微調到語音合成。
Google執行長Sundar Pichai於2018年5月8日在Google I/O 2018大會上發表主題演講
但是,這家公司也有一個嚴重的問題。
不少人都從Google員工和其他業內人士那裡聽過這樣的軼事——Google的運作方式太封建了。這裡似乎有一種約定俗成的觀點,就是讓專案在現有產品(如地圖或助手)的支持下運轉,才是一種可靠的賺錢方式。
因此,儘管公司裡已經囤積了許多世界上最優秀的AI研究人員,但他們的才能似乎只能受困於企業戰略的軌道。
這樣做的結果是什麼?讓咱們來看看下面這個時間表。
2018年,Google的成果是改進了的Google Assistant flow、Photos(例如為單色圖像著色)、帶有「視覺優先版助手」的智慧顯示器(有人見過嗎?)、地圖助理、AI輔助的Google新聞和MLKit。
Google Assistant即將登陸Google地圖
2019年,Google展示了更有名、尺寸更大的智慧顯示器、AR搜尋結果、AR地圖、Google Lens更新、網路Duplex(還有人記得Duplex嗎?)、可以在本地完成更多工作的壓縮版Google Assistant、Waze中的助理、駕駛模式中的助理、即時字幕、現場轉播(語音辨識)以及一個更了解語言障礙人士的專案。
當然,可以肯定地說,其中某些產品很棒!
然而,它們中的大多數只是一個現成的東西,區別是得到了AI的推動。
Google推出ML Kit,這是一個SDK,可以輕鬆地將AI加入iOS和Android應用程式
現在再回想起來,很多人都會感覺到,Google的確有點畏縮。
像Google這樣的大公司,本來應該是能順應趨勢、推動潮流的。
Google推出了Duplex,這是一個基於人工智慧的客戶服務工具,旨在幫助小型企業(如餐廳和美髮沙龍)接聽更多電話、回答常見問題並安排預訂
而在2019年2月,OpenAI有這樣一條新聞:《OpenAI建立了一個非常好的文字產生器,但因為太危險,所以不能發布》。
這則新聞裡講的不是GPT-3,不是GPT-3.5…而是GPT-2。
2020年,Google製作了一個由AI驅動的Pinterest克隆,然後在12月解雇了Timnit Gebru——AI倫理領域的主要發聲人之一,因為他寫了一篇論文,指出了這個技術的限制和危險。
雖然如今我們看到了ChatGPT的大紅大紫,但其實當初OpenAI的聯合創始人Sam Altman也曾不得不親自壓制對GPT-3的炒作,因為它超過了可承受的水平。
而在2021年,Google的大語言模型LaMDA首次亮相,但谷歌並沒有真正把它推向市場。據悉,除了減少Assistant拋出的錯誤之外,谷歌仍然在尋找讓它存在的理由。
而OpenAI的2021年是以DALL-E開始的,這個文字到圖像模型很快就變得家喻戶曉。
OpenAI證明了,透過CLIP等系統,LLM不僅可以執行語言任務,還可以充當通用的解釋和生成引擎。
2022年,Google幹的事情就是對Assistant的更多調整、更多的智慧顯示器、更多的AR 地圖,以及花1億美元收購AI 產生的個人資料圖片(收購Alter)。
同一年,OpenAI在4月發布了DALL-E 2 ,在12月發布了ChatGPT。
或許在2022年初的某一刻,當Google高層睜開眼睛的時候,被眼前的東西嚇壞了。
可以想像,疑惑的Google高層急忙發送電子郵件,詢問為什麼一些有活力的新創公司正在圍繞著OpenAI運作。
證據是,Imagen在DALL-E 2發布一個月後就退出了,實際上,退不退出也沒什麼區別,就像谷歌公佈的其他AI研究一樣,任何人都無法測試它,更不用說連接到API了。
然後,Meta在9月發布了Make-A-Video後,Google在一週之後就以Imagen Video做出回應。然後Riffusion在生成音樂方面掀起了波瀾,一個月後,MusicLM就出現了(同樣的,我們仍然不能用它)。
但可以肯定,Google這樣對別家亦步亦趨,正是因為ChatGPT帶給Google領導層的焦慮,讓他們只能全力以赴。
但其實內部人士都知道,ChatGPT與Google投資了十年的助理產品截然不同,後者其實是假裝出來的偽AI(實際上只是一組API的自然語言前端罷了)。
但Google被生存競爭嚇到了。
不過,現在就把必應稱為Google搜尋的「競爭對手」還有些為時過早,畢竟與Google的92%相比,必應在全球的份額僅為3%。
但搜尋引擎,成功地將微軟對創新的需求與大規模語言模型的核心競爭力結合了起來,進而造就了最新的GPT模型與必應與Edge的整合。
看到這一點的谷歌顯然是急了,於是搶在微軟發布ChatGPT的前一天,試圖用一篇空洞的博文來吸引眼球。
但由於發布得過於匆忙,以至於在兩天後的「搜尋與人工智慧」活動中,Google甚至都沒怎麼提到有關Bard的內容。
此外,用來宣傳Bard的圖片裡,還包含一個非同小可的錯誤:詹姆斯-韋伯太空望遠鏡「首次拍攝了太陽系外行星的照片」。顯然,這是錯的。
更令人震驚的是,Google內部竟然沒人發現,甚至沒人關心這個問題。
當然,ChatGPT也有自己的問題。
但Google倉促出手,並在如此明顯地被絆倒。恰恰說明,即使在有限的、實驗性的層面上,谷歌也缺乏準備,更不用說像微軟這樣已經開始在全球推廣了。
那麼,這是不是代表Google的衰退?
當然不是,在不久的將來,它仍將是我們預設的搜尋引擎,以及一家利潤豐厚的公司。
但從隨後的股價大跌也能看出,投資人的信心已經被動搖了。
事實證明,Google在過去幾年裡,都沒有進行任何有意義的創新。而這可能並不是出於智慧,而是出於自傲。
不過,當新的技術尚未證明自己能夠像所有人想的那樣有價值時,我們也無法做出過多的預測。
以上是教訓慘痛!谷歌如何從AI老大哥一步步跌落神壇?的詳細內容。更多資訊請關注PHP中文網其他相關文章!