受大規模語言建模的啟發,Deepmind應用類似的方法建構了一個單一的「通才」智能體Gato,它具有多模態、多任務、多具身(embodiment)特點,能夠執行600多個不同的任務。而這款人工智慧,可以說是世界上迄今為止最令人印象深刻的一體式機器學習套件。
DeepMind在官方部落格中解釋:
「Gato是作為一個多模式、多任務、多組件的通用人工智慧。在相同的網路條件下可以玩雅達利遊戲、為圖像加標題、與人聊天,以及控制機械手臂堆積木等等,它會根據當前情境決定是否輸出文字、轉動機械手臂、按下按鈕或是進行其他標記。」
雖然Gato的表現究竟如何還有待觀察,但它似乎比GPT-3所希望實現的一切還要多。
圖片來源:DeepMind官網
GPT-3是一個大型語言模型(LLM),由資金充足的人工通用智慧(AGI)公司OpenAI製作。它不僅有來自微軟的數十億美元的支持,在美國政府的監管方面基本上允許它做任何事。
它所專注於研究的通用人工智慧(AGI)是一種具有人類智慧、可以執行人類能夠做的任何智力任務的人工智慧。有些研究人員將通用人工智慧稱為強AI(strong AI)或完全AI(full AI),或稱機器具有執行通用智慧行為(general intelligent action)的能力。與弱AI(weak AI)相比,強AI擁有全方位的人類認知能力。
最初,OpenAI的使命是開發和控制一個AGI,但現實是,該公司設法創造的所有東西都是非常花哨的LLM,這與它的「初心」有些背道而馳了。
儘管GPT-3和DeepMind的Gato一樣令人印象深刻,但大眾對它們的評價標準需要一些細微的差別。
因為OpenAI在通往AGI的道路上走的是LLM路線,其中的原因很簡單:沒有人知道如何讓AGI運作。就像從「火的發現」到「內燃機的發明」之間花了許多時間一樣,弄清楚如何從深度學習到AGI也不會在一夜之間發生。不過,GPT-3還是可以做一些看起來像是人類會做的事情,例如生成文字。
而標榜自己是「通用人工智慧」的Gato所做的幾乎是與GPT-3相同的事情。它只把一個工作原理很像LLM的東西整合成了一個能夠變成600多種戲法「魔術師」。其亮點是使用單一序列模型解決所有任務,但卻需要增加訓練資料的數量和多樣性。
Gato執行多種任務的能力更像是一個可以儲存600種不同遊戲的遊戲機,而不是像一個你可以用600種不同方式玩的遊戲。它並不如介紹所說,是一個通用人工智慧,而是由一堆預先訓練好的、狹窄的模型整齊地捆綁在一起所組成。
圖片來源:DeepMind官網
正如Knives and Paintbrushes研究小組的Mike Cook最近同TechCrunch的Kyle Wiggers所說的:
「像Gato這樣的人工智慧能夠完成所有這些聽起來非常不同的任務,這很令人興奮,因為對我們來說,寫文字和控制機器人聽起來非常不同。
但實際上,這與GPT-3理解普通英文文本和Python代碼並無太大區別。
並不是說這很容易實現,但對外部觀察者來說,這或許聽起來像是人工智慧還能泡茶或輕鬆地學習另外十項或五十項任務,然而事實上,它不能做到這這些。」
總而言之,Gato和GPT-3都是強大的人工智慧系統,但它們都不具備通用智慧的能力。
DeepMind已經在AGI方向發展了十多年,OpenAI則是從2015年開始。但兩者都沒能解決解決AGI道路上的第一個問題:建立一個無需訓練就能學習新事物的AI。
除非你賭AGI的出現是運氣所產生的結果,否則,是時候該重新評估這些公司對AGI領域的推進進程了。
或許,Gato可能是世界上最先進的多模態人工智慧系統。但DeepMind採用了和OpenAI一樣的讓AGI走向死胡同的概念,只是讓它更有市場。
Gato或許能透過行銷手段在消費者市場上贏得比Alexa、Siri或Google助理更多的青睞。但是,Gato和GPT-3並不是比上述虛擬助理更可行的AGI入門點。
如果這正是你正在尋找的一類人工智慧,那麼這並不是一件壞事。但是,在Gato的附帶研究論文中,根本沒有任何證據表明它在往AGI的正確方向上發展,更不用說是AGI的一塊墊腳石了。
以上是超越 GPT-3,DeepMind 推出新寵 Gato,卻被質疑「換湯不換藥」的詳細內容。更多資訊請關注PHP中文網其他相關文章!