首頁  >  文章  >  科技週邊  >  Bengio、LeCun 等人聯名發行 NeuroAI 白皮書:智慧的本質是感覺運動能力,AI 迎來具身圖靈測驗大挑戰

Bengio、LeCun 等人聯名發行 NeuroAI 白皮書:智慧的本質是感覺運動能力,AI 迎來具身圖靈測驗大挑戰

王林
王林轉載
2023-04-11 10:51:02765瀏覽

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

歷史上,神經科學一直是人工智慧發展的關鍵驅動力和靈感來源,特別是視覺、基於獎勵的學習、與物理世界的互動以及語言等人類和其他動物非常擅長的領域,人工智慧曾藉助神經科學在這些領域取得長足進展。

但近年來,人工智慧的研究方式似乎正在遠離神經科學,與此同時,人工智慧在追趕人類智慧的路上困難不斷。在此背景下,一股回歸神經科學的人工智慧熱潮正在形成。

近日,一份白皮書發出了「NeuroAI 將催化下一代人工智慧革命」的宣言。

這份以「Toward Next-Generation Artificial Intelligence: Catalyzing the NeuroAI Revolution」為題的白皮書,集結了Yoshua Bengio、Yann LeCun 兩位圖靈獎得主,以及一批致力於機器學習與神經科學結合研究的科學家。

Bengio、LeCun 等人联名发布 NeuroAI 白皮书:智能的本质是感觉运动能力,AI 迎来具身图灵测试大挑战

他們呼籲:為了加快人工智慧的進步並發揮其巨大的潛力,我們必須致力於 NeuroAI 的基礎研究。

白皮書首先提出,生物智能的基本要素在於動物與世界進行感覺運動互動的能力。

從這個前提出發,他們提出具身圖靈測試(The Embodied Turing Test )作為NeuroAI 的終極挑戰,它的核心在於高級感覺運動能力,具體包括與世界互動、動物行為的彈性、能源效率等特徵。

同時,白皮書也設想了應對具身圖靈測試的路線,從演化史角度把AI 系統的具身圖靈測試分解為從中低階生物進階到更複雜生物的智能。

NeuroAI:智能的本質在於感覺運動

人工智慧向神經科學的回歸是必然的。

人工智慧革命的種子正是幾十年前在計算神經科學中播下的,神經學家McCulloch  和 Pitts 在1943 年首次提出神經元性質的數學表達形式,他們試圖了解大腦是如何計算的。

而馮諾依曼發明“馮諾依曼計算機體系結構”,事實上也是來自最早在構建“人工大腦”方面的工作,他從1940 年代還非常有限的大腦知識中汲取了靈感。

掀起最近一輪人工智慧浪潮的深度卷積網絡,則是建立在人工神經網絡 (ANN)  之上的,該網絡直接從貓的視覺處理電路方面的研究中得到啟發。

同樣,強化學習  (RL)  的發展也是直接從動物在學習過程中的神經活動中汲取了靈感。

幾十年後的今天,人工神經網路和強化學習已經成為人工智慧的主流技術,所以在大眾看來,「通用人工智慧」這一長期目標似乎已經在我們掌握之中。

然而,與這種樂觀主義相反,許多一線的人工智慧研究人員認為,我們仍需要取得新的重大突破,才有可能建構能夠完成人類的所有工作的人工系統,而且不僅是人類,甚至包括像老鼠這樣更簡單的動物。

目前的AI 還遠遠未達到這種目標:

AI 可以在國際象棋和圍棋等遊戲中輕鬆擊敗任何人類對手,但並不具有足夠的穩健性,在面對新事物時經常遇到困難;

#AI 還做不到'」走到架子上、取下棋盤、佈置棋子並在遊戲中移動棋子」這一系列的簡單行為;AI 的感覺運動能力還無法與四歲兒童相媲美,甚至是更簡單的動物也比不上;AI 缺乏與不可預測的世界互動的能力,難以處理新情況,而這種能力是所有動物毫不費力就獲得的基本能力。

因此,越來越多的 AI 研究人員懷疑,再沿著目前的路子往前走,難以解決上述問題。

既然我們的目標是讓 AI 擁有更多自然智能,那麼我們很可能就需要來自自然智慧系統的新靈感。

雖然如卷積人工神經網路和強化學習等都受到了神經科學的啟發,但目前機器學習的大部分研究都在走另一條路,其所採用的方法受到神經科學幾十年前發現的啟發,例如基於大腦注意力機制的神經網路。

現代神經科學的確仍在影響 AI ,但影響還很微小。這是一種機會的錯失。在過去的幾十年裡,我們已經累積了大量關於大腦的知識,這使我們能夠深入了解支撐自然智慧的解剖結構和功能結構。

正是在這樣的背景下,這些科學家在這份白皮書中發出宣言:

NeuroAI 是神經科學和AI 交叉的新興領域,其所基於的前提是更好地理解神經計算將揭示智能的基本成分,它將催化AI 的下一次革命,最終實現具有匹敵甚至超越人類能力的人工智慧體。他們認為,現在是進行大規模工作來識別和理解生物智慧原理,並將其抽象化為電腦和機器人系統的大好時機。

那麼,生物智能最重要的要素是什麼?

他們認為,適應性、靈活性和從稀疏觀察中做出一般推斷的能力,這些才是智慧的基本要素,它們已經以某種形式存在於我們進化了數億年的基本感覺運動電路中。

儘管抽象思考和推理經常被認為是人類特有的智能行為,但正如人工智慧先驅Moravec 所說,抽象思維只是「一種新技巧,歷史也許還不到10 萬年…它之所以有效,是因為得到了更古老、更強大、但通常是無意識的感覺運動知識的支持。」

這無疑是個好消息,大鼠、小鼠和非人靈長類動物可以作為自然智慧實驗中更容易處理的模型,如果人工智慧可以匹配它們的感知和運動能力,那麼人類智慧的步驟就會小得多。因此,如果我們弄清楚所有動物在與世界的具體感覺運動互動中擁有的核心能力,NeuroAI 就必將帶來重大進步。

NeuroAI  大挑戰:具身圖靈測試

1950 年,艾倫·圖靈提出「模仿遊戲」  ,用於測試機器所表現出的與人類相同、或無法區分的智慧行為的能力。在那場比賽中,人類法官需要評估真人與受過訓練、可以模仿人類反應的機器之間的自然語言對話。

圖靈提出,相較於無法回答的「機器是否可以思考」問題,我們可以確定的是,機器的會話能力與人類能否區分。這當中隱含的觀點是,語言代表了人類智慧的頂峰,因此,能夠對話的機器肯定是智慧的。

在某種程度上,圖靈是對的,但另一方面他也錯了。

雖然沒有AI 通過圖靈測試,但近日,在大型文本庫上訓練的語言系統已經實現了有說服力的對話,這一成功在某種程度上也揭示了,我們容易將智力、能動性甚至意識歸因於對話者。但同時,這些系統在某些推理任務上的表現仍然很差,這凸顯了圖靈忽略的一個事實,即智力遠不止語言能力。

當前,自然語言處理(NLP)系統所犯的許多錯誤也說明了AI 對語意、因果推理和常識的根本缺乏。 對這些模型而言,單字的意義在於它們在統計上的共現性,而非現實世界的基礎,所以即使是最先進的語言模型,儘管能力越來越大,但它們在一些基本的物理常識方面還是表現不佳。

最初制定的圖靈測試並沒有探討AI 在與動物共享、以靈活方式理解物理世界的能力,只是建立一個簡單的定性標準,以此來判斷我們在建構AI 方面取得的進展。而這當中的理解和能力,可能是建立在人類的感知和運動能力之上的,是透過無數代自然選擇磨練出來的。

對此,作者在白皮書中提出了一個擴展的「具身圖靈測試」(The Embodied Turing Test ),其中就包括了高級感覺運動能力,可將AI與人類和其他動物的交互作用進行基準測試和比較。

以動物為例,每隻動物都有自己獨特的一套能力,因此它們也定義了自己的具身圖靈測試,例如測試人造的海狸建造水壩能力,松鼠跳樹的能力等等。在這當中,許多核心的感覺運動能力幾乎為所有動物共有,而動物能夠迅速進化出適應新環境所需的感覺運動技能,也表明這些核心技能為其提供了一個堅實的基礎。

以下是白皮書所介紹的感覺運動能力的幾個共同特徵。

與世界互動

有目的地四處走動、並與環境互動是動物的決定性特徵。

儘管機器人技術近期在優化控制、強化學習和模仿學習等方面取得了進展,但在控制身體和操縱物體方面,距離要達到動物級別還很遙遠。

作者指出,由於神經科學可以提供關於模組化和分層架構的指導,當這些架構適應於 AI 時,可以使 AI 也能具有這些能力。

不僅如此,神經科學也為我們設計AI 系統提供了一些原則性指導,例如部分自主性(層次結構中的低階模組如何在沒有高階模組輸入的情況下半自主地行動)和分期控制(最初由緩慢的計劃過程產生的運動如何最終轉移到快速的反射系統中去)等。

了解特定的神經網路如何參與不同的任務——如運動,對四肢、手和手指的精細控制,感知以及行動選擇——可能為這種系統如何在機器人中實現提供路徑,也可能給其他形式的"智能"在更多認知領域中提供解決方案。例如,納入低階運動控制的電路原理,有助於為 AI 的高階運動規劃提供更好的基礎。

動物行為的靈活性

了解特定的神經網路的另一個目標,是發展能夠以與個別動物產生的行為範圍相呼應的方式、參與大量靈活和多樣化任務的人工智慧系統。

如今,AI 可以很容易地學會在電玩遊戲中勝過人類,如《霹靂火》,只需使用螢幕上的像素和遊戲分數。然而與人類玩家不同的是,這些 AI 是脆弱的,對小的擾動非常敏感,稍微改變遊戲規則或輸入幾個像素,都會導致災難性的糟糕表現。這是因為 AI 學習了一種從像素到行動的映射,而這種映射不需要涉及對遊戲中的代理、物體以及支配它們的物理學的理解。

同樣地,一輛自動駕駛汽車本身並不了解從它前面的卡車上掉下來的箱子的危險性,除非它真的看到從卡車上掉下來的箱子導致壞結果的案例。即使它接受過關於板條箱墜落危險的培訓,系統也可能認為一個從它前面汽車吹過來的空塑膠袋是一個要不惜一切代價避免的障礙,這是因為它實際上並不了解塑膠袋是什麼,或它在物理上有多大的威脅。這種無法處理訓練資料中沒有出現過的場景,是對廣泛依賴 AI 系統的重大挑戰。

為了在不可預測和不斷變化的世界中取得成功,智能體必須具有靈活性,並透過這種情況的常規發展趨勢來掌握新的變化, 這也是動物所做的事情。由於動物在現實世界的互動中打下了堅實的基礎,在進化和發展的過程中,它們生來就具備茁壯成長所需的大部分技能,或是能從有限經驗中迅速獲得這些技能。

因此可以明顯看到,從頭開始訓練特定任務並不是動物獲得技能的方式。動物不會進入白板世界,然後依靠大型標記訓練集來學習。儘管機器學習一直在尋求避免這種「白板」的方法,包括自我監督學習、遷移學習、持續學習、元學習、一次性學習和模仿學習,但這些方法並沒有太接近動物身上的靈活性。

為此,作者認為,理解為現實世界中的行為靈活性提供基礎的神經迴路級原理,即使是存在於簡單的動物當中,也有可能大大提高AI 的靈活性和實用性。也即是說,我們可以利用進化已經參與的最佳化過程,大大加快對用於現實世界互動的通用電路的探索。

能源效率

目前, AI 面臨的一個重要挑戰我們大腦已經克服了,就是能源效率。例如,訓練 GPT‑3 等大型語言模型需要超過1000兆瓦時,足以為一個小鎮供電一天。用於訓練 AI 的能源總量很大且成長迅速,相較之下,生物系統的能源效率更高,例如人類大腦的使用約20瓦。

大腦和電腦對能力需求的差異源自於資訊處理得差異。在演算法層面上,現代大規模人工神經網路如大規模語言模型依賴大的前饋架構,隨時間推移對過程序列的自我關注,往往會忽略了遞歸對於處理連續資訊的潛在力量。

目前,由於我們在循環網路中沒有有效的信用分配電腦製,大腦利用靈活的循環架構來處理長時間序列的方式,顯然可以高效地解決時間信用分配問題—甚至比目前人工神經網路中使用的前饋信用分配機制更有效。如果我們能利用大腦來指導如何為循環電路設計高效的訓練機制,或許可以提高我們處理順序資料的能力,同時進一步提高系統的能量效率。

其次,在實現層面上,生物神經元主要透過傳輸動作電位(尖峰訊號)來進行交互,這是一種非同步通訊協定。就像傳統數位元素之間的相互作用一樣,神經元的輸出可以看作是0 和1 的串,但與數位計算機不同的是,「 1 」(即峰值)的能量消耗比「 0 」高幾個數量級。由於生物電路在尖峰稀疏的狀態下運作——即使是非常活躍的神經元也很少超過 10% 的佔空比,大多數以較低的速率運作——它們的能源效率要高得多。

此外,其他因素也可能有助於提高生物網路的能源效率。例如,即使某些組件非常不可靠或“嘈雜”,生物網路仍能有效計算。

突觸釋放-神經元溝通的方式-也許很不可靠,以至於每 10 個訊息中只有 1 個被傳遞。電路的組織方式使得尖峰序列是高度可變的,而這特性或可以令神經電路能進行機率推理。

這是一種很在不確定情況下的穩健計算形式,儘管目前許多研究正在努力開發峰值網路的潛力,但迄今為止,仍未出現能夠與生物電路能量效率媲美的「殺手級應用」。目前主要問題是,「神經形態晶片」既不複製先天的神經迴路功能,也不容易訓練,因此儘管它們更節能,用處也不如同類能耗大的數位產品。

在這樣的情況下,作者提出,要使AI 中獲得更高的能效,不僅可以藉鑑稀疏尖峰網路的思想,還能透過提供具有神經迴路功能和學習規則的神經形態晶片來實現。

如何應對具身圖靈測試

那麼,我們該如何開發具身圖靈測試的 AI ?

作者認為,或許可以從演化史的角度逐步進行。例如,讓絕大部分動物都進行以目標為導向的運動,例如靠近食物和遠離威脅。在此基礎上有更複雜的技能,包括結合不同感官,像視覺或嗅覺,透過不同感官訊息來區分食物和威脅,導航到以前的位置,衡量激勵和威脅來實現目標,並用準確的方式與世界互動來服務目標等等。

這些複雜的能力可以在像蠕蟲這樣簡單的生物體中找到,而在魚類和哺乳動物等更複雜的動物中,這些能力會被設計與新策略結合,以實現更強大的行為策略。這種演化的觀點提出了一種解決具身圖靈測試的策略,即將其分解為一系列相互依賴的增量挑戰,並對此系列反覆優化。

此外,代表解決中低階挑戰的生物包括蠕蟲、蒼蠅、魚類、囓齒動物和靈長類動物等,都是神經科學研究中廣泛使用的系統,我們可以利用先前關於這些動物行為模式背後的電路和機制等知識積累,使用虛擬環境和虛擬生物在電腦上進行相關研究。

為了達到所需行為的靈活水平,透過具身圖靈測試的AI 將面臨一系列特定物種的測試,以探索自我監督學習、持續學習、遷移學習、元學習和終身記憶等,這些測試也可以標準化,以便我們衡量研究進展。 最終,成功的虛擬生物體可以透過機器人的努力來適應物理世界,並用於解決現實世界的問題。

要實現以上提到的目標,既需要大量資源,也需要在心理學、工程學、語言學等傳統人工智慧和神經科學以外的學科中做出成績。除了簡單地利用這些學科的現有專業知識之外,我們的當務之急是培養同時擅長工程/計算科學和神經科學的新一代人工智慧研究人員。

這些研究人員將利用神經科學數十年的成果,為人工智慧研究制定全新的方向。最大的挑戰將是確定如何利用神經科學、計算科學和其他相關領域的協同作用來推進探索,也就是確定大腦電路、生物物理學和化學的哪些細節是重要的,而哪些細節在AI 應用中可以忽略。

因此,我們迫切需要在不同領域接受過一定訓練的研究人員,他們用適用於電腦的方式抽像神經科學知識並幫助設計實驗,從而產生與人工智慧相關的新神經生物學研究成果。

其次,我們需要建立一個能夠開發和測試這些虛擬智能體的共享平台。在創建迭代、體現圖靈測試和進化人工生物來解決這個需求時,我們將面臨的最大技術挑戰之一就是運算能力。目前,僅針對單一特定任務(例如在 3 維空間中控制身體)訓練一個大型神經網路模型可能需要數天時間在專門的分散式硬體上。

第三,我們需要支持神經運算的基礎理論和實驗研究。

在過去的幾十年裡,我們已經了解了大量關於大腦的知識,我們開始越來越了解大腦的單一細胞,神經元,以及這些東西是如何作為簡單電路的一部分發揮作用的。有了對這些模組的知識,我們的下一步就是將精力投入在探索大腦這個綜合智慧系統的運作方式中。

而探索這個整體,就需要深入了解1000種不同類型的1000億個神經元是如何連接在一起的,需要去了解每個神經元與數千個其他神經元之間那靈活多變、適應性強的連接,也需要去了解運算能力,也就是智慧。 所以我們必須對大腦進行逆向工程,把其運作的基本原理抽象化。

請注意,虛擬智能體的發展將極大地加速這一過程,因為虛擬智能體允許在真實動物和電腦模擬動物的實驗之間進行直接比較,而這將揭示穩健控制、靈活行為、能源效率和智慧行為所必需的神經電路層級屬性和機制的內在機制。

利用神經科學和人工智慧之間強大的協同效應需要專案和基礎設施支持,才能組織和實現跨學科的大規模研究。

結論

儘管神經科學推動人工智慧發展的歷史由來已久,而且其未來發展也有巨大的潛力,但人工智能界的大多數工程師和計算科學家都不知道可以藉神經科學這股東風。

神經科學對馮諾依曼、圖靈和其他計算理論巨人思想的影響,在典型的電腦科學課程中很少被提及;NeurIPS 等前沿人工智慧會議曾經被用來分享展示計算神經科學和機器學習的最新成果,但現在參加的人們也幾乎只專注於機器學習,而忽略了神經科學。

「工程師研究鳥類不是為了造更好的飛機」是大家常說的一句話。但這個類比很失敗,部分原因是航空先驅確實研究過鳥類,而且現代仍有學者在研究。此外,這種類比在一個更基本的層面上也不成立:現代航空工程的目標不是實現「鳥類等級」的飛行,但是人工智慧的主要目標確實是實現,或者說超過「人類層級」的智慧。

正如電腦在許多方面超過人類一樣(例如計算質數的能力),飛機在速度、航程和載貨能力等方面也超過了鳥類。如果航空工程師的目標確實是建造一種具有「鳥類等級」能力的機器,這種機器能夠穿過茂密的森林,輕輕地降落在樹枝上,那麼這些工程師就得去密切注意鳥類是如何做到這一點的。

同樣,如果人工智慧的目標是達到動物層級的常識性感覺運動智能,研究人員最好向動物學習,學習動物在這個不可預測的世界中進化出的行為方式。

以上是Bengio、LeCun 等人聯名發行 NeuroAI 白皮書:智慧的本質是感覺運動能力,AI 迎來具身圖靈測驗大挑戰的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除