搜尋
首頁科技週邊人工智慧神經網路的可解釋性存在問題:重溫三十年前對 NN 的批判

可解釋AI (XAI)

隨著深度神經網路(DNN) 用於決定貸款批准、工作申請、批准法院保釋等與人們利益息息相關或一些生死攸關的決定(例如在高速公路上突然停車),去解釋這些決定,而不僅僅是產生一個預測分數,是至關重要的。

可解釋人工智慧 (XAI) 的研究最近集中在反事實(counterfactual)例子的概念上。這個想法很簡單:首先製造一些有預期輸出的反事實範例並輸入到原來的網路中;然後,讀取隱層單元解釋為什麼網路會產生一些其他輸出。更正式地說:

「傳回分數p 是因為變數V 具有與其關聯的值(v1, v2, ...)。如果V 具有值(v′1 , v ′2 , ...),並且所有其他變數保持不變,分數p' 會被回傳。」

下面則是更具體的一個例子:

「你被拒絕貸款是因為你的年收入是30,000 英鎊。如果你的收入是45,000 英鎊,你就會獲得貸款。」

然而,一篇由Browne 和Swift提出的論文[1] (以下簡稱B&W)最近表明,反事實示例只是稍微更有意義的對抗性示例,這些示例是通過對輸入執行小的且不可觀察的擾動而產生的,從而導致網路對它們進行錯誤分類具有很高的自信度。

此外,反事實的例子「解釋」了一些特徵應該是什麼才能得到正確的預測,但「沒有打開黑盒子」;也就是說,沒有解釋演算法是如何運作的。文章繼續爭辯說,反事實的例子並沒有為可解釋性提供解決方案,並且「沒有語義就沒有解釋」。

事實上,文章甚至提出了更強有力的建議:

1)我們要麼找到一種方法來提取假定存在於網路隱藏層中的語義,要麼

2)承認我們失敗。

而Walid S. Saba本人則對(1)持悲觀態度,換句話說他遺憾地承認我們的失敗,以下是他的理由。

Fodor 和Pylyshyn 的“鬼魂”

#雖然大眾完全同意B&W的觀點,即“沒有語義就沒有解釋”,但解釋深度神經網路中隱藏層表示的語意為深度學習系統產生令人滿意的解釋的希望之所以不能夠實現,作者認為,原因正是出自三十多年前Fodor 和Pylyshyn [2]中概述的原因。

Walid S. Saba接著論證到:在解釋問題出在哪裡之前,我們需要注意到,純粹的外延模型(例如神經網路)不能對系統性(systematicity)和組合性(compositionality)進行建模,因為它們不承認具有可再衍生的句法和相應語義的符號結構。

因此,神經網路中的表示並不是真正與任何可解釋的事物相對應的「符號」——而是分佈的、相關的和連續的數值,它們本身並不意味著任何可以在概念上解釋的東西。

用更簡單的術語來說,神經網路中的子符號表示本身並不指人類在概念上可以理解的任何事物(隱藏單元本身不能代表任何形而上學意義的對象)。相反,它是一組隱藏單元,它們通常共同代表一些顯著特徵(例如,貓的鬍鬚)。

但這正是神經網路無法實現可解釋性的原因,即因為幾個隱藏特徵的組合是不可確定的-一旦組合完成(透過一些線性組合函數) ,單一單元就會丟失(我們將在下面展示)。

可解釋性是“反向推理”,DNN無法逆向推理

作者討論過為什麼Fodor 和Pylyshyn 得出的結論是NN 不能對系統性(因此是可解釋的)推論進行建模[2]。

在符號系統中,有定義明確的組合語意函數,它們根據成分的意義計算複合詞的意義。但是這種組合是可逆的-

也就是說,人們總是可以得到產生該輸出的(輸入)元件,而正是因為在符號系統中,人們可以訪問一種“句法結構”,這一結構含有如何組裝組件的地圖。而這在 NN 中並非如此。一旦向量(張量)在NN 中組合,它們的分解就無法確定(向量(包括標量)可以分解的方式是無限的!)

為了說明為什麼這是問題的核心,讓我們考慮一下B&W 提出的在DNN 中提取語義以實現可解釋性的建議。 B&W 的建議是遵循以下原則:

輸入影像被標記為“建築”,因為通常會啟動輪圈蓋的隱藏神經元 41435 的活化值為 0.32。如果隱藏神經元 41435 的活化值為 0.87,則輸入影像將被標記為「汽車」。

要了解為什麼這不會導致可解釋性,只需注意要求神經元 41435 的激活為 0.87 是不夠的。為簡單起見,假設神經元 41435 只有兩個輸入,x1 和 x2。我們現在所擁有的如下圖1 所示:

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

#圖註:擁有兩個輸入的單一神經元的輸出為0.87

現在假設我們的激活函數f 是流行的ReLU 函數,那麼可以產生z = 0.87 的輸出。這表示對於下表中顯示的 x1、x2、w1 和 w2 的值,可以得到 0.87 的輸出。

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

表註:多種輸入方式都可以產生0.87的數值

查看上表,很容易看出x1、x2、w1 和w2 的線性組合有無數個,它們會產生輸出0.87。這裡的重點是 NN 中的組合性是不可逆的,因此無法從任何神經元或任何神經元集合中捕獲有意義的語義。

為了與 B&W 的口號「沒有語義就沒有解釋」保持一致,我們聲明永遠無法從 NN 獲得任何解釋。簡而言之,沒有組合性就沒有語義,沒有語義就沒有解釋,DNN 無法對組合性進行建模。這可以形式化如下:

1. 沒有語意就沒有解釋[1] 2. 沒有可逆的組合性就沒有語意[2]

##3. DNN 中的組合性是不可逆的[2]

#=> DNN 無法解釋(沒有XAI)

結束。

順便說一句,DNN 中的組合性是不可逆的這一事實除了無法產生可解釋的預測之外還有其他後果,尤其是在需要更高層次推理的領域,如自然語言理解(NLU)。

特別是,這樣的系統確實無法解釋一個孩子如何僅從( ) 之類的模板中學習如何解釋無限數量的句子,因為「約翰」、「鄰居女孩」、 「總是穿著T卹來這裡的男孩」等都是的可能實例化,還有「經典搖滾」、「成名」、「瑪麗的奶奶」、「在海灘上跑步」、 等都是 的所有可能的實例。

因為這樣的系統沒有“記憶”,而且它們的組成不能顛倒,理論上它們需要無數個例子來學習這個簡單的結構。 【編者註:這一點正好是喬姆斯基對結構主義語言學的質疑,並由此開啟了影響語言學半個多世紀的轉化生成語法。 】

最後,作者強調,三十多年前Fodor 和Pylyshyn [2]提出了對NN 作為認知架構的批評——他們展示了為什麼NN 不能對系統性、生產力和組合性進行建模,所有這些都是談論任何「語義」所必須的——而這一令人信服的批評從未得到完美的回答。

隨著解決人工智慧可解釋性問題的需求變得至關重要,我們必須重新審視那篇經典論文,因為它顯示了將統計模式識別等同於人工智慧進步的限制。

以上是神經網路的可解釋性存在問題:重溫三十年前對 NN 的批判的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
一個提示可以繞過每個主要LLM的保障措施一個提示可以繞過每個主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

5個錯誤,大多數企業今年將犯有可持續性5個錯誤,大多數企業今年將犯有可持續性Apr 25, 2025 am 11:15 AM

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響Apr 25, 2025 am 11:12 AM

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

如果Openai購買Chrome,AI可能會統治瀏覽器戰爭如果Openai購買Chrome,AI可能會統治瀏覽器戰爭Apr 25, 2025 am 11:11 AM

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

AI如何解決零售媒體的痛苦AI如何解決零售媒體的痛苦Apr 25, 2025 am 11:10 AM

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

'AI是我們,比我們更多''AI是我們,比我們更多'Apr 25, 2025 am 11:09 AM

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud在下一個2025年對基礎架構變得更加認真Google Cloud在下一個2025年對基礎架構變得更加認真Apr 25, 2025 am 11:08 AM

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。Apr 25, 2025 am 11:07 AM

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具