搜索
首页科技周边人工智能神经网络的可解释性存在问题:重温三十年前对 NN 的批判

可解释AI (XAI)

随着深度神经网络 (DNN) 用于决定贷款批准、工作申请、批准法院保释等与人们利益息息相关或者一些生死攸关的决定(例如在高速公路上突然停车),去解释这些决定,而不仅仅是产生一个预测分数,是至关重要的。

可解释人工智能 (XAI) 的研究最近集中在反事实(counterfactual)例子的概念上。这个想法很简单:首先制造一些有预期输出的反事实样例并输入到原来的网络中;然后,读取隐层单元解释为什么网络会产生一些其他输出。更正式地说:

“返回分数 p 是因为变量 V 具有与其关联的值 (v1, v2, ...)。如果 V 具有值 (v′1 , v′2 , ...),并且所有其他变量保持不变, 分数 p' 会被返回。”

下面则是更加具体的一个例子:

“你被拒绝贷款是因为你的年收入是 30,000 英镑。如果你的收入是 45,000 英镑,你就会获得贷款。”

然而,一篇由Browne 和 Swift提出的论文[1] (以下简称 B&W)最近表明,反事实示例只是稍微更有意义的对抗性示例,这些示例是通过对输入执行小的且不可观察的扰动而产生的,从而导致网络对它们进行错误分类具有很高的自信度。

此外,反事实的例子「解释」了一些特征应该是什么才能得到正确的预测,但「没有打开黑匣子」;也就是说,没有解释算法是如何工作的。文章继续争辩说,反事实的例子并没有为可解释性提供解决方案,并且「没有语义就没有解释」。

事实上,文章甚至提出了更强有力的建议:

1)我们要么找到一种方法来提取假定存在于网络隐藏层中的语义,要么

2)承认我们失败。

而Walid S. Saba本人则对(1)持悲观态度,换句话说他遗憾地承认我们的失败,以下是他的理由。

Fodor 和 Pylyshyn 的「鬼魂」

虽然大众完全同意B&W的观点,即“没有语义就没有解释”,但解释深度神经网络中隐藏层表示的语义为深度学习系统产生令人满意的解释的希望之所以不能够实现,作者认为,原因正是出自三十多年前Fodor 和 Pylyshyn [2]中概述的原因。

Walid S. Saba接着论证到:在解释问题出在哪里之前,我们需要注意到,纯粹的外延模型(例如神经网络)不能对系统性(systematicity)和组合性(compositionality)进行建模,因为它们不承认具有可再衍生的句法和相应语义的符号结构。

因此,神经网络中的表示并不是真正与任何可解释的事物相对应的“符号”——而是分布的、相关的和连续的数值,它们本身并不意味着任何可以在概念上解释的东西。

用更简单的术语来说,神经网络中的子符号表示本身并不指代人类在概念上可以理解的任何事物(隐藏单元本身不能代表任何形而上学意义的对象)。相反,它是一组隐藏单元,它们通常共同代表一些显着特征(例如,猫的胡须)。

但这正是神经网络无法实现可解释性的原因,即因为几个隐藏特征的组合是不可确定的——一旦组合完成(通过一些线性组合函数),单个单元就会丢失(我们将在下面展示)。

可解释性是“反向推理”,DNN无法逆向推理

作者讨论过为什么 Fodor 和 Pylyshyn 得出的结论是 NN 不能对系统性(因此是可解释的)推论进行建模[2]。

在符号系统中,有定义明确的组合语义函数,它们根据成分的意义计算复合词的意义。但是这种组合是可逆的——

也就是说,人们总是可以得到产生该输出的(输入)组件,并且正是因为在符号系统中,人们可以访问一种“句法结构”,这一结构含有如何组装组件的地图。而这在 NN 中都并非如此。一旦向量(张量)在 NN 中组合,它们的分解就无法确定(向量(包括标量)可以分解的方式是无限的!)

为了说明为什么这是问题的核心,让我们考虑一下 B&W 提出的在 DNN 中提取语义以实现可解释性的建议。B&W 的建议是遵循以下原则:

输入图像被标记为“建筑”,因为通常激活轮毂盖的隐藏神经元 41435 的激活值为 0.32。如果隐藏神经元 41435 的激活值为 0.87,则输入图像将被标记为“汽车”。

要了解为什么这不会导致可解释性,只需注意要求神经元 41435 的激活为 0.87 是不够的。为简单起见,假设神经元 41435 只有两个输入,x1 和 x2。我们现在所拥有的如下图 1 所示:

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

图注:拥有两个输入的单一神经元的输出为0.87

现在假设我们的激活函数 f 是流行的 ReLU 函数,那么可以产生 z = 0.87 的输出。这意味着对于下表中显示的 x1、x2、w1 和 w2 的值,可以得到 0.87 的输出。

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

表注:多种输入方式都可以产生0.87的数值

查看上表,很容易看出 x1、x2、w1 和 w2 的线性组合有无数个,它们会产生输出 0.87。这里的重点是 NN 中的组合性是不可逆的,因此无法从任何神经元或任何神经元集合中捕获有意义的语义。

为了与 B&W 的口号“没有语义就没有解释”保持一致,我们声明永远无法从 NN 获得任何解释。简而言之,没有组合性就没有语义,没有语义就没有解释,DNN 无法对组合性进行建模。这可以形式化如下:

1. 没有语义就没有解释[1] 2. 没有可逆的组合性就没有语义[2]

3. DNN 中的组合性是不可逆的[2]

=> DNN 无法解释(没有 XAI)

结束。

顺便说一句,DNN 中的组合性是不可逆的这一事实除了无法产生可解释的预测之外还有其他后果,尤其是在需要更高层次推理的领域,如自然语言理解 (NLU)。

特别是,这样的系统确实无法解释一个孩子如何仅从 ( ) 之类的模板中学习如何解释无限数量的句子,因为“约翰”、“邻居女孩”、 “总是穿着T恤来这里的男孩”等都是的可能实例化,还有“经典摇滚”、“成名”、“玛丽的奶奶”、“在海滩上跑步”、 等都是 的所有可能的实例。

因为这样的系统没有“记忆”,而且它们的组成不能颠倒,理论上它们需要无数个例子来学习这个简单的结构。【编者注:这一点正好是乔姆斯基对于结构主义语言学的质疑,并由此开启了影响语言学半个多世纪的转化生成语法。】

最后,作者强调,三十多年前Fodor 和 Pylyshyn [2]提出了对 NN 作为认知架构的批评——他们展示了为什么 NN 不能对系统性、生产力和组合性进行建模,所有这些都是谈论任何“语义”所必须的——而这一令人信服的批评从未得到完美的回答。

随着解决人工智能可解释性问题的需求变得至关重要,我们必须重新审视那篇经典论文,因为它显示了将统计模式识别等同于人工智能进步的局限性。

以上是神经网络的可解释性存在问题:重温三十年前对 NN 的批判的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
阅读AI索引2025:AI是您的朋友,敌人还是副驾驶?阅读AI索引2025:AI是您的朋友,敌人还是副驾驶?Apr 11, 2025 pm 12:13 PM

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

开始使用Meta Llama 3.2 -Analytics Vidhya开始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

AV字节:Meta' llama 3.2,Google的双子座1.5等AV字节:Meta' llama 3.2,Google的双子座1.5等Apr 11, 2025 pm 12:01 PM

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

与机器交谈的人类成本:聊天机器人真的可以在乎吗?与机器交谈的人类成本:聊天机器人真的可以在乎吗?Apr 11, 2025 pm 12:00 PM

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

了解Python的Scipy图书馆了解Python的Scipy图书馆Apr 11, 2025 am 11:57 AM

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

3种运行Llama 3.2的方法-Analytics Vidhya3种运行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

使用dagster自动化数据质量检查使用dagster自动化数据质量检查Apr 11, 2025 am 11:44 AM

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机在人工智能时代有角色吗?大型机在人工智能时代有角色吗?Apr 11, 2025 am 11:42 AM

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器