搜索
首页科技周边人工智能像婴儿一样学习,DeepMind新模型28小时学会物理世界规则

​Deepmind 旨在建立一个能够学习直观物理学的模型,并剖析模型实现这种能力的原因。

从 AlphaFold​ 到数学推理,DeepMind 一直在尝试将 AI 和基础科学结合。现在,DeepMind 又创建了一个可以学习简单物理规则的新模型。

发育心理学家测试分析了婴儿如何通过目光来跟随物体的运动。例如,当播放视频中有一个球突然消失时,孩子们会表现出惊讶。

DeepMind 的计算机科学家 Luis Piloto 及其同事希望为人工智能 (AI) 开发类似的测试。该团队使用立方体和球等简单物体的动画视频训练了一个神经网络,该模型通过从大量数据中发现模式来学习。研究论文于 7 月 11 日发表在《Nature Human Behaviour》上。

图片

  • 论文地址:https://www.nature.com/articles/s41562-022-01394-8
  • 数据集地址:https://github.com/deepmind/physical_concepts

该模型通过自动编码和跟踪对象进行物理学习,因此命名为 PLATO (Physics Learning through Auto-encoding and Tracking Objects)。PLATO 接收来自视频的原始图像和突出显示场景中每个对象目标的图像版本。PLATO 旨在开发对象物理特性的内部表征,例如它们的位置和速度。

该系统接受了大约 30 个小时的视频训练,这些视频展示了简单的运动机制(例如一个球从斜坡上滚下来),并开发了预测这些对象在不同情况下行为的能力。特别地,PLATO 学习了连续性和稳固性,保证目标的轨迹是不间断的,物体形状是持久的。随着视频的播放,模型的预测会变得更加准确。

当播放带有「不可能」事件的视频时,例如一个物体突然消失,PLATO 可以度量视频和它自己的预测之间的差异,从而提供一种「惊讶」的衡量标准。

Piloto 说:「PLATO 并非设计为婴儿行为模型,但它可以测试关于人类婴儿如何学习的假设。我们希望认知科学家最终可以使用它来模拟婴儿的行为。」

英属哥伦比亚大学的计算机科学家 Jeff Clune 表示,「将 AI 与人类婴儿的学习方式进行比较是一个重要的研究方向。PLATO 的研究者手工设计了许多赋予人工智能模型优势的先验知识。」Clune 等研究人员正试图让程序开发自己的算法来理解物理世界。

运用发展心理学的知识

为了在 AI 系统中追求更丰富的物理直觉,DeepMind 的研究团队从发展心理学中汲取灵感。研究团队构建了一个深度学习系统,该系统整合了发展心理学的核心见解,即物理学是在离散对象及其相互作用的层面上理解的。

直觉物理学的核心依赖于一组离散的概念(例如,对象的持久性、稳固性、连续性等),可以区分、操作和单独探测。传统的 AI 学习直观物理的标准方法通过视频或状态预测指标、二元结果预测、问答性能或强化学习任务来学习物理世界。这些方法似乎需要理解直觉物理学的某些方面,但并没有明确地操作或战略性地探索一组明确的概念。

另一方面,发展心理学认为一个物理概念对应于一组未来如何展开的期望。例如人们期望物体不会神奇地从一个地方突然传送到另一个地方,而是通过时间和空间追踪连续的路径,这就有了连续性的概念。因此,有一种测量特定物理概念知识的方法:违反期望 (VoE) 范式。

使用 VoE 范式探索特定概念时,研究人员向婴儿展示视觉上相似的阵列(称为探测(probe)),这些阵列与物理概念一致(物理上可能)或不一致(物理上不可能)。在这个范式中,「惊讶」是通过凝视持续时间来衡量的。

图片

方法介绍

首先,DeepMind 提出了一个非常丰富的视频语料库 ——Physical Concepts 数据集。该数据集包含 VoE 探测视频,针对五个重要的物理概念,这些概念在发展心理学中被视为核心要素,包括连续性、目标持久性和稳固性。第四种是不可变性,用于捕捉某些目标属性 (例如形状) 不会改变的概念;第五个概念是方向惯性,涉及到运动物体在与惯性原理一致的方向上发生变化的期望。

最重要的是 Physical Concepts 数据集还包括一个单独的视频语料库作为训练数据。这些视频展示了各种程序生成的物理事件。

图片

图 2:用于训练模型的视频数据集示例

PLATO 模型架构

Deepmind 旨在建立一个能够学习直观物理学的模型,并剖析模型实现这种能力的原因。PLATO 模型中实例化了 AI 领域一些先进的系统。

首先是目标个性化过程。目标个性化过程将视觉的连续感知输入切割成一组离散的实体,其中每个实体都有一组对应的属性。在 PLATO 中,每个分段的视频帧通过感知模块分解为一组目标代码(图 3a-c),从而实现从视觉输入到个体目标的映射。PLATO 没有学习分割场景,但给定一个分割目标,其学习一个压缩表示。

其次,目标跟踪(或目标索引)为每个目标分配一个索引,从而实现跨时间目标感知和动态属性计算之间的对应关系(图 3b,c)。在 PLATO 中,目标代码在目标缓冲区中的帧上累积和跟踪(图 3d)。

最后一个组件是这些被跟踪目标的关系处理,这一过程受到发展心理学中提出的「物理推理系统」的启发,该系统可以动态地处理物体的表征,产生新的表征,这些表征会受到物体与其他物体之间关系和互动的影响。

PLATO 学习目标内存和目标感知历史之间的交互作用(图 3d),以生成针对下一个目标的预测视频帧并更新基于目标的内存。

图片

图 3:PLATO 包括两个组件:感知模块(左)和动态预测(右)

实验结果

在测试时,当使用五种不同的随机种子进行训练时,PLATO 在所有五个探测类别中都显示出强大的 VoE 效果。

图片

图 5:PLATO 在 Physical Concepts 数据集的探测中显示出稳健的效果。

Physical Concepts 数据集中的训练语料库共包含 300000 个视频。用保守计算方法,大约需要 52 天的持续视觉体验。从 AI 和开发的角度来看,这存在一个问题,即在测试中产生 VoE 效果实际上需要多少训练数据。为了评估这一点,Deepmind 在大小逐渐减小的数据集上训练了三个 PLATO 动态预测器的随机种子(图 6),计算了所有五个探测类别的 VoE 效应的总平均值。

在仅对 50000 个示例进行训练后,研究结果表明,在使用少至 50000 个示例(相当于 28 小时的视觉体验)进行训练后,Deepmind 的模型中出现了稳健的 VoE 效果。

图片

图 6:PLATO 只需短短 28 小时的视觉体验就能显示出强大的效果。

泛化测试:Deepmind 采用 ADEPT 数据集,该数据集旨在探索直观的物理知识。如图 7 所示,PLATO 对所有三个探测类别都显示出清晰的 VoE 效果。

图片

图 7:PLATO 展示了在不可见目标和动态上的鲁棒效果,而无需任何重新训练。

更多内容,请查看原论文。​

以上是像婴儿一样学习,DeepMind新模型28小时学会物理世界规则的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
ai合并图层的快捷键是什么ai合并图层的快捷键是什么Jan 07, 2021 am 10:59 AM

ai合并图层的快捷键是“Ctrl+Shift+E”,它的作用是把目前所有处在显示状态的图层合并,在隐藏状态的图层则不作变动。也可以选中要合并的图层,在菜单栏中依次点击“窗口”-“路径查找器”,点击“合并”按钮。

ai橡皮擦擦不掉东西怎么办ai橡皮擦擦不掉东西怎么办Jan 13, 2021 am 10:23 AM

ai橡皮擦擦不掉东西是因为AI是矢量图软件,用橡皮擦不能擦位图的,其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

谷歌超强AI超算碾压英伟达A100!TPU v4性能提升10倍,细节首次公开谷歌超强AI超算碾压英伟达A100!TPU v4性能提升10倍,细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年,就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日,谷歌才首次公布了这台AI超算的技术细节。论文地址:https://arxiv.org/abs/2304.01433相比于TPU v3,TPU v4的性能要高出2.1倍,而在整合4096个芯片之后,超算的性能更是提升了10倍。另外,谷歌还声称,自家芯片要比英伟达A100更快、更节能。与A100对打,速度快1.7倍论文中,谷歌表示,对于规模相当的系统,TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式吗ai可以转成psd格式吗Feb 22, 2023 pm 05:56 PM

ai可以转成psd格式。转换方法:1、打开Adobe Illustrator软件,依次点击顶部菜单栏的“文件”-“打开”,选择所需的ai文件;2、点击右侧功能面板中的“图层”,点击三杠图标,在弹出的选项中选择“释放到图层(顺序)”;3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”;4、在弹出的“导出”对话框中,将“保存类型”设置为“PSD格式”,点击“导出”即可;

ai顶部属性栏不见了怎么办ai顶部属性栏不见了怎么办Feb 22, 2023 pm 05:27 PM

ai顶部属性栏不见了的解决办法:1、开启Ai新建画布,进入绘图页面;2、在Ai顶部菜单栏中点击“窗口”;3、在系统弹出的窗口菜单页面中点击“控制”,然后开启“控制”窗口即可显示出属性栏。

GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑Apr 04, 2023 am 11:55 AM

Yann LeCun 这个观点的确有些大胆。 「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。当然,被 Yann LeCun 指出问题的不只是自回归模型。在他看来,当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

ai移动不了东西了怎么办ai移动不了东西了怎么办Mar 07, 2023 am 10:03 AM

ai移动不了东西的解决办法:1、打开ai软件,打开空白文档;2、选择矩形工具,在文档中绘制矩形;3、点击选择工具,移动文档中的矩形;4、点击图层按钮,弹出图层面板对话框,解锁图层;5、点击选择工具,移动矩形即可。

强化学习再登Nature封面,自动驾驶安全验证新范式大幅减少测试里程强化学习再登Nature封面,自动驾驶安全验证新范式大幅减少测试里程Mar 31, 2023 pm 10:38 PM

引入密集强化学习,用 AI 验证 AI。 自动驾驶汽车 (AV) 技术的快速发展,使得我们正处于交通革命的风口浪尖,其规模是自一个世纪前汽车问世以来从未见过的。自动驾驶技术具有显着提高交通安全性、机动性和可持续性的潜力,因此引起了工业界、政府机构、专业组织和学术机构的共同关注。过去 20 年里,自动驾驶汽车的发展取得了长足的进步,尤其是随着深度学习的出现更是如此。到 2015 年,开始有公司宣布他们将在 2020 之前量产 AV。不过到目前为止,并且没有 level 4 级别的 AV 可以在市场

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。