参与Vision Pro的前苹果AR工程师Sterling Crispin,发文分享了自己在苹果期间所做的工作。其中提到,苹果Vision Pro融合了大量机器学习技术,包括用AI模型预测你的身体、大脑状态,比如是否对当前事务好奇,是否走神,注意力是否被分散等等。
这一切是基于用户眼睛的动作数据、心率、肌肉活动、血压、大脑血液密度等等数据来衡量和判断。
苹果Vision Pro项目团队负责人Mike Rockwell也表示:眼睛注视方向就是非常敏感的个人隐私数据,苹果在Vision Pro也做了隐私保护,第三方App无法获取你的眼睛注视方向,只有你通过“点击”之后,App才能获取你的操作行为,但也无法获取你的眼睛注视方向。
Apple Vision Pro隐私防护
以下是Sterling Crispin的原文:
当我在 Apple 担任技术开发组的神经技术原型研究员时,我花了 10% 的时间为#VisionPro的开发做出贡献。这是我做过的最长的一次努力。我为它终于宣布而感到自豪和欣慰。我在 AR 和 VR 领域工作了 10 年,在很多方面,这是整个行业在单一产品中的结晶。我很感激我帮助实现了它,如果你想进入这个领域或改进你的策略,我愿意接受咨询和接听电话。
我所做的工作支持了 Vision Pro 的基础开发、正念体验、 ▇▇▇▇▇▇产品,以及更雄心勃勃的神经技术登月研究。就像,预测你会在你点击某些东西之前点击,基本上是读心术。我在那里工作了 3.5 年,并于 2021 年底离开,所以我很高兴能体验过去两年是如何将一切融合在一起的。我真的很好奇是什么做了剪辑以及稍后将发布什么。
具体来说,我很自豪能够为 Vision Pro ▇▇▇▇▇▇计划的最初愿景、战略和方向做出贡献。我在一个小团队中所做的工作帮助为该产品类别开了绿灯,我认为它有一天可能会产生重大的全球影响。
我在 Apple 所做的大部分工作都在 NDA 之下,并且涉及广泛的主题和方法。但是有些事情已经通过专利公开,我可以在下面引用和解释。
总的来说,我做的很多工作都涉及到在沉浸式体验中,根据用户身体和大脑的数据来检测用户的心理状态。
因此,用户处于混合现实或虚拟现实体验中,人工智能模型试图预测你是否感到好奇、走神、害怕、注意力集中、回忆过去的经历或其他一些认知状态。这些可以通过眼动追踪、大脑电活动、心跳和节律、肌肉活动、大脑血液密度、血压、皮肤电导率等测量来推断。
要使特定预测成为可能,涉及很多技巧,我提到的少数专利对此进行了详细说明。最酷的结果之一是预测用户会在他们实际点击之前点击某些东西。这是一项艰巨的工作,也是我引以为豪的事情。你的瞳孔在你点击之前做出反应,部分原因是你预计在你点击之后会发生一些事情。因此,您可以通过监视用户的眼睛行为,并实时重新设计 UI 以创建更多这种预期的瞳孔反应,从而创建用户大脑的生物反馈。这是一个通过眼睛进行的粗糙的脑机接口,但非常酷。而且我会在任何一天接受侵入性脑部手术。
其他推断认知状态的技巧包括以用户可能察觉不到的方式向用户快速闪烁视觉效果或声音,然后测量他们对此的反应。
另一项专利详细介绍了如何使用机器学习以及来自身体和大脑的信号来预测您的注意力、放松程度或学习情况。然后更新虚拟环境以增强这些状态。因此,想象一个自适应沉浸式环境,它可以通过改变您在背景中看到和听到的内容来帮助您学习、工作或放松。
所有这些细节都可以在专利中公开获得,并且经过精心编写,不会泄露任何内容。我还参与了很多其他事情,希望最终能看到更多。
很多人对这个产品已经等了很长时间了。但这仍然是通往 VR 的道路上的一步。该行业要到本世纪末才能完全赶上这项技术的宏伟愿景。
同样,如果您的企业希望进入该领域或改进您的战略,我愿意接受咨询工作和接听电话。大多数情况下,我感到自豪和欣慰的是,这终于被宣布了。从我开始从事这项工作到现在已经五年多了,我的大部分时间都花在了上面,其他设计师和工程师也是如此。我希望整体大于部分之和,Vision Pro 让您大吃一惊。
来源:Sterling Crispin
以上是苹果Vision Pro结合大量AI技术用于用户状态检测的详细内容。更多信息请关注PHP中文网其他相关文章!

由于AI的快速整合而加剧了工作场所的迅速危机危机,要求战略转变以外的增量调整。 WTI的调查结果强调了这一点:68%的员工在工作量上挣扎,导致BUR

约翰·塞尔(John Searle)的中国房间论点:对AI理解的挑战 Searle的思想实验直接质疑人工智能是否可以真正理解语言或具有真正意识。 想象一个人,对下巴一无所知

与西方同行相比,中国的科技巨头在AI开发方面的课程不同。 他们不专注于技术基准和API集成,而是优先考虑“屏幕感知” AI助手 - AI T

MCP:赋能AI系统访问外部工具 模型上下文协议(MCP)让AI应用能够通过标准化接口与外部工具和数据源交互。由Anthropic开发并得到主要AI提供商的支持,MCP允许语言模型和智能体发现可用工具并使用合适的参数调用它们。然而,实施MCP服务器存在一些挑战,包括环境冲突、安全漏洞以及跨平台行为不一致。 Forbes文章《Anthropic的模型上下文协议是AI智能体发展的一大步》作者:Janakiram MSVDocker通过容器化解决了这些问题。基于Docker Hub基础设施构建的Doc

有远见的企业家采用的六种策略,他们利用尖端技术和精明的商业敏锐度来创造高利润的可扩展公司,同时保持控制权。本指南是针对有抱负的企业家的,旨在建立一个

Google Photos的新型Ultra HDR工具:改变图像增强的游戏规则 Google Photos推出了一个功能强大的Ultra HDR转换工具,将标准照片转换为充满活力的高动态范围图像。这种增强功能受益于摄影师

技术架构解决了新兴的身份验证挑战 代理身份集线器解决了许多组织仅在开始AI代理实施后发现的问题,即传统身份验证方法不是为机器设计的

(注意:Google是我公司的咨询客户,Moor Insights&Strateging。) AI:从实验到企业基金会 Google Cloud Next 2025展示了AI从实验功能到企业技术的核心组成部分的演变,


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境