搜索
首页科技周边人工智能并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

Nov 13, 2023 am 11:29 AM
并行人体姿态估计(parallel pose estimation)ar/vr技术(ar/vr技术)虚拟表示(virtual representation)

(映维网Nweon 2023年11月13日)关于人类用户姿势的信息可以映射到虚拟铰接表示。例如,当参与虚拟现实环境时,人类用户在虚拟环境中的表现会呈现出与现实世界姿势相似的姿势。用户的真实世界姿态可以通过先前训练的模型转换为虚拟铰接表示的姿态,模型可以训练为输出用于最终渲染的相同虚拟铰接表示姿态。

有时候系统需要展示不真实的表现。例如,用户可以选择不同身体比例、骨骼或其他方面的卡通角色

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

根据图1所示,真实世界环境102中的人类用户100被展示出来。可以看到,人类用户的姿势被应用到铰接表示104上。换句话说,当人类用户在真实世界环境中进行活动时,相应的动作会转化为虚拟环境106中铰接表示104的运动

有时候,虚拟铰接表示与用于训练模型的表示可能不同,需要进行重新编写。为了解决这个问题,微软专利“Concurrent human pose estimates for virtual representation”介绍了一项技术,能够同时估计模型铰接表示和目标铰接表示的姿态

具体来说,计算系统至少部分地基于来自一个或多个传感器的输入,接收人类用户一个或多个身体部位的详细参数的定位数据。这些传感器可以包括头显的惯性测量单元输出,以及适当摄像头的输出

重写后的内容为:系统会同时维护一个或多个与目标关节表示相关联的模型关节表示的映射约束,例如关节映射约束。姿态优化机会通过定位数据和映射约束,同时估计模型关节表示的姿态和目标关节表示的目标姿态。一旦完成估计,系统可以将目标关节表示和目标姿势一起显示为虚拟表示,供人类用户查看

姿态优化机可以使用具有用于模型铰接表示的ground truth标签的训练定位数据进行训练。然而,训练定位数据可能缺乏目标铰接表示的ground truth标签。

通过这种方法,可以有效地实现对真实世界姿态的准确再现,而无需对每个不同的潜在目标进行昂贵的训练计算。这种技术的发明描述可以对人类用户产生积极的影响

当用户参与虚拟环境时,他们可以选择不同的Avatar来代表自己,并且可以在交流过程中随时改变外观。可以将新的目标铰接表示添加到可供用户选择的表示菜单中,而无需为特定表示重新训练模型,从而节省计算费用

发明描述的技术可以提供减少计算资源消耗的技术优势,同时准确地重新创建人类用户的真实世界姿势,并允许将准确的姿势应用于多个不同目标铰接表示中的任何一个。具体方法是通过同时估计目标和模型的姿势。

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

在图2中展示了用于虚拟表示人体姿势的示例方法200

在202,基于来自一个或多个传感器的输入,接收人类用户的一个或多个身体部位的详细参数的定位数据。

在204年,需要维护一个或多个与目标铰接表示相关的映射约束,以保证模型的连结。如图4所示,展示了一个示例模型铰接表示400

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

如上所述,目标铰接表示呈现用于在虚拟环境中显示,并且可以通过姿态优化机输出目标姿态来显示。例如,目标铰接表示可以具有任何合适的外观和比例,并且可以具有任何合适数量的肢体、关节和/或其他可移动的身体部位。

可以将其改写为:目标铰接表示可以代表非人类动物、虚构角色或任何合适的Avatar。模型铰接表示和目标铰接表示通过一个或多个映射约束402进行关联

一个或多个映射约束可以包括联合映射约束404。对于目标铰接表示的关节,关节映射约束指定模型铰接表示中的一组一个或多个关节。例如,模型铰接表示400包括多个关节,其中两个标记为403A和403B,其对应于肩关节和肘关节。

104号目标铰接包括类似的关节405A和405B。因此,目标表示的关节405A和405B可能有多个不同的关节映射约束,表示这些关节映射到模型表示的关节403A和403B

关节映射约束可以进一步指定每个模型关节在映射到目标关节表示时的权重。例如,当模型的铰接表示只有一个关节映射到目标铰接表示的特定关节时,该模型关节的权重可能为100%。而当两个模型关节映射到目标关节时,两个模型关节的权重可以是50%和50%、30%和70%、10%和90%等

在图2中,方法200通过对先前训练的位姿进行优化,同时估计模型铰接表示的模型位姿和目标铰接表示的目标位姿。模型位姿和目标位姿的估计至少部分依赖于定位数据

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

图5A示意性地示出了位姿优化机500的示例,其可以作为计算机逻辑组件的任何合适组合来实现。作为一个非限制性示例,位姿优化机500可以实现为如图6所述的逻辑子系统602。

如图5A所示,姿态优化机同时估计模型铰接表示的模型姿态502A和目标铰接表示的目标姿态502B。这至少部分地基于定位数据504和一个或多个映射约束506来完成。

姿态估计可以至少部分地基于在一个或多个先前时间框架估计的一个或多个先前模型姿态和先前目标姿态来完成。因此,位姿优化机器500存储多个先前的位姿506,其可以表示为每个模型关节的多个局部旋转。

一个或多个映射约束可以包括位姿连续性约束,它施加帧对帧的限制,限制给定关节的局部旋转可以从一个帧改变到另一个帧的程度。 可以将一组映射约束应用于位姿连续性,通过限制帧与帧之间的变化程度,来约束给定关节的局部旋转

图5B以示意的方式展示了将估计的模型和目标姿态应用于模型和目标铰接表示的过程。具体来说,图5B再次展示了模型铰接表示400和目标铰接表示104对应的默认姿态407A和407B。然后,通过改变铰接的方向,使得模型铰接表示400假设模型姿态502A,目标铰接表示104假设目标姿态502B

在姿态优化中,需要同时估计模型的位姿和目标的位姿。换句话说,与其他方法不同,姿态优化机不是先输出模型的姿态表示,然后将其转换为目标的姿态表示。相反,姿态估计是同时找到满足一组约束的模型姿态和目标姿态的过程

例如,模型铰接表示的姿态可以受到姿态优化机器的先前训练的约束,以输出给定一组定位数据的可能的人类姿态,并且目标铰接表示的姿态可以受到将目标铰接表示与模型铰接表示相关联的一个或多个映射约束的约束。

另外,在先前的训练中,姿态估计可以由执行姿态优化的机器学习模型508来实现。在一个实例中,姿态优化机可以被配置为基于稀疏输入定位数据输出姿态。换句话说,姿态优化机可以通过训练来输出更准确的姿态估计,这取决于在运行时接收到的更多输入参数

换句话说,姿态优化机接收到的定位数据可能包含人类用户的n个关节的旋转参数。在之前的训练中,姿态优化机接收的是n+m个关节的旋转参数作为输入,其中m大于1。然后,估计模型的姿态可以通过估计模型铰接表示的n+m个模型关节的旋转参数来确定,至少需要基于n个关节的旋转参数,而不需要基于m个关节的旋转参数

另外,训练姿态优化机时,不需要包括目标铰接表示的ground truth标签。相反,通过一个或多个映射约束,将标铰接表示与模型铰接表示相关联,通常将目标姿态约束为与模型姿态基本相似

微软指出,采用上述技术,过程的速度可以有益地提高两个数量级。这可以实现模型和目标姿态的实时并发估计,而无需使用专门的硬件加速。

在图2中,方法200包括输出具有目标姿态的目标铰接表示作为人类用户的虚拟表示以供显示,该步骤发生在208。例如,在图1中,目标铰接表示104通过电子显示设备108进行展示。用于展示目标铰接表示的显示装置可以采用任何适当的形式,并且可以使用任何适当的底层显示技术

相关专利:Microsoft Patent | Concurrent human pose estimates for virtual representation

名为“Concurrent human pose estimates for virtual representation”的微软专利申请最初在2022年4月提交,并在日前由美国专利商标局公布。

以上是并行人体姿态估计专利:微软AR/VR技术实现虚拟表示的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
在LLMS中调用工具在LLMS中调用工具Apr 14, 2025 am 11:28 AM

大型语言模型(LLMS)的流行激增,工具称呼功能极大地扩展了其功能,而不是简单的文本生成。 现在,LLM可以处理复杂的自动化任务,例如Dynamic UI创建和自主a

多动症游戏,健康工具和AI聊天机器人如何改变全球健康多动症游戏,健康工具和AI聊天机器人如何改变全球健康Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

没有关于AI的投入:获胜者,失败者和机遇没有关于AI的投入:获胜者,失败者和机遇Apr 14, 2025 am 11:25 AM

“历史表明,尽管技术进步推动了经济增长,但它并不能自行确保公平的收入分配或促进包容性人类发展,”乌托德秘书长Rebeca Grynspan在序言中写道。

通过生成AI学习谈判技巧通过生成AI学习谈判技巧Apr 14, 2025 am 11:23 AM

易于使用,使用生成的AI作为您的谈判导师和陪练伙伴。 让我们来谈谈。 对创新AI突破的这种分析是我正在进行的《福布斯》列的最新覆盖范围的一部分,包括识别和解释

泰德(Ted)从Openai,Google,Meta透露出庭,与我自己自拍泰德(Ted)从Openai,Google,Meta透露出庭,与我自己自拍Apr 14, 2025 am 11:22 AM

在温哥华举行的TED2025会议昨天在4月11日举行了第36版。它有来自60多个国家 /地区的80个发言人,包括Sam Altman,Eric Sc​​hmidt和Palmer Luckey。泰德(Ted)的主题“人类重新构想”是量身定制的

约瑟夫·斯蒂格利兹(Joseph Stiglitz约瑟夫·斯蒂格利兹(Joseph StiglitzApr 14, 2025 am 11:21 AM

约瑟夫·斯蒂格利茨(Joseph Stiglitz)是2001年著名的经济学家,是诺贝尔经济奖的获得者。斯蒂格利茨认为,AI可能会使现有的不平等和合并权力恶化,并在几个主导公司的手中加剧,最终破坏了经济的经济。

什么是图形数据库?什么是图形数据库?Apr 14, 2025 am 11:19 AM

图数据库:通过关系彻底改变数据管理 随着数据的扩展及其特征在各个字段中的发展,图形数据库正在作为管理互连数据的变革解决方案的出现。与传统不同

LLM路由:策略,技术和Python实施LLM路由:策略,技术和Python实施Apr 14, 2025 am 11:14 AM

大型语言模型(LLM)路由:通过智​​能任务分配优化性能 LLM的快速发展的景观呈现出各种各样的模型,每个模型都具有独特的优势和劣势。 有些在创意内容gen上表现出色

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。