搜索
首页科技周边人工智能元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

(映维网Nweon 2023年12月26日)远程会议的发展正在推动元宇宙的普及化。然而,目前在线会议应用在使用元环境时面临一个主要问题,即并非所有参与者都使用相同类型的设备。比如,有些用户使用个人电脑进行操作,而其他用户则使用虚拟现实头显

桌面设备用户有时处于不利地位,因为他们无法导航或与虚拟环境中的所有用户进行交互。当计算机提供3D环境的2D视图时,计算机在如何接收用户导航或与3D环境交互的输入手势方面受到限制。

从目前来看,虽然技术发展迅速,但是VR头显用户和PC用户的体验并不相同。此外,无论是从VR头显过渡到桌面设备,还是反过来,现有的系统并不能在聚会或公司会议等活动中实现无缝切换

在微软的专利申请中,名为“2D和3D过渡在用户参与通信会话中的渲染”的内容详细介绍了一种相关的无缝过渡方法

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

图1A和1B说明了当用户参与通信会话时,用户界面安排从用户的二维图像的显示到用户的三维表示的呈现的转换。

所述通信会话可由由若干台计算机11组成的系统100来管理,每台计算机11对应于若干用户10。在本例中,第三用户10C的呈现将经历从2D模式到3D模式的转换。

为了开始转换,系统可以接收一个输入,以引起特定用户的二维图像呈现的显示转换。在这个例子中,输入标识第三个用户10C。该输入同时可以提供许可,允许系统访问为第三个用户10C定义位置和方向的3D模型。这些位置和方向可以包括在本文中称为虚拟环境200的3D环境200中表示的矢量和坐标

作为对接收输入的响应,系统100的一台或多台计算机可以对用户界面101进行修改,以删除如图1A所示的用户10C的图像151C的渲染,并添加如图1B所示的用户10C的3D表示251C的渲染。根据在3D模型中定义的坐标和/或向量,可以在3D环境中定位和定向用户10C的3D表示251C的呈现。

在本例中,删除了用户10C的2D图像的渲染,然后可以用其他渲染代替。例如,将图1A所示的第三用户10C的2D图像渲染在UI中替换为图1B所示的另一用户第四用户10D的另一2D图像。

这种转换允许用户以不同的方式与计算设备进行交互。例如,在这个例子中,如果用户10C希望从通信会话中的实时视频流切换到另一种操作模式,该模式允许用户与3D环境中的其他用户进行交互,系统会将用户从一种模式转换到另一种模式,从而使其能够与一般内容、文档、电子表格和幻灯片交互的模式切换到与3D对象交互的模式

通信会话期间的这种转换允许所选用户在每个环境中使用适合不同内容类型的编辑工具。例如,如果视频流中的一个人希望离开使用2D图像向用户显示的2D模式,并进入3D环境向其他用户展示如何在特定位置移动对象或塑造特定的3D对象,则一旦用户能够在通信会话中进行转换,他们就可以更容易地做到这一点。

用户可以使用台式PC完成这种转换,而无需使用任何类型的XR头显。使用桌面的这种转换使用户能够使用桌面计算机进入与3D计算环境交互的3D模式,这可能更适合于编辑或查看特定类型的内容。

微软指出,其中一个技术优势是,系统可以允许用户在通信会话的3D模式和2D模式之间切换,而不管他们与什么硬件进行交互。

发明所述技术同时适用于头显。在这样的实施例中,用户在将交互模型从3D计算环境转换到2D计算环境时,可以保持仅使用一个计算设备,例如头显。所以,用户可以在3D计算环境中启动,并通过3D表示251C的呈现来表示,例如图1B所示的表示。

然后,响应一个或多个输入,例如用户开始编辑具有特定文件类型的内容,或基于指示执行UI转换意图的输入,系统可以转换UI以删除3D表示251C的呈现,如图1B所示,并生成用户的2D图像151C的呈现,例如图1A所示的表示。这允许用户在不实际使用使用平面屏幕显示和键盘的桌面设备的情况下过渡到2D环境。

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

图2A和2B说明了当用户参与通信会话时,用户界面从具有用户的二维图像的显示到用户的三维表示的呈现的转换的另一个示例。

在这个例子中,用户界面201是基于3D模型的3D环境的呈现。用户界面201以第一用户10A的表示251A的3D呈现和第二用户10B的表示251B的3D呈现开始。每个表示的3D渲染都有一个位置和一个方向,由存储在3D模型中的虚拟对象属性决定

3D环境同时包括虚拟对象275,其形式为安装在虚拟环境墙壁的虚拟平面电视。虚拟对象275具有显示虚拟用户界面的显示表面,虚拟用户界面显示第三个用户10C的2D渲染151C和第四个用户10D的2D渲染151D。

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

图3A和3B说明了第三用户转换的另一个方面。在本例中,第三用户10C的呈现经历了从2D模式到3D模式的转换。

如图3A所示,用户界面301首先显示杰思敏、劳伦斯和麦克的二维图像,分别显示为图像151A、151B和151D的效果图。用户界面同时包括具有其他用户的两个3D表示251A和251B的3D环境200的呈现。

为了响应本文所述的输入数据,系统执行转换。在第三用户的过渡中,第三用户10C的第三计算机11C从图3A所示的用户界面过渡到图3B所示的用户界面。

经过转换后,夏洛特的计算机11C显示了修改后的用户界面301,如图3B所示。系统会维护每个用户的状态,就像图3A中展示的两个用户251A和251B的三维表示一样,同时还会维护图3B中展示的251A和251B的三维表示

同样如图3B所示,修改后的用户界面301包括虚拟对象275,虚拟对象275在本例中为虚拟显示设备,其显示最初以2D图像显示的其他用户的2D渲染,例如图3A中的杰思敏和劳伦斯。

这个修改后的301用户界面现在显示夏洛特的视角,就好像她从2D环境传送到3D环境一样。与其他例子类似,在这种传送中,系统可以根据一个或多个因素确定夏洛特Avatar的位置和方向。

在这样一个例子中,夏洛特可能正在操作一个设备,比如PC。然后,响应本文所述的一个或多个输入,系统可以在继续使用桌面PC的同时从图3A的用户界面过渡到图3B的用户界面。即使不使用传统上用于查看3D渲染的头显,都可以实现这个示例的过渡。

在另一个例子中,过渡可以涉及夏洛特从图3B的用户界面开始,然后过渡到图3A的用户界面的过程。在这个例子中,夏洛特可能正在操作一个单独的设备,比如头戴式显示器。她首先浏览图3B中展示的3D环境,然后通过对本文所述的一个或多个输入做出反应,系统可以从图3B的用户界面过渡到图3A的用户界面,并继续使用头戴式设备。即使不使用传统上用于查看2D图像的计算机,这个示例的转换也是可能的

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

图4A说明了UI转换的其他特性。当接收用于致使UI从用户10C的2D图像的呈现转换到用户10C的3D表示的呈现的输入时,系统可以确定用户10C的3D表示的位置和方向。

例如,如果一个模型在虚拟环境200中开始时只有两个代表用户的虚拟对象351A和351B,那么系统可以确定新增加的代表用户的虚拟对象351C的位置和方向。在这个例子中,当输入表明特定用户,比如第三个用户10C时,系统可以根据虚拟环境200中其他用户的位置和/或共享内容的位置,确定表示第三个用户10C的虚拟对象351C的位置和方向

在一个说明性示例中,如果系统确定用于表示第三个用户10C的虚拟对象351C将添加到虚拟环境200中,则系统可以以一种方式定位虚拟对象351C,使得虚拟对象351C呈现出用户的Avatar正在查看与用户10C共享的内容。

在另一个例子中,如果系统确定将用于代表第三个用户10C的虚拟对象351C添加到虚拟环境200中,系统可以以一种方式定位虚拟对象351C,使其看起来像是用户的Avatar正在与用户10C交谈的Avatar对话

在一个实施例中,每个虚拟对象351的放置可以基于团队成员、用户组和/或由单个用户或用户组建立的策略的分布。例如,如果一个人是公司团队的一部分,当其中一个人在转换用户界面的输入中识别时,他们对应的Avatar将被定位在其他团队成员的阈值距离内。

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

图4B示出系统的两种操作模式,以及每种操作模式如何改变参与通信会话的个体的权限。在图4B的上半部分的第一种操作模式中,当3D模型中不包含用户的表示时,权限可以允许系统使用图像文件来显示用户的2D图像。

在这种情况下,3D模型数据处于第一状态320A,其中所选用户在3D环境200中没有表示该用户的虚拟对象。当3D模型处于这种状态时,所选用户在3D环境中没有表示该用户的虚拟对象,与该用户关联的权限数据315配置为允许系统和其他用户访问该用户的图像数据310。这意味着所述系统和每个远程用户的客户端可以使用所述图像数据310生成该用户的呈现,或者所述系统可以编辑所述图像数据310。

当系统检测到3D模型数据处于第二状态时,例如,模型数据320B中包含代表所选用户的虚拟对象351C,系统会修改权限以限制该特定用户对图像数据的使用。根据图中所示,系统会修改权限数据315,以限制系统读取图像数据310来显示该特定用户的2D图像。在这种操作模式下,权限会被配置为限制所有用户对图像数据的访问,从而阻止所有客户端对2D图像文件的访问或显示

图5A和图5B示出了配置为在相对于共享内容的3D环境200中定位用户的表示的系统的特征。

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

在图5A中展示了用于第一用户351A和第二用户351B的Avatar定向,用于在3D环境中查看共享内容的场景。他们共享的内容可以显示在虚拟对象上,例如虚拟显示屏。当系统检测到有一定数量的用户正在查看共享内容时,系统会为拥有Avatar的第三个用户生成进入3D环境的方向

特征的一个示例如图5B所示。在本例中,将第三用户351C的Avatar添加到虚拟环境中。第三用户351C的Avatar指向共享内容,以响应系统检测到其他用户在其视场内具有共享内容。系统同时可以确定每个人视场的几何形状,并确定第三个用户的Avatar的位置,使得第三个用户的Avatar不会阻挡其他用户的视场。

图6A和图6B示出了配置为相对于其他用户在3D环境200中定位。图6A示出了一种场景,其中第一用户和第二用户的Avatar定向成用户在虚拟环境中相互看着。

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享

在一个特定的团队或预先确定的群体中,当系统确定有一定数量的人在相互注视时,系统可以定位进入环境的第三个用户的Avatar,这样Avatar的位置就可以看向其他用户。图6A显示了在视场内具有至少三个具有其他组成员的用户的若干虚拟形象。当系统确定某个阈值数量的虚拟角色在视场内拥有其他组成员时,如图6B所示,系统可以允许新的组成员加入具有允许该用户查看其他组成员的位置和方向的虚拟环境。

相关专利:Microsoft Patent | 2d and 3d transitions for renderings of users participating in communication sessions

名为“2d and 3d transitions for renderings of users participating in communication sessions”的微软专利申请最初在2022年5月提交,并在日前由美国专利商标局公布。

需要注意的是,一般来说,美国专利申请接收审查后,自申请日或优先权日起18个月自动公布或根据申请人要求在申请日起18个月内进行公开。注意,专利申请公开不代表专利获批。在专利申请后,美国专利商标局需要进行实际审查,时间可能在1年至3年不等。

以上是元宇宙远程会议中实现2D与3D无缝过渡的微软专利分享的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
AI技能差距正在减慢供应链AI技能差距正在减慢供应链Apr 26, 2025 am 11:13 AM

经常使用“ AI-Ready劳动力”一词,但是在供应链行业中确实意味着什么? 供应链管理协会(ASCM)首席执行官安倍·埃什肯纳齐(Abe Eshkenazi)表示,它表示能够评论家的专业人员

一家公司如何悄悄地努力改变AI一家公司如何悄悄地努力改变AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地获得动力。 本周五在德克萨斯州奥斯汀,Bittensor最终游戏峰会标志着一个关键的时刻,将分散的AI(DEAI)从理论转变为实际应用。 与闪闪发光的广告不同

NVIDIA释放NEMO微服务以简化AI代理开发NVIDIA释放NEMO微服务以简化AI代理开发Apr 26, 2025 am 11:11 AM

企业AI面临数据集成挑战 企业AI的应用面临一项重大挑战:构建能够通过持续学习业务数据来保持准确性和实用性的系统。NeMo微服务通过创建Nvidia所描述的“数据飞轮”来解决这个问题,允许AI系统通过持续接触企业信息和用户互动来保持相关性。 这个新推出的工具包包含五个关键微服务: NeMo Customizer 处理大型语言模型的微调,具有更高的训练吞吐量。 NeMo Evaluator 提供针对自定义基准的AI模型简化评估。 NeMo Guardrails 实施安全控制,以保持合规性和适当的

AI为艺术与设计的未来描绘了一幅新图片AI为艺术与设计的未来描绘了一幅新图片Apr 26, 2025 am 11:10 AM

AI:艺术与设计的未来画卷 人工智能(AI)正以前所未有的方式改变艺术与设计领域,其影响已不仅限于业余爱好者,更深刻地波及专业人士。AI生成的艺术作品和设计方案正在迅速取代传统的素材图片和许多交易性设计活动中的设计师,例如广告、社交媒体图片生成和网页设计。 然而,专业艺术家和设计师也发现AI的实用价值。他们将AI作为辅助工具,探索新的美学可能性,融合不同的风格,创造新颖的视觉效果。AI帮助艺术家和设计师自动化重复性任务,提出不同的设计元素并提供创意输入。 AI支持风格迁移,即将一种图像的风格应用

Zoom如何彻底改变与Agent AI的合作:从会议到里程碑Zoom如何彻底改变与Agent AI的合作:从会议到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其视频会议平台而闻名,它通过创新使用Agentic AI来引领工作场所革命。 最近与Zoom的CTO XD黄的对话揭示了该公司雄心勃勃的愿景。 定义代理AI 黄d

对大学的存在威胁对大学的存在威胁Apr 26, 2025 am 11:08 AM

AI会彻底改变教育吗? 这个问题是促使教育者和利益相关者的认真反思。 AI融入教育既提出了机遇和挑战。 正如科技Edvocate的马修·林奇(Matthew Lynch)所指出的那样

原型:美国科学家正在国外寻找工作原型:美国科学家正在国外寻找工作Apr 26, 2025 am 11:07 AM

美国科学研究和技术发展或将面临挑战,这或许是由于预算削减导致的。据《自然》杂志报道,2025年1月至3月期间,美国科学家申请海外工作的数量比2024年同期增加了32%。此前一项民意调查显示,75%的受访研究人员正在考虑前往欧洲和加拿大寻找工作。 过去几个月,数百项NIH和NSF的拨款被终止,NIH今年的新拨款减少了约23亿美元,下降幅度接近三分之一。泄露的预算提案显示,特朗普政府正在考虑大幅削减科学机构的预算,削减幅度可能高达50%。 基础研究领域的动荡也影响了美国的一大优势:吸引海外人才。35

所有有关打开AI最新的GPT 4.1家庭的信息 - 分析Vidhya所有有关打开AI最新的GPT 4.1家庭的信息 - 分析VidhyaApr 26, 2025 am 10:19 AM

Openai推出了强大的GPT-4.1系列:一个专为现实世界应用设计的三种高级语言模型家族。 这种巨大的飞跃提供了更快的响应时间,增强的理解和大幅降低了成本

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器