声学领域的机器学习研究可以开启多模态元宇宙

声学领域的机器学习研究可以开启多模态元宇宙

Apr 16, 2023 pm 06:34 PM

机器学习原始宇宙

声学领域的机器学习研究可以开启多模态元宇宙

麻省理工学院和IBM Watson AI Lab的研究人员创建了一个机器学习模型，用于预测听众在3D空间内的不同位置上会听到什么。

研究人员首先使用这个机器学习模型来了解房间中的任何声音是如何在空间中传播的，按照人们通过声音理解自身所处环境的方式构建3D房间的图景。

在麻省理工学院电气工程与计算机科学系（EECS）研究生Yilun Du共同撰写的一篇论文中，研究人员们展示了如何将类似于视觉3D建模的技术应用于声学领域。

但是他们要面对声音和光线传播的不同之处。例如，由于障碍物、房间的形状和声音的特性，听众处在房间中不同的位置可能会对声音产生非常不同的印象，从而让结果变得难以预测。

为了解决这个问题，研究人员们在他们的模型中建立了声学特征。首先，在所有其他条件都相同的情况下，交换声音源和听众的位置不会改变听众听到的内容。声音还特别受本地条件影响，例如位于听众和声音源之间的障碍物。

Du表示：“到目前为止，大多数研究人员只专注于视觉建模。但是作为人类，我们有多种感知模式。不仅视觉很重要，声音也很重要。我认为这项工作开辟了一个令人兴奋的研究方向，可以更好地利用声音来模拟世界。”

使用这种方法，生成的神经声场（NAF）模型能够对网格上的点进行随机采样，以了解特定位置的特征。例如，靠近门口会极大地影响听众听见房间另一侧声响的内容。

该模型能够根据听众在房间中的相对位置预测听众可能从特定声学刺激中听到的内容。

这篇论文表示：“通过将场景中的声学传播建模为线性时不变系统，NAF学会不断地将发射器和听众的位置映射到神经脉冲响应函数，后者可以应用于任意声音。”“我们证明了NAF的连续性让我们能够在任意位置为听众渲染空间声音，并且可以预测声音在新位置的传播。”

MIT-IBM Watson AI Lab的首席研究员Chuang Gan 也参与了该项目，他表示：“这项新技术可能会为在元宇宙应用程序创建多模态沉浸式体验带来新的机会。”

我们知道不是所有 Reg 读者都会对这个用例感到兴奋。

以上是声学领域的机器学习研究可以开启多模态元宇宙的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

在LLMS中调用工具

在LLMS中调用工具Apr 14, 2025 am 11:28 AM

大型语言模型（LLMS）的流行激增，工具称呼功能极大地扩展了其功能，而不是简单的文本生成。现在，LLM可以处理复杂的自动化任务，例如Dynamic UI创建和自主a

多动症游戏，健康工具和AI聊天机器人如何改变全球健康

多动症游戏，健康工具和AI聊天机器人如何改变全球健康Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑，建立焦点或支持多动症的孩子吗？随着医疗保健在全球范围内挑战，尤其是在青年中的挑战，创新者正在转向一种不太可能的工具：视频游戏。现在是世界上最大的娱乐印度河之一

没有关于AI的投入：获胜者，失败者和机遇

没有关于AI的投入：获胜者，失败者和机遇Apr 14, 2025 am 11:25 AM

“历史表明，尽管技术进步推动了经济增长，但它并不能自行确保公平的收入分配或促进包容性人类发展，”乌托德秘书长Rebeca Grynspan在序言中写道。

通过生成AI学习谈判技巧

通过生成AI学习谈判技巧Apr 14, 2025 am 11:23 AM

易于使用，使用生成的AI作为您的谈判导师和陪练伙伴。让我们来谈谈。对创新AI突破的这种分析是我正在进行的《福布斯》列的最新覆盖范围的一部分，包括识别和解释

泰德（Ted）从Openai，Google，Meta透露出庭，与我自己自拍

泰德（Ted）从Openai，Google，Meta透露出庭，与我自己自拍Apr 14, 2025 am 11:22 AM

在温哥华举行的TED2025会议昨天在4月11日举行了第36版。它有来自60多个国家 /地区的80个发言人，包括Sam Altman，Eric Schmidt和Palmer Luckey。泰德（Ted）的主题“人类重新构想”是量身定制的

约瑟夫·斯蒂格利兹（Joseph Stiglitz

约瑟夫·斯蒂格利兹（Joseph StiglitzApr 14, 2025 am 11:21 AM

约瑟夫·斯蒂格利茨（Joseph Stiglitz）是2001年著名的经济学家，是诺贝尔经济奖的获得者。斯蒂格利茨认为，AI可能会使现有的不平等和合并权力恶化，并在几个主导公司的手中加剧，最终破坏了经济的经济。

什么是图形数据库？

什么是图形数据库？Apr 14, 2025 am 11:19 AM

图数据库：通过关系彻底改变数据管理随着数据的扩展及其特征在各个字段中的发展，图形数据库正在作为管理互连数据的变革解决方案的出现。与传统不同

LLM路由：策略，技术和Python实施

LLM路由：策略，技术和Python实施Apr 14, 2025 am 11:14 AM

大型语言模型（LLM）路由：通过智能任务分配优化性能 LLM的快速发展的景观呈现出各种各样的模型，每个模型都具有独特的优势和劣势。有些在创意内容gen上表现出色

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么（黄色晶体）

4 周前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳图形设置

3 周前By尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影：贝壳谜语解决方案

2 周前ByDDD

R.E.P.O.如果您听不到任何人，如何修复音频

4 周前By尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解锁Myrise中的所有内容

1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

SublimeText3 英文版

SublimeText3 英文版

推荐：为Win版本，支持代码提示！

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境，用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问，并防止学生使用未经授权的资源。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

热门话题

gmail邮箱登陆入口在哪里

7503

15

1377

52

steam的账户名称是什么格式

78

11

win11激活密钥永久

52

19

NYT连接提示和答案

19

54