php小编小新今天为大家介绍什么是空间音频。空间音频是一种音频技术,通过使用特殊的编码和解码算法,能够在音频中模拟出真实的三维空间效果。这种技术可以让听众在听音频时感受到音源的距离、方向和环境,增强了音频的沉浸感和逼真度。在空间音频技术全面讲解中,我们将详细介绍空间音频的原理、应用和发展趋势,让大家对这一领域有更深入的了解。
本周,苹果召开了WWDC全球开发者大会,大会结束过后所有媒体基本上都表示出了失望的情绪。首先没有发布任何新硬件,其次在系统方面的更新也乏善可陈。目前开放的iOS15测试版本基本上也都是一些软件层面的改善,安卓用户普遍表示多少年前就已经用上了。
目前手机、平板和电脑之间跨屏幕交互的体验尚未实现,因此其效果尚不明确。然而,最近鸿蒙系统已经提前带来了这种前所未有的效果,这并没有给人带来太大的震撼。
如果要在这次开发者大会当中找到一丝亮点,那就是“空间音频”技术的广泛应用,未来会有更多的音乐软件或者视频软件,以及耳机等等硬件支持“空间音频”技术,而且这个技术也在不断破圈,向着安卓阵营扩展。
今天我们就来聊聊“空间音频”。
“空间音频”(Spatial Audio)这个词其实是苹果造的,它的本质是“计算音频”。别被这些名词概念吓到,它非常好理解。
拿我们生活当中最的常见朋友圈发照片举例,现在敢不修图就直接发原图的人都是真正的勇士。尤其是合照,如果不把对方稍微修饰一下,或者只给自己美颜,那友谊的小船说翻就翻。
这里有朋友可能会说我就不修图,我每次就是拍完了直接发。但即便如此,你发的照片依然是修过的。这是因为计算视觉已经是我们手机设备上必不可少的一部分了。在我们拍照时,影像处理系统就已经帮我们锐化了照片,提高了对比度,让天更蓝草更绿人更瘦。
哪怕我们拍出来照片真的原汁原味,但是在显示端,也就是我们的屏幕上,画面还会是经过美化。计算视觉如此无孔不入,为的就是给我们营造出一种来源于真实,但要比真实更符合人类审美的感觉,即便我们眼前的景象根本不是这个样子。
比起图像技术的突飞猛进,声音相对就显得传统太多了。除了供娱乐消遣使用的所谓变声软件,计算音频技术很长一段时间都没有找到合适的窗口期。
直到降噪耳机开始迅速普及,它的原理是通过耳机上的麦克风,先捕捉环境噪音,然后在耳机内部发出一个反相的声波,来抵消掉环境噪音。从而让我们能够更加清楚地听到耳机里的声音。
现在我们的手机已经大量应用了这种技术,随着计算音频技术的发展,设备还可以更准确地识别人声,只对人声部分进行增强,让我们在通话时声音更清楚。
有些音乐软件如今已经可以做到把一首歌中的人声部分全部消除,只保留伴奏,或者相反,只保留人声去掉伴奏。这些都是计算音频技术的典型应用。
说回耳机,它有个致命伤,就是无法营造出临场感。从原理上,我们的耳机只能做到双声道立体声,永远没办法和影院的5.1、7.1声道的那种被声音包围起来的效果媲美。
现在的全景声影院,可以让观众清晰地感受到一架飞机从头顶上飞过的声音效果。这是怎么做到的呢?
这里我需要再普及一个知识,我们的耳朵是如何分辨出声音的方向的。
我们之所以可以明确地判断出声音从哪个方向传过来,是因为我们有两只耳朵,两只耳朵听到的声音不一样,产生了两种差。一个叫做时间差,另一个叫做声级差。
说白了就是一个声源传递出来的声波,到达我们两只耳朵的时间会有细微的不同,另外,由于我们的头部对声音有遮挡,来自左侧和右侧的声音音量大小会有不同,这两不同都会被我们用来判断声音方向。
如果还是很难判断,我们会下意识地侧一下头,这个动作会让我们人为扩大时间差和声级差,有助于我们做判断。
我们头部的直径大约是20厘米左右,换算成波长大约是1500Hz的声波。低于1500Hz的声波,波长大于我们头部的直径,因此可以绕过我们的头部,到达我们两只耳朵的声音会感觉差不多。这也就是为什么低音炮这种低频设备没有指向性,理论上放到哪儿都行的原因,因为我们无法判断出低频声音的方向。
这个时候问题就来了,我们是怎么判断出来上方和下方的声音的呢?想象一下,来自上方45度和下方45度的声音,时间差和声级差是一模一样的,但是我们还是能够判断出来。
这是因为我们有耳廓。我们的耳廓之所以长成这个奇怪的造型,而不是一个平滑的漏斗状,是有原因的。来自上方和下方的声音在我们的耳廓里会产生不同的反射效果,这种不同会被我们敏锐捕捉,从而判断上下方位的声音。
有兴趣的朋友可以做个试验,闭上双眼,让一个朋友在你的面前用一串钥匙垂直晃动,你会很准确地指出声音的方向。但如果您捏住耳廓,改变它们的形状,或者比如用橡皮泥,把耳廓填平。虽然耳朵没有被堵住,但这时我们就很难分辨出声音到底来自上方还是下方了。
以空间音频为代表的计算音频技术,首先要实现的就是让我们的双耳还原听声辨位的能力。现在当我们戴上耳机的时候,无论手机上的画面在哪个方向,我们始终都会觉得声音是从正前方传过来的,这其实是反直觉的。
如果耳机中有陀螺仪,可以感受到我们头部的晃动,计算音频技术就可以判断出我们双耳和屏幕的相对位置,然后在我们的两耳中播放出不同时间差、声级差的声音,甚至模拟出耳廓反射的效果。这种计算会和手机屏幕的位置匹配起来,让我们误以为,声音永远是从屏幕的方向传过来的,甚至如果把手机拿到身后,我们也会觉得耳机里的声音是从后面传来的。
这样做有什么好处呢?这就和我们在影院里看电影的感觉一样了,电影院里银幕的方向永远是声音的主要来源,它不会随着我们的头部晃动而改变。这也更符合自然直觉,每个声源都在它本来的位置,而我们只是置身其中。
用一幅耳机就能实现x.1声道的效果,这在过去绝对是夸大宣传,但现如今,计算音频技术的普及,让这种效果真的就来到了我们的耳边。
那多声道的传统音频设备岂不是要被取代?
也不是。
能够判断出声音方向,和能够提供高质量的声音效果是两码事。很多人就想安安静静欣赏音乐,不希望被空间音频技术干扰,目前支持空间音频技术的耳机,和同价位的经典有线耳机相比,音质上还差不少。而对于影视内容,临场感比音质往往更加重要,空间音频在这方面会发挥更大作用。
当然,还有提供更加真实的VR体验。
虽然基于算法,但目前空间音频还是需要特定软硬件配合,耳机、视频软件以及视频内容要同时支持空间音频,才能发挥出最好的效果。
计算音频的浪潮已然袭来,我们听见的世界也将似真似幻。
以上是空间音频是什么意思「附:空间音频技术全面讲解」的详细内容。更多信息请关注PHP中文网其他相关文章!