任何关注音乐或电影的人都肯定都注意到,几乎所有的流媒体上都有 "沉浸声"、"空间"、"3D "或者至少"环绕声 "一类的流行字眼。作为音频内容制作者,我们需要了解创造出沉浸式音频的原则,这一般被称为 "多声道 "音频。我们花了数年时间来发展立体声混音的技艺,完善听觉技能,并为我们的立体声监控系统精心打造高度精确的环境;但现在,我们一下子就得将监听系统扩展到使用12个或更多的扬声器……本文将为您解开多声道系统的神秘面纱,帮助您理解监听系统的设置和校准工作,以便在世界各地不同的播放系统上,从耳机、智能音箱到家庭影院系统,实现一致的聆听体验。
本文将重点介绍多声道的音乐制作,但同样的原理和技术也适用于电影、电视、甚至游戏音频。最常见的多声道音频格式包括5.1和7.1环绕声、Dolby Atmos、索尼360 Reality Audio、MPEG-H和Auro 3D。Atmos在音乐发行和流媒体方面处于领先地位,尽管360 Reality Audio也是具有影响力的存在。虽然有不同格式竞争的情况,但为了更加专注统一,我们将基于Atmos制定的标准上,但是这些原则同样可转化为其他格式的应用。
1. 多声道扬声器设置
立体声音频使用两个扬声器来呈现声音辐射,而多声道音频则提供多个扬声器包围听众:从耳朵等高位,上方,以及某些案例中的下方扬声器。传统的5.1扬声器系统包含五个位于听众耳朵等高的扬声器,以及一个用于低频的超重低音扬声器(.1)。扬声器被标记为左、中、右、左环绕、右环绕和LFE。7.1系统用左和右 "侧环绕 "声道来扩展这一概念。在一个大房间或剧院里,可能有多个侧环绕扬声器来覆盖整个房间的长度,所以来自侧边的声音并没有精确的点位,而是一个 "区域 "的空间。这种类型的设置被称为“基于通道”的(channel-based)混音。如果一个现代多声道设置被命名为7.1.4,这意味着七个环绕声扬声器,一个低音炮和四个顶置扬声器。同样,".1 "低音炮是专门用于LFE通道的。
许多多声道格式,例如Atmos,扩展了基于通道的系统,并增加了将声音分配给一个对象(object)的功能,该对象可以被自由移动到空间内任何x、y、z坐标。声音可以来自空间内任意确切定位的点,而不是直接把声音送给“左侧环”通道。x、y、z坐标始终代表听众周围和上方的精确位置,无论实际房间大小。建议最低Atmos扬声器设置包括12个扬声器:左、中、右、左侧环绕、右侧环绕、左后环绕、右后环绕、LFE、左前顶部、右前顶部、左后顶部和右后顶部。这就是7.1.4,七个环绕声扬声器,一个LFE超低扬声器,以及四个顶置扬声器。Atmos扬声器系统可以扩展到64个扬声器,以覆盖非常大的空间。在使用对象混音时,任何音轨或总线都可以放入7.1.2通道床(作为基于通道的混音)或分配到118个对象中的任何一个。这些对象包含元数据,告诉播放系统声音应该来自空间的什么地方,无论房间的尺寸、扬声器的数量如何。此外,Atmos为在较小的系统上播放多声道混音提供了兼容性,如7.1、5.1、立体声,甚至是具备或不具备双耳处理的耳机。特定房间的播放系统,会智能地处理音频发送到该房间内扬声器系统的方式。
2. 房间设置
在Atmos中针对音乐混音的工作室设置实例非常全面而且相当简单。扬声器(至少7.1.4,建议9.1.4或以上)都应可回放全频域音频(40 Hz至18 kHz,±3 dB),每个扬声器应可在聆听位置产生85 dB SPL,并有超过20 dB余量。低音炮应能处理31.5赫兹至150赫兹。对于商业音乐工作室,杜比建议使用一个专用的LFE低音炮,以及补充主扬声器低频的额外低音炮。当低音炮被用作主扬声器系统的一部分时,该系统被称为经过 "低音管理" 的,你的监听控制器应该为低音管理和全频扬声器系统提供分频控制和路由选项。大多数典型的工作室应具有足以容纳Atmos环绕声系统的面积尺寸,杜比推荐的扬声器布局尺寸从3.5m x 3m x 2.4m(长x宽x高)到6.4m x 5.5m x 3m(11.5' x 9.8' x 7.9' 到21' x 18' x 9.8' )。
扬声器的几何形状和与混音位置的距离可以基于等距(圆形)或正交(矩形)布局。同样地,房间应尽可能地对称设置,但听者与前部或后部扬声器之间的实际距离可以有一定的差异,监听系统将根据房间的具体几何形状进行校准。请记住,对于混音室,通常只会有一个最佳聆听位置,且同时是立体声和多声道系统的最佳听音点。与耳朵等高扬声器的位置和它们相对于听音点的角度如下图所示。上层扬声器被设置在听音点的外侧45度并向前或向后倾斜45度。Atmos系统遵循ITU-R BS.775.3规范,该规范允许因部分实际原因(如门或控制台)而在扬声器位置上有轻微变化。
Dolby Atmos 9.1.4音乐设置的正交房间布局。图片来自杜比的技术指南
Atmos推荐的扬声器设置与许多其他环绕格式兼容。然而,Auro 3D增加了一个被称为 "上帝之音 "的顶部扬声器层(高于上层扬声器),而360 Reality Audio增加了一个下扬声器层。如果你正在为Atmos设计房间,请花些时间阅读杜比Atmos音乐室的最佳实践:
https://dolby.my.salesforce.com/sfc/p/#700000009YuG/a/4u000000lFIV/YHgXgrJVKAcelcXkD.DnlRUBZU1CqEMGDKweLRpuu98
并尝试家庭娱乐杜比音频房间设计工具:
https://professionalsupport.dolby.com/s/article/HE-DARDT-Quick-Start-Video-Series?language=en_US
这是一个电子表格工具,允许你使用常见品牌的监听音箱或自定义配置建立一个特定的房间布局。
关于Atmos音乐工作室的完整建议可以在这里找到:https://dolby.my.salesforce.com/sfc/p/#700000009YuG/a/4u000000lFIV/YHgXgrJVKAcelcXkD.DnlRUBZU1CqEMGDKweLRpuu98
关于更多多声道和沉浸声音频格式的比较,请看来自Genelec的沉浸声中心:
https://www.genelec.com/immersive-hub
用于混合索尼 360 Reality Audio推荐扬声器设置的顶视图和侧视图,这需要至少13个扬声器,包括3个下层扬声
现在我们对所需的扬声器类型和监听音箱的摆位有了一些准则。需要注意的是,必须对扬声器的响度、频率响应和相对于混音位置的时间差进行校准。我们还需要一个便捷的方法来同时控制所有扬声器的音量。
3. 监听控制
小型音乐工作室的多声道系统需要对至少12个扬声器进行监听控制,也许还有耳机和辅助监听扬声器。较大的房间可能需要对多达64个扬声器进行监听控制。监听控制的选择范围从纯软件解决方案到复杂的硬件设备,但即使是最简单的Atmos设置也需要一个至少具备12个输出的音频接口。如果你愿意或预算有限,可以用Dolby Renderer应用程序或甚至DAW中的监听音量推子来控制扬声器的音量/衰减/静音。Cubase和Nuendo的多声道监听控制部分设置得特别好。甚至SoundID Reference for Multichannel中的音量推子也可以作为你的监听音量控制器。
Dolby Atmos Renderer应用程序。右上角的黄框部分标明了扬声器控制部分,左上角的黄框表示可用的扬声器布局
有些人对基于软件的音量控制持谨慎态度,并认为使用硬件监听控制器更舒服。到目前为止,只有少数监听控制器是专门为多声道设置设计的,包括AVID、Focusrite、Genelec、Grace、JBL、Merging Technologies、NTP和Trinnov。这些品牌提供扬声器控制和校准的DSP处理功能。其他设备,如Merging Technologies和MOTU接口,可以由用户配置,从一个音量旋钮控制多个扬声器输出,并提供不同程度的监听校准。通常多声道硬件监听控制器至少要花几千美元,特别是如果你喜欢与专用混音控制器(如EUCON控制器)整合的话。
4. 扬声器校准
对于多声道扬声器系统,我们需要对每个扬声器的频率响应、响度和延迟进行精确校准。如果所有扬声器的时间(相位)或频率响应不匹配,声音从多个扬声器播放时便可能会受到梳状滤波的影响,听起来不自然、不准确,或者在听音点的声场效果不佳。如果每只扬声器的响度没有被校准,那么你的三维声混音亦不能良好地在其他系统中回放。
对于响度校准,杜比建议除LFE外的每个扬声器都被校准为:在听音点获得相同的响度。粉噪发生器配合一个声压计,或扫频+测量软件都可以用来测量每只扬声器的输出。对于大型混音室,播放-20dBFS粉红噪声应能使每只扬声器产生85dB SPL(C-加权,慢速)。用于LFE通道的低音炮在其频率范围内应有89至91.5dB SPL的输出,而用作低频管理的低音炮应在其他全频扬声器静音的情况下具有79-81.5 dB SPL响度输出。对于较小的家庭工作室和制作间,你可以考虑将所有建议的声压级降低6dB。沉浸声混音往往相较于立体声混音,在稍大的监听电平下更舒适。
对于校准每只扬声器的频率响应工作,我们建议使用扫频信号以及可以创建测量图的软件,尽管某些方案使用粉噪和RTA测量。像SoundID Reference Measure、Room EQ Wizard和Smaart这样的软件可以作为完整的解决方案来测量每个扬声器的响度、频率响应和延迟。例如,SoundID从监听位置周围的几个位置测量每个扬声器,并生成一个多通道校正的配置文件,然后导入SoundID插件中。SoundID和Room EQ Wizard都允许你将测量结果导出到某些内置DSP的监听控制器中。一些硬件监听控制器,包括Genelec、JBL、MiniDSP和Trinnov,均提供部分内置的测量和房间校正工具。
播放并捕捉脉冲响应或短促的响声是校准每只扬声器延时设置的必要步骤。我们可以通过 DAW 手动播放节拍器声,并用置于听音点的麦克风录制改节拍器声响来完成这一步骤。我们需要为每只扬声器单独进行测量,以便之后在DAW中计算延迟时间。这些延时需以某种方式应用到每只扬声器的输出,比如通过监听控制器的内置DSP,或通过杜比的Atmos Mastering Suite软件(比较昂贵)。SoundID Reference可测量扬声器延迟(实际上是相位响应),并将时域校正作为其生成的多声道校准配置文件的一部分。Genelec、JBL和Trinnov监听控制器也在其房间校正处理中具备时域校正。
虽然杜比软件和一些硬件监听控制器提供了一些房间校正功能,但SoundID Reference for Multichannel可测量从立体声到9.1.6系统的响度、频率响应和延迟。测量覆盖了听音点周围的一个舒适甜蜜点区域,并生成校准配置文件。这个配置文件可以保存并导入DAW中的SoundID插件,或者可以从SoundID导出到几种硬件监听控制设备,包括带有SPQ卡的DADman接口、AVID MTRX Studio、Merging Technology的接口、Jones-Scanlon工作室监听音箱以及Dolby Atmos Renderer Mastering Suite。因此,这里有几种校准方案可供选择,这取决于你的预算,以及哪种类型的监听控制方案更符合你的工作流程。
5. 多声道房间的声学处理
数字化房间校正是必要的,但应在房间经过声学处理与优化后进行。现在我们都应该熟悉立体声工作室的声学处理;而多声道房间的处理则会稍微复杂一些,因为声音来自房间的多个方位,而且两个以上的扬声器(通常面对面)可以发出相同的声音。延时对齐、响度校准和电平匹配对于一个监听系统的准确性具有很大作用,但先让我们看看一些主要的声学处理因素。
靠近墙壁或天花板的扬声器的一个主要问题是扬声器的边际干涉(SBIR)。当扬声器的低频到达临近的墙壁/天花板并产生反射时,会对从音箱前方发出的特定狭窄范围低频产生抵消作用,这便是边际干涉。对于立体声监听,我们可以通过以下三种方式来缓解音箱的边际干涉:(1)在檐下安装扬声器;(2)将扬声器靠近前墙,并对前墙进行处理以吸收低至约150Hz的低频;(3)将扬声器放在距任何墙面2米或更远的地方,以将边际干涉频率降低到很低的频率。即便在3.5×3×2.4米的房间里,我们也应至少使用以上一种或多种解决方案对房间进行处理。
作为边际干涉的一个例子:安装在非常靠近墙壁和天花板的扬声器需要在它们背后做至少 10 到 15 厘米(4 英寸 – 6 英寸)的声学处理,以适当吸收低至 125 赫兹的能量。如果没有声学处理,一只扬声器正面距墙或天花板60厘米(24英寸),将会在140赫兹左右产生一个问题凹陷。移动该扬声器,使其正面离墙只有30厘米(12英寸)时,则会将抵消频率提高到280Hz,这就变成一个更容易处理的问题了。因此,在小房间里,建议对墙壁进行10厘米(4英寸)的吸声处理,并将扬声器尽可能地靠近墙壁。
靠近墙壁、天花板或角落的扬声器所造成的空间负载,与其说是声学问题,不如说是低频铺张问题,通过EQ修正扬声器的频率响应便可以解决。空间负载问题是扬声器在房间里少数几个可以轻松解决的频率响应问题一,用一个简单的搁架均衡即可。
关于时域对齐,即延时问题(如前所述),我们应确保从多个扬声器发出的声音到达听音点时相位一致。此外,建议在扬声器系统中使用同一系列的扬声器。为了获得最具凝聚力的声音印象,左、中、右扬声器应该是相同的,所有的环绕扬声器,以及所有顶置扬声器也应如此。例如,SoundID Reference甚至可以将不匹配的扬声器正确对齐,但所有的扬声器使用相同的型号,会产生最具凝聚力的声场。
对于多声道系统,和立体声系统一样,混音或制作间在所有频率上的衰减时间(T20)应保持均匀,一般在150ms到250ms之间。对于多声道系统,由于扬声器面向所有方向,应均匀地在房间内四周进行宽频率吸声处理。为减少边际干涉造成的频率抵消,在每只扬声器周围进行低频吸声处理是有必要的。除了大型多声道工作室以外,扩散器都不是必要的,因为房间内周围都有声源,这个声场只应属于这个回放系统。多声道房间内最后一个考虑因素,是尽可能多地在地板上铺设地毯。因为顶层扬声器均指向地面,侧面的扬声器也需要考虑到地板反射的问题。
对于立体声系统中的低音炮位置,通常需要反复试验才能找到合适的位置,使低音炮与主扬声器相匹配,而不会产生破坏性的驻波。对于多声道系统,我们可能需要一或两只低音炮来补充水平层扬声器,以及另一只(或两只)低音炮来补充顶层扬声器。鉴于安装顶置扬声器的可行性限制,这些扬声器往往具有更多频宽限制,因此通常建议使用低音炮来补充它们的输出。该低音炮很可能置于距天花板至少2.5米的位置,并且与四个顶置扬声器的距离不同。我们如何调整这一只或两只低音炮,使其与顶置扬声器发挥良好的作用?分频点设置在80Hz或更低频率下的低音炮基本上不容易被定位,但它们仍可能与不同的顶置扬声器有明显不同的相位差。我的建议是避免使用与顶置扬声器相关联的低频管理超低音箱,而是想办法使用全频顶置扬声器。
与立体声混音和母带处理的空间一样,正确理解多声道混音并确保混音在其他播放系统中正确回放的关键是设置好混音室,使其具有平直的频率响应,和所有频率范围上相似衰减时间。在多声道空间里处理低频的方式可能更加关键,因为更多扬声器被放置在靠墙和靠近角落的地方,那里肯定会出现激励。多声道混音令人兴奋的部分原因在于它们会产生更大的动态,这增强了瞬态的感觉,并由于房间内全频扬声器的数量,低音的存在感更加明显。然而,由于多声道空间提供了极为宽广的动态范围和清晰度,用耳机来验证混音是很重要的。无疑的是,大多数听众会通过流媒体服务通过耳机听到混音,所以我们有必要验证我们的混音在无论是否具备双耳渲染的情况下都能很好地在耳机中回放。
6. 平坦的声音和目标曲线
一个混音作品在不同空间之间回放的转换始终是一个问题,杜比公司在电影播放方面已经很好地解决了这个问题。在混音阶段,剧院发行的电影需要用 "X-curve "目标曲线进行校准。这个X-Curve曲线的开发是为了考虑到影院的大小和声学环境,以及听者(混音师)与扬声器的距离。对于立体声音乐,混音师和母带工程师倾向于选择中性或平坦的频率响应,以便能够很好地在典型的客厅家庭立体声系统中回放。杜比全景声音乐工作室最佳实践文档推荐将 "杜比全景声音乐目标曲线"(Dolby Atmos Music Target Curve) 用于全景声混音的商业音乐。该目标曲线考虑到了近场混音环境以及混音如何在典型的家庭立体声环境中回放。
杜比建议严格遵守目标曲线,尽管许多混音师认为杜比全景声音乐曲线与他们习惯的目标曲线没有明显区别。 SoundID Reference提供的目标曲线已在专业全景声混音室中验证过,可以提供杜比全景声音乐曲线。另一方面,索尼360建议在音乐混音中采用平坦的频率响应。基于这些不同标准,SoundID Reference允许用户在杜比目标曲线和平坦目标曲线之间快速切换。
杜比全景声音乐目标曲线与SoundID Reference中显示的平直曲线比较。用户只需点击一下鼠标,就可以在平直目标和
杜比建议对听音点周围的空间进行平均测量,SoundID进行37次空间测量并取平均值,得出其校准曲线。SoundID Reference for Multichannel允许你在平坦的目标曲线、杜比全景声音乐曲线或任何其他你想使用的自定义曲线之间轻松切换。如果你要把SoundID校正曲线导出到硬件设备上,比如AVID MTRX Studio,你可以选择导出任何你喜欢的曲线。
结论
设置多声道音频系统似乎是一项艰巨的任务,但通过采用适当的声学处理、扬声器相位对齐和校准,您可以获得出色的监听环境,可以很好地转换至其他多声道回放系统中播放。消费者用户的多声道回放系统往往会与典型混音系统环境截然不同,这种差异要比立体声系统更多。因此,搭建一个准确一致的混音环境是很重要的。即便如此,也要在工作室之外多种不同系统上评估你的混音。这个过程,至少会在你开始进行多声道混音时,提供重要的反馈信息,以便让你的混音在经过校准的房间里听起来足够好,也能在消费者播放系统和典型的家庭环境中得以出色的还原。