从两声道立体声、多声道环绕声再到三维沉浸式音效,接近真实世界和创作者意图的观影体验逐渐呈现在观众的面前。当我们谈论三维音效时,我们往往惊叹于音箱数量之多,聚焦于精确的音箱摆位,热衷于探究杜比全景声、DTS:X和AURO-3D等主流沉浸式音频格式的同与异。但你是否想过,作为三维音效的核心,高度声道究竟从何而来?高度扬声器的数量和布局如何演变?这当中,又涉及哪些有趣的建筑声学和心理声学知识呢?
从建筑声学开始说起
在新近出版的《沉浸式声音:双耳声和多声道音频的艺术与科学》一书中,作者Paul Geluso尝试从建筑声学的角度,来探究高度声像/声场的起源。他提到,即使史前时期的音乐家和神职人员也知道,洞穴中辐射的声音会增加感知响度,从而提升人们对于神明的敬畏感。在音乐的发展历程中,音乐家和观众逐渐意识到声学环境能够显著改变人们欣赏音乐表演的体验,甚至“一个特定的声学环境可以被视作乐器来处理”。
位于马萨诸塞州的 Koussevitzky Music Shed 音乐厅
很多建筑设计师们也早将目光紧紧投注在房顶样式和空间高度上。Paul Geluso举了两个例子,一个是位于马萨诸塞州的Koussevitzky Music Shed音乐厅,另一个是日本的Yamaha Ginza音乐厅。前者为了解决音乐听感浑浊的情况,在乐队和前排观众的头顶上搭了一个类似“天棚”的结构。这个天棚由一系列大尺寸的三角形构成,其中有50%的表面积是开孔的,看上去像许多巨大的蝙蝠翅膀连接在一起(见图1)。书中提到,这样设计的目的在于“一半声音从开孔的位置穿过,到达上方空间,保证混响时间不变,另一半声音通过反射回到观众区,增加声音的清晰度和亲切感。”
Yamaha Ginza 音乐厅位于东京,特点是内部空间宽度较窄,但是房顶很高
Yamaha Ginza音乐厅位于东京,特点是内部空间宽度较窄,但是房顶很高。设计师为了塑造更强烈的空间感,在音乐厅的顶部增设了一个拱形表面和若干可移动的反射体(见图2)。可别小看这几块反射体,它们一方面可以增强乐器的直达声,另一方面能调整正面和侧方的声学能量,塑造更适宜的空间感。通过控制反射体的高度,甚至可以调整声像的感知尺寸(或范围)。
ITU-R BS.2051-0 标准建议书提议以“X/Y/Z.LFE”格式进一步明确了各层前/侧/后(加LFE)扬声器的数量
高度声道的感知和方向性频段
上期,我们已经在《神秘的“幻象声像/声场”从何而来?》中为各位简单介绍了基于双耳时间差(ITD,intramural time difference)和双耳电平差(ILD,interaural level difference)的定位机制。需要注意的是,这些双耳间的信息差异对于感知高度声源的方向和空间信息并没有那么重要,相反,肩膀、头部和耳廓反射塑造出的频率变化影响更大,尤其是声源位于正中平面的时候。阿强家庭影院
1996年,Jens Blauert在对相关现象进行深入研究之后,发现了声源位置与特定频段的增减之间有特别的关系,并将这些频段命名为“方向性频段”,比如8kHz为中心的频段就与头顶位置相关。在他之后,相关研究也没有停止。虽然得出的数据和结果略显不同,但无一不证明“方向性频段”的存在。“以8kHz为中心频率的1/3倍频程频段与正中平面上的头顶位置听觉密切相关。”
简单来说,当高度信号被辐射时,方向性频段会影响感知高度。举个例子,如果将Hi-Hat踩镲声(主要集中在8kHz)定位在前上方扬声器中,由于高度方向性频段在信号频谱中占据主导,实际听感方位可能比预期更高。因此在实际应用中,一方面要考虑频率内容对声音信号的合理分布产生的影响;另一方面,可以通过调整方向性频段的频率,在不使用高度扬声器的情况下提高感知声像的位置。
虚拟的高度声像
这就相当于,获得一个虚拟的高度声像 。Tomlinson Holman在《多声道环绕声技术(第二版)》 书中谈到幻象声场/声像的来源时,说道“当反射声电平增高到某一水平时,‘综合定位效应’开始起作用,使两个声源之间的方位被听音者判断为声源的方位,从而产生了幻象声源,在扬声器之间形成幻象声像。”发烧友们对这一概念最真切的体会应该是在聆听两声道Hi-Fi音乐时,感觉歌手就站在自己的面前唱歌。很多时候,我们对虚拟声像的讨论也多是集中在水平方向的扬声器之间,那么,水平扬声器和高度扬声器之间也能获得一个稳定的虚拟声像吗?针对这个问题,研究人员进行了多项心理声学实验,并得出以下结论:
当ICTD(Inter-Channel Time Difference通道间时间差)小于10ms时,小于6-7dB的ICLD(Inter-Channel Level Difference通道间强度差/电平差)仅对高度声道的信号产生水平方向的定位。而当高度扬声器相较水平扬声器的ICLD高于7dB时,就会提升虚拟声像的高度。
10dB的ICLD可以将声像从一个水平面提升到另一个水平面。
值得注意的是,多个研究结果都表明,虽然两只扬声器可以对高度声像的定位进行渲染,但高度声像定位无法像水平的前置声像定位那么准确。
AuroMax 格式最高支持 26.1 声道系统
高度扬声器的数量演变
基于此,多家机构开始陆续提出了包含高度声道在内的三维扬声器布局。ITU-R BS.2051-0标准建议书(ITU,2014)中对此有着非常详细的阐述,并建议用用“上方扬声器数量+中部扬声器数量+下方扬声器数量”的形式来表示三维扬声器布局。其中上方指的是高度平面,中部表示的是靠近人耳的水平平面,下方指的是地平面。按照这个说法,传统的5.1声道系统可以被标记为0+5+0布局。在此基础上,建议书甚至提议以“X/Y/Z.LFE”格式进一步明确了各层前/侧/后(加LFE)扬声器的数量,如图3所示。
Tomlinson Holman 曾提出在 2+8+0 的布局基础上增加两只低音炮,从而得到我们熟悉的 THX10.2 系统
THX10.2
按照中层扬声器成双成对的逻辑,高度扬声器的布局演变从两只上层扬声器开始。它们的位置通常是在左前和右前扬声器的上方,与中层的扬声器配合使用,让听众能获得自然的纵深感。Tomlinson Holman曾提出在2+8+0的布局基础上增加两只低音炮,从而得到我们熟悉的THX10.2系统。
2010年,Kim、Lee和Pulkki为确定所需高度扬声器的数量做了一项研究,让听音者们对0、2、3、4和9只上层扬声器布局的定位和空间感进行评价。就整体效果而言,听音者们均认为9只扬声器的布局更加出色,而3-4只扬声器能提供可信的方向性特征。
AURO-3D
AURO Technologies也对扬声器的数量和位置进行了许多探索,包括使用4只或更多数量的高度扬声器、将上层扬声器直接放置在中层扬声器的正上方、增加一个头顶正上方的扬声器(也被称为VOG:Voice-of-the-God上帝之声)。
2006年,AURO -3D的概念被正式提出。专利的AURO -MATIC技术甚至能将传统立体声或环绕声音源渲染出适用于AURO -3D扬声器布局的AURO -3D声场。2015年,AURO Technologies宣布推出新一代的三维沉浸式音效格式——AuroMax,最高支持26.1声道系统。
NHK22.2
可能很多人不知道的是,早在2003年,日本广播公司NHK就提出了一套22.2(9+10+3)的多声道系统。在屏幕范围内使用了5只中层扬声器、3只上层扬声器和3只下层扬声器。除此之外,还有11只扬声器对屏幕外的沉浸式体验进行扩展。
后来,Hamasaki等人进行了两声道、5.1声道和22.2声道系统主观特点的比较研究。参加实验的听音者们都认为22.2声道在所有测试项目(响度除外)上均超过两声道系统,并且在以下六个方面超过5.1声道系统:前/后区分度、上/下区分度、运动、方向、混响和包围感。
《沉浸式声音:双耳声和多声道音频的艺术与科学》一书中对这个实验进行了详细的描述,并特别指出“22.2系统能够为更多听音者提供相似的听音体验”,即“扩展了有效听音区”。
2011年,Hamasaki在后续论文中进一步总结了9+10+3扬声器布局需要做到的五个特征:
完整性:能够在屏幕上的任何位置对声像进行定位;
全向性:以听音者为中心,能重播任何方向上的声音;
临场感:能够呈现自然、高品质的三维空间;
兼容性:能够与现有多声道格式兼容;
可用性:能够支持实况录音和实况播出。
DTS:X 诞生之初还仅支持 7.1.4 声道
杜比全景声是目前应用最广泛的三维音频格式之一
借助杜比反射式音箱模块来增强上方声场的表现力
最新的 DTS:X Pro 格式已经能在 7.1.6、13.2.9 及更多声道的布局中配置多达32只扬声器,实现 5 层架构
杜比全景声和DTS:X
时间来到2012年前后,杜比全景声(Dolby Atmos)和DTS:X格式相继登场。这两个基于对象的音频格式在商用和家用领域都发展迅猛,以后来者居上的姿态,成为与AURO-3D并驾齐驱的主流三维音频格式。目前杜比全景声格式最高支持24.1.10扬声器布局。
DTS:X也不遑多让,诞生之初还仅支持7.1.4声道,最新的DTS:X Pro格式已经能在7.1.6、13.2.9及更多声道的布局中配置多达32只扬声器,实现5层架构。阿强家庭影院
高度扬声器的布局影响
数量是最直观的,但高度扬声器的布局和摆位也不容忽视。2015年,Kim、King和Kamekawa对4+5+0扬声器布局中的高度扬声器布局进行了比较。研究人员将12只高度扬声器放置在水平方位角不同,而高度角相同(+30°)的位置,每次选择4只扬声器来重播高度声道的信息,共有8种不同的组合方式。
结果显示,高度扬声器的位置比信号内容(如混响类型/音乐选择)所带来的影响更大。听音者在进行布局选择时,会更倾向于选择那些“前额的”“狭窄的”声像,能提供强烈的临场感而非更好的整体空间感。另外,扬声器布局也会影响听众对声场的感知,从而影响对整体音质的评判。
参考资料
1《沉浸式声音:双耳声和多声道音频的艺术与科学》Paul Geluso著,翼翔译,人民邮电出版社,2021年
2《多声道环绕声技术(第二版)》 Tomlinson Holman著,王珏译,人民邮电出版社,2011年
3《ITU-R BS.2051-0建议书(02/2014)》,国际电信联盟发布,2014