赵焕绮, 陈克安,, 闫靓, 周兵, 张建功, 张珺, 邓云云, 李晗, 李豪
(1.西北工业大学 航海学院, 陕西 西安 710072; 2.电网环境保护国家重点实验室, 湖北 武汉 430000)
机动车噪声作为道路交通噪声与车内噪声的主要来源,其控制方法包括无源控制和有源控制两大类,目的均在于降低噪声的声能量,它们被称为面向声能量降低的“减法控制”措施。
在实际工作中,“减法控制”措施遇到许多问题。例如在特定场合下降噪效果有限、降噪成本不可接受或降噪措施无法实施,有些场景下声能量降低后的噪声并不会带来听感舒适性提升。就车内声环境来说,单纯以降低噪声能量为目标的噪声控制方法已不能完全满足人们对汽车产品乘坐舒适性的要求,以声级为唯一评价指标的方法存在不足。
为了评价与表征声事件带给人的主观感受,声品质技术应运而生[1]。用人耳对声事件经听觉感知后做出的主观评价值作为描述声音的参量。由此来看,噪声对人的主要影响是引发烦恼感,因此大多数场景下噪声控制的本质就是抑制烦恼感。
于是,一种通过加入可听声以降低原始声烦恼感的噪声控制方法被人们提出,这种方法区别于以减少声能量为目的的“减法控制”,是一种“加法控制”措施,又称为音频注入法(audio injection)。在音频注入法中,原始噪声称为目标声(target sound),所加入的声音称为调控(controllable sound),混合后的声音称为叠加声(combined noise)。近年来,音频注入法引起了人们的广泛关注,其研究和初步应用也越来越多。
声景观是应用音频注入法最主要的方面。流水声是增强城市声景观的最佳声音[2]。Fan等的研究表明引入满意度高的声音是改善公园声环境的有效手段[3]。Joo等认为引入令人愉悦的自然声掩蔽城市噪声是一种改善声舒适性的重要策略[2]。
在环境噪声烦恼感抑制方面,自然声作为适宜的调控声被重点研究。添加需要的声音来掩蔽机械的声音是比较有效的[4-5]。Jeon等调查了流水声对城市噪声掩蔽的影响,认为声舒适性和响度的感知与噪声干扰之间存在较强的相关性[6]。李争光[7]研究了人体对叠加不同声音后的噪声暴露下噪声主观烦恼关系。Leung等[8]研究了流水声与道路交通噪声共同作用下噪声烦恼反应的多元预测模型。
在封闭空间内的声环境调控方面,Suhara等[9]提出了一种控制信号设计方法,用于掩蔽牙科治疗声中引起不舒适感的多个谱峰。Brocolini等[10]发现当存在可懂语音时,记忆任务表现会下降。
已有研究证明了音频注入法对改善听觉舒适性或降低噪声烦恼感的有效性[11],但是缺乏深入而细化的研究。对道路交通噪声而言,流水声是非常合适的调控声候选者[12]。
听觉属性差异很大的2种声音的可识别性不仅是声音特性的描述,也是调控声声级选择的参考依据。Gygi等[13]研究了常见环境声的检测和识别阈值。陈克安等[14]发现与声音时频性相近的噪声干扰对目标辨识率的影响大,而与声音时频性相差大的噪声干扰对目标辨识率的影响小。
本文以机动车噪声为目标声,开展音频注入下的绝对阈限实验和烦恼感主观评价实验,随后基于可识别性研究了目标声烦恼感降低的程度与范围,即“相消效应”存在的条件,同时对音频调控声进行了参数优化和音频注入效应的分析。
本文以8种机动车噪声为目标声,以3种舒适度较高的溪流声为调控声,研究叠加后的相消效应。研究表明,5 s时长的声样本可产生稳定的感知印象,且避免因时间过长而导致被试疲劳,可保证评价结果的准确性,所以声样本时长均为5 s。
以机动车噪声烦恼感音频调控为目标,选择大巴车、燃油汽车、电动汽车、摩托车4种机动车在2种时速下车内或驾驶者附近的8种噪声为目标声,声样本来自www.ponds.com,采样频率为44 100 Hz。此外,音频注入法不适用于高声压级目标声,且为了降低研究复杂度,将目标声声压级设为60 dB不变,其具体信息见表1。已有研究表明对烦恼感抑制来说溪流声比喷泉声和瀑布声更受青睐[12]。为此,本文选择溪流声为调控声。从www.ponds.com下载了3种溪流声作为调控声,声样本时长5 s,采样频率从48 000 Hz降为44 100 Hz。
在音频注入法中,将调控声视为信号,目标声视为噪声,设置一系列不同的信噪比(RSN),2种声音组合后得到不同的叠加声。RSN定义如(1)式所示
(1)
式中,PC,PT分别为调控声和目标声的声功率。
将8种目标声和3种调控声以不同RSN混合得到叠加声用于后续主观评价实验或预测。
表1 目标声信息与参数
为得到叠加声烦恼度评分,本次实验分为两部分:调控声阈限值研究和叠加声烦恼度评价。第1部分实验为第2部分实验获得调控声声压级提供依据,第2部分实验为研究相消效应提供依据。
分3次进行实验,每次实验完成一种调控声的评价。被试由不完全相同的13名(男10名,女3名)20~24岁听力状况良好的在校大学生组成。
主观评价实验在安静适宜的普通房间进行。房间的本底噪声为47.5 dB。利用计算机对声样本随机排序后由Windows Media Player音频播放软件通过一个24位声卡传至16通道耳机放大器(BEHRINGER HA4700),然后经动圈式高保真监听级头戴耳机(SENNHEISER HD280)播放给被试。
第1部分实验为绝对阈限实验,分别通过极限法获得调控声的下阈限(lower threshold)和上阈限(upper threshold)。其中,下阈限TL是指固定目标噪声级下,人们刚好能够感觉到调控声的声压级;上阈限TU是指固定目标噪声级下,人们刚好感觉不到目标噪声时对应的调控声声压级。获取下、上阈限值的目的不仅在于明确调控声声级范围,为后续声级选择提供依据。本文将下、上阈限覆盖范围称为阈限范围,由于目标声与调控声是2种感知属性差异较大的声音,研究其阈限范围ΔT(ΔT=TU-TL)可为后续机理阐释提供参考。第2部分实验为参考评分实验,在阈限范围内,通过参考评分法得到不同信噪比下叠加声烦恼度评分。
2.3.1 绝对阈限实验
在绝对阈限实验中,要求评价人员熟悉声样本列表,对整体声样本有一个全面的了解。RSN以2 dB为步长叠加得到叠加声。使用心理物理学的经典方法之一的极限法,其主要特点是刺激按照“递增”(用↑标记)或“递减”(用↓标记)的2种序列逐级进行微小变化。即将叠加声中调控声的声压级按↑↓↓↑的顺序播放4遍,被试每听完5 s的声样本有2 s的时间判断是否能听到调控声或目标声。
根据被试有无检测到调控声或目标声反应变化的转折点两值的平均值,即为对应的绝对阈限;多次测试的平均即为该调控声的最终绝对阈限。
2.3.2 烦恼度评价实验
使用烦恼度作为叠加声烦恼感评价的量化指标,烦恼度评分记作A。本实验采用参考评分法,等间隔的测量等级以满足线型回归及其他统计技术的需要。在8种目标声中选取1个声样本为参考样本,该声样本的物理特性在全体声样本中处于中等位置附近。评价尺度见表2。
表2 评价尺度
选取绝对阈限范围内的一部分叠加声作为参评声样本,随机播放打分。由于有被试报告RSN过大会影响实验进行,而且RSN过小没有起到明显的相消作用,所以该部分叠加声RSN的起始并不严格按照阈限值。
主试讲解实验目的、流程、注意事项,解答被试的疑问。在阈值范围内,以3 dB为步长,叠加得到叠加声并进行参考评分,声样本序列随机播放。
实验期间被试每次听到1对声音,每对包含2段5 s的声音,中间间隔1 s。第1段声音为参考样本,烦恼度评分设定为5分,第2段声音为待评价样本。在听完每对声音后,被试有3 s的时间进行比较,相对于参考样本来说待评价样本的烦恼度等级,并对其打分。其中“9”、“5”和“1”表示待评价样本相对参考样本“非常烦恼”、“同样烦恼”和“非常不烦恼”。被试听完1对声样本后进行线上打分直至序列播放完毕,形成作为第1组数据。选取待评价声样本约1/3进行重复打分,作为第2组数据。最后选出合适的被试打分取平均值作为每个声样本的最终烦恼度评分。
为保证后续分析结果的准确性,首先对数据进行有效性检验。
2.4.1 误判分析
实际中,允许同一评价者对同一声样本多次重复评价的结果间存在一定程度的差异,只要这一差异超过某一数值的概率低于可接受性检验的显著水平即可。对13名被试烦恼度评分的第2组和第1组数据中对应的数据进行误判分析,若2个评分值的数值之差大于2,则视为不可允许误判,实际中,如果某个被试的误判率大于0.4,则剔除该被试。图1为参考评分的误判分析,剔除被试12。
图1 参考评分的误判分析图
2.4.2 相关分析
对13名被试烦恼度评分的第2组数据和第1组数据中对应的数据进行相关分析,即同一被试评价同一叠加声,获得该叠加声的2组评分。如图2所示,被试评分数据整体上具有较好的一致性,将Pearson相关系数低于0.5的予以剔除,3次实验分别为剔除被试3,5,6,8,11和被试3,6,9,13以及被试5,7,9,10,11,12。
图2 参考评分的误判分析图
本节结合实验结果,对目标声与调控声自身特性进行分析,研究相消效应的产生与影响因素。
利用2.3.1节给出的方法,获得了调控声的阈限值,计算得到了3个调控声在不同目标声下的下阈限、上阈限及其覆盖范围,如图3所示。
图3 调控声的下、上阈限及其范围
在由第i个目标声和第j个调控声组成的叠加声中(i∈[1,8],j∈[1,3]),第j个调控声的阈限范围定义为ΔTi,j,如(2)式所示
ΔTi,j=TU,ij-TL,ij
(2)
式中,TU,ij,TL,ij分别表示由第i个目标声和第j个调控声组成的叠加声中调控声的上、下阈限值。
虽然前文中提到的阈限值和阈限范围等概念是针对调控声的,但对不同的目标声情况不一样,所以阈限范围也是相对目标声来说的一个量,可以描述目标声的特性。阈限范围也可以作为判断2个声音可识别性的一种体现。可识别性是指一个声音与另一个感知属性不同的声音混合后,该声音被识别出来的难易程度。本研究中,将可识别度定义为I,作为衡量可识别性的一种指标,用阈限范围的均值来表示。因此每个目标声的可识别度用3个调控声下阈限范围长度的均值表示;每个调控声的可识别度用8个目标声下阈限范围长度的均值表示。第i个目标声的可识别度Ii定义如(3)式所示,同理,第j个调控声的可识别度Ij定义如(4)式所示,各目标声和调控声的可识别度如图4所示。
图4 不同目标声和调控声的可识别度
(3)
(4)
所有目标声和调控声可识别度的均值为35.04 dB,在图4中用黑色虚线表示,所以选择35 dB为本实验中可识别度分类线。可见,可识别度高于35 dB的有目标声5,6,8和调控声1;可识别度低于35 dB的有目标声1,2,3,4,7和调控声2,3。
调控声注入后,叠加声烦恼感较目标声烦恼感下降的现象称为相消效应,它所依赖的因素是一个基础性问题,也是调控声设计的基本前提。
烦恼度评分的实验结果经数据处理后,每个叠加声的烦恼度评分如图5所示。每幅图中黑实线为目标声的烦恼度评分,黑实线以下的区域为相消效应发生的区域。可以看出大多数情况下加入调控声后叠加声的烦恼度下降了,大部分叠加声烦恼度会先下降后上升。调控效果最好时对应的RSN可从图中看出。由图可见,调控声1更适合目标声5和8;调控声2更适合目标声2和6;调控声3更适合目标声1,3,4和7。
图5 不同目标声下叠加声的烦恼度
其中,将烦恼度下降值ΔA定义为加入调控声前后目标声烦恼度与叠加声烦恼度之差,如(5)式所示
ΔA=AB-AA
(5)
式中,AB,AA分别为加入调控声前后目标声和叠加声的烦恼度。
将使目标声烦恼度下降最大的调控声称为最优调控声,对应的信噪比为最佳信噪比RSNO。根据烦恼度评分实验的结果,可知目标声5和8的最优调控声为调控声1;目标声2和6的最优调控声为调控声2;目标声1,3,4和7的最优调控声为调控声3。加入最优调控声后的ΔA及RSNO如图6所示。其中,左纵坐标为烦恼度下降值ΔA,右纵坐标为最佳信噪比RSNO,分别用蓝色和红色竖线表示。
图6 加入最优调控声后各目标声的ΔA及其RSNO
目标声与调控声的特性都与相消效应的发生有关,不同调控声适合不同的目标声。由以上结果可知,对于大部分可识别度高于35 dB的目标声,如目标声5和8,其最佳调控声的可识别度也高于35 dB,并且其对应的RSNO大,在-7 dB及以上;而对于可识别度低于35 dB的目标声,如目标声1,2,3,4和7,其最佳调控声的可识别度也低于35 dB,并且除了目标声2,其余目标声对应的RSNO小,在-15 dB及以下。由图6可知,加入最优调控声后,对于可识别度高于35 dB的目标声,其ΔA的均值低于可识别度低于35 dB的目标声。
利用SPSS软件进行多因素方差分析,进一步确定目标声与调控声的可识别度对叠加声烦恼度下降值的影响。为研究相消效应影响因素,选择相消效应区内的数据进行分析。影响因素为目标声和调控声的可识别度分类(分类为1表示其可识别度小于35 dB,分类为2表示其可识别度大于35 dB)。由显著性结果可知,目标声可识别度分类的影响显著,调控声可识别度分类的影响不显著,两者的交叉项影响也是显著的。目标声和调控声可识别度分类对ΔA影响如图7所示,可见,与最佳调控声的规律一致,即可识别度小的目标声与可识别度小的调控声混合后,叠加声的烦恼度下降值更大;可识别度大的目标声与可识别度大的调控声混合后,叠加声的烦恼度下降值更大。
图7 目标声和调控声可识别度分类对ΔA影响
总的说来,如果目标声的可识别度高,要求最佳调控声的RSN大、可识别度高,叠加后ΔA较小;反之,如果目标声的可识度低,要求最佳调控声的RSN小、可识别度低,叠加后ΔA较大。这说明对于听感显著的目标声,要求调控声的听感显著且能量较大,但烦恼度下降值却较小;反之对于听感不明显的目标声,要求调控声的听感也不明显,需要的能量也较低,但烦恼度下降值却较大。
当然,以上结论也不是绝对的,可识别度高于35 dB的目标声6和可识别度低于35dB的目标声2就是2个例外。从最佳调控声的角度看,目标声6不符合上述规律。但由图5可见,对目标声6来说,3种调控声下的ΔA都很小,且数值相近,虽然调控声2为其最佳调控声,但可能存在偶然因素。从RSNO的角度看,目标声6和目标声2不符合上述规律,可能与其他因素有关。
上述现象表明,相消效应源于能量掩蔽和信息掩蔽的共同作用。当目标声和调控声同时出现,且两者在频谱上互相重叠时,目标声和调控声一起激活了听觉外周神经系统中的相同成分,发生了能量掩蔽。根据能量掩蔽特性[15]:频率相近的纯音容易互相掩蔽;提高掩蔽声的声压级会增加掩蔽量,本实验中的目标声和调控声有频率相近的成分,而且大多数情况下ΔA会随RSN的增大而增大,因此能量掩蔽是烦恼度降低的因素之一。但由以上对可识别性的讨论以及例外的出现可知,烦恼度的降低不能都归因于能量掩蔽,有时是通过转移注意力来达到掩蔽的效果。所以,对此可以用能量掩蔽之外的掩蔽,即信息掩蔽来解释。信息掩蔽是由刺激的不确定性导致的阈值升高[16],是发生在听觉中枢层次上的掩蔽[15]。所以对于本实验中烦恼度的降低,能量掩蔽和信息掩蔽都有贡献,但各成分占比多少是一个很复杂的问题,有待进一步研究。
本文选取4种车型不同速度下的8种机动车噪声作为目标声,3种溪流声为调控声开展主观评价实验。研究了基于音频注入的机动车噪声烦恼感抑制特性,从多个角度研究了调控声叠加后烦恼感“相消效应”的影响因素。
研究发现:①对于大多数可识别度高于35 dB的目标声,其最佳调控声的可识别度也高于35 dB,且其RSNO大,在-7 dB及以上。②对于大多数可识别度低于35 dB的目标声,其最佳调控声的可识别度也低于35 dB,且其RSNO小,在-15 dB及以下。③加入最优调控声后,可识别度高于35 dB的目标声的ΔA均值低于可识别度低于35 dB的目标声。④能量掩蔽和信息掩蔽对烦恼度的降低都有贡献,但各自的占比有待进一步研究。
从最佳信噪比的角度来看,本文结果与前人的研究结果基本一致[6,12],即当调控声声压级比目标声小3 dB及以上时,调控效果最好;从听觉特性角度看,前人研究认为当流水声的愉悦度越高,与道路交通噪声混合后的总愉悦度将越高[17]。本研究还进一步增加了目标声种类并对其听觉感知特性进行了分类,得到了目标声与调控声需基于可识别度进行最佳匹配的初步结论。
可识别度可以作为选择调控声的重要依据,对于可识别度高的目标声,应选择可识别度高、RSN大的调控声;对于可识别度低的目标声,应选择可识别度低、RSN小的调控声。
为使本文研究更加深入,可对信噪比参数进行优化;增加调控声的种类,拓宽调控声的选择和研究范围。在音频注入法中,调控声与目标声叠加后引发的听觉感知效应是一种复杂的心理声学现象,最优调控声设计涉及到对音频注入效应基本特性、物理机制及数学建模等方面的研究,需长期努力。