瞬态响应对耳机清晰度的影响

2017-03-23 22:20李光炬桑晋秋郑成诗李晓东于丽玫

中国听力语言康复科学杂志 2017年2期

李光炬桑晋秋# 郑成诗李晓东于丽玫

1 引言

耳机作为最常用的声重放设备，在现代通信、家用音频播放器、虚拟现实、智能硬件、听力康复等领域应用广泛。采用耳机进行声重放时，双耳声信号依次经耳机重放、耳廓的耦合与传输到达鼓膜，引入了耳机到鼓膜的传递函数（headphone-to-eardrum transfer function，HETF）[1]。由于耳机本身往往并非理想电声系统以及耳机与耳廓的耦合作用，使得HETF具有明显的峰谷结构，这会影响到耳机还原双耳声信号的音色与空间信息。耳机均衡可以消除HETF明显的峰谷结构，改善耳机重放效果。耳机的幅频响应和相频响应是耳机重放效果的常用客观指标，反映耳机的频域特性。耳机的瞬态响应反映耳机的时域特性，即反映耳机对突发信号的跟随能力与还原能力，对耳机重放有重要影响，是检验耳机均衡质量的重要客观标准。耳机瞬态响应的衰减特性是否对耳机清晰度产生显著影响尚未有深入研究。

由于耳机与助听器发声单元类似，对耳机清晰度的研究也对如何提高助听器言语或音乐的清晰度起指导作用。目前助听器中对言语清晰度的研究比较关注言语材料本身的清晰度（如掩蔽声对目标声的影响），而忽视了助听器中发生单元的物理特性对清晰度的影响。为了排除助听器本身若干因素（如验配公式、自动增益控制、麦克风输入特性）的干扰，本研究目前采用普通耳机来研究发声单元的瞬态特性对主观清晰度的影响。

耳机均衡方法可以借鉴扬声器的均衡方法，如FIR均衡方法[2]、IIR均衡方法[3]、Kautz均衡方法[4]和双二阶IIR级联结构的均衡方法[5～6]。本文利用不同的耳机均衡方法分别对罩耳式耳机与耳塞式耳机进行耳机均衡，根据客观指标与主观评价实验，探讨了瞬态响应对耳机清晰度的影响。

2 瞬态响应的物理意义与衡量标准

2.1 瞬态响应的物理意义

瞬态响应是指激励信号接入以后，完全响应中瞬时出现的有关成分，随着时间增大，它将消失。耳机瞬态响应反应了耳机对突发信号的跟随能力和还原能力。瞬态响应好的耳机应当是信号一来就立即响应，信号一停就戛然而止。在假定耳机为线性系统的前提下，耳机的冲激响应可以反应耳机的瞬态响应。

当瞬态响应不佳时，影响系统对突发信号的跟随能力与还原能力，当瞬态响应最佳时，耳机得到一个更快的衰减时间，获得更加清晰的直达声。

2.2 瞬态响应的衡量标准

耳机瞬态特性用经耳机的瞬态响应衰减时间T60来衡量，即混响时间[7]。Schroeder在1965年提出计算混响时间的方法[8]，它采用能量衰减曲线（energy decay curve，EDC）表达直达声的衰减特性，如下式所示：

3 耳机均衡原理与方法

3.1 耳机均衡原理

由于耳机重放时引入HETF，实际到达聆听者鼓膜处的声信号与馈给耳机的声信号存在以下频域关系：

因此，为了消除耳机传输特性的影响，需将实际的双耳信号声信号经均衡滤波器滤波后，才馈给耳机重放，表示如下：

可见，理想的耳机均衡滤波器是HETF的逆滤波器。实际中，由于聆听者的个性化差异，采用在人工头上测量的耳机到鼓膜的传递函数来设计，耳机均衡后不能完全消除聆听者的HETF，使得均衡后耳机到鼓膜的传递函数的频响不平直，从而使鼓膜处实际接收的声信号频谱产生误差。因此，需要较合理的均衡方法对HETF进行均衡，最大化地减小误差。

3.2 耳机均衡方法

3.2.1 FIR method 该方法的设计基于最小二乘准则[9]，采用正则化滤波器使均衡误差最小化[10]。

3.2.2 IIR method 该方法的设计基于Hawksford等人提出的IIR均衡方法[3，11]，采用IIR模型模拟系统，并对系统建立混合相位模型，将混合相位模型分离为最小相位系统和全通系统，分别均衡频域的幅频响应与相频响应。

3.2.3 Kautz method 该方法的设计基于Matti等人提出的利用Kautz滤波器均衡扬声器系统的方法[4]。其滤波器由权系数与一组极点决定，权系数由最小二乘算法求解，极点组由对数刻度放置极点的固定设置法求解。

3.2.4 Ramos-Lopez method 该方法的设计基于Ramos和Lopez提出的双二阶滤波器链结构均衡方法[5～6]，该方法的均衡思想是寻找代价函数的峰谷对其进行均衡。

4 耳机的选择

4.1 HETF测量实验

实验耳机采用编号为HP1、HP2两款耳机，分别是Edifier H180耳塞式耳机、Sennheiser HD202罩耳式耳机。罩耳式耳机耳罩较大，因整个发声单元（连耳绵）能完全将耳廓盖住，所以佩带时相对舒适。耳塞式耳机则是把发音单元塞在耳孔之外。入耳式耳机外表和轻巧程度像耳塞，发音单位伸入耳道之内，比耳塞更接近鼓膜。

图1是HETF测量原理方框图。采用最大长度序列(maximum length sequences，MLS）信号作为激励信号，将由计算机产生的MLS(长度为 213-1，8次平均，44.1 kHz采样)信号经B&K PULSE的D/A馈给戴在B&K人工头上的耳机进行重放。声信号由B&K人工头鼓膜处的B&K 4192压力场传声器捡拾，再经B&K PULSE的A/D变换器输入到计算机进行记录，将记录到的信号进行解卷积以及傅立叶变换，即得到HETF。每款耳机进行4次重复测量，每次测量后，将耳机取下并重新戴上，然后进行新一次测量。

图1 HETF测量原理的方框图

4.2 HETF测量结果及分析

图2为两款耳机的HETF在B&K HATS type 4128左耳处的4次测量结果，以幅频响应的形式给出，频率范围为20 Hz～20 kHz

图2 耳机的HETF四次测量结果

图2（a）表明HP1耳机的HETF测量重复性很好。10 kHz以下范围标准偏差都小于2 dB。这是由于耳塞式耳机直接与耳道耦合，组成一维传输系统，避免了耳廓因素的影响。

图2（b）表明HP2耳机的HETF测量重复性较好，相应的标准偏差在0.1～10 kHz的范围内基本都在3 dB以下。耳罩式耳机的HETF测量重复性，不仅受到耳廓的耦合作用影响，重复佩戴时耳罩位置的细微变化也会对传输函数造成一定的影响，如在高频上出现较多的峰谷。

不同研究得到的HETF测量重复性的结论不同。Pralong等人的研究[12]表明耳罩式耳机具有较好的测量重复性。饶丹等人的研究表明[13]耳塞式耳机具有很好的测量重复性。

通过上述实验分析，确定了HP1、HP2耳机的HETF测量重复性较高，可用于耳机均衡。

5 客观均衡结果

利用3.2节的耳机均衡方法对HP1、HP2耳机进行均衡，本文只给出HP2耳机左耳的均衡结果。

图3 耳机冲激响应响应(HP2)

图3为不同均衡方法均衡后的耳机冲激响应。利用式（2）计算均衡前后耳机瞬态响应衰减60 dB所需时间，见表1。

表1 HP2耳机瞬态响应衰减时间T60(ms)

由表1可知，与HP2耳机的原始瞬态响应衰减时间比较，FIR method的瞬态响应衰减时间很小，Ramos-Lopez method的瞬态响应衰减时间较大，IIR method与Kautz method的瞬态响应衰减时间与原始瞬态响应衰减时间相差不大。

6 主观评价实验

6.1 原理和方法

耳机均衡时瞬态响应上的差异，对耳机声信号的清晰度造成怎样的影响尚需结合主观评价实验来验证。

试验音频由录制的两类声音素材(弦乐、对白)与HP1、HP2耳机的HETF的逆函数卷积得到。弦乐与对白涵盖不同的频率范围，有利于进行较为全面的主观比较。试验音频经HP1与HP2耳机播放给受试者聆听。共有30名受试者参与主观评价实验，年龄介于25～30岁之间，听力正常，其中15人有较丰富的听音经验，其余15人有参与听音试验的经历，对声音信号方面都比较熟悉。

主观评价实验方法采用MUSHRAM方法[14](本文主观评价实验不设置参考试验音频，所有试验音频均进行盲听)，要求受试者对试验音频的音色进行评价，尤其关注清晰度。评分标准参ITU-RBS.1534-1主观测试标准[15]，打分区间为0～100，音色越好，打分越高。受试者通过MUSHRAM音色测试界面进行操作，点击“Play”按钮聆听试验音频，可以反复听多次，最后拖动滑动按钮给出评分。在主观评价实验之前先对试验音频进行编号，具体做法为：每名受试者随机听取两类试验音频，每类试验音频包含5种不同处理方法，分别为original response(Ⅰ)、FIR method(Ⅱ)、IIR method(Ⅲ)、Kautz method(Ⅳ)、Ramos-Lopez method(Ⅴ)。在正式听音试验前，每名受试者完成至少一次完整试听比较练习，以便熟悉试验打分标准。

6.2 结果与分析

主观评价实验结果采用统计软件SPSS 16.0[16]，使用单因素方差分析5种不同处理方法对耳机清晰度影响的差异性。P表示统计学差异，取（P＜0.01）具有极显著统计学差异。

30名受试者主观评价实验的平均得分与标准偏差，如图4所示。

图4（a）表示弦乐的主观评价实验的平均得分与标准偏差，表2为弦乐的组间比较的统计分析结果。Ⅱ平均得分63.1为最高，Ⅱ和其他几种方法之间都具有显著统计学差异（表2），说明Ⅱ显著最好。Ⅴ平均得分56.4为最低。Ⅴ和其他几种方法之间都具有显著统计学差异（表2），说明Ⅴ显著最差。结合表1可以看到，II对应的瞬态响应衰减最快，Ⅴ对应的瞬态响应衰减最慢，这就反映了耳机重放声信号的清晰度与瞬态响应的衰减特性相关，瞬态响应衰减时间越短，耳机重放声信号的清晰度越好。Ⅰ、Ⅲ、Ⅳ之间无统计学差异(表2)，对应的瞬态响应衰减时间相差不大，耳机重放声信号的清晰度差别不显著。

表2 组间比较分析(弦乐)

图4（b）表示对白的主观评价实验的平均得分与标准偏差，Ⅱ平均得分62.2为最高，Ⅴ平均得分55.5为最低。表3为对白组间比较的统计分析结果，组间比较分析结果表明了对白具有与弦乐类似的特征，Ⅱ显著最好，Ⅴ显著最差。这也说明瞬态响应衰减时间越短，耳机重放声源的清晰度越好。

表3 组间比较分析(对白)

7 结论

本文通过客观指标与主观评价实验探讨了瞬态响应的衰减特性对耳机重放后清晰度的影响。耳机重放过程中，瞬态响应衰减越快，耳机获得清晰的直达声，耳机的音色不再浑浊，清晰度较好；相反，瞬态响应衰减越慢，两个不同时间点的瞬态信号出现混叠现象，即前一个瞬态信号播出后，系统还在振动，而下一个瞬态信号播出时与前一个瞬态信号产生多余振动重合，导致耳机声信号在重放过程中，音色出现浑浊，清晰度差。这表明，瞬态响应衰减时间越小，耳机重放后的清晰度效果越好。

图4 30名受试者主观评价实验平均得分与标准偏差

主观评价实验结果同样表明，瞬态响应的衰减越快，耳机重放后的清晰度越好。本研究采用了弦乐和对白两种测试素材，既包含了对音乐素材的测试，也包含了对言语素材的测试。本研究目前只是针对健听人士的耳机补偿效果评估，但同样可以延伸至助听器的验配补偿，助听器的发声单元也是耳机的一种形式，助听器验配补偿后的瞬态响应也是值得关注的重要特性，预计会影响听障人士对言语清晰度的感受。为了排除助听器本身若干因素（如验配公式、自动增益控制）的干扰，本研究目前只是采用普通耳机来研究其瞬态特性对主观清晰度的影响。助听器瞬态特性对音乐或言语清晰度的影响还需要进一步的研究来检验。

[1]Moller H.Fundamentals of binaural technology[J].Applied Acoustics，1992，36(3-4)：171-218.

[2]Clarkson PM，Mourjopoulos J，Hammond JK.Spectral，phase，and transient equalization for audio systems[J].Journal of the Audio Engineering Society，1985，33(3)：127-132.

[3]Greenfield R，Hawksford MJ.Efficient filter design for loudspeaker equalization[J].Journal of the Audio Engineering Society，1991，39(10)：739-751.

[4]Paatero T，Karjalainen M，Harma A.Modeling and equalization of audio systems using kautz filters[C]//Acoustics，Speech，and Signal Processing，2001.Proceedings.(ICASSP'01).2001 IEEE International Conference on.IEEE，2001，5：3313-3316.

[5]Ramos G，Lopez JJ.Direct method with random optimization for parametric IIR audio equalization-applications to one way and multiway systems[C]//Audio Engineering Society Convention 116.Audio Engineering Society，2004.

[6]Ramos G，Lopez JJ，Lloret J.Direct method with random optimization for loudspeaker equalization using IIR parametric filters[C]//Acoustics，Speech，and Signal Processing，2004.Proceedings.(ICASSP'04).IEEE International Conference on.IEEE，2004，4：iv-iv.

[7]GB/T3947.Acoustical terminology[S].1996.

[8]Schroeder M.New method of measuring reverberation time[J].J.Acoust.Soc.Amer，1965，37(3)：409-412.

[9]Salamouris S，Politopoulos K，Tsakiris V，et al.Digital system for loudspeaker and room equalization[C].Audio Engineering Society Convention 98.Audio Engineering Society，1995.

[10]Norcross SG，Soulodre GA，Lavoie MC.Subjective investigations of inverse filtering[J].Journal of the Audio Engineering Society，2004，52(10)：1003-1028.

[11]Hawksford MJ.MATLAB program for loudspeaker equalization and crossover design[J].Journal of the Audio Engineering Society，1999，47(9)：706-719.

[12]Parolong D，Carlile S.The role of individualized headphone calibration for the generation of High fidelity virtual auditory space.J.Acoust.Soc.Am，1996，100(6)：3785-3793.

[13]饶丹，谢菠荪.耳机传输特性的重复性分析[C].声学技术，2006.441-442.

[14]Vincent E.mushram：A matlab interface for mushra listening tests(version 1.0)[EB/OL].2015.

[15]ITU Recommendation BS.1534-1.Method for the subjective assessment of intermediate quality level of coding systems[EB/OL].2015.

[16]朱星宇，陈勇强.SPSS多元统计分析方法及应用[M].清华大学出版社，2011，8：26-37.