郑 洋 唐加能 柳培忠 刘晓芳
数字助听器研究现状及其算法综述*
郑 洋 唐加能 柳培忠 刘晓芳
华侨大学工学院
随着中国老龄化社会的到来,效果良好的听力设备得到重视,一些相关算法和技术先后被提出和改进,有效解决了现代数字助听器中的响度补偿、去噪和回声消除等问题。该文阐述了助听器的发展历程、数字助听器的工作原理,以及响度补偿、语音降噪技术、回声消除技术和声源定位技术等核心技术的研究现状,并对未来相关技术的发展进行了展望。
数字助听器 响度补偿 语音降噪 回声消除 声源定位
随着中国老龄化社会的到来,助听器的使用和发展受到越来越多人的关注。助听器实质上是一种帮助听力障碍患者补偿听力缺失的小型扩音装置,在解决听力损失人群的耳听力补偿方面发挥着不可替代的优势作用。在我国,听力损失与常见性耳病已经成为大多老年人安度晚年生活的障碍,而这些听力障碍的人群里只有很少一部分人佩戴了助听器。
半导体等微电子技术不断发展,现代数字助听器相比模拟助听器有着明显的优势,实现了数字化、小型化。在去噪和回声消除等方面,随着相关算法的不断改进,在可调性方面也有很大的进步。数字助听器通过对信号的数字化处理,逐渐智能化,和模拟助听器单纯进行声音信号放大有很大区别。数字助听器可以通过频率的改变处理过滤噪声,再通过相关算法处理,智能化选择需要的语音信号,并加强和辨别减少其他噪声的污染,达到满足低度或中度听力损失人群的需要。为此,佩戴合适的助听器是解决听力障碍的重要途径,相关的助听器工作也需要进行进一步研究,以更好地满足社会需要。
传统的模拟助听器中,声频信号被麦克风收集并转化为电信号。麦克风输出的振幅和频响,通过一系列的模拟滤波器后,信号被送至接收器。模拟助听器的信号持续不断通过信号处理的路径,加大了噪声的污染。在数字可编程助听器中,麦克风的输出经过采样和量化,通过A/D转换器将其转换为离散信号。所有的信号处理过程都通过数字滤波器和相应的算法处理。完成数字信号处理后,数字信号通过D/A转换器或者解调器转换回模拟信号。
数字助听器最核心的部分由一块集成的 DSP 处理芯片组成,具有功能强、运算快、功耗低、体积小等优点。DSP芯片利用数字信号处理算法对数字信号进行变换、增强、压缩、滤波等处理,得到需要的信号。数字助听器具有强大的数据处理能力和高运行速度,可以进行复杂的非线性信号处理,并且可以存储多个算法程序,当用户需要响度补偿时,根据其环境特征设计不同响度补偿方案。当助听器使用者在一个安静的环境中,去噪算法就可以关闭,这样既能够降低能耗,又可以避免去噪算法给语音信号带来的失真。一般来说,数字助听器数字信号处理模块主要包括有响度补偿、降噪技术、回声消除和声源定位等,下文将根据这些内容逐步介绍算法研究现状。
图1 数字助听器主要工作原理
为了提高语音理解度和聆听舒适度,目前数字助听器使用最多且比较核心的技术分别为响度补偿技术、语音降噪技术、回声反馈消除技术和声源定位算法[1]。
3.1 响度补偿算法
在助听器的算法中,响度补偿是一种主要的算法,其作用是补偿听力损失患者的语音信息,提高听力损失人群对语音的识别率。响度补偿算法需要根据患者不同的听阈、痛阈情况,调整它的动态范围,使之匹配。另外,有些算法会针对不同患者的频率缺失情况,对不同频率信号进行相关补偿。
在现代数字助听器中,大多数已经实现了多通道的响度补偿的功能[2],这些响度补偿方案很多集中在等宽频率间隔滤波器组。由于人耳对语音信号频率的高低感觉与实际听到的语音信号频率的高低可以近似为对数关系,所以在进行响度补偿方案时,利用等宽频率间隔滤波器组的设计要求并不能满足听力损失人群对听力的补偿要求。因此文献[3]提出了一种非等宽多通道响度补偿方法,该算法在对语音信号分析时,采用了一种过采样完美重构滤波器组,并使语音信号达到了响度补偿和重建的效果,弥补了相关算法对人耳特性的考虑不周。也有学者提出一种基于共振峰提取的多通道响度补偿算法[4],他们通过对滤波器组重新设计,并加入一个共振峰模块,对共振峰起到保护作用,使响度补偿取得更佳的效果。
为了减轻响度补偿时产生的负面影响,提高高频严重损失的听损患者的听辨率,文献[5]将压缩移频技术用于多通道响度补偿,有效提高了听损患者的听力水平,同时有效提高了患者的话语辨识率。针对传统多通道补偿算法忽略保护语音特征,容易造成语音结构变形和识别率低等问题,文献[6]提出了一种基于多分辨率小波的单通道语音增强算法。该算法利用多分辨率小波对信号进行分解和重构,然后在语音信号中提取出频谱结构,通过提取出的特征点初期信息计算补偿增益,此时的响度补偿是利用插值算法计算整个频谱的增益,与多通道响度补偿技术相比,可以有效保证语音特征,并提高语音辨别率。
3.2 数字助听器语音降噪技术
在噪声环境下,听力损失的人的语音理解度非常有限,如何提高语音理解度并提高语音的纯净性,需要相关的降噪技术。现代数字助听器产品都带有相对独立的去噪功能,提高了聆听的舒适度和语音的可理解度。传统上,为了提高助听器抗噪声的性能,大多利用单通道的降噪处理技术,近年来,基于多通道的维纳滤波降噪技术逐渐被提出,并能更好地提高语音可理解度。
为了满足高阻带衰减和高频分辨率的限制,文献[7]提出了一个级联双级滤波器组的宽带系统,以提高频率分辨率和降噪性能。Schasse 等人[8]提出一种改进的单通道助听器双级滤波器组噪声抑制技术,解决了助听器中低延迟和高阻带衰减,以及因低频率分辨率问题导致残留的噪声等问题,并分析了一个两个阶段的降噪系统,减少了计算复杂度,进一步提高助听器的降噪性能。为了提高单通道语音增强降噪算法的整体质量,有学者[9]提出了基于参数估计和感知提升的语音增强降噪算法,相比传统算法,该算法通过引入参数估计改进模块和感知质量提升模块,在消噪效果和语音质量两方面均得到了较大的提高,适用于多类噪声环境和信噪比条件。
近年来,学者们提出多种基于多通道维纳滤波(Multi- channel Wiener Filtering,MWF)的降噪技术,这些降噪技术均适用于双耳助听器设备,其中MWF有很好的噪声抑制性能,对于语音特征的保留也有很好的效果。文献[10]指出,SDW-MWF在单一噪声源时有少量语音失真,但在多个噪声源的情况下有较好的性能,文献[11]、[12]针对真实的噪声环境,分别提出了MWF-COR和MWF-IC,比以前的降噪技术都有良好的效果,提高了语音可懂性。
文献[13]结合人耳听觉特性和助听器响度补偿的特点,提出一种改进的多通道维纳滤波算法的助听器语音降噪算法,该方法能更有效地抑制残留噪声,提高语音可懂度,具有较高的实用价值。文献[14]针对助听器降噪算法的特殊性,提出了一种实时多通道数字助听器降噪算法。考虑到算法实时性和降噪性能的特点,该算法以子带声压级计算代替传统的信号功率谱估计算法,有效降低了算法复杂度,也有效降低了噪声。
3.3 数字助听器回声消除算法
在使用现代数字助听器时,声学回声是使用者抱怨频率最高的问题,这里的回声即接收器的输出通过耳道、气孔以及助听器耳模与耳道的间隙泄露出的声音被麦克风捕获放大产生的声音。助听器中常见的回声消除系统如图2所示,图2中,H*(Z)表示真实的回声信道,这往往由助听器和用户的特性决定。H(Z)是自适应估计的回声信道,由助听器采用的回声估计算法确定。e(n)为麦克风输入信号d(n)减去后的残差信号,并用e(n)来调整H(z)的参数。
图2 助听器回声消除系统
回声消除最常用的是LMS类算法,包括LMS、NLMS[15、16],其中LMS的更新方程为:
(2)
文献[20]改进了一种仿射投影算法,该算法通过能量误差和步长因子之间存在的非线性函数关系使步长因子可以根据能量误差的变化自动调整,也可以达到加快滤波器收敛速度、降低稳态失调的目的。而文献[21]则采用一种仿射组合的方案通过两个带有不同步长的滤波器操作,比单个滤波器和固定步长的仿射方案,在助听器回声消除方面获得稳定的性能。
在数字助听器回声抵消算法中,当助听器的增益与相位达到一定的条件时便会引发高强度的振荡,即啸叫,这会给助听器佩戴者带来明显的不舒适感。文献[22]针对当自适应滤波器算法中回声路径发生快速变化时,收敛速度仍然难以实现快速啸叫抑制,提出一种变步长标准最小均方差-陷波器(Variable Step Normalized Least Mean Square- Notch Filter,VSN-NF)算法,既改善了回声抵消性能,又有效减少啸叫的产生。
3.4 数字助听器声源定位算法
在一个复杂的噪声环境下,若存在多个噪声源声音信号交叠的情况,将导致助听器语音信号信噪比下降,大大降低了佩戴助听器的语音理解效果。目前,研究者们基于复杂的噪声场景提出了多种声源定位算法[23-25],并将其运用到助听器定位系统中,可以有效定位声源的3D位置。文献[26]研究了一种基于压缩感知的麦克风阵列声源定位算法,将声源定位问题变为稀疏信号的重构问题,将不同位置的房间冲激响应作为特征以构建字典,提高了麦克风阵列在高混响、低信噪比环境中的定位性能,但存在字典模型误差,有待进一步研究。为了改善混响和多干扰声场景下的声源定位能力,文献[27]介绍了一种多通道联合策略,改善了传统算法鲁棒性差的缺点,并结合人耳的哈斯效应,提出一种双耳时间差提取策略以提高定位精度,该策略能根据环境信噪比自适应调整。
小型化发展一直是数字助听器的趋势[28-30],而未来让数字助听器越来越小,甚至微型化,让别人看不见是大多数听力损失者的要求,隐形助听器将是未来研究的方向。这就需要算法复杂度更低以获得低功耗,由于是在体积更小的空间,对于算法的要求也要更高,研究者们希望得到没有噪声、回声消除更明显的算法,这样可以大大提高助听器的聆听度和舒适度。
数字助听器的防水技术也一直获得人们的关注,让听力损失患者在一些特殊场景(如游泳),防止设备因进水而停止工作,现在也已经有多家公司在考虑防水技术。另外,以前助听器只是单纯地将信号放大,达到语音增强的效果,最后完成去噪和回声消除。随着声源定位技术的发展,让两侧耳的数据共享,达到同步效果,获得声源定位将是一个研究和发展的方向。
目前,大多数研究集中在一些算法的改进方面,对于实际的应用效果还需要根据不同场合进行环境测试,发展智能化的助听器将会大大提高数字助听器设备的语音处理能力。智能化的助听器将可以根据听力损失患者在不同环境(餐厅、会议室、街道等)下自适应调整参数。算法为不同环境参数设置数据库,根据外部不同场合的环境噪声,听力损失患者可以自动调整,随时改变聆听效果。
近几年,随着数字信号处理技术的发展,数字助听器的发展也得到了明显的提升和改善。现在评价一个数字助听器的好坏,主要取决于其核心算法技术的改进,所以研究数字信号处理技术对于数字助听器具有重要的理论意义和实用价值。本文从响度补偿技术、降噪技术、声学回声消除技术和声源定位技术等方面介绍了目前比较流行的一些技术,随着微电子技术的发展,对于语音的识别和去噪等要求,需要从患者的听力损失情况和现实一些复杂的噪声环境考虑,相信在技术的不断发展下,数字助听器在未来的应用一定会更加广泛,也能达到帮助更多听力障碍患者改善听力的目的。
[1] 赵力,张昕然,梁瑞宇, 等.数字助听器若干关键算法研究现状综述[J].数据采集与处理,2015(2):252-265.
[2] Chong K S, Gwee B H,Chang J S. A 16-Channel Low-Power Nonuniform Spaced Filter Bank Core for Digital Hearing Aids[J]. Circuits & Systems II Express Briefs IEEE Transactions on, 2006, 53(9):853-857.
[3] 王青云,赵力,赵立业, 等.一种数字助听器多通道响度补偿方法[J].电子与信息学报,2009,31(4):832-835.
[4] 赵毅,尹雪飞,陈克安.一种基于共振峰提取的多通道响度补偿算法[J].信号处理,2012, 28(3):352-360.
[5] 张宝琳,张玲华.数字助听器中多通道响度补偿方法的研究[J].信号处理,2013,29(5):656-661.
[6] 曹旭来,张玲华,林志敏,等.数字助听器中单通道语音增强算法的研究[J].信号处理,2014,30(4):405-412.
[7] Schasse A, Martin R, Soergel W, et al. Efficient Implementation of Single-Channel Noise Reduction for Hearing Aids Using a Cascaded Filter-Bank[C]// Speech Communication; 10.ITG Symposium; Proceedings of. 2012:1-4.
[8] Schasse A, Gerkmann T, Martin R, et al. Two-Stage Filter-Bank System for Improved Single-Channel Noise Reduction in Hearing Aids[J]. IEEE/ACM Transactions on Audio Speech & Language Processing, 2015, 23(2): 383-393.
[9] 王晶,尹栋,蒋涉权,等.基于参数估计和感知提升的语音增强降噪算法[J].电子与信息学报,2016,38(1):174-179.
[10] Cornelis B, Moonen M, Wouters J. Performance Analysis of Multi-channel Wiener Filter-Based Noise Reduction in Hearing Aids Under Second Order Statistics Estimation Errors[J].IEEE Transactions on Audio Speech & Language Processing, 2011, 19(5):1368-1381.
[11] Marquardt D, Hohmann V, Doclo S. Coherence preservation in multi-channel Wiener filtering based noise reduction forbinaural hearing aids[J]. IEEE/ACM Transactions on Audio Speech & Language Processing, 2013, 23(12):8648-8652.
[12] Marquardt D,Hohmann V,Doclo S. Interaural Coherence Preservation in Multi-Channel Wiener Filtering-Based Noise Reduction for Binaural Hearing Aids[J]. IEEE Transactions on Audio Speech & Language Processing, 2015, 23(12):2162-2176.
[13] 奚吉,梁瑞宇,王国伟, 等.多通道助听器语音降噪算法研究[J]. 计算机工程与应用,2014,50(11):237-240.
[14] 梁瑞宇,赵力,王青云, 等. 实时多通道数字助听器降噪算法[J].东南大学学报(自然科学版),2016,46(1):13-17.
[15] 高鹰,谢胜利.一种变步长LMS自适应滤波算法及分析[J].电子学报,2001,29(8):1094-1097.
[16] 谷源涛,唐昆,崔慧娟, 等.新的变步长归一化最小均方算法[J].清华大学学报(自然科学版),2002,42(1).
[17] 张云翼,崔杰,肖灵.一种新的应用于助听器指向性传声器的自适应算法[J].声学技术,2011,30(3):270-274.
[18] 吴兆胜,黑勇,袁甲, 等.应用于助听器的带限NLMS反馈抑制算法及硬件实现[J].微电子学与计算机,2011,28(3):157-160.
[19] 王侠,梁瑞宇,王青云, 等.应用于助听器反馈抑制系统的变步长归一化子带自适应滤波算法[J].东南大学学报(自然科学版),2015(3):417-422.
[20] 秦海娟,张玲华.基于改进仿射投影算法的数字助听器自适应回声消除[J].数据采集与处理,2015(2):382-389.
[21] Schepker H, Tran L T T, Nordholm S, et al. Improving adaptive feedback cancellation in hearing aids using an affine combination of filters[C]// IEEE International Conference on Acoustics, Speech and Signal Processing, 2016.
[22] 梁瑞宇,王侠,王青云,等.啸叫快速抑制的助听器回声抵消算法[J].声学学报,2016,41(2):249-259.
[23] 王青云,赵力,邹采荣.基于次梯度投影的数字助听器自适应声源定位方法[J]. 东南大学学报(自然科学版),2009,39(4):667-672.
[24] 赵立业,李宏生.噪声与共振环境下的数字助听器鲁棒声源定位法[J].Transactions of Nanjing University of Aeronautics & Astronautics, 2010, 27(2):176-182.
[25] 梁瑞宇,赵力,奚吉,等.基于听觉仿生和压缩感知的助听器声源定位方法[J].仪器仪表学报,2011,32(6):1390-1395.
[26] 赵小燕,周琳,吴镇扬.基于压缩感知的麦克风阵列声源定位算法[J].东南大学学报(自然科学版),2015,45(2):203-207.
[27] 梁瑞宇,周健,王青云,等.仿人耳听觉的助听器双耳声源定位算法[J].声学学报, 2015,40(3):446-454.
[28] 崔杰.数字助听器关键技术的研究与实现[D].北京:中国科学院声学研究所,2009.
[29] 马小玲,刘训,张思幸,等.国内助听器的现状调研与发展分析[J].中央民族大学学报(自然科学版),2014,23(1):39-43.
[30] 蒋涛.助听器技术发展的3.0及未来[J].中国听力语言康复科学杂志, 2015(6):401-404.
泉州市科技项目(2014Z103),福建省教育厅项目(JA15035),华侨大学研究生科研创新能力培育计划资助项目。