仿听觉掩蔽效应的助听器语音增强算法*

2016-08-18 01:46张素贞唐加能梁瑞宇
电子器件 2016年3期
关键词:维纳滤波信噪比增益

张素贞,唐加能,梁瑞宇

(1.常州轻工技术学院,江苏常州213164;2.华侨大学工学院,福建泉州362021;3.南京工程学院通信工程学院,南京211167)

仿听觉掩蔽效应的助听器语音增强算法*

张素贞1*,唐加能2,梁瑞宇3

(1.常州轻工技术学院,江苏常州213164;2.华侨大学工学院,福建泉州362021;3.南京工程学院通信工程学院,南京211167)

为增强听障患者在噪声环境下的语言理解度,提出了一种改进的感知滤波器算法。针对一般感知滤波器会出现被掩蔽音在感知滤波后变为可闻噪声的问题,仿听觉掩蔽效应设计了加权感知滤波器算法。算法在基本感知滤波器设计的基础上,首先采用直接判决法来估计先验信噪比,并基于最佳平滑因子法进行修正。然后基于最小均方差准则获得最优估计值,从而得到感知权重滤波器的增益函数。仿真实验结果表明,该方法能够有效地消除残留噪声,降低噪声对语音的干扰,使得处理后的语音质量有所提高。

助听器;掩蔽效应;降噪;最小均方差

如何提高助听器在噪音环境下的表现一直是助听算法研究的重要方向。经过近几十年的研究,许多降噪方法被提出来。对于单通道降噪算法来说,需要解决的问题是如何从被噪声污染的信号中估计出期望语音信号。最早出现的方法是1979年Boll提出的谱减法[1],该方法计算简单,但是会带来音乐噪声问题,之后,又有许多研究者提出了多种改进的谱减法,如Gaustafsson[2]提出的自适应增益平均谱减法,Sim[3]等提出的最小均方误差谱减法等,均取得了一定的效果。另一种常见的单通道降噪方法是维纳滤波器法[4],以估计信号和真实信号之间的误差最小均方值作为最佳准则,后来Lim和Oppenheim[5]又提出了迭代的维纳滤波器方法。1984年,Ephraim[6]等人提出了一种基于最小均方误差MMSE(Minimum Mean Square Error)估计的最优幅度谱估计方法,由于人耳对声音的响度感知与频谱幅度的对数成正比,采用对数谱更加合适,Ephraim和Malah[7]由此提出了基于对数谱幅度的MMSE估计方法。此外,还出现了其它一些MMSE的改进形式,如Chen和Loizou[8]提出的基于拉普拉斯分布的MMSE估计,Cohen[9]引入条件语音存在概率提出的最优修正对数谱幅度估计等。

项目来源:国家自然基金项目(61375028);江苏省自然基金项目(14KJB510034);泉州市科技计划项目(2014Z103)

收稿日期:2015-07-23修改日期:2015-08-23

由于人对声音的主观感知是人生理、心理等方面的综合作用的结果,许多学者对此进行了研究,其中,基于听觉掩蔽模型的语音增强成为一个研究热点,Virag[10]等将人耳听觉系统的听觉掩蔽效应与谱减法相结合来进行语音降噪,Loizou、Alam[11]等学者提出了感知滤波器的降噪方法,通过设计感知滤波器来对带噪语音信号进行感知滤波。但是由于噪声种类、应用场合等的多样性,并没有一种算法能够抑制所有的噪声。此外,尽管感知滤波器方法和传统降噪方法相比表现不错,但它们仍会残留可闻噪声。其根本原因在于:在用感知方法进行降噪后,语音成分被衰减,导致原先的掩蔽阈值下降,因此,可能会使原先被掩蔽的且未被处理的不可闻噪声成分超出掩蔽阈值,变得可闻[12]。

为此,本文基于听觉掩蔽机理改进了感知滤波器算法。算法基于最小均方差原则设计了感知滤波器的加权因子,从而修正了先验信噪比的估计,获得最优增益函数。在不同噪声类型和不同信噪比的3种噪声类型下,本文对比了3种降噪算法,主客观指标显示该算法的降噪效果突出,语音质量佳。

1 听觉掩蔽降噪原理

基于听觉掩蔽效应的语音增强算法不需要将噪声完全消除,只要满足残留的噪声不被人感知条件即可,减少了语音的失真,改善了人耳的听觉舒适度。

设y(n)为带噪语音信号,x(n)为纯净语音信号,d(n)为加性噪声信号,并且假设x(n)和d(n)两者不相关,则带噪语音信号为:

经过分帧、傅里叶变换后得:

其中,Y(m,k)为带噪语音的幅度谱,X(m,k)为纯净语音的幅度谱,D(m,k)为噪声的幅度谱,m为帧号,k为离散频率。

令X^(m,k)=G(m,k):Y(m,k)为通过感知滤波器增强后的语音信号,G(m,k)为感知滤波器的增益函数,则增强语音与纯净语音的误差谱为:

由式(3)可知,语音信号失真和噪声失真随增益函数G(m,k)的变化趋势相反,不可能使得两者都同时变小。因此,一个理想的增益函数需要在语音信号失真和噪声失真之间做一个合理的折衷。感知滤波器不是将残留噪声完全消除,而是利用人耳的听觉掩蔽效应,将残留噪声控制在听觉门限T之下,使之不被人耳感知到,同时使语音信号的失真最小。即:

引入一个拉格朗日因子μ(m,k),且μ(m,k)≥0。令拉格朗日代价函数为:

其中,ξ(m,k)表示第m帧的信噪比。将上式代入约束条件G2(m,k)||D(m,k)2≤T(m,k),又μ(m,k)≥0得:

只要μ(m,k)满足式(7),残留噪声就会被掩蔽掉。将公式(6)代入ε2X(m,k)可得

从式(8)可以看出,随着μ(m,k)的增大,ε2X(m,k)也增大,即语音失真也增大。因此,为了减小语音的失真,取μ(m,k)的最小值,得增益函数:

式(9)的增益函数是在使残留噪声保持在掩蔽阈值之下的同时,使语音失真最小这一目标下求解得到的。

2 改进策略

当噪声的第m帧的第k个离散频点功率谱|D(m,k)|2大于它所对应的掩蔽阈值T(m,k):时,得G(m,k)<1,即对带噪语音的第m帧的第k个离散频点进行了抑制;而对于|D(m,k)|2≤T(m,k)的频点,G(m,k)=1,是不进行衰减处理,直接输出的,即只有高于掩蔽阈值的噪声被滤波,而低于掩蔽阈值的噪声仍然存在。这就产生了MAN现象。基于数字助听器实时性和低功耗角度考虑,一般采用基于先验信噪比的维纳滤波器进行抑制,因为维纳滤波器计算较简单,并且维纳滤波器的残留噪声类似白噪声,听觉感受较好。

本文对感知滤波器进行改进,引入一个权重因子W,权重因子W定义如下:

其中,Tabs(m,k)为绝对听阈,ξ(m,k)为先验信噪比。当噪声功率谱在满足Tabs(m,k)<||D(m,k)2≤T(m,k)条件时,对带噪语音进行噪声抑制即维纳滤波,从而减小了MAN现象的发生,提高了语音质量。

一般采用直接判决法来估计先验信噪比ξ(m,k)。

在先验信噪比估计中,平滑系数α的取值很重要,通常是一个非常接近1的常数。文献[13]表明,α的值越接近1,则残留的音乐噪声越小,但也会导致最终信号的瞬变失真增多。为了平衡这两方面,一般把α值设置为0.95~0.99之间的一个常数。然而,固定的α值不能很好地应对后验信噪比突然变化的情况。因此,为了解决上述问题,本文使用一种最佳平滑因子方法,α不再是一个固定值,而是一个随时间变化的平滑系数。

将原有的先验信噪比平滑公式(11)改写为由时变平滑系数作用的公式:

为了减小估计值与真实值间的误差,本文采用最小均方差准则对α(m,k)进行更新。

定义均方误差为:

将式(12)代入式(13),并化简得:

在实际的应用中,由于 ξ(m,k)未知,可以用max(γ(m,k)-1,0)代替上式中的ξ(m,k)。为了避免α(m,k)=1的死锁情况发生,最优平滑系数αopt(m,k)被限制在一个最大值αmax之下,如αmax=0.998。同样,为了保证在低后验信噪比下的平滑效果,也给平滑系数设置一个下限值αmin,如0.3。

3 实验仿真与分析

为了衡量加权感知滤波器(WPF)法的降噪性能,本文在不同噪声环境下进行了测试。实验采用NOISE-92噪声库中的 White噪声、Pink噪声、SpeechBabble噪声和DestroyEngine噪声4种噪声进行测试,通过叠加得到不同信噪比(-5 dB,0 dB,5 dB,10 dB,15 dB)的带噪语音信号,并且采用主观评价方法中的MOS方法和客观评价中的segSNR 和PESQ指标对3种方法进行性能分析。实验中纯净语音和噪声均重新采样为16 kHz,选用汉明窗加窗,帧长为512采样点,帧之间重叠50%。将维纳滤波WF(Wiener Filter)法、感知滤波器PF(Perceptual Filter)法两种降噪方法作为对比实验。

3.1主观评价

MOS得分是用得较多的一种主观评价方法,在本文的MOS方法测评中,邀请10名听力正常的测试者进行试听,并根据MOS评分等级标准进行打分,在White噪声、Pink噪声、SpeechBabble噪声和DestroyEngine噪声下,3种降噪方法的MOS得分结果如图1所示。

从图1可知,WF法的MOS得分在3种方法中得分最低,因为WF降噪后仍然有音乐噪声存在。而PF法降噪后的声音几乎听不到音乐噪声,MOS得分比WF法要高。由于WPF法在PF法的基础上减少了MAN现象的发生,进一步提高了语音质量,因此其MOS得分也是最高的。主观评价表明,与WF方法和PF方法相比,本文提出的WPF方法能够更有效地消除噪声,语音听觉感受也更好。

图1 MOS得分

3.2客观评价(1)segSNR

在White噪声、Pink噪声、SpeechBabble噪声和DestroyEngine噪声下,3种降噪方法的分段信噪比如图2所示。

(2)PESQ

在White噪声、Pink噪声、SpeechBabble噪声和DestroyEngine噪声下,3种降噪方法的PESQ得分如图3所示。

图2 分段信噪比比较图

从种客观评价的结果中可以看出,改进的WPF降噪方法是优于WF法和PF法的,WPF方法降噪后的语音与原始的纯净语音更接近,语音失真更小,语音质量也更好,在消除背景噪声、抑制残留噪声和减小语音失真等方面都取得了较好的效果。

4 结论

本文仿人耳听觉掩蔽效应提出一种加权感知滤波器算法。相比传统的语音降噪算法,本文引入实时加权因子,能更好的改善语音降噪性能,提高语音质量和自然度,进而提高听损患者的语言辨识率,对后续数字助听器的设计与实现有较高的参考价值和意义。

[1] Boll S.Suppression of Acoustic Noise in Speech Using Spectral Subtraction[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1979,27(2):113-120.

[2] Gustafsson H,Nordholm S E,Claesson I.Spectral Subtraction Using Reduced Delay Convolution and Adaptive Averaging[J]. IEEE Transactions on Speech and Audio Processing,2001,9(8):799-807.

[3] Sim B L,Tong Y C,Chang J S,et al.A Parametric Formulation of the Generalized Spectral Subtraction Method[J].IEEE Transactions on Speech and Audio Processing,1998,6(4):328-337.

[4] Wiener N.Extrapolation,Interpolation,and Smoothing of Stationary Time Series[M].Cambridge,MA:MIT Press,1949:110-119.

[5] Lim J S,Oppenheim A V.Enhancement and Bandwidth Compression of Noisy Speech[J].Proceedings of the IEEE,1979,67(12):1586-1604.

[6] Ephraim Y,Malah D.Speech Enhancement Using a Minimum-Mean Square Error Short-Time Spectral Amplitude Estimator[J]. IEEE Transactions on Acoustics,Speech and Signal Processing,1984,32(6):1109-1121.

[7] Ephraim Y,Malah D.Speech Enhancement Using a Minimum Mean-Square Error Log-Spectral Amplitude Estimator[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1985,33(2):443-445.

[8] Chen B,Loizou P C.A Laplacian-Based MMSE Estimator for Speech Enhancement[J].Speech Communication,2007,49(2):134-143.

[9] Cohen I,Berdugo B.Speech Enhancement for Non-Stationary Noise Environments[J].Signalprocessing,2001,81(11):2403-2418.

[10]Virag N.Single Channel Speech Enhancement Based on Masking Properties of the Human Auditory System[J].IEEE Transactions on Speech and Audio Processing,1999,7(2):126-137.

[11]Udrea R M,Vizireanu N D,Ciochina S.An Improved Spectral Subtraction Method for Speech Enhancement Using a Perceptual Weighting Filter[J].Digital Signal Processing,2008,18(4):581-587.

[12]Amehraye A,Pastor D,Tamtaoui A,et al.From Maskee to Audible Noise in Perceptual Speech Enhancement[J].International Journal of Signal Processing,2008(2):302-308.

[13]Cappé O.Elimination of the Musical Noise Phenomenon with the Ephraim and Malah Noise Suppressor[J].IEEE Transactions on Speech and Audio Processing,1994,2(2):345-349.

张素贞(1979-),女,江苏镇江,常州轻工职业技术学院讲师,主要研究方向为电子信息与信号处理,zhangszcz@163.com。

Speech Enhancement Algorithm for Hearing Aids Imitating the Hearing Masking Effect*

ZHANG Suzhen1*,TANG Jianeng2,LIANG Ruiyu3
(1.Changzhou Vocational Institute of Light INdustry,Changzhou Jiangsu 213164,China;2.College of Engineering,Huaqiao University,Quanzhou Fujian 362021 China;3.School of Communication Engineering,Institute of Nanjing Technology,Nanjing 211167,China)

In order to improve the language comprehension of patients with hearing impairment under the noise environment,one perception filter algorithm is proposed.For the general perception filter,the masking tone will be changed to audible noise after perception filtering.To solve this problem,one weighted perception filter algorithm for the simulation of the auditory masking effect is designed.Based on the design of basic perception filter,firstly,the priori SNR is estimated by the direct decision method and revised by the optimal smoothing factor method.The optimal estimate value is obtained with minimum mean square error criterion,and then gain function of perception weighting filter is obtained.The simulation experiment results show that with the proposed method the residual noise can be eliminated effectively and the interference of noise is reduced,so that the quality of the processed speech is improved.

hearing aids;masking effect;noise reduction;minimum mean square error

TH785.1;TB535.1

A

1005-9490(2016)03-0698-05

EEACC:645010.3969/j.issn.1005-9490.2016.03.038

猜你喜欢
维纳滤波信噪比增益
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于增益调度与光滑切换的倾转旋翼机最优控制
基于单片机的程控增益放大器设计
基于深度学习的无人机数据链信噪比估计算法
多级维纳滤波器的快速实现方法研究
自适应迭代维纳滤波算法
基于Multisim10和AD603的程控增益放大器仿真研究
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
基于多窗谱估计的改进维纳滤波语音增强
基于维纳滤波器的去噪研究