基于小波去噪的自适应波束形成算法研究

2017-06-27 08:14文小方张玲华高婉贞
计算机技术与发展 2017年6期
关键词:旁瓣小波麦克风

文小方,张玲华,高婉贞

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

基于小波去噪的自适应波束形成算法研究

文小方,张玲华,高婉贞

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

语音增强算法是数字助听器的一项关键技术。广义旁瓣抵消器自适应波束形成算法对受固定干扰源影响的目标语音有良好的消噪效果。针对广义旁瓣抵消器自适应波束形成算法带来的语音泄漏以及残留噪声问题,在分析语音泄漏原因的基础上,引进了小波阈值去噪技术,提出了基于小波去噪的自适应波束形成算法。该算法在对原始语音进行小波阈值去噪后,将去噪后的语音信号通过GSC结构,从而得到输出语音信号。因小波阈值去噪既能提高语音通过GSC结构前的信噪比,又能使通过GSC结构后的语音更加准确,一定程度上减少了语音的泄漏,降低了残留噪声的发生,提高了语音的辨识度。实验结果表明,所提出的算法使得算法性能有所提高,从而达到了增强语音的目的。

广义旁瓣抵消器;语音泄漏;小波阈值去噪;语音辨识度

0 引 言

随着科技的不断发展,人类的生活环境变得复杂起来。在各种通讯领域,如:手机通信、固定电话、助听器等,语音信号都不可避免地受到各种噪声的干扰,这些干扰降低了语音的质量[1]。因此需要用去噪来达到语音增强的效果。目前,语音增强方法有很多种,根据麦克风的数目可分为单麦克风系统和麦克风阵列系统[2]。现如今由于实际环境噪声的复杂性,单麦克风系统已经无法实现很好的消噪效果。麦克风阵列信号[3]采用的是广义旁瓣对消的思想:用“电子瞄准”的形式从声源位置获取高品质的语音信号,同时抑制其他声音以及环境噪声,具有很好的空间选择性。目前关于语音增强的研究工作主要集中于麦克风阵列信号处理[4],包括固定波束形成(Fixed Beamforming,FBF)、自适应波束形成[5]算法(Adaptive Beamforming,ABF)和带有后置滤波器的波束形成算法。其中自适应波束形成算法又包括最小方差无失真响应(MVDR)波束形成算法、广义旁瓣抵消器(GSC)结构的波束形成算法以及Hoshuyama的GSC结构波束形成算法。在实际应用中,GSC结构波束形成算法应用广泛,由三个部分组成:固定波束形成器(FBF)、阻塞矩阵(Blocking Matrix,BM)、多输入抵消器(Multiple-input Canceller,MC)。然而该算法在MC模块存在残留噪声和语音泄漏问题。针对该问题,Hoshuyama曾提出了基于GSC结构的鲁棒自适应约束波束形成(CCAF-NCAF)结构,以减少语音泄漏[6];文献[7]提出了一种多通道补偿算法,对共振峰结构进行保护,同样减少了语音泄漏。

为此,在对GSC结构原理进行分析的基础上,围绕语音泄漏的原因,提出在GSC结构处理前添加小波阈值去噪算法[8]。实验结果表明,改进算法可以提高语音辨识率,改善语音质量,达到语音增强[9]的效果。

1 广义旁瓣抵消器结构的自适应波束形成算法

广义旁瓣抵消器[10]的波束形成器实际上是自适应波束形成的一般模型,该系统结构可以分为上下两支路,即将算法分为三个模块。该算法无论是理论研究还是工程应用中都很普及,因为GSC结构的波束形成算法中没有线性约束,算法消噪效果较好。其算法模型结构如图1所示。

图1 广义旁瓣抵消波束形成结构框架图

GSC结构的基本原理如下:假设输入原始语音信号有M路,上支路通过时延估计[11]得到信号的时延以及角度。对各路麦克风接收到的信号进行时延补偿,使各路通道语音信号尽可能达到同步。再将阵列接收信号分别向两个正交的子空间投影,上支路对各路信号进行加权求和,权重为a(θ0),得到初步增强的语音信号,即d0(k)。

根据图1可得:

(1)

(2)

(3)

X0(k)=B0X(k)

(4)

(5)

GSC结构算法中很关键的一部分就是阻塞矩阵的设计[12],使Ba(θ0)=0,即必须满足B0的每行元素之和为0,在这里选用常用的一个阻塞矩阵:

由于麦克风阵列位置的偏差,麦克风增益的不同,以及环境中存在混响、干扰,目标方向估计存在误差等因素,使得在BM模块中,阻塞矩阵只滤除了大部分的纯语音信号,同时屏蔽了少部分的噪声。在MC模块中,存在部分的语音和参考噪声混在一起。这样就不可避免地导致参考噪声不可能完全抵消原语音信号中混有的噪声,因此最终的语音信号存在残留噪声和部分的语音泄漏,这也是GSC结构固有的弊端。文中直接选用语音库一段比较纯净的语音,其中采样频率为16 kHz,在信噪比SNR=-5 dB的白噪声环境下,原语音方向是0°,干扰源方向是30°,有方向估计误差为3°条件下进行仿真实验。

图2是将原始语音通过GSC结构处理后得到的仿真图。

其中,(a)是一段纯净的语音波形“中央革命根据地”;(b)是加入SNR=-5 dB的白噪声;(c)是经过GSC结构处理后的波形,其中方向估计误差为3°;(d)是因为目标方向估计误差产生的泄露语音。

通过分析比较GSC结构处理前后的语音信号频谱图和语谱图,找出语音泄漏的地方,以及GSC结构处理后输出语音的受损程度,进而提出改进算法。

图2 传统GSC结构语音增强仿真图

2 基于小波阈值去噪的自适应波束形成算法

为了能更有效地消除残留噪声,减少原语音的泄漏,提高语音的辨识度,提出在GSC结构处理前,对原始语音进行小波阈值去噪,信噪比有所提高,此时再将去噪后的语音信号通过GSC结构时,结果会更加准确,因此能有效消除残留噪声并且减少语音的泄漏。其关键是提高含噪语音的信噪比。算法主要分为五个部分:

(1)将含噪信号进行预处理,包括分帧、预加重、端点检测。

(2)使用小波函数对信号进行多尺度分解,得出各尺度小波系数。常见的小波基有Haar小波基、db系列小波基、Coiflets小波基、Symlets小波基等。文中选取Symlets小波基。

(3)对各尺度小波系数进行阈值处理。

(4)利用小波逆变换重构语音信号。

(5)将小波阈值去噪后的语音信号通过GSC结构,得到最终输出的语音信号。

原理框图如图3所示。

图3 小波阈值去噪结构框图

2.1 小波阈值去噪算法

Donoho提出的小波阈值去噪是目前工程运用中最广泛的方法。由于有用信号和混有的噪声经过小波变换后统计特性不一样,即信号能量集中在一些大的小波系数中,而噪声能量分散在整个小波域中。在小波域小波系数幅值大一点的对应有用信号,幅值小一点的对应噪声信号。即经过小波分解后,噪声系数小于信号系数。因此找到一个临界值th为阈值,如果分解系数大于阈值,则主要由信号引起;反之,主要由噪声引起[8]。把主要由信号引起的这一部分保留下来,用得到的小波系数进行小波重构,得到去除噪声之后的信号[8]。传统的小波阈值去噪方法[13]分为两种:

(1)硬阈值法。

当小波系数绝对值小于阈值th时,则将其置为0;当小波系数绝对值大于等于阈值th时,则小波系数保持不变。

(6)

(2)软阈值法。

当小波系数绝对值小于阈值th时,则将其置为0;当小波系数绝对值大于等于阈值th时,则取小波系数绝对值与阈值的差值。

(7)

在文献[13]中,通过比较硬阈值法,软阈值法以及提出的改进多项式插值法,发现改进多项式插值法消噪效果更佳。因此,文中选用改进多项式插值法:

(8)

(9)

通过式(9)可以看出,改进的多项式法在整个定义域内既连续也可导,避免了硬阈值法的不连续性,同时,在|Wj,k|>t的范围内,由于Wi,j是无偏估计,因此改进的多项式法也同样避免了软阈值法的不足。

2.2 实验与仿真

通过Matlab仿真实现文中改进算法,如图4和图5所示。

图4 GSC结构处理后的语音以及语音泄漏

图5 改进算法处理后的语音以及语音泄漏

经过图4和图5比较可知,小波阈值去噪相对传统算法而言,提高了语音信号的信噪比,减少通过GSC结构产生的残留噪声,并且减少了语音泄漏。另外,在文献[7]的基础上,文中进行了听力辨别试验[14]。搜集200个含清辅音的词语,如果听力正常的试验者能准确说出每个词语,那么就能正确辨识。先将这150个词语分别在信噪比为-5,-3,0,5的环境下通过GSC结构后,让一组试验者辨识;同理,将这200个词语分别在同样的信噪比情况下通过改进算法后,让另一组试验者辨识。两组计算平均辨识率,如图6所示。

由上述实验可知,改进算法确实提高了语音的辨识度,改善了语音质量,达到了语音增强[15]的目的。

3 结束语

为达到提高语音增强算法的目的,将小波阈值去噪与GSC自适应波束形成算法进行了有机结合,提出了一种改进算法。该算法提高了通过GSC结构前语音信号的信噪比,使得通过GSC结构会更加准确,减少了残留噪声以及语音泄漏。实验测试结果表明,改进算法提高了语音的辨识度和语音增强效果。

[1] 姚 瑶.基于小波分析的语音信号增强的研究[J].信息通信,2010,5(3):59-61.

[2] 洪 鸥.麦克风阵列语音增强技术及其应用[J].微计算机信息,2006,22(1-1):142-144.

[3] 徐 进,赵益波,郭业才.一种新的麦克风阵列自适应语音增强方法[J].应用科学学报,2015,33(2):187-193.

[4] Cornelis B,Doclo S,Tim V D B,et al.Theoretical analysis of binaural multi-microphone noise reduction techniques[J].IEEE Transactions on Audio,Speech,and Language Processing,2010,18(2):342-355.

[5] McCowan I A, Moore D C, Sridharan S. Near-field adaptive beamformer for robust speech recognition[J].Digital Signal Processing,2002,12(1):87-106.

[6] Hoshuyama O,Sugiyama A,Hirano A.A robust adaptive be-amformer for micro-phone arrays with a blocking matrix using constrained adaptive filters[J].IEEE Transactions on Signal Processing,1999,47(10):2677-2684.

[7] 高婉贞,张玲华,曹旭来,等.基于GSC结构的多通道语音补偿算法研究[J].南京邮电大学学报:自然科学版,2014,34(4):51-56.

[8] 吴光文,王昌明,包建东,等.基于自适应阈值函数的小波阈值去噪方法[J].电子与信息学报,2014,36(6):1340-1347.

[9] Lallouani A, Gabrea M, Gargour C S.Wavelet based speech enhancement using two different threshold based denoising algorithms[C]//Canadian conference on electrical and computer engineering.[s.l.]:[s.n.],2004:315-318.

[10] Gannot S,Cohen I.Speech enhancement based on the general transfer function GSC and postfiltering[J].IEEE Transactions on Speech and Audio Processing,2004,12(6):561-571.

[11] Rui Y,Florencio D.Time delay estimation in the presence of correlated noise and reverberation[C]//IEEE international conference on acoustics,speech,and signal processing.[s.l.]:IEEE,2004:133-136.

[12] Nordebo S,Claesson I,Nordholm S.Adaptive beamforming: spatial filter designed blocking matrix[J].IEEE Journal of Oceanic Engineering,1994,19(4):583-590.

[13] 李海东,李 青.基于阈值法的小波去噪算法研究[J].计算机技术与发展,2009,19(7):56-58.

[14] 杨 琳,张建平,颜永红.单通道语音增强算法对汉语语音可懂度影响的研究[J].声学学报,2010,35(2):248-253.

[15] Fukane A R,Sahare S L.Enhancement of noisy speech singnals for hearing aids[C]//International conference on computational intelligence & communication networks.[s.l.]:[s.n.],2011:648-652.

Investigation on Adaptive Beamforming Algorithm with Wavelet Denoising

WEN Xiao-fang,ZHANG Ling-hua,GAO Wan-zhen

(College of Telecommunication & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

Speech enhancement algorithm is a key technique in digital hearing aid.The Generalized Sidelobe Canceller (GSC) adaptive beamforming algorithm can effectively remove the fixed interference source noise in the target speech.Aimed at the residual noise and speech leakage problems caused by the generalized sidelobe canceller adaptive beamforming algorithm,on the basis of analysis on the reasons for speech leakage and introduction of wavelet threshold denoising technology,the adaptive beamforming algorithm based on wavelet denoising has been proposed.After the denoising of wavelet threshold value has employed to deal with original speech,the outputs of audio signal through GSC structure obtained.Since wavelet threshold,value denoising can improve the SNR of the speech signal effectively and can reduce speech leakage with certain content,and enhance the speech recognition.The experimental results show that performance of the improved algorithm and the effects of speech enhancement have been achieved.

generalized sidelobe canceller;speech leakage;wavelet threshold denoising;speech recognition

2016-06-16

2016-10-19 网络出版时间:2017-04-28

江苏省教育自然科学研究重大项目(13KJA510003);江苏高校优势学科建设工程资助项目(PAPD)

文小方(1991-),女,硕士研究生,研究方向为现代语音处理与通信技术;张玲华,教授,博士生导师,通信作者,研究方向为语音处理与现代语音通信技术、无线通信中的信号处理。

http://kns.cnki.net/kcms/detail/61.1450.TP.20170428.1702.026.html

TP301.6

A

1673-629X(2017)06-0169-04

10.3969/j.issn.1673-629X.2017.06.035

猜你喜欢
旁瓣小波麦克风
约束优化的空间变迹算法的旁瓣抑制应用
基于圆柱阵通信系统的广义旁瓣对消算法
构造Daubechies小波的一些注记
一种基于线性规划的频率编码旁瓣抑制方法
基于Haar小波的非线性随机Ito- Volterra积分方程的数值解
汽车内麦克风阵列布放位置优化方法研究*
基于MATLAB的小波降噪研究
基于加权积分旁瓣最小化的随机多相码设计
麦克风的艺术
讯飞输入法也能离线语音输入