基于滤波器组的MCAF噪声对消语音增强

2010-05-13 08:46斌,申明军,曾庆宁
现代电子技术 2009年12期

黄 斌,申明军,曾庆宁

摘 要:在自适应噪声对消语音增强系统中,为了更好地加快自适应收敛速度,又不增加系统的计算复杂度,同时达到较好的增强效果,提出基于滤波器组的多通道自适应滤波(MCAF)语音增强;给出分析滤波器组与综合滤波器组的原型滤波器设计的具体方法。自适应滤波部分采用经典的LMS算法,同时结合多通道自适应滤波(MCAF),实现对含噪语音的处理,以达到增强效果。实验结果表明,相对于传统的子带LMS算法,基于滤波器组的多通道自适应滤波具有更好的性能,且加快了计算速度。

关键词:滤波器组;多通道自适应滤波;语音增强;原型滤波器

中图分类号:TN913文献标识码:A

文章编号:1004-373X(2009)12-156-03

MCAF Noise Cancellation Speech Enhancement Based on Filter Banks

HUANG Bin,SHEN Mingjun,ZENG Qingning

(Information & Communication College,Guilin University of Electronic Technology,Guilin,541004,China)

Abstract:In adaptive noise cancellation speech enhancement system,in order to better speed up the convergence rate adaptive,not increase the complexity of the system,and to better enhance the effect,methods based on filter banks and the Multi-channel Adaptive Filtering (MCAF) speech enhancement are proposed.the specific design methods of analysis of filters and filter group prototype filter are given.The adaptive filtering part uses the classic LMS algorithm combination of Multi-channel Adaptive Filter (MCAF),realization of the noise to deal with to enhance the effect.The results show that,compared to the traditional sub-band LMS algorithm,based on the multi-channel filter banks adaptive filter has better performance,and accelerate pace of the calculation.

Keywords:filter banks;multi-channel adaptive filter;speech enhancement;prototype filter

0 引 言

现实生活中,语音总会受到外界环境噪声的干扰而影响语音的通话质量。严重情况下会将语音完全淹没在噪声中,使语音无法分辨。语音增强的目的就是从带噪语音中提取尽可能纯净的原始语音。

关于信号的子带分解[1,2],涉及多速率数字信号处理,在近年来有许多研究和发展。在信号的子带分解中,存在着由于分析滤波器组的非理想特性引起的子带信号混叠问题。为了避免混叠对自适应滤波的影响,可以采用加入子带间滤波的方法,也可采取在抽取时过采样,即抽取的比率低于子带数的方法。文章考虑后一种方案。

自适应滤波[3-5]广泛应用于系统辨识、谱估计、回波抵消以及信道均衡等领域。最常采用的是利用自适应算法调节的横向滤波器,虽然结构简单,但具有很好的稳健性。近年来,基于子带分解的自适应滤波[6,7],以其在提高收敛性能的同时,节省了一定的计算量,因而受到许多研究者的关注,已得到了若干有意义的结果。基于子带分解的自适应滤波是先由分解滤波器组抽取,输入信号和参考信号进行子带分解,再将信号按频带划分;然后在各个子带上分别进行自适应滤波,再将子带信号内插后通过合成滤波器组得到最后的合成信号。由于对信号的抽取,使完成自适应滤波所需的计算量得以减少;而由于在子带进行自适应滤波,又使收敛性能有所提高。

1 滤波器组与子带分解

1.1 信号的子带分解

将信号进行子带分解的原理如图1所示,x(n)为输入信号;x∧(n)为理想重建输出信号;y0(n),y1(n),…,yM-1(n)是分解在M个子带上的信号。H0(z),H1(z),…,HM-1(z)和F0(z),F1(z),…,FM-1(z)分别是分解滤波器组和合成滤波器组的函数;↓D 表示对信号的抽取,即下采样,表明将输入的数据每间隔D-1个输出;↑D表示对信号的内插,即上采样,表明在每两个输入数据中插入D-1个0再输出。

图1 信号的子带分解

1.2 滤波器组的设计[8]

多速率信号处理[9]系统在语音和图像的压缩、去噪、尺度变换和自适应滤波等很多领域都有着重要的应用。通常的设计要求系统满足完全重构或是几乎完全重构的条件。在这种情况下,子带信号中允许有一定的混叠存在,这可以通过选择合适的综合滤波器组来消除。最先考虑的是采用一个原型滤波器的结构,分析与综合滤波器的Fourier变换互为共轭[10]。设分析与综合滤波器组的原型滤波器分别为H(z)与G(z),即有H(z)=G(z)*。所有分析滤波器都可以从式(1)得到:

hm(n)=h(n)W-mnM蹾m(z)=H(zWmM)(1)

式中:WM=e-j2π/M,m=0,1,2,…,M-1。同样,综合滤波器可由式(1)得到:

gm(n)=g(n)W-mnM蹽m(z)=G(zWmM)(2)

理想的滤波器组是一组带通滤波器,具有标准的中心频率ωm=2π(m/M)和带宽2π/M。其中m=1,2,…,M-1。一种直接设计原型滤波器的方法是设计一低通滤波器,通带中心在ω=0处。下面设计一个原型滤波器。

设Hd(z)为原型分析滤波器的期望频率响应,定义为:

Hd(ejω)=e-jωτH,ω∈Ωp(3)

式中:Ωp=[-ωp,ωp]为通带范围;τH是原型分析滤波器组期望的群延时即为整个滤波器组的延时。让式(1)最小:

εh=12ωp∫ωp-ωp|H(ejω)-Hd(ejω)|2dω(4)

式中,h=[h(0)h(1)…h(Ln-1)]T。将式(4)变为:

εh=αh+βh(5)

式中:αh为通带内响应误差;βh为带内失真,定义:

αh=12ωp∫ωp-ωp|H(ejω)-Hd(ejω)|2dω=

12ωp∫ωp-ωp{|H(ejω)|2-2Re[H*d(ejω)H(ejω)]+

|Hd(ejω)|2}dω(6)

βh=12π∫π-π∑Dd=1|H(ejω/DWdD)|2dω(7)

其中WD=e-j2π/D。原型分析滤波器的冲击响应为:

H(z)=∑nh(n)z-n=hTφh(z)(8)

其中:

φh(z)=[1,z-1,…,z-Lh+1]T(9)

式(9)中,Lh为滤波器长度,将式(3)与式(9)代入式(6),可得:

αh=12ωp∫ωp-ωp{hTφh(ejω)φHh(ejω)h-

2Re[ejωτHhTφHh(ejω)]+1}dω(10)

其中(•)H表示共轭转置。上式重写如下:

αh=hΤAh-2hTb+1(11)

式中:A为Lh×Lh的矩阵,即:

A=12ωp∫ωp-ωp[φh(ejω)φHh(ejω)]dω

可由Ai,j=sin[ωp(j-i)]ωp(j-i)来计算;b是Lh×1的向量,可由bi=sin[ωp(τH-i)]ωp(τH-i)计算。其中,i,j=0,1,2,…,Lh-1。

带内失真可以重写如下:

βh=12π∑Dd=1hT

[∫π-πφh(ejω/DWdD)φHh(ejω/DWdD)dω]h(12)

写成向量形式为:

βh=hΤCh(13)

其中:

C=12π∑Dd=1∫π-πφh(ejω/DWdD)φHh(ejω/DWdD)dω

可由:

ci,j=φ(j-i)sin[π(j-i)/D]/π(j-i)

来计算,这里的φ(n)=D∑∞k=-∞δ(n-kD)-1。

则式(5)可表示为:

εh=hT(A+C)h-2hTb+1(14)

原型分析滤波器的设计问题变为最佳问题,即:

hopt=argminh{hT(A+C)h-2hTb+1}(15)

计算结果如下:

(A+C)h=b,即h=(A+C)-1b(16)

文中选取子带分解个数为M=8,抽取因子为D=6,滤波器长度Lh=Lf=96。图2给出了原型分析滤波器的幅频图;图3为分析滤波器组的幅频特性图。

图2 原型滤波器的幅频特性

图3 分析滤波器组的频响特性

2 子带自适应滤波

2.1 结构框图

基于滤波器组子带分解的MCAF结构如图4 所示。将输入信号x(n)和参考信号ns(n)分别进行子带分解,利用分析滤波器组hm(n),m=0,1,2,…,M-1,将输入的宽带信号分解到M个子带,并对每个子带的信号以因子D进行抽取(D

图4 滤波器组子带分解的多通道自适应滤波

2.2 计算的复杂度估计

对于一个自适应滤波算法,如果全带滤波器的长度为Lf,设完成一次迭代的运算量为Lf (或L2f ,根据不同的自适应算法而异)数量级,则利用相应的子带自适应滤波。由于以较低的速度更新较少的系数,相应的自适应部分的运算量为原来的M/D2(或M/D3)[11]。

3 实验仿真与结果

输入的纯净语音信号与带噪信号如图5所示。

图5 纯净语音信号与输入信号

信号采样率为8 kHz,信噪比SNR为-10 dB,分析滤波器组的幅频特性如图3所示,子带分解个数为M=8,抽取因子为D=6,分析综合滤波器长度Lh=Lf=96阶,下分支多通道自适应(MCAF)滤波器采用FIR滤波器,长度N=56阶,LMS算法步长在0.1时最佳。图6给出全带LMS算法与滤波器组下的子带LMS算法增强效果。由图可见,后者的收敛速度更快。图7给出两者与输入信号的信噪比增益图。

图6 传统子带LMS算法与滤波器组的子带分解LMS算法

图7 信噪比增益图

4 结 语

研究基于滤波器组的多通道自适应滤波,由于分解滤波器组的非理想特性,有必要采取子带间滤波。但在滤波器组近似理想特性时,可以降低子带间滤波器的阶数,以节省计算量。在这方面进一步的研究应包括更优滤波器组的选择,多带分解的情况等;使得在输入信号频谱特性很差(起伏很大,或有零点),即自相关矩阵的特征值很分散的情况下,能有效地提高自适应滤波的收敛性能,并减少计算量。基于滤波器组的语音增强结构,通过将自适应部分的宽带输入信号分解到各个子带,加快了自适应部分的收敛速度。实验结果表明,相对基于传统子带LMS语音增强系统来说,该系统有更快的收敛速度,且增强后的语音信噪比约有3~4 dB的提高。

参考文献

[1]Papoulis E V Stathaki T.New Structures for Adaptive Filtering in Subbands Based on Transmultiplexers [J].IEEE International Acoustics,Speech and Signal Processing,2002:1 557-1 560.

[2]Hu Wen,Farooq O,Datta S.Wavelet-based Sub-space Features for Face Recognition[J].IEEE Image and Signal Processing,2008:426-430.

[3]Allred D J,Heejong Yoo Krishnan,Huang V,et al.LMS Adaptive Filters Using Distributed Arithmetic for High Throughput[J].IEEE Trans.2005:1 327-1 337.

[4]Griesbach J D,Lightner M,Etter D M.Basis Expansion Adaptive Filters for Time-varying System Identification [J].IEEE Signals,Systems and Computers,2000:1 489-1 493.

[5]Deng G.Partial Update and Sparse Adaptive Filters [J].IET Signal Processing,2007:9-17.

[6]Patnaik S,Patnaik Y,Upadhya A.RLS Algorithm-based Sub-band Decomposition for Low Memory Multimedia Applications[J].Advanced Communication Technology,2006:20-22.

[7]Larson L O,de Haan J M,Claesson I.A New Subband Weight Transform for Delayless Subband Adaptive Filtering Structures[J].IEEE Digital Signal Processing.2002:201-206.

[8]Ma X J,Xie X M,Shi G M,et al.A Simple Design of M-channel FIR Wavelet-like Filter Bank[J].IEEE Intelligent Signal Processing and Communication Systems,2007:474-477.

[9]Xu Lijun,Han Jun.Cancellation of Harmonic Interference Using Multi-Rate Signal Processing Techniques[A].IEEE Instrumentation and Measurement Technology Conference[C].2006:1 392-1 396.

[10]Wilbur M R,Davidson T N,Reilly J P.Efficient Designing of Oversampled NPR GDFT Filter Banks [J].IEEE Trans.on Signal Processing,2004,52(7):1 962-1 974.

[11]Wei Liu,Stephan Weiss,Lajos Hanzo.Subband Adaptive Generalized Sidelobe Canceller for Broadband Beamforming[A].Proceedings of the 11th IEEE Workshop on Statistical Signal Processing[C].2001:591-594.