张正丽,包化伟,刘宇红
(贵州大学 电子信息学院,贵州 贵阳 550025)
语音信号是一种在复杂生活环境中容易通过多种方式混入噪声的非平稳信号,通常以加性噪声为主。目前语音降噪主要的方法主要有[1]:傅里叶变换(FT)、窗口傅里叶变换(WFT)、滤波器法和小波变换(WT)法等。FT方法是恒窗的,不宜用于具有非平稳特性的语音信号降噪。针对噪声的特点,又提出了自适应滤波器,该方法在某种程度上对白噪声的去除有很好的效果,但其收敛速度较慢、计算量较大。WFT方法主要是分割信号,将信号划分成多个小的时间间隔,再用FT方法进行分析,其窗口形状固定不变。WT方法对低频信号采用扁平的窗口,而对高频信号其窗口自动变得瘦长,其时频窗口形状是根据信号情况而自适应变化。因此,对于非平稳的语音信号,WT方法更具优势。从一定程度上说,采用小波分解和重构的方法能很好解决语音信号降噪的问题。近年来,应用小波的方法进行去噪也获得了非常可观的效果[2-3]。文中主要采用小波阈值法[4-5]对信号进行处理。
文中获取的语音信号源是通过使用WindowsXp操作系统下自带的录音机进行录音并存储为16k采样的.wav格式得到。再在原始语音信号的基础上加入随机噪声,改变其携带噪声的程度,得到不同信噪比的信源。
若原始语音信号的时域函数为f(t),加性噪声为高斯白噪声,其信号时域函数为n(t),那么,带噪语音信号在时域的表达式就写为式(1)的形式。
语音信号为非平稳信号,所以在语音信号处理过程中,可将其进行约为20~30 ms的分帧处理。针对每一帧信号,都可以近似于平稳信号。在信号近似平稳之后即可进行小波降噪处理。
分帧即是将信号按照一定的时间长度来进行分段。分帧可采取连续分段的方式,也可采用交叠分段的方法,交叠分段的方法可使帧与帧之间过渡更加平滑,保持其连续性。加窗可使每帧语音信号的时域波形两端变化平滑,从而缓慢的降为零,减小语音帧的截断效应。
分帧是用可移动的有限长度窗口进行加权的方法来实现的,即使用一定的窗函数w(t)来乘y(t),从而形成加窗后的语音信号式(2):
2.2.1 小波分解
小波[6]是一种函数,这种函数在有限时间范围内变化,且平均值为0。小波具有两种性质,第一:在有限时间范围内平均值为0;第二:具有有限的持续时间和突变的频率和振幅。
信号的小波分解[7]情况如下所示:已知式(3)的 fN,确定 fN-M及 gj,j=N-1,N-2,…,N-M,
fj∈Vj,gj∈Wj;fN是 f∈L2(R)的逼近。反过来,已知gj及 fN-M而求 fN,即为小波的重构。
设 φj,k(j∈z,k∈z)为小波空间{Wj}j∈Z的一组正交基。另设y(t)∈Vj-1,将其分别投影到Vj和Wj空间,得y(t)在j尺度下的小波分解:
式中,cj,k和 dj,k分别为 j尺度空间的剩余系数和小波系数。
2.2.2 sym3 小波
symN函数系是由Daubechies提出的近似对称的小波函数,是对db函数的一种改进。sym3小波为紧支正交基,满足精确重构的条件。其小波函数与尺度函数的有效支撑长度为5,小波函数的消失矩为3。sym3小波函数表达式如式(5):
图1为紧支区间内迭代1次得到的sym3小波函数和尺度函数。
图1 sym3小波函数及尺度函数Fig.1 Sym3 wavelet function and scaling function
2.2.3 小波阈值降噪
在进行一维小波多尺度分解后,将会得到信号和噪声的小波谱分量,而去掉噪声产生的小波谱分量就是小波降噪的关键所在。小波降噪的核心是根据噪声信号与原始有效信号在各尺度上的小波谱不同的特点,将各尺度上由噪声产生的小波谱分量以及噪声小波谱占主导地位的尺度上的谱分量去掉,同时保留并适当地增强有效信号的小波谱,最后利用小波变换重构算法,重构信号。
定义如式(6):
为硬阈值函数;如式(7):
为软阈值函数。
硬阈值法是使对数值大于λ的小波系数保留,其余系数全为0;软阈值法是指先将小波系数与阈值λ进行比较,然后根据比较结果再向0进行收缩。
具体实现方法为:将携带噪声的语音信号作分帧处理,对各帧信号在sym3小波下进行小波分解,得到各层的分解系数。基于每层包含的有效信号成分不同,在分别采用硬阈值、软阈值以及软硬阈值结合的方法对系数处理的前提下,对各层系数采用不同的阈值进行处理;对在信号中起重要作用的分量作适当的增强处理,对噪声谱分量作抑制处理。以提高信噪比,达到更好的降噪效果。
输出信噪比snr作为降噪的重要指标,它通过式(8)得出:
式中,Pf和Py分别为纯信号功率和处理后信号的噪声功率。若输出信噪比越大,则表面降噪效果越明显。
文中分别用不同的阈值函数对不同信噪比的一系列输入信号“自动.wav”、“设置.wav”、“时间.wav”、“系统.wav”、“确定.wav”(语音信号采样频率为16 k,量化 16比特)等分别进行降噪处理。图2(a)是“自动.wav”原始纯净语音信号、图2(b)是其噪声方差为0.2时的语音信号时域波形(以信号“自动.wav”的处理结果为例给出客观效果图)。
图2 “自动.wav”时域波形Fig.2 Wave of‘aoto.wav’in time domain
文中进行的一系列仿真研究过程如下:
1)载入信号。将一段不同信噪比的语音信号“自动.wav”(输入信号信噪比通过改变噪声的方差实现)的时域波形载入matlab8.0。
2)分帧加窗。将“自动.wav”采用每帧为25 ms的分帧处理,并加以hamming窗。
3)小波分解。对带噪信号进行一维小波多尺度分解,文中对信号进行6层分解。
4)系数处理。每帧信号均在不同的尺度采取不同的阈值处理。
5)小波重构。经阈值处理后的信号在基于小波重构算法下进行重构,还原信号。
6)语音连接。将分帧处理后的语音片段连接成连续语音。
每次处理结束后,改变输入信号噪声方差,反复进行研究。
图3为信号在噪声方差为0.2时通过硬阈值、软阈值以及软硬阈值结合方法对一帧信号进行处理分别得到的降噪效果。图2(c)为在软硬阈值结合降噪处理方法下得到的“自动.wav”时域波形。
图3 噪声方差为0.2时不同方法的降噪效果Fig.3 Results different ways in noise variance 0.2
在不同噪声方差的输入信号下,得到对信号处理后的结果。表1为不同方法下得到的信噪比统计。
表1 处理结果统计Table 1 Statistics of processing results
仿真结果显示:硬阈值法能够得到粗糙的降噪结果以及相对最低的信噪比;软阈值法得到的结果相对硬阈值要平滑且信噪比较高;软硬阈值结合的方法能使降噪结果最接近原始语音信号、得到最高的信噪比。从试听效果看来:硬阈值法得到的语音较生硬,而软硬阈值结合的方法就可以得到很自然的降噪信号,其听觉效果与原始信号吻合。
文中通过对多个相同采样频率的语音信号段进行处理,研究显示:小波阈值处理的方法中,软硬阈值结合的方法处理效果最好,软阈值次之,硬阈值的效果最差。噪声越强,得到的处理效果越差。文中处理的繁杂之处在于阈值的选取,对于降噪阈值过大或过小都影响最终的降噪效果,阈值过大会造成语音的细节部分丢失,得到很空旷的语音;阈值过小则得不到最好的降噪效果。在此同时也需要进一步研究,对现有的方法进行改进或找出其他适合语音信号的降噪方法,力求结果更加完美。
[1]赵力.语音信号处理[M].北京:机械工程出版社,2010:34-36.ZHAO Li.Speech Signal Processing[M].Bei Jing:China Machine Press,2010:34-36.
[2]黄文丽,裘咏霄,陈茂源,等.小波阈值法在图像去噪中的应用[J].电子技术,2010,47(04):1-3.HUANG Wen-li,QIU Yong-xiao,CHEN Mao-Yuan,et al.Application of Wavelet Threshold Method in Image Denoising[J].Electronic Technology,2010,47(04):1-3.
[3]周予,刘宇红.db3小波在图像钝化中的应用[J].通信技术,2013,46(03):77-79.ZHOU Yu,LIU Yu-hong.Application of Db3 Wavelet in Image Passivation [J].CommunicationsTechnology,2013,46(03):77-79.
[4]朱建华,田岚.基于谱减法和小波阈值的新型语音降噪算法研究[J].煤炭技术,2013,32(01):171-173.ZHU Jian-hua,TIAN Lan.Research on New Speech Denoising based on SpectralSubtraction and Wavelet Threshold Method[J].Coal Technology,2013,32(01):171-173.
[5]张宝琳,张玲华,林志敏.基于多分辨率小波阈值去噪的响度补偿方法[J].计算机技术与发展,2012,22(12):83-86.ZHANG Bao-lin,ZHANG Ling-hua,LIN Zhi-min.A Loudness Compensation Method Based on Multi-resolution Wavelet Threshold De-noising[J].Computer Technology And Development.2012,22(12):83-86.
[6]邸继征.小波分析原理[M].北京:科学出版社,2010:60-64.DI Ji-zheng.Wavelet Analysis Theory[M].Bei Jing:Science Press,2010:60-64.
[7]李冠,吴尽昭,范明钰.基于小波的信号去噪分析[J].通信技术,2010,43(09):80-84.LI Guan,WU Jin-zhao,FAN Ming-yu.Signal De-noising Analysis based on Wavelet[J].Communications Technology,2010,43(09):80-84.