张洪涛,裴 浩,周 航
(1湖北工业大学电气与电子工程学院,湖北 武汉430068;2许继集团有限公司,河南 许昌461000)
语音通信过程中经常会受到各种噪声的影响而导致通信质量的下降.语音增强一直是人们研究的热点,并且不断有新的方法出现,但是由于噪声的性质各有不同,至今尚未找到一种能对各种噪声都具有较好的抗噪效果的算法.只能根据噪声特性的不同,使用有针对性的增强方法.根据加性宽带噪声的特性,各国学者经过多年的研究得到了很多种增强算法,目前比较成熟的方法主要有维纳滤波法、谱减法、卡尔曼滤波法、FIR自适应滤波法等[1].近年来一些新的语音增强算法也不断被提出来,例如基于小波变换的语音增强方法、基于听觉掩蔽效应的语音增强方法、基于盲源分离的语音增强算法等[2].本文根据算法降噪效果和复杂度综合考虑,采用成熟的谱减法和新兴的小波变换联合降噪方法对加性宽带噪声进行降噪以达到语音增强的目的.
谱减法:根据带噪的语音信号频域的功率谱减去噪声的估计功率谱的差值,从而得到原始纯净语音频域的功率谱的估计值,然后开平方运算获得纯净语音的幅度值的估计,由于人耳对相位信息不敏感,所以可以根据原带噪语音的相位信息直接恢复出估计的纯语音相位,再采用傅里叶的逆变换获得语音的时域信号[3].
设y(n)表示时域带噪语音信号,s(n)表示时域纯净语音信号,d(n)表示时域噪声信号,由于是加性噪声,所以有
其中,n为每一帧上的采样数据点序号,n的取值为n=0,1,…N-1,N是每一帧的数据点数,在这里取N=256.假设语音s(n)和噪声d(n)统计独立或不相关,用Y(k)、S(k)、D(k)分别表示y(n)、s(n)、d(n)的傅里叶变换,则有
计算功率谱后有
其中 *代表共轭复数.由于s(n)与d(n)具有统计独立假设条件,所以它们的互谱就统计独立,即有
根据上面的推导得到纯净语音的功率谱估计值
从上式中可以看出谱减法的关键是如何实时准确地从带噪语音中估计出噪声功率谱.Rainer Martin经过研究提出了一种噪声的估计算法[4].该算法首先将带噪语音信号的短时功率谱用一个最优信号平滑滤波器进行滤波处理,得到一个粗略的噪声功率谱的估计值,然后在一定的数据帧中找出这个估计值的最小值,再根据这个最小值采用修正算法进行噪声功率谱的偏差修正,从而获得需要的噪声的功率谱估计最终值[5].这种算法具有能快速跟踪噪声的变化的优点并且不需要进行语音断点检测.
设P(λ,k)表示噪声功率谱,其中λ表示数据帧号,k表示频率点号.噪声功率谱平滑估计公式表示为
恢复的语音可以根据下面的式子得到
其中arg(Y(k))是带噪语音的相位值.
小波(wavelet)是一种均值为零,长度为有限值的小区域波[9].它的准确函数定义为:设函数Ψ(t)∈L2(R),即是一个平方可积的函数,如果其傅里叶变换满足下面的条件[10]
那么就可以称Ψ(t)是一个小波基或母小波函数,称式(2)是小波函数的完全重构条件或恒等分辨条件.将基小波函数Ψ(t)进行伸缩和平移运算,就可以得到
称上式为一个小波序列,其中a称作伸缩因子,b称作平移因子,将伸缩因子a和平移因子b离散化就得到了离散化小波序列[11].一般情况下的离散化分别取其中m∈Z,a0是一个不等于1的固定值[12].由此可以得到离散小波序列
对应的离散小波变换类似于傅里叶变换,其表达式为
同样类似于离散傅里叶逆变换,其逆变换可以表示为
其中C是一个常数.
小波语音信号降噪通常采用阈值降噪方法,一般可以分解为以下三个步骤[13]:(1)选择一个合适的小波基函数,然后将信号进行适当层次的小波分解.(2)对各个分解层高频系数选择一种合适的阈值策略,然后再利用软阈值处理方法分别对各层高频系数进行量化处理[14].(3)依据量化处理后的各层高频系数与信号的小波分解后最后一层的低频系数进行小波逆变换.
笔者首先将经过麦克风采集到的一段(5s)带噪语音信号在MATLAB仿真平台上使用其自带的小波降噪函数wden对录取的带噪语音进行自动降噪.选取小波分解层数为lev=5,经过反复的降噪效果试听对比,最后选取听觉质量和降噪效果都相对较好的sym5小波和heursure启发式阈值规则,但是降噪后仍然有较严重的高频失真(图1).采用谱减法对带噪语音进行降噪处理得到图2所示的波形.
图1 小波变换语音降噪
然后经过试听可以发现采用谱减法降噪后语音信号几乎不存在失真,但是降噪后有明显的“音乐噪声”存在.我们对谱减法降噪后的语音采取上面所述的小波自动降噪,得到联合降噪波形(图3).
经过试听发现经过小波再次降噪后,“音乐噪声”明显减少,降噪程度进一步提高,并且只存在少量高频失真.
从上面的降噪实验可以发现采用谱减法和小波变换联合降噪可以在很大程度上克服两种方法单独降噪存在的不足之处.
[1]刘 钰,马艳丽,董蓓蓓.语音增强技术及算法综述[J].电脑编程技术与维护,2010(16):88-90.
[2]刘淑华.低信噪比下的语音增强技术研究[D].南宁:广西大学图书馆,2006.
[3]索忠伟.语音增强技术研究及其DSP实现[D].成都:西南交通大学图书馆,2006.
[4]刘 静.机载环境下语音噪声抑制技术研究及实现[D].成都:电子科技大学图书馆,2008.
[5]刘玉军,孔 洲,徐万里,等.基于谱减法的装甲车辆语音降噪研究[J].计算机工程与设计,2010,31(2):4 657-4 660.
[6]丁晓敏.强噪声环境下语音增强算法的研究及其DSP实现[D].南京:南京航空航天大学图书馆,2010.
[7]Abdallah I,Montresor S,Baudry M.Robust Speech/non-speech Detection in Adverse Conditions Using an Entropy Based Estinator[C].International Conference on Digital Signal Processing,1997:757-760.
[8]张 俊.基于谱减算法语音增强的研究[J].信息技术,2009(3):74-76.
[9]成礼智,郭汉伟.小波与离散变换理论及工程实践[M].北京:清华大学出版社,2005:9-13.
[10]戴春风.基于小波变换的语音降噪分析与实现[J].南通职业大学学报,2006,20(4):95-97.
[11]张林林.基于DSP实现的语音联合降噪方法的研究[D].焦作:河南理工大学图书馆,2011.
[12]盛 英.基于小波变换的语音信号降噪研究[D].哈尔滨:哈尔滨工程大学图书馆,2007.
[13]陈新锐.基于小波语音去噪的FPGA系统设计与实现[D].桂林:广西师范大学图书馆,2010.
[14]马建仓,陈 静,刘小龙.小波降噪与BSS在航空发动机故障诊断中的应用[J].计算机测量与控制,2009,17(11):2 115-2 117.