王贤波 李盛 张缓缓
摘要:在语音通信中,常常会受到外界环境干扰,传统的谱减法虽可抑制噪声,但信号处理的过程中伴随着音频噪声。背景很强的机械噪声采用谱减法会产生很强的音乐噪声。文章基于DSP实现的多频段谱减法,结果表明,利用DSP实现多频段谱减法的语音增强系统能够减少背景很强的机械噪声产生的音乐噪声。
关键词:语音增强;多频段;谱减法;DSP
随着数字信号处理的发展,语音信号处理领域越来越受到关注,语音信号处理是实现人机交互和通信技术的必要方法[1]。但语音通信过程中噪声的污染是不可避免的,尤其是在一些强的噪声环境中,语音识别系统的识别率将会受到严重影响。谱减法是语音增强去噪的主要方法之一,它是通过从含噪的功率谱中直接减去噪声功率谱,来估计纯净功率谱。谱减法虽然可以成功地衰减原始带噪语音中的噪声,但由于噪声是有色的,并且不会在整个频谱均匀地影响语音信号,因此,带来“音乐噪声”,且有可能听者会发现处理后的比原始信号中的噪声更为清晰[2]。因此,这里提出了基于多频带的谱减法,谱减法及其改进算法是一种基于短时谱估计的语音增强算法,它的运算量相对较小,容易实时实现,而且增强的效果明显,是最常用的语音增强算法。本文采用TMS320VC5509 DSP和TLV320AIC23组成实时系统,实时实现了多频段谱减法的语音增强。
1 多频带谱减法
谱减法的原理是基于假设信号中附加性噪声是固定的。令y(n)是嘈杂的语音信号,则它是由纯净的语音信号x(n)和噪声信号d(n)的相加。
即:y(n)=x(n)+d(n)(1)
大多数的减法型算法有不同的变化,允许灵活的光谱减法的变化。Berouti提出的广义谱减法方案如下:当α>1是超减法因子[3],这是由于信噪比的作用。β(0<β<1)则是光频谱段,y是指数取决于过度清晰度。取γ=2,β=0.002。多频段谱减法是将带噪语音、估计的噪声信号按频率划分Ⅳ个互不相交的频带,然后根据每个频带内带噪语音与估计噪声信号的信噪比,来确定该频带噪声的谱减参数[4-5]。语音频谱被划分为N个无重叠带,而谱减法在每个频带中独立执行。因此,第i波段的清洁语音频谱的估计是:
因此,多频段谱减法的系统结构框如图1所示。
2 多频段谱减法的DSP实现
本文采用TMS320VC559 DSP和TLV320AIC23 Codec组成实时系统,实现了多频段谱减法的语音增强系统,系统的结构框如图2所示。
本系统所述硬件系统有:带噪音音频输入,增强后音频输出,电源模块,TLV320AI23,TMS320VC5509芯片,利用TLV320AIC23完成信号的A/D,D/A转换,并利用TMS320VC5509中的多通道缓冲串口MCBSPI与DMA通道配合时钟工作,从而完成TLV320AI23与TMS320VC5509串口收发数据的同步。同时再利用TMS320VC5509进行对TLV320AI23端口的配置。系统使用配套套电源模块对整个系统供电,简化了电源模块的设计。电源模块带有电压监控芯片,当供电不足时可自動进行操作,使系统能够应对各种突发事件。
3 系统的软件设计
在本系统中,语音是按Bark频带划分5个频段(60~300 Hz,300~1 kHz,1~2 kHz,2-3kHz,3~5 kHz)。然后根据谱减参数的确定方法,逐帧逐频带进行参数确定和谱减,最后结合含噪语音的相位,得到输出语音。软件算法框如图3所示。
4 实验结果及分析
实验所用的纯洁语音信号来自普通话训练学习库,噪声取自机械噪声,含噪语音信号采样频率均为16 kHz,程序中窗口选取汉明窗,每帧取512个点,机械背景噪声的仿真,以及DSP多频段谱减法系统处理后刻录语音的波形如图4-5所示。
通过对比机械背景噪声下多频带MATLAB语音信号的仿真图和DSP多频带增强系统处理后波形,发现波形基本一致,采用主观评价方法,将刻录的DSP多带增强系统处理后的波形,播放给听众,并让听众复述播放的内容,以听众复述的字的个数统计,发现DSP多频带系统处理后听众的复述正确率达到90.93%。表明DSP多频段谱减法的语音增强系统能够减少背景很强的机械噪声产生的音乐噪声。
[参考文献]
[1]杨毅,李泽伟语音信号处理的实验的改革实践[J].实验室研究与探索,2014 (4):123-126.
[2]王龙基于DSP的语音增强系统的研究与设计[D]上海:华东大学,2011
[3]李圆,赵振东,杨超基于多带谱相减的语音端点检测算法[J].通信技术,2007 (11):353-356
[4]BEROUTI M, SCHWARTZ R, MAKHOUL J.Enhancement of speech corrupted by acoustic noise[Cl.Washington: Acoustics, Speech,and Signal Processing IEEE International Conference on ICASSP. IEEE Xplore, 1979: 208-211[5]SHENG L, MING N, JIANQI W,et al.Enhancement of non-air con-duct speech based on muki-band spectral subtraction method[C].Washington: Processing IEEE International Conference on Image and Signal Processing, 2008: 338-341