联合改进子空间的自适应小波包阈值语音增强算法

2016-06-08 05:48任永梅张雪英贾海蓉贾雅琼
计算机应用与软件 2016年5期
关键词:波包特征值信噪比

任永梅 张雪英 贾海蓉 贾雅琼

1(湖南工学院电气与信息工程学院 湖南 衡阳 421002)2(湖南工学院信号与信息处理重点实验室 湖南 衡阳 421002)3(太原理工大学信息工程学院 山西 太原 030024)



联合改进子空间的自适应小波包阈值语音增强算法

任永梅1,2张雪英3贾海蓉3贾雅琼1,2

1(湖南工学院电气与信息工程学院湖南 衡阳 421002)2(湖南工学院信号与信息处理重点实验室湖南 衡阳 421002)3(太原理工大学信息工程学院山西 太原 030024)

摘要针对传统自适应小波包阈值算法增强的语音存在失真的问题,提出联合改进子空间的自适应小波包阈值语音增强算法。提出的新算法对带噪语音首先做KL变换(Karhunen Loeve Transform)得到其特征值,并用自适应小波包阈值算法对该特征值进行处理,以去除部分噪声子空间;接着用递归最小二乘算法(RLS)对噪声的特征值进行估计,修正传统子空间算法容易导致的特征值估计偏差问题;最后用经过自适应小波包阈值算法处理得到的新的特征值减去噪声特征值,以去除所有噪声子空间并由KL逆变换最终还原出纯净语音。仿真结果表明新算法相比传统自适应小波包阈值算法有更优的增强效果,减少了语音失真。并且在信噪比较低的情况下,新算法对增强的语音的信噪比和分段信噪比提高得更多。

关键词语音增强小波包子空间递归最小二乘算法信噪比分段信噪比

0引言

由于子空间技术能够在残留噪声和语音失真之间统筹兼顾增强语音的质量,也可以很好地消除音乐噪声,所以此方法已经在语音增强领域得到了广泛应用。其基本思想为通过进行空间分解,把整个空间划分为噪声子空间和叠加了噪声的信号子空间,且二者相互独立,再将噪声子空间滤除,将原始信号从叠加了噪声的信号子空间中估计出来[1,2]。传统的子空间算法不能去除整个噪声子空间,所以在估计语音特征值时易引起偏差,进而导致产生语音失真等问题,因此本文首先对传统子空间方法进行改进,即利用RLS方法估计出噪声特征值,以修正传统方法中仅用无声段的方差平均值来估计噪声特征值,减少了语音失真。

小波分析作为时-频域分析方法,具有多分辨率特性和时变性,能从局部到任意细节观察信号,克服了傅立叶变换不能描述信号局部特性的不足[3]。小波包分解和小波分解的不同之处就是它对语音信号的高频部分也会做分解,具有更强的分析信号的能力。

近些年提出了基于清浊音分离[4]和基于听觉小波包[5]等自适应小波包阈值语音增强算法,文献[4]中的方法能否准确检测清音和浊音具有一定的复杂度,增强语音中仍有残留噪声;文献[5]中的方法采用小波包模拟人耳的频率分析机制,在每一频率群里采用新的阈值动态除噪,不仅算法复杂度比较高,而且人的听觉系统要比文献中的系统复杂很多,所以会引起过阈值处理现象。鉴于此,本文提出了联合改进子空间的自适应小波包阈值语音增强算法。新算法用自适应小波包阈值算法对经过霍特林变换(KL)得到的带噪语音的特征值做初步处理,去除部分噪声子空间并获得新的特征值;接着用此特征值减去RLS方法估计的噪声的特征值,以去除全部噪声子空间;最后通过KL逆变换获得增强语音;利用子空间方法能统筹兼顾语音失真和残留噪声的优势,进一步改善了传统自适应小波包阈值语音增强算法的增强效果。实验结果表明,和传统算法对比,新算法可以取得更好地去噪效果,并且减少了语音失真。

1改进的子空间语音增强算法

1.1递归最小二乘算法的原理

自适应滤波器的原理方框图[6]如图1所示,此图中的自适应方法通常采用递归最小二乘算法(RLS),本质上该算法是一种有限长单位脉冲响应维纳滤波器的时间递推算法,并严格以最小二乘法准则为依据[7]。

图1 自适应滤波器的原理方框图

RLS算法的递推公式如下:

w(n)=w(n-1)+k(n)e*(n)

(1)

e(n)=d(n)-wH(n-1)u(n)

(2)

这里,k(n)为增益向量,e(n)为预测误差,通过调整参数,力图找到噪声的最佳估计,噪声就可以得到一定程度的抵消。

递归最小二乘算法(RLS)的优点是对于非平稳信号的适应性较好,收敛速度比较快,估计精度也较高。递归最小二乘算法(RLS)自适应滤波器在噪声消除中也得到了很好的应用,所以这里采用RLS算法对噪声的特征值做估计。

1.2改进的子空间算法

在对语音信号进行处理时,通常都会假定噪声方差是已知且严格正定的,噪声矢量将存在于整个噪声语音信号张成的空间当中,因此可以认为含噪语音信号的空间由两部分组成:信号加噪声的子空间和噪声子空间[8]。子空间方法就是要去除掉噪声子空间,从而估计出语音信号,最终实现语音增强。

传统子空间算法对于噪声特征值的估计仅仅用前3000点(无声段)的方差平均值,易引起语音特征值估计偏差,导致语音失真。为此,提出改进的子空间方法,即通过自适应RLS递推更新方法估计出噪声的特征值,实现对传统子空间方法中的噪声的特征值的修正,达到减少语音失真的目的。改进的子空间算法原理方框图如图2所示。

图2 改进的子空间语音增强算法原理方框图

改进的子空间语音增强算法可按照如下四个详细步骤进行:

1) 输入的噪声语音作霍特林(KL)变换,得出其在子空间中的特征值ΛY和特征向量;

2) 估计噪声的特征值ΛN,这里采用RLS算法进行估计;

为了验证算法的有效性,在白噪声情况下,对两种算法计算出的噪声特征值进行了对比,结果如表1所示。从表1可以看出,改进子空间方法估计的噪声特征值比传统方法估计的噪声特征值更加接近于真实噪声的特征值。

表1 两种算法计算出的噪声的特征值

2联合改进子空间的自适应小波包阈值语音增强算法

2.1自适应小波包阈值去噪原理

经过小波包分解之后,语音信号的小波包系数和噪声信号的小波包系数将呈现出相反的性质。通常认为,幅值较大的小波包系数是语音信号的,而幅值较小的小波包系数是噪声信号的,所以,可以假定不同的阈值门限来阈值处理小波包系数,以去除小于阈值门限的系数,并用剩余的大于阈值门限的系数来重构信号。自适应小波包阈值去噪原理方框图如图3所示。

图3 自适应小波包阈值去噪原理方框图

2.2新的阈值函数

由于传统的硬阈值函数具有不连续性,因此在重构语音信号时不可避免地将会产生震荡现象;而软阈值函数处理后的信号幅度和纯净语音信号幅度之间有恒定的偏差存在[10]。鉴于此,本文提出了一种新的阈值函数,其表达式如式(3)所示:

(3)

2.3新算法描述

由于传统自适应小波包阈值算法增强的语音存在着语音失真和残留噪声,而子空间算法在平衡语音失真和残留噪声方面又有优势,所以提出了联合改进子空间的自适应小波包阈值语音增强算法。新算法的原理方框图如图4所示。

图4 新算法的原理方框图

对于新算法的描述如下:先对经过霍特林变换(KL)的噪声语音利用自适应小波包阈值算法来去除掉部分噪声子空间,并得出新的特征值,再从该特征值中减去RLS算法估计出的噪声的特征值,以得出增强语音的特征值,最后再进行KL逆变换得出增强语音。

3仿真实验与分析

本文对新算法与文献[4]中的自适应小波包阈值方法分别作了仿真实验并进行了对比分析,用的软件版本是MATLABR2008a。实验时选的原始语音来自NOIZEUS语音库。噪声来自Noisex-92噪声库中的白噪声和火车噪声,其中白噪声信号的信噪比取-5到15 dB(间隔5 dB),火车噪声信号的信噪比取0到10 dB(间隔5 dB)。

为了取得最优的实验结果,取帧长度为40个采样点,帧移为帧长的二分之一;小波函数选取的是sym8小波;小波包分解结构为文献[11]中的3层小波包分解结构。图5中的时域波形图是信噪比为5 dB的白噪声背景下两种算法处理得到的,图6是图5中各个时域波形图的频谱图。

图5 白噪声背景下增强语音的时域波形图

图6 白噪声背景下增强语音的频谱图

从图5可以看出,传统方法增强的语音还存在较多的残留噪声,也有语音失真;新算法处理得到的增强语音的波形图和原始(纯净)语音的波形图最接近,能够更好地保留住原始语音成分,减少了语音失真。

从图6可以看出新算法增强的语音的频谱图与原始语音的频谱图最接近,而且其对深色部分(语音)保留得更多;另一方面在语音间歇处的颜色要比5 dB带噪语音的频谱图深一些,说明了新算法在一定程度上能够较好地抑制音乐噪声。

本文在测评增强后的语音的性能时采用的评价方法有信噪比、分段信噪比和PESQ(感知语音质量评价),仿真结果如下面表2、表3和图7、图8所示。

表2 两种算法增强后的语音的信噪比/dB

表3 两种算法增强后的语音的分段信噪比  单位:dB

图7 白噪声背景下的PESQ值对比     图8 火车噪声背景下的PESQ值对比

从表2和表3可看出,当输入的信噪比(SNR)和分段信噪比(SSNR)相同时,新算法增强的语音的信噪比值和分段信噪比值比传统算法增强的语音的对应值都有所提高,并且信噪比越低,提高的越多;在15 dB时,SNR和SSNR大约分别降低了0.2和0.15 dB,但这并不影响该算法的整体优越性。

从图7和图8中的PESQ值中可看到,由新算法增强的语音的PESQ值要比由自适应小波包阈值方法增强的语音的PESQ值高,并且在0和5 dB时,PESQ值的增幅要比信噪比较高时更多一些;主观测听的结果也是新算法增强得到的语音的质量更好。主客观评价方法都证明了新算法不仅能够去噪,而且可以减少语音失真。

4结语

本文提出的新算法将自适应小波包阈值方法和利用递归最小二乘算法(RLS)修正了的传统子空间语音增强方法进行了结合,进一步改善了自适应小波包阈值算法的增强效果。实验表明,新算法在抑制噪声的同时减少了语音失真,并且其在低信噪比时的去噪效果更好。但本文方法也有不足之处,比如自适应阈值是引用文献中的,在以后的研究中可以考虑改进自适应阈值来进一步改善去噪效果。

参考文献

[1] 刘鹏,马建芬.具有较高可懂度的子空间语音增强算法[J].计算机工程与设计,2013,34(7):2619-2622.

[2] 张雪英,贾海蓉,靳晨升.子空间与维纳滤波相结合的语音增强方法[J].计算机工程与应用,2011,47(14):146-148.

[3] 任永梅,张雪英,贾海蓉.一种新阈值函数的小波包语音增强算法[J].计算机应用研究,2013,30(1):114-116,137.

[4] Zhang Junchang,Zhang Yi,Ye Zhen.Adaptive Speech Enhancement Based on Classification of Voiced/Unvoiced Signal[C]//IEEE International Conference on Multimedia and Signal Processing.Guilin:IEEE,2011:310-314.

[5] 陈春辉,冯刚.基于听觉小波包自适应语音增强方法[J].华南师范大学学报(自然科学版),2013,45(2):55-59.

[6] 张然,汤全武,史崇升.基于递推最小二乘自适应滤波算法的图像去噪[J].计算机应用与软件,2014,31(4):193-196.

[7] 罗文超,张友纯.在MATLAB中采用RLS算法实现FIR自适应滤波器[J].软件导刊,2008,7(1):107-108.

[8] 贾海蓉,张雪英,牛晓薇.用小波包改进子空间的语音增强方法[J].太原理工大学学报,2011,42(2):117-120.

[9] 董胡,钱盛友.基于小波变换的语音增强方法研究[J].计算机工程与应用,2007,43(31):58-60.

[10] Ghanbari Y,Karami-mollaei M R.A new approach for speech enhancement based on the adaptive thresholding of the wavelet packets[J].Speech Communication:2006,48(8):927-940.

[11] 田秀荣.基于正交小波包分解的语音去噪增强[J].计算机仿真,2011,28(5):388-390.

ADAPTIVE WAVELET PACKET THRESHOLD SPEECH ENHANCEMENT ALGORITHM COMBINED WITH IMPROVED SUBSPACE

Ren Yongmei1,2Zhang Xueying3Jia Hairong3Jia Yaqiong1,2

1(SchoolofElectricalandInformationEngineering,HunanInstituteofTechnology,Hengyang421002,Hunan,China)2(KeyLaboratoryofSignalandInformationProcessing,HunanInstituteofTechnology,Hengyang421002,Hunan,China)3(CollegeofInformationEngineering,TaiyuanUniversityofTechnology,Taiyuan030024,Shanxi,China)

AbstractFor distortion problem existed in speech enhanced by traditional adaptive wavelet packet threshold algorithm, we propose the adaptive wavelet packet threshold speech enhancement algorithm combined with improved subspace. The new algorithm proposed first makes Karhunen Loeve transform on noisy speech to get its eigenvalues, which are then dealt with by adaptive wavelet packet threshold algorithm to remove part of the noise subspace. Then it adopts recursive least squares algorithm (RLS) to estimate the noise eigenvalues, and revises the eigenvalue estimation deviation caused by traditional subspace algorithm. Finally the algorithm uses the derived new eigenvalues processed by adaptive wavelet packet threshold algorithm to subtract the noise eigenvalues so as to eliminate all the noise subspace and eventually restores the pure speech by KL reverse transform. Simulation results show that this new algorithm has better enhancement effect compared with traditional adaptive wavelet packet threshold algorithm, and reduces the speech distortion as well. And what’s more, in the circumstance of low SNR, the new algorithm gains much higher improvement in signal-to-noise ratio (SNR) and segment SNR (SSNR) of the enhanced speech.

KeywordsSpeech enhancementWavelet packetSubspaceRLSSNRSSNR

收稿日期:2014-12-15。2013年度湖南工学院校级科学研究项目(HY13002);山西省科技厅2013年青年科技研究基金项目(2013021016-1);湖南省自然科学青年人才培养联合基金项目(14JJ6046);湖南工学院信号与信息处理重点学科项目。任永梅,助教,主研领域:语音信号处理。张雪英,教授。贾海蓉,副教授。贾雅琼,副教授。

中图分类号TP391.9

文献标识码A

DOI:10.3969/j.issn.1000-386x.2016.05.035

猜你喜欢
波包特征值信噪比
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
基于支持向量机和小波包变换的EOG信号睡眠分期
单圈图关联矩阵的特征值
基于深度学习的无人机数据链信噪比估计算法
基于小波包Tsallis熵和RVM的模拟电路故障诊断
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
基于小波包变换的电力系统谐波分析
基于商奇异值分解的一类二次特征值反问题