朱宗明,姜占才(.中国人民解放军690部队,阿克苏 843000;.青海师范大学物理系,西宁 90008)
小波递归最小二乘语音自适应增强
朱宗明1,姜占才2
(1.中国人民解放军69220部队,阿克苏843000;2.青海师范大学物理系,西宁910008)
摘要:针对语音自适应增强的递归最小二乘算法必须已知参考信号的约束条件,将小波技术引入RLS算法中,提出了一种语音自适应增强算法—小波递归最小二乘算法(WRLS)。无需参考输入和输入信号的延时量,而是用小波分解、合成技术初估期望信号,以此获得先验误差;再用RLS算法求解滤波器权系数修正量;同时采用“块”和“符号”技术减少权系数修正的运算量,提高算法的收敛速度。仿真实验表明该算法的增强效果明显优于谱减法和小波增强法。
关键词:语音;自适应增强;小波;RLS算法;滤波器权系数
本文引用格式:朱宗明,姜占才.小波递归最小二乘语音自适应增强[J].新型工业化,2015,5(7):18-23
Citation:ZHUZong-ming,JIANGZhan-cai.AlgorithmforSpeechAdaptiveEnhancementofWaveletRecursive LeastSquare[J].TheJournalofNewIndustrialization,2015,5(7):18-23.
语音信号常常不可避免地受到背景噪声的污染。语音增强是从被噪声污染的语音中提取尽可能干净的语音,这在通信尤其是军事通信中尤为重要。噪声信号和语音信号都是随机信号,没有一种方法能达到完全滤除噪声的目的。谱减法和相应的变形方法具有运算量小、实时性强、增强效果显著等优点,成为此前和目前主要的增强方法而得到了广泛的应用;小波域语音增强效果显著;Wiener滤波对平稳信号的增强效果显著,但语音是非平稳的,对此,人们提出了许多改进的或综合算法[1-3]。背景噪声对语音是加性的随机信号,语音增强应基于非平稳假设,因此,基于优化算法的自适应滤波技术是语音增强最根本的方法[4-6]。最小均方误差(LMS)和递归最小二乘(RLS)是两种最基本的自适应滤波算法,每一种又有FIR和IIR两种实现类型。将自适应滤波技术应用于语音增强,目前尚存在一些比较困难的问题。文献[5]探讨了LMS类自适应语音增强,本文以基本RLS算法为基础,提出了一种利用小波技术、辅以“块”和“符号”技术的语音自适应增强算法,并对其进行了大量的仿真实验,证明该方法对语音有显著的增强效果。
受到噪声污染的语音信号用下式表示:
其中d(n)是未收污染的语音即干净语音;v(n)是背景噪声干扰;x(n)是受噪声污染的语音即语音的噪声观测。背景噪声一般是宽带的,可用零均值的高斯白噪声来模拟。语音增强的目的是从语音的噪声观测中提取原始语音,尽可能地减小噪声的干扰。常用的方法有两种,一是设法得到噪声的估计,然后从含噪语音即语音的噪声观测中减去噪声估计,这种方法称为噪声对消法;另一种是对含早语音即语音的噪声观测信号进行滤波,直接得到语音的估计,称为滤波法。如图1所示。
图1 自适应滤波原理Fig1. Principle of adaptive filtering
自适应滤波的递归最小二乘(RLS)算法是一种递归修正算法,是在最小二乘意义上最优的滤波器对含噪语音进行滤波,其FIR型实现的滤波器是线性相位、因果、稳定的。RLS算法可归纳为如下过程:
算法参数:p——滤波器的阶数;λ——指数加权因子(遗忘因子);δ——用于初始化)0(P→的值;
计算公式:对n=1,2,3,...,计算滤波后信息矢量
增益矢量
先验误差
修正滤波器
修正逆矩阵→
小波作为一种有效的时间(空间)/尺度分析工具,为信号分析提供了一种有效的多分辨(多尺度)的表示方法。小波变换能够同时给出信号的时/空域和频域信息,具有良好的时频局部化性能。小波域信号增强能够兼容去噪和保留信号有意义特征。从信号的噪声观测x(n)中求得期望信号的估计)(ˆnd,可以利用小波分解和小波重构技术,其基本原理和过程是:①选用适当的小波函数和小波分解层次,对观测数据进行小波分解,分别得到低频和高频分解系数向量{cai}、{cdi},i=1,2,…,N,N是选定的分解层数;②对从第1层到第N层的每一层,采用Stein的无偏似然估计原理,选用一个自适应阈值,对高频系数向量进行软阈值处理。③根据第N层的低频系数和所有经过处理的高频系数,计算出信号的小波重建,即为期望的估计)(ˆnd。小波分解如图2所示。
4.1RLS算法语音增强核心技术
将RLS算法应用于语音自适应增强时遇到一个关键问题:欲得到先验误差,必先求得参考信号d(n),d(n)就是干净语音,当然是未知的。大量文献给出了两种假设下的情况:①除了主观测(语音的噪声观测)或称主输入外,还可获得辅观测,它是与主观测中的噪声强相关的随机噪声,该假设在飞行员通信中容易实现;②将观测信号的适当延时信号作为自适应滤波器的输入,该假设在非语音信号且允许事后处理中容易实现。显然,两种假设在实时语音处理(如通信)中都是难以实现的。4.2语音自适应增强的WRLS算法
像移动通信这样的语音实时处理,辅观测法和数据延时法是不现实的。欲实现自适应滤波的RLS算法,必须由输入数据即语音的噪声观测x(n)直接获得先验误差α(n),参考信号(期望信号)d(n)虽然未知,但可以先对其进行估计。当然,若果该估计效果理想,即可将该估计直接输出;若果估计效果不佳,则可将该估计作为参考信号,然后用迭代法修正滤波器,使其在最小二乘意义上达到最优。
小波期望估计法虽然具有算法比较简单、去噪效果比较显著等优点,但由于其算法是基于分层高频系数阈值门限处理,其去噪效果仍然是有限的。将小波去噪引入RLS算法中,用于参考信号d(n)的估计,以此获得先验误差α(n),进而对时变滤波器递归修正。这种基于小波和RLS的自适应语音增强算法称为WRLS算法,如图3所示。
图2 小波分解原理图Fig 2. Principle of wavelet decomposition
图3 WRLS语音自适应增强原理图Fig 3. Principle of WRLS speech adaptive enhancement
为了提高WRLS的运算速度,采取两项技术。一是将先验误差α(n)取“符号”运算;二是滤波器修正时采用“块”技术,即将一帧数据视为块,对块用迭代法得到最优滤波器,而不是在帧的每个样点上进行迭代。
4.3WRLS算法步骤
4.3.1初始化
先对时变滤波器的权系数向量和自相关逆矩阵作初始化处理,分别得到初始权系数w→=0→和→→0
P(0)=δ−1I,δ是由试验确定的很小的正数。初始化只在一段语音的最前几帧上进行,不必对一段语音都进行。
4.3.2修正滤波器
①估计期望信号:对当前输入的含噪语音即语音的噪声观测帧,由小波期望估计器求出原始语音的估计dˆ(n),将其作为自适应滤波器的期望信号;②求滤波后信息矢量→z(n);③求增益矢量g→(n)并对取其符号;对g→(n)取符号运算sign(g),如下式:④修正自相关逆矩阵:用(7)式对自相关逆矩阵进行修正,得到自相关逆矩阵;之后视先验误差的情况,需要对矩阵进行第二、三等多次的迭代修正,依次得到,直到滤波器达到最优为止。⑤求α(n):用初始化的滤波器对当前帧滤波,求得滤波器输出,由(5)式求α(1),其中括号中的数字表示帧序号;先验误差经过比较器比较后,再确定是否对滤波器进行再修正;⑥滤波器的修正:若果先验误差大于阈值T,则按(6)式对滤波器进行修正,得到修正后的滤波器的权重向复量上述②;~再⑥用的新全的部滤过波程器,再依次次对得当到前指帧向滤当波前,帧求的的滤先波验器误权差系α数(1.2)。、、 …、,直到滤波器权系数达到最优为止。下一帧缓冲完成并到达当前位置,系统接受为当前帧,刚刚处理完的帧的最优滤波器权系数w→、和再自重相复关②逆~矩⑥阵全部P→( 1过.N 程)成,为得当到前第帧2帧的初的始值,重复前述。①对~之⑥后全的过各程个后帧依,次依得次到迭代,依次得到等参1数. N ,当前帧是第1帧时,就是初始值;如果是第2、3、…帧,则将前一帧的最优参数作为当前帧的初始值,显然,无须对每一帧都作繁杂的初始化处理。语音信号的帧间的相关性很强,这种初始化方案将极大地缩短RLS算法的收敛时间,整体上体现为算法速度大幅提高。
5.1实验方案
①直接仿真实验:对同一段语音样本,在不同的噪声强度下,分别用谱减法和WRLS法进行仿真实验;在同一噪声强度下,用ISS算法和WRLS算法对不同的语音样本进行滤波仿真实验。
②应用仿真实验:将WRLS增强算法移植到低速率声码器中,观察比较未经增强环节和经WRLS法增强环节,再经过编码、传输、解码后,合成语音的音质效果。
5.2实验语音样本
实验语音样本取自笔者建立的语音库yyk2.wav,库中语音为8kHz采样、8bit量化、线性PCM编码的码率为64kbps的数字语音。实验时从语音库随机抽取语音段,加入不同信噪比的高斯白噪声后形成含噪语音。分帧帧长和帧移都取20ms即160点,帧与帧之间无重叠。
5.3实验系统
分别对改进的谱减法和WRLS法用M语言编程,以文件名iss.m和wrls.m存盘;在PC机上仿真实验。
5.4实验结果及其分析
实验结果如图4、5、6、7所示。图4和图5是同一段语音在信噪比为3dB时,ISS法和WRLS法的增强结果。大量实验都显示,当信噪比大于10dB时,改进的谱减法与小波递归最小二乘法的增强效果相差不明显;但当信噪比降到10dB以下时,小波递归最小二乘法增强的效果明显优于改进的谱减法;当信噪比进一步降低到3dB时(信号几乎被噪声淹没),改进的谱减法增强效果明显欠佳,但小波递归最小二乘法仍然显示比较显著的增强效果。
图6和图7分别是在信噪比为10dB时,没有增强和经小波递归最小二乘法增强的语音,分别经过编码速率为2.4kb/s的混合激励线性预测声码器后的合成语音。试听者由仿真实验试听得出:未经增强的语音经声码器编、解码,其合成语音中含有明显的噪声;经小波递归最小二乘法(WRLS)增强环节、再经声码器编、码,其合成语音的噪声明显减少,使得合成语音的可懂度和自然度得到显著的提高,这对通信是非常有益的。
图4 3dB时谱减法语音增强增强Fig 4. Speech enhancement of ISS under 3dB
图6 10dB时未经增强环节的解码语音Fig 6. Decoding speech without enhancement link under 10dB
图7 10dB时经WRLS增强环节的解码语音Fig 7. Decoding speech with WRLS enhancement link under 10dB
将自适应滤波的RLS算法移植到语音增强算法中,期望信号的获得是实现增强目的的关键技术。将小波分解与合成技术引入自适应滤波的递归最小二乘算法中,得到的小波递归最小二乘算法(WRLS),是求解自适应增强滤波器的参考信号的一个比较有效的方法,从而实现了非平稳语音的自适应增强。计算机仿真实验表明,小波递归最小二乘算法(WRLS)对含有背景噪声的语音信号,有显著的增强效果,增强效果优于改进的谱减法;在信噪比接近3dB的较强噪声环境中,其增强效果仍比较明显。
参考文献
[1]李野,吴亚锋,刘雪飞.基于感知小波变换的语音增强方法研究[J].计算机应用研究,2009,26(4),1413-1415.
YeLI,Ya-fengWU,Xue-feiLIU.Researchonspeechenhancementbasedonperceptualwavelettransform[J].ApplicationResearchof Computers,2009,26(4):1313-1315.
[2]王振力,张雄伟,刘守生,韩彦明.基于离散小波变换与小波包分解的语音增强算法[J].解放军理工大学学报(自然科学版),2005,6(5),424-427.
Zhen-liWANG,Xiong-weiZHANG,Shou-shengLIU,Yan-mingHAN.Algorithmforspeechenhancementbasedondiscretewavelet transformandwaveletpacketdecomposition[J].JournalofPLAUniversityofScienceandTechnology,2006,6(5):424-427.
[3]王娜,郑德忠,刘永红.双树复小波包变换语音增强新算法[J].传感技术学报,2009,22(7),983-987.
NaWANG,De-zhongZHENG,Yong-hongLIU.NewMethodforSpeechEnhancementBasedonDual-TreeComplexWaveletPacket Transform[J].ChineseJournalofSensorsandActuators,2009,22(7):983-987.
[4]柳林,李辉,戴蓓蓓,等.基于多脉冲激励和卡尔曼滤波的语音增强算法[J].数据采集与处理,2009,24(1),100-104.
LinLIU,HuiLI,Bei-qianDAI,WeiLU.SpeechEnhancementMethodBasedonKalmanFilteringandMultipluseExcitation[J].Journal0f DataAcquisition&Processing,2009,24(1):100-104.
[5]姜占才,孙燕,王得芳.基于谱减和LMS的语音自适应增强[J].计算机工程与应用,2011,47(7),145-148.
Zhan-caiJIANG,YanSUN,De-fangWANG.AdaptivespeechenhancementbasedonspectralsubtractionandLMS[J].Computer EngineeringandApplications,2012,48(7):142-145.
[6]姜波,杨军,张尔扬.稀疏自适应Volterra滤波的QRD-RLS算法[J].信号处理,2008,24(4),595-599.
BoJIANG,JunYANG,Er-yangZHANG.QRD-RLSAlgorithmforSparseAdaptiveVolterrafiltering[J].SignalProcessing,2008,24 (4):595-599.
DOI:10.3969/j.issn.2095-6649.2015.07.03
基金项目:*国家社科基金(15XYY026)资助项目。
作者简介:朱宗明(1985-),男,青海西宁人,助理工程师,从事军事通信和军械保障方面的研究。
通信作者:姜占才(1958-),男,青海西宁人,教授,主要从事通信语音处理与保密通信方面的研究。
Algorithm for Speech Adaptive Enhancement of Wavelet Recursive Least Square
ZHUZong-ming1,JIANGZhan-cai2
(1.The Chinese people’s liberation army 69220 troops, Akzo 843000; 2.Physics Department of Qinghai Normal University, Xining 810008)
Abstract:Anewspeechadaptiveenhancementalgorithm,basedonwaveletrecursiveleastsquare(WRLS)isproposed, accordingtorecursiveleastsquare(RLS)algorithmofspeechadaptiveenhancement,withtheknownconstraintsofthe referencesignalandemployingthewavelettechniqueinintheRLSalgorithm.Withoutthereferenceinputandthetimedelay oftheinputsignal,desiredsignalisestimatedbywaveletdecomposition,synthesistechnology,thusobtainingapriorierror;the weightcoefficientscorrectionofthefilterisobtainedadoptingRLSalgorithm;meanwhile,adoptingthetechniqueof"block" and"symbol"reducestheamountofoperationofweightcoefficientscorrection,andimprovestherateofconvergenceofthe algorithm.Simulationresultsshowthattheenhancementeffectofthealgorithmisobviouslysuperiortothespectralsubtraction andwaveletenhancementalgorithm.
Keywords:Speech;Adaptiveenhancement;Wavelet;RLSalgorithm;Weightcoefficientsoffilter