王山海,马鑫鑫,刘 谦,杨 敏
(河南省人工影响天气中心,郑州 450003)
人工影响天气作业飞机中语音增强算法的研究
王山海,马鑫鑫,刘 谦,杨 敏
(河南省人工影响天气中心,郑州 450003)
飞机实施人工影响天气作业,具有覆盖范围广,作业效果好的优点,是未来人工影响天气工作的发展方向;但人影作业飞机内部工作环境复杂,工作人员的正常语言交流会受到飞机引擎、机舱内设备、飞机外部等噪声的影响,甚至无法正常交流;因此,需要设计一种语音增强装备或设施来消除噪声,方便人影飞机上工作人员的正常沟通交流;从理论上阐述了参数法、非参数法、统计方法及其他语音增强算法;重点研究了维纳滤波法、谱减法和基于短时对数谱幅度的MMSE算法,并对这3种语音增强算法都进行了实验仿真,对比了各种算法的优缺点;针对人影飞机的特定工作环境,提出基于短时对数谱幅度的MMSE算法比较适合用于人影飞机上进行语音增强,消除噪音。
人工影响天气;语音增强;谱减法;维纳滤波;最小均方误差
人工影响天气,是指为避免或者减轻气象灾害,合理利用气候资源,在适当条件下通过科技手段对局部大气的物理、化学过程进行人工影响,使某些局地天气过程朝着有利于人类的方向转化,从而实现增雨雪、防雹、消雨、消雾、改善环境等目的。
目前实施人工影响天气作业主要有地面和空中两种方式。地面作业通常利用高炮或者火箭架向空中具有一定条件的目标云发射含有催化剂的炮弹、火箭弹,它们在云中爆炸,把催化剂播撒在云中,以影响云物理过程。这种作业方式具有播撤路径长、发射高度高、成核率高、便于操作、机动性强等特点。但在发射高炮和火箭弹前需要申请空域,得到空管部门的批复后才能作业。随着民航事业的发展,航线逐年增多,空域申请难度也随之增加。例如在河南周口上空,每天过境飞机最高达1300架次。在申请空域过程中,往往会失去最佳作业时机,使人工影响天气效果大打折扣[1]。
第二种方式是利用飞机直接入云,在具有一定条件的目标云中直接播撒含有催化剂的物质,进行人工影响天气作业,以影响云物理过程。飞机机动性强,可根据飞机实时探测的云作业条件直接将催化剂播入云中预定的部位,播撒均匀,作业面积大,覆盖范围较广。因此这种作业方式相比地面具有明显的优势,作业效果较好,是未来人工影响天气工作的发展方向。同时,可以通过飞机上的观测设备对云结构进行直接观测,进一步了解掌握云中作业条件,促进人影科学研究。
目前河南所使用的人工影响天气飞机主要有运-8、运-12等小型运输机。机舱内工作环境复杂,噪音较大,正常的语言交流往往受到很大影响。因此,如何从被干扰的语音中恢复清晰的语音,使交谈双方能够清晰的交谈是一个亟待解决的问题。语音增强作为一种处理手段,不失为解决噪声污染的有效途径。语音增强就是尽可能地消除背景噪声、提高信噪比,使处理后的语音信号和原始语音尽可能地保持一致[2]。
1.1 语音增强算法简介及分类
实际环境中,噪声特点多种多样,不可能设计出一种算法用来消除所有噪声。人们针对不同的噪声源,研究了多种方法,大致可以分为如下几种,下面对这几类方法分别进行阐述和分析。
参数方法主要依赖于语音生成模型,需要提取如基音周期、LPC系数等模型参数,常常使用迭代方法。维纳滤波器[3]、卡尔曼滤波器[4]都是属于这种方法。但是在实际噪音与模型差别比较大的情况下,这种去噪方法效果不好。
非参数方法不需要从带噪的语音信号中估计模型参数,因此这种方法应用更为广泛,但是效果并不是最优。较为常用的这种方法包括谱减法[5]、自适应滤波法[6]。
统计方法主要根据语音和噪声的统计特性,通过训练得到的统计数据建立模型,采用的方法有最小均方误差估计(MMSE, minimum mean square error)、听觉掩蔽效应等。
除了上面所说的几种方法,还有小波变换[7]、离散余弦变换(DCT)、人工神经网络等方法。这些方法目前应用还不够广泛,是一些新兴知识在语音增强领域的应用[8]。
1.2 谱减法语音增强算法
谱减法利用了噪声的平稳统计特性以及噪声和语音信号不相关的特性,它是一种较为经典和有效的算法。这种算法的使用前提是需要假定噪声统计平稳。用无音期间计算得到的频谱值作为有语音期间噪声的频谱值,然后用带噪语音信号的频谱值减去噪声频谱值,这样就近似地得到了纯净语音信号的频谱值。如果得到负值,将其置0。另外,人耳主要是通过对语音信号的频谱幅度值来获得信息,而语音信号频谱的相位值对信息的获取不起主要作用。因此,对语音信号短时谱的幅度估计是谱减法主要考虑的内容[9]。
假设带噪信号为:
y(n)=s(n)+d(n),0≤n≤N-1
(1)
其中:s(n)为有用的语音信号,d(n)为要消除的噪声信号。y(n)是对原始语音信号进行加窗和分帧处理后的信号。设y(n)的傅里叶变换为Yk=|Yk|exp(jθk),s(n)的傅里叶变换为Sk=|Sk|exp(jαk),d(n)的傅里叶变换为Nk,则有:
Yk=Sk+Nk
(2)
Nk表示的含义是多个噪声信号样本的加权和,它满足高斯分布,其均值为0,方差通过对静音期间的噪声计算得到。根据统计得到的噪声功率谱信息,就可以从Yk中计算出Sk。然后用含有噪声信号中的相位,再进行傅里叶反变换就得到了消除噪音后的增强语音信号。
谱减法语音增强算法原理如图1所示。y(n)经FFT变换后,有Yk=Sk+Nk,由此得:
|Yk|2=|Sk|2+|Nk|2+SkNk*+Sk*Nk
(3)
图1 谱减法原理图
由于s(n)和d(n)相互独立,所以Sk和Nk也相互独立,而Nk是均值为0的高斯分布,所以有:
E(|Yk|2)=E(|Sk|2)+E(|Nk|2)
(4)
短时平稳过程在一个短时帧内有:
|Yk|2=|Sk|2+λn(k)
(5)
λn(k)表示的意思是静音时|Nk|2的统计平均值,则原来语音信号的估计值可以用式(6)表示:
(6)
(7)
(8)
式中,当γk小于1时,没有意义。因此,将公式(8)改写为:
(9)
其中:ε是个大于零的常数。
谱减法比较简单,实现比较容易,但这种方法会出现“音乐噪声”。
1.3 维纳滤波语音增强算法
维纳滤波法的基本思想是:以最小均方误差的准则设计一个数字滤波器,然后从此数字滤波器处理后的输出信号中估计得到原始信号。当数字滤波器的性能达到最佳状态的时候,也就是维纳滤波器。维纳滤波器是在最小均方误差准则意义下,基于统计意义的最优数字滤波器,但它是对平稳条件设计的一种的最优估计。维纳滤波器相比谱减法有其优点,即经过维纳滤波器处理后的语音中的噪声不是“音乐噪声”,而是一种近似于白噪声的噪声。但是维纳滤波方法存在一个严重的缺点,就是它对于所有频率的响应是固定不变的,没有考虑人耳对于语音的频率感知特性,并且需要在滤波前对信号和噪声的功率谱进行估计[10]。
(10)
由正交性原理可知,最优滤波器必须对任意的m都满足:
(11)
将式(10)代入式(11)中,两边同时取傅立叶变换,得:
(12)
这里,Ssy(k)是s(n)与y(n)的互功率谱密度,Sy(k)是y(n)的功率谱密度。
因为s(n)与噪声d(n)不相关,所以Rsd(m)=0,则:
Sy(k)=Ss(k)+Sd(k)
(13)
Ssy(k)=Ss(k)
(14)
所以公式(12)可以化简为:
(15)
公式(15)就是维纳要求的维纳滤波器的响应函数。因为开始不存在语音信号,所以需要通过迭代进行反复的改善,在第一次维纳滤波后,输出的语音信号更为纯洁并且更接近原始语音,再将输出的语音信号作为估计继续滤波[11]。迭代的维纳滤波法原理如图2所示。
图2 维纳滤波法原理框图
1.4 短时对数谱幅度的MMSE估计语音增强算法
使用基于谱减法的语音增强算法对带噪语音进行消噪处理时,处理结果会产生“音乐噪声”,使听者在听觉效果上受到一定的干扰。最小均方误差算法(minimummeansquareerror,MMSE)能够有效地去除增强语音中的“音乐噪声”,该算法最初是由Y.Ephrain和D.Malah在1984年提出的[12]。MMSE算法在语音可懂度和降噪比之间取得了较好的折衷,适用范围较广。
设接收到的一帧带噪语音为:
y=x+d
(16)
式中,y为带噪语音,x为纯净语音,d为加性平稳噪声。令Yk=Rkexp[jθk],Xk=Bkexp[jαk]和Dk分别表示y,x和d经过FFT变换后的第k个频谱分量。其中Rk和Bk分别为带噪语音、纯净语音在频点k的幅度;θk和αk分别为带噪语音、纯净语音在频点k的相位。MMSE算法的核心就是从Yk中估计出Bk。
(17)
(18)
基于短时对数谱最小均方误差估计为[13]:
(19)
增益函数可以表示为:
(20)
式中,
其中:ξk和γk分别为先验信噪比(SNR)和后验信噪比(SNR);λs为纯净语音方差,λn为噪声方差。因此,MMSE算法的增益函数仅依赖于先验信噪比和后验信噪比。MMSE算法达到了语音可懂度和降噪比的折衷,适用信噪比的范围较广,但是由于需要统计各种参数,算法运算量大,实时性有待提高。
为了对比分析不同语音增强算法的处理效果,使用Matlab软件分别就3种语音增强算法进行仿真实验。实验所需的语音信号来自NOIZEUS语料库,NOIZEUS是德克萨斯大学达拉斯分校语音处理实验室为方便对比各种语音去噪算法效果开发的语料库,总共包含了从IEEE语料库中选取出的30条连续语音,其中包括15个男声和15个女声样本,采样频率为8kHz,量化为16bit。噪声选自NOISEX-92语料库,从中选取比较具有代表性的高斯白噪声(white)、说话人噪声(babble)和战斗机噪声(f16)。
2.1 谱减法实验仿真分析
在众多语音增强算法中,谱减法因其原理简单、容易实现且计算量小等优点,应用非常广泛。本文通过对混入不同类型、不同信噪比噪声的语音信号用谱减法进行语音增强处理。选用”sp01.wav”样本进行实验,在纯净的语音中混入0db的战斗机噪声(f16),处理前后波形对比如图3所示。
图3 谱减法语音增强处理前后语音波形对比图
可以地看出,经过语音增强处理后,受到噪声干扰的语音信号波形有了明显的变化,噪声已被消除。对”sp01.wav”样本分别加上-5、0、5、10、15db的白噪声、babble噪声、f16噪声,处理后输出信噪比的对比结果如表1所示。
表1 谱减法语音去噪输出信噪比 dB
2.2 维纳滤波法实验仿真分析
用维纳滤波法对含有噪声的语音信号进行处理,即将含有噪声的语音作为对原始语音信号的估计来设计滤波器。因为开始不存在语音信号,所以需要通过迭代进行反复的改善,在第一次维纳滤波后,输出的语音信号更为纯洁并且更接近原始语音,再将输出的语音信号作为估计继续滤波。
在实验中,选用”sp01.wav”样本进行实验,在纯净的语音中混入0db的战斗机噪声(f16),处理前后波形对比如图4所示。
图4 维纳滤波语音增强处理前后波形对比图
从实验结果对比图中可以看出,维纳滤波算法能够很好地对带噪语音信号进行消噪处理。采用维纳滤波最大的好处是增强后的残留噪声类似于白色噪声,而不是有节奏起伏的音乐噪声。但是维纳滤波只是在平稳条件下才能保证在最小均方误差意义下的最优估计。而语音是非平稳的,只在短时间内近似平稳,实际环境中的噪声也常是非平稳的。这是维纳滤波器的缺陷所在。
对”sp01.wav”样本分别加上-5、0、5、10、15db的白噪声、babble噪声、f16噪声,处理后输出信噪比的对比结果如表2所示。
表2 维纳滤波法语音去噪输出信噪比 dB
2.3 基于MMSE算法的语音增强实验仿真分析
最小均方误差语音增强算法基于语音的短时平稳性,同时人耳对语音信号的相位不敏感。该算法假设原始纯净语音信号和噪声信号互不相关,因此它们的傅里叶展开系数也相互独立。基于这个假设采用MMSE准则,在对数域上对纯净语音信号的功率谱进行估计。这种语音增强算法能够在一定程度上减少音乐噪声,达到了语音可懂度和降噪比的折衷,适用信噪比的范围较广,但是由于需要统计各种参数,算法运算量大。在实验中,选用”sp01.wav”样本进行实验,在纯净的语音中混入0db的战斗机噪声(f16),处理前后波形对比如图5所示。
图5 MMSE算法语音增强处理前后波形对比图
对”sp01.wav”样本分别加上-5、0、5、10、15 db的白噪声、babble噪声、f16噪声,处理后输出信噪比的对比结果如表3所示。
利用飞机实施人工影响天气作业,具有作业面积大,覆盖范围广,作业效果好的优点,是未来人工影响天气工作的发展方向。但人影作业飞机内部工作环境复杂,噪音较大,给工作人员的正常语言交流带来了影响。因此,需要设计一种语音增强装备或设施来消除噪声。本文从理论上阐述了常见的语音增强算法,包括参数方法、非参数方法、统计方法及其他方法,重点研究了谱减法、自适应滤波算法、基于短时对数谱幅度的MMSE算法。谱减法具有原理简单,便于计算的优点;但这种方法由于没有考虑噪声的分布特性,会存在音乐噪声。维纳滤波算法消除噪音效果较好,但这种方法是在假定噪音为平稳条件下的最优估计,而实际语音是非平稳的,这是维纳滤波器的缺陷所在。基于短时对数谱幅度的MMSE算法适应范围较广,做到了可懂度和信噪比的折衷。对比分析不同算法的优缺点,针对人影作业飞机的特定工作环境,MMSE算法去噪效果优于前两种语音增强算法。特别是在战斗机噪声干扰的情况下,MMSE算法输出信噪比最高。因此,可以选用基于短时对数谱幅度的MMSE算法来进行语音增强处理。
表3 MMSE算法语音去噪输出信噪比 dB
[1] 王广河,胡志晋,陈万奎.人工增雨农业减灾技术研究[J].应用气象学报,2001,12(s):1-9.
[2] 柴 恒.几种语音增强技术降噪效果的比较和MATLAB仿真[J].科技资讯,2008,22:8-10.
[3] Fan N P. Low distortion speech denoising using an adaptive parametric Wiener filter[A]. 2004. Proceedings. (ICASSP 04)IEEE International Conference on Acoustics, Speech, and Signal Processing[C]. 2004:1309-1312.
[4] You C H, Koh S N, Rahardja S. Kalman filtering speech enhancement incorporating masking properties for mobile communication in a car environment[A]. 2004, ICME 04. 004 IEEE International Conference on Multimedia and Expo[C]. 2004: 1343-1346.
[5] Flogeras D, Doraiswami R, Kaye M. E. A real time specatral subtraction based speech enhancement scheme[A]. IEEE CCECE 2003. Cnandian Conference on Electrical and Computer Engineering 2003[C]. 2003: 1071-1074.
[6] Hu X, Hu A Q, Zhao L. A robust adaptive speech enhancement system[A]. Proceedings of the 2003 International Conference on Neural Networks and Signal Processing[C]. 2003:814-817.
[7] 史迎馨. 航空飞机计算机通信中滤波器的优化设计[J]. 计算机测量与控制, 2015, 23(1):234-236.
[8] 赵鸿图, 刘 云. 改进粒子群算法的小波神经网络语音去噪[J]. 计算机测量与控制, 2013, 21(10):2799-2807.
[9] 张雪英.数字语音处理及MATLAB仿真[M].北京: 电子工业出版社,2010,7.
[10] 李 琴. 语音增强技术研究[D]. 桂林: 桂林电子科技大学, 2007.
[11] 李 洋. 基于小波变换的语音去噪算法研究与实现[D]. 桂林: 桂林电子科技大学, 2014.
[12] Ephraim Y, Malah D. Speeeh enhancement using a minimum mean square error short time spectral amplitude estimator[J]. IEEE Transaetionson Speech Audio Proeessing, 1984, 32(6): 1109-1121.
[13] 陈 琪, 郭 英, 张 群, 等. 基于听觉感知的LSA-MMSE改进型语音增强方法[J]. 信号处理, 2008, 24(6): 1037-1040.
ResearchofSpeechEnhancementAlgorithmsofWeatherModificationAeroplane
WangShanhai,MaXinxin,LiuQian,YangMin
(WeatherModificationCenterofHenanProvince,Zhengzhou450003,China)
The implementation of weather modification with aeroplane can cover a wide range and produce better results. So it is the future trend of the development of weather modification. However, the internal working environment of the aeroplane is so complex that the normal communication of the staff would be affected by the noise of aircraft engines, inside equipments and external aeroplane. Sometimes they can’t communicate fluently. Therefore, it is need to design a speech enhancement equipment or facilities to eliminate the noise and convenient staff communication. Elaborates theoretically the parametric method, the nonparametric method, the statistical method and other speech enhancement algorithms. Focus research on Wiener filtering algorithm, spectral subtraction algorithm and MMSE algorithm based on short-time logarithm spectrum. The three algorithms are simulated and are compared. The experimental results demonstrate that the MMSE algorithm based on short-time logarithm spectrum is suitable for speech enhancement aiming at the specific circumstance.
weather modification; speech enhancement; spectral subtraction; Wiener filter; minimum mean square error
2016-11-01;
2016-11-22。
河南省气象局科研项目(Z201508)。
王山海(1982-),男,河南长垣人,硕士研究生,主要从事人工影响天气信息技术方向的研究。
1671-4598(2017)04-0162-05DOI:10.16526/j.cnki.11-4762/tp
TP
A