朱佰泽 卜庆凯
摘 要: 语音作为一种搭载着特定的信息模拟信号,已成为人们社会生活中获取信息和传播信息的重要的手段。语音信号处理的目的就是在复杂的语音环境中提取有效的语音信息。环境干扰在语音传播过程中对信号的影响不容小觑,因此语音信号处理的抗噪声能力已经成为一个重要的研究方向。Matlab的应用有着广泛的领域,在信息处理领域其强大的数据处理能力可以将非平稳时变的语音数据转换为离散的数据,然后可对离散数据进行分析或者做进一步运算处理。它的信号处理工具箱可以迅速、有效地实现语音信号的处理和分析,Matlab是适用于信号处理领域的强大的处理工具。在此运用Matlab对一段包含有环境噪声的语音进行傅里叶变换、时域和频域分析、提取部分语音信号及分析信号的处理。
关键词: Matlab; 语音信号; 傅里叶变换; 信号处理
中图分类号: TN911.74?34; TP311.1 文献标识码: A 文章编号: 1004?373X(2016)04?0009?03
Abstract: Speech signal processing is to extract the effective speech information from the complex speech environment. The influence of environmental interference in speech communication process on the speech signal should not be underestimated, so the anti?noise ability of speech signal processing has become an important research direction. Matlab has a powerful data processing capacity in the information processing field and can convert the nonstationary time?varying audio data into discrete data, and then performs discrete data analysis or further processing. Its signal processing toolbox can quickly and effectively achieve the processing and analysis of speech signal. It is a powerful processing tool in the signal processing field. For a piece of speech containing environment noise, Matlab was used to do Fourier transform, time domain and frequency domain analysis, extraction of partial speech signal and analysis of signal characteristic.
Keywords: Matlab; voice signal; Fourier transform; signal processing
0 引 言
语言作为传播信息的工具,其最主要的表现形式是语音,语音为交际和思维提供了比文字更为便捷的方式。人类的语言起源于语音,由语音开始逐渐演变为文字,而不是先有文字后有语音。语音是由人类声带发出具有社会功能的特殊声音,语音是语言符号的载体,对信息的传递起着重要的推动作用。如果没有了语言,人们也就失去了交换思想和实施社会活动独特的功能,几千年的人类文明史将难以创造和继承。伴随着科技的发展,人们对信息的传播速度及质量要求越来越高,通过现代语音信号处理技术的研究和探索,可以让人们语音信息的产生、传输、存储、检索更有效率。信号处理的发展让计算机能听到声音,看到图片,还能说话,其中语音在未来人机交互中更具优势,也是最具发展潜力的方向[1]。本文对数字信号处理中所用的原理进行了详细的介绍,运用巴特沃斯型滤波器和切比雪夫滤波器实现了语音信号的提取和去噪滤波。运用Matlab 7.0软件编写语音信号处理的程序实现语音信号处理,包括信号的采集、傅里叶变换、倒谱、滤波等。
1 语音信号的处理设计
Matlab可以方便地实现模拟信号转换为数字信号,快捷地实现傅里叶、倒谱等计算,使设计处理语音的速度更为高效,提取语音的效果更明显易懂。语音信号处理分为三个步骤来进行:第一步是采集语音信号,对其进行傅里叶变换、倒谱;第二步是将采集到的语音通过设计好的巴特沃斯型滤波器和切比雪夫滤波器滤波。第三步根据经过滤波处理后提取到语音信号的质量对滤波器提取信息的有效性进行分析。
1.1 语音信号的提取
首先需要采集到音频信号“啊欧,你有新的消息请注意查收”,同时语音中也包含些许背景噪声,这对信息的提取和传递性产生了一定的影响,获取信号的采样频率为22 500 Hz。
采集数据并画出波形图,整段音频的时域波形高低起伏与录入的声音信号基本一致,由该语音信号波形图可以大致分析出振幅主要分布在0~1之间,声调有高有低,含有高频和低频成分,时长3 s,如图1所示。
1.2 语音信号的倒谱
倒谱分析[2],其可以采集到频谱包络信息用来表现音韵的特征参数,也可以采集到细微的结构信息。声道特性和声门特征可以通过频谱分析得到有效的参数,这些参数的获取可以通过语音来精确地分辨一个人。对语音信号进行频谱分析,可以提取到声道和声门参数,以便通过声音来区分不同的人。倒谱分析在各类信号分析中经常使用,要获取倒谱需要先取得信号的频谱,再对频谱的对数进行快速傅里叶变换,然后可得信号倒谱。
频谱图展示了采集的语音信号在不同频率上所携带的能量的状况,而倒谱是检测采样信号频谱周期性的工具。倒谱图中存在多个峰值表示主要频率成分,通过对语音倒谱的峰值提取得到的共振峰对人的声音具有较高的辨识度。
1.3 语音信号的滤波
如图2所示,使用Matlab采集到的语音信号中含有嘈杂的噪声,这些背景噪声频率一般较高。为了进一步提取到有效的语音信息,使用各种滤波器对采集的语音进行滤波,分析利用各个滤波器提取到语音信息的质量。
1.3.1 语音信号的低通滤波
切比雪夫?I型低通滤波器中,设计截止频率为1 000 Hz,其性能指标是: [ωp=0.075π,ωs=0.125π,][Rp=0.25 dB,As=50 dB。]然后采集到信号的图,如图3所示。
1.3.2 语音信号的高通滤波
为了使采集到的语音信号通过切比雪夫?Ⅱ型数字高通滤波器,设计其性能指标为:[ωp=0.6π,][ωs=0.975π,Rp=0.25 dB,As=50 dB。]然后采集到的信号如图4所示。
1.3.3 语音信号的带通滤波
让采集到的语音信号通过巴特沃斯带通滤波器,带通滤波性能指标为:N=5;ωc=[0.1,0.3];信号通过此滤波器后仿真图如图5所示。
1.3.4 语音信号的带阻滤波
对采集到的语音信号运用巴特沃斯数字带阻滤波器[2]进行过滤提取,结果如图6所示。
在频谱图中此次采集到的语音能量分布比较分散,其中语音也包括背景噪声。由各种数字滤波器提取得到语音信号对比可知,通过低通滤波后,提取到的语音频率更加集中分布在500~1 000 Hz范围内。由于低频分量被低通滤波器保留,高频分量被衰减,语音听起来有些发闷、低沉;但由于背景噪声被滤除,语音中包含的信息仍能被人耳分辨,提取到的语音辨识度较高。通过高通滤波后,人声频率无法达到足够高的频率,不能通过高通滤波器,所以提取到的语音信号听不到人的声音。带通滤波后,大部分语音被滤除,只有部分语音频率可被提取到,滤波后声音有点像儿童发出的声音,提取到的语音信息人耳辨别困难。带阻滤波后,在语音中只有部分频率被滤除,提取到的声音听上去比较混浊。
2 结 语
本文构建了一个基本的语音信号处理系统,经过测试运行,完成了对语音信号的采集,通过FFT变换得出了语音信号的频谱图和频谱的分析,并运用滤波、倒谱等数字语音处理技术,最后再对提取到的语音信息进行效果分析和比对。设计主要是从数字滤波器入手来设计滤波器,提取了自定义频段内的语音信号,同时比较各种滤波器对语音信号的影响,为如何有效除噪提供了良好的方法。
注:本文通讯作者为卜庆凯。
参考文献
[1] 张雄伟,陈量,吉斌,等.现代语音处理技术及应用[M].北京:机械工业出版社,2003.
[2] 王京辉.语音信号处理技术研究论[D].济南:山东大学,2008.
[3] 任明溪.基于EMD与特征规整的含噪语音特征提取方法研究[D].哈尔滨:哈尔滨工程大学,2012.
[4] 王彪.基于EMD法的语音信号特征提取方法研究[D].宝鸡:宝鸡文理学院,2012.
[5] 于俊凤.语音信号的识别和转换研究[D].成都:成都理工大学,2004.
[6] 王彪.一种改进的语音信号特征参数提取算法研究[D].宝鸡:宝鸡文理学院,2011.
[7] 俞翠华.含噪语音信号的基音提取算法的研究[D].南京:南京信息工程大学,2011.
[8] 孙广.基于优化语音提取的声纹识别系统[D].西安:西安建筑科技大学,2013 .
[9] 肖宇锋.基于ISOMAP语音特征提取的研究与DSP实现[D].长沙:湖南大学,2013.
[10] 胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社,2005.