基于残差信号谐波和的声门波提取

2016-03-15 01:05:34师宏慧李昊璇乔晓艳
测试技术学报 2016年1期
关键词:小波变换

师宏慧, 李昊璇, 乔晓艳

(山西大学 物理电子工程学院, 山西 太原 030006)



基于残差信号谐波和的声门波提取

师宏慧, 李昊璇, 乔晓艳

(山西大学 物理电子工程学院, 山西 太原 030006)

摘要:为了获取高自然度和高精度的声门波, 将残差信号谐波和(SRH)应用到声门波的提取算法中. 首先, 设计了一种基于小波变换结合SRH的清浊音判别算法W-SRH; 然后, 提出了一种基于SRH的基音同步迭代自适应逆滤波方法SRH-PSIAIF, 提取激励源声门波. 结果表明采用W-SRH方法对清浊音的判别准确率更高, 采用SRH-PSIAIF算法提取的声门波自然度较高. 该研究为情感语音声门波的分析以及情感语音合成奠定了良好基础.

关键词:声门波; 清浊音判别; 小波变换; 残差信号谐波和; PSIAIF

0引言

为了获取高自然度和高精度的声门波, 需要对采集到的语音信号进行清浊音地判别, 并去除不必要的无声段和清音段. 目前, 判别清浊音方法虽然很多, 但判别效果不是很理想. 传统的判别方法基于短时能量和短时平均过零率[1], 但该方法清浊音交叠率很大, 会造成较多的误判, 尤其在一些需要精确研究浊音的实验中, 会造成一定的损失[2]. 为此, 学者们做了很多改进, 谭丽等设计了一种基于参数组合的方法对语音信号进行清浊音判别[2]; 胡瑛等在小波域上用Teager能量算子对语音信号进行了清浊音的判别[3]; Thomas Drugman等用SRH算法对语音信号进行了清浊音判别[4], 使清浊音的判别率得到了较大提高. 然而, 在汉语语音特别是情感语音中, 有的清塞音如“k”无周期性, 短时能量以及过零率与浊音段无异, 采用小波变换的清浊音判别算法时, 会将这部分语音判别为浊音, 这种误判会使提取的浊音信号不太纯净, 对后期的研究造成一定的干扰. SRH算法对这类清塞音的判别率很高, 因此本文设计了一种小波变换结合SRH的清浊音判别算法即W-SRH, 对清浊音的判别具有很高的精准度.

准确提取出一段语音中的浊音信号后, 可以进一步获取浊音信号的激励声门波. 目前比较常用的获得声门波的办法是逆滤波方法, Wong等提出了最小平方相位声门逆滤波方法[5], Alku提出了迭代自适应逆滤波方法(IAIF), 随后Alku又提出了基音同步迭代自适应逆滤波方法(PSIAIF)[6], 这些方法都可以进行声门波的估计, 其基本思想都是逆滤波. 然而, 这些方法都有不足之处, 最小平方相位声门逆滤波方法只有在声门波有比较长的闭合相位时效果才好, IAIF算法中用线性预测分析(LPC)对声道共振峰进行估计时会受到声源谐波成分的影响, 从而使估计结果不准确[6]. 为了避免这些缺陷, 本文采用PSIAIF算法, 并且在基音同步分析中, 我们采用精确度高并且鲁棒性也很强的SRH方法进行基音同步标注, 实现了一种基于SRH的基音同步迭代自适应算法(SRH-PSIAIF). 实验结果表明该算法提取的声门波自然度较高.

1算法基本理论

1.1小波变换分析

一般浊音的低频幅度比清音部分的低频幅度明显要高很多[3], 利用这个特征对清浊音判别的准确度较高. 采用时频分析方法提取语音信号的低频成分可以进行清浊音的判别, 而小波变换是一种很好的时频分析方法, 它具有多分辨率、 多尺度的特点. 小波变换定义为:

(1)

时, 称ψ(t)为一个基本小波或母小波. 将母函数ψ(t)经伸缩和平移后得

(2)

式中:a为伸缩因子;b为平移因子. 对于任意信号f(t)∈L2(R)的连续小波, 可变换为

(3)

连续小波逆变换公式为

(4)

在本实验中, 需要计算小波变换后低频重构信号的短时能量, 短时能量定义为

(5)

式中:En表示在信号的第n个点开始加窗函数时的短时能量;x(n)是重构信号;w(n)是窗函数;N为窗长.

1.2逆滤波原理

如图 1 所示, 语音信号的产生模型包括3个部分:激励源模型、 声道模型和辐射模型[7]. 根据这个模型, 语音信号S(t)的Z变换S(z)可以用一个统一的公式来计算, 即

(6)

在浊音的情况下,E(z)是一周期冲击序列的Z变换, 且A=AV,H(z)=G(z)V(z)R(z); 在清音的情况下,E(z)则是一个随机噪声的Z变换, 且A=Au,H(z)=V(z)R(z).

图 1 语音信号产生模型Fig.1 The model of speech signal

逆滤波可以看作是语音产生的逆过程, 设计一个传输函数等于声道滤波器倒数的逆滤波器, 然后用该滤波器对语音信号进行滤波, 即在语音信号中消除声道的影响, 最终得到声源信号的估计. 通常进行逆滤波处理的语音信号可以是口腔气流信号, 也可以是语音声压信号, 两者的区别在于口腔气流信号没有唇辐射的影响, 而声压信号是经过唇辐射后的信号, 唇辐射相当于一个一阶微分滤波器, 所以, 两者经过逆滤波后分别得到声门波和声门波的微分波形[8]. 影响逆滤波后声门波质量的因素主要是共振峰波纹, 这是因为没有将声道共振峰完全滤除. 从波形上, 理想的声门波比较平滑, 没有波纹, 而质量不好的声门波有共振峰波纹.

1.3残差信号谐波和(SRH)

SRH算法依赖于分析语音信号的残差信号, 首先从语音信号的频谱包络中估计出声道模型的自回归模型, 残差信号可以将语音信号从传输函数为声道模型倒数的滤波器逆滤波得到. 对得到的残差信号e(n)进行傅里叶变换即可得到残差信号的频谱E(f). 对于每个范围在[F0,min,F0,max]的基频F0,SRH可以由式(7)计算[4]

(7)

2算法仿真实现

2.1W-SRH清浊音判别算法实现

图 2 W-SRH算法实现框图Fig.2 Implementation block diagram of W-SRH algorithm

清浊音的判别算法实现框图如图 2 所示, 其实现步骤如下:

1) 采集语音信号并对采集到的信号进行预处理, 包括消噪、 预加重、 分帧和加窗等;

2) 对预处理信号进行小波分解, 并用低频系数对信号进行重构, 将重构的信号分帧加窗, 并根据式(5)计算每帧重构信号的短时能量En, 设置一个阈值T1, 当En

3) 对2)中得到的浊音信号分帧加窗, 并根据式(7) 计算每帧信号的谐波能量和Wn, 设置一个阈值T2, 当Wn

2.2SRH-PSIAIF算法实现

2.2.1迭代自适应逆滤波(IAIF)算法

迭代自适应逆滤波(IAIF)算法的基本思想是从原始语音的频谱中消除声门激励的影响[7], 然后通过线性预测的方法(LPC)精确估计出声道的模型, 最后通过逆滤波得到声门波信号. 这个算法的精髓就是对声门激励的估计和对声道传输函数的估计都进行了两次[10], 使得到的声门波更加精确, 具体实现流程如图 3 所示, 其中E1,E2是声门波LPC参数估计,H1,H2是声道LPC参数估计.

2.2.2 SRH-PSIAIF

图 4 SRH-PSIAIF算法实现框图Fig.4 Implementation block diagram of SRH-PSIAIF algorithm

SRH-PSIAIF的算法流程图如图 4 所示. 首先, 将采集到的信号进行高通滤波, 将滤波后的信号输入到IAIF-1模块中可以得到声源信号g(n), 用SRH算法对声源信号g(n)进行基频检测得到语音信号的基音周期长度值M; 然后, 在声源信号g(n)上选取声门脉冲的峰值作为基音同步位置, 位置提取规则:Ni为[Ni-1+0.5M,Ni-1+1.5M]区间中声源信号g(n)波形幅度最大的时刻; 最后, 根据基音同步位置对高通滤波后的信号选择基音整数倍的信号输入到IAIF-2模块, 该模块的输出为对声源信号的最终估计[6].

3结果与分析

3.1清浊音判别结果

在本次实验中, 以“孙英开飞机”这句语音为例进行清浊音地判别, 这句语音以16 kHz采样、 16 bits 量化, 判别出的浊音信号值为1, 清音信号和无声段值为0. 实验中以20 ms为一帧, 帧叠为10 ms, 分别采用小波变换分析、 SRH算法和W-SRH算法对这句语音进行清浊音判别, 实验结果如图 5 所示, (a)为“孙英开飞机”时域图, (b)为小波变换判别结果, (c)为SRH判别结果, (d)为W-SRH判别结果.

图 5 清浊音判别结果Fig.5 Voice/unvoiced determination result

由图 5 可以看出, 小波变换分析算法可以很精确提取出浊音信号, 但对一些清塞音的判别结果却不是很理想, 如“孙英开飞机”中的“k”这个音, 小波变换分析算法将它误判为浊音, 这是因为在汉语语音的清塞音中有很大的低频成分, 所以会被误判. 相对而言, SRH算法可以很精确的去除清音, 包括不易判别的清塞音, 但在帧长较短的情况下, 会将部分浊音误判为清音, 帧长较长的时候可以很好的判别出浊音, 但部分清音(不包括清塞音)也被判别为浊音. 由此可以看出, 单独使用这两种算法得到的结果并不理想, 而我们设计的W-SRH算法充分结合了这两种算法的优点, 能够精确的将清浊音分开. 在W-SRH算法中, 小波变换使用较短的帧长, 阈值设置为5, 而SRH算法使用较长的帧(30 ms~40 ms), 阈值设置为0.075.

图 6 声门波提取结果Fig.6 The glottal waveform extraction result

3.2声门波提取结果

在本实验中, 采用的是语音声压信号, 根据SRH-PSIAIF算法, 对提取出的浊音信号进行逆滤波得到声门波, 声门波经过一阶微分即可得到声门波微分波形. 采用8 kHz采样的语音信号进行声门波地提取, 根据语音编码标准算法中线性预测模型的阶数来确定逆滤波的阶数, 对于8 kHz采样的语音信号, 选用10到12阶的滤波器进行LPC估计. 根据大量的实验发现, 采用10阶滤波器对声道参数进行估计效果最佳. 对声门波以及声门微分波形的提取结果如图 6 所示.

如图 6 中(a)是一帧语音信号的时域图, (b)是这帧语音的声门波提取结果, (c)是这帧语音的声门波微分波形. 由图可以看出:用SRH-PSIAIF提取出的声门波波形很平滑, 没有波纹, 说明能够有效将声道共振峰滤除完全, 声门波自然度较高.

4结论

本文设计了一种小波变换结合SRH的清浊音判别算法W-SRH, 实验结果表明其比直接采用小波变换或者SRH算法进行清浊音的判别效果要好. 此外, 还设计了基于SRH的基音同步迭代自适应逆滤波算法SRH-PSIAIF, 用此方法逆滤波得到的声门激励源很自然, 有效克服了LPC分析的缺陷, 为后期情感语音声门源参数的提取以及情感语音合成奠定了较好基础.

参考文献:

[1]郭英, 李雪娇, 李宏伟. 一种组合参数的语音信号清/浊音判决方法[J]. 空军工程大学学报(自然科学版), 2002, 3(4): 18-20.

Guo Ying, Li Xuejiao, Li Hongwei. A simple method of unvoiced/voiced classification of speech signal[J].Journal of Air Force Engineering University(Natural Science Edition), 2002, 3(4): 18-20.(in Chinese)

[2]谭丽, 胡双红. 语音通信中信号的清浊音判别[J]. 电脑与信息技术, 2010, 18(1): 33-34.

Tan Li, Hu Shuanghong. The voice/unvoiced decision in speech communication[J]. Computer and Information Technology, 2010, 18(1): 33-34. (in Chinese)

[3]胡瑛, 陈宁. 基于小波变换的清浊音分类及基音周期检测算法[J]. 电子与信息学报, 2008, 30(2): 353-355.

Hu Ying, Chen Ning. Voice/unvoiced classification and pitch period detection algorithm based on wavelet transform[J]. Journal of Electronics & Information Technology, 2008, 30(2): 353-355. (in Chinese)

[4] Thomas D, Abeer A. Joint robust voicing detection and pitch estimation based on residual harmonics[C]. Proceedings of the Annual Conference of the International Speech Communication Association.INTERSPEECH 2011-12th Annual Conference of the International Speech Communication Association, 2011: 1973-1976.

[5]Wong D, Markel J D, Gray A H. Least squares glottal inverse filtering from the acoustic speech waveform[J]. IEEE Trans. Acoustics, Speech, and Signal Processing, 1979, 27(4): 350-355.

[6]Alku P. Glottal wave analysis with pitch synchronous iterative adaptive inverse filtering[J]. Speech Communication, 1992, 11(2/3): 109-118.

[7]韩纪庆, 张磊, 郑铁然. 语音信号处理[M]. 北京: 清华大学出版社, 2013.

[8]Cobl C.The voice source in speech communication production and perception experiments involving inverse filtering and synthesis[D].Stockholm:Department of speech,Music and Hearing, KTH, 2003.

[9]Edwards J A, Angus J A S. Using phase-plane plots to assess glottal inverse filtering[J]. Electronics Letters, 1996, 32(3): 192-193.

[10]胡琼, 赵春宇. 利用逆滤波和相平面获取高自然声门波的研究[J]. 语音技术, 2011, 35(5): 59-63.

Hu Qiong, Zhao Chunyu. Study of improving the quality of glottal flow using inverse filtering and phase plane[J].Voice Technology, 2011, 35(5): 59-63. (in Chinese)

Extraction of the Glottal Waveform Based on the Summation of the Residual Harmonics

SHI Honghui, LI Haoxuan, QIAO Xiaoyan

(College of Physics and Electronic Engineering, Shanxi University, Taiyuan 030006, China)

Abstract:Aiming for fetching more natural and accurate glottal waveform, the summation of the residual harmonics (SRH) algorithm was applied to extract the glottal excitation signal. Firstly, a voice/unvoiced determination algorithm, W-SRH, which combines the wavelet transform analysis and the SRH, was designed. Subsequently, the combined SRH and the pitch synchronization iterative adaptive inverse filtering method (SRH-PSIAIF) approach was utilized to extract the voiced glottal waveform. The experimental results show that, the W-SRH algorithm has a more accurate rate for identifying voice/unvoiced segments, also the extracted glottal excitation by the SRH-PSIAIF technique is sufficiently natural which could contribute to the work for glottal source based emotional speech analysis and synthesis.

Key words:glottal waveform; voice/unvoiced determination; wavelet transform; SRH; PSIAIF

中图分类号:TN912

文献标识码:A

doi:10.3969/j.issn.1671-7449.2016.01.015

作者简介:师宏慧(1991-), 女, 硕士生, 主要从事语音信号检测与处理的研究.

收稿日期:2015-09-24
基金资助: 山西省回国留学人员科研资助项目(2014-010); 山西省自然科学基金资助项目(2013011016-2)

文章编号:1671-7449(2016)01-0080-06

猜你喜欢
小波变换
最优小波包变换在齿轮箱振动信号去噪中的应用研究
软件导刊(2016年12期)2017-01-21 16:25:22
负压波法管道泄漏监测定位系统实践与探索
卷宗(2016年10期)2017-01-21 15:48:38
基于峰度和小波变换的超短波信号调制识别
基于双树四元数小波变换的图像降噪增强
MATLAB在《数字图像处理》课程中的辅助教学
基于互信息和小波变换的图像配准的研究
保持细节的Retinex红外图像增强算法
基于小波变换的数字水印技术
考试周刊(2016年45期)2016-06-24 13:55:17
基于Matlab的遥感图像IHS小波融合算法的并行化设计
科技视界(2016年11期)2016-05-23 08:13:35
基于小波包络分析的滚动轴承典型故障诊断技术研究
商情(2016年11期)2016-04-15 07:39:54