自然音节状态下声母区别特征检测

2016-01-27 03:06徐益华刘亚丽孟子厚

徐益华,刘亚丽,孟子厚

(中国传媒大学 传播声学研究所,北京 100024)



自然音节状态下声母区别特征检测

徐益华,刘亚丽,孟子厚

(中国传媒大学 传播声学研究所,北京 100024)

摘要:从基于言语知觉特性的声母区别特征出发,观察MFCC和美尔能量取值在区别特征有无上的表现差异,修正了声母区别特征的客观参数特性,与修正前的结果相比更合理。定义含有区别特征参数特性的语音帧为有效帧,在自然音节中通过能量确定出声母初判范围位置的基础上,利用该范围内有效帧的含量Para作为检测探针,实现自然音节状态下声母区别特征检测。正检率在80%左右。

关键词:声母区别特征;自然音节;计算机辅助评测

1引言

目前汉语普通话的评测主要以人工评测和机器评测相结合的方法进行,人工方法测试成本较高,而且测试信度得不到保证。现有的机器评测从统计模型角度设计计算机辅助的评测策略,虽然克服了人工评测的主观性的缺点,但该方法较难锁定发音缺陷,对数据过分依赖[1][2]。语音错误或缺陷往往发生在最小对立体之间,这与区别特征的定义很相似,区别特征是构成语音的基本元素,是区分音位的最小差别[3-5]。从区别特征角度设计计算机辅助评测策略,有望从言语本质角度为锁定发音缺陷提供了新的思路。张家騄由知觉混淆结果,初步构建了普通话声韵调区别特征体系[5][6]。论文[7]在孤立声母的条件下根据声母的语音特征,结合二元对立的特点,构建了由13个区别特征参数构成的声母参数体系,如图1,该体系可以用于声母检测。论文[8]分析了不同声学传递条件下声母的清晰度特点和知觉混淆规律。建立由13个声母区别特征组成的普通话声母区别特征体系,如图2。文中对各区别特征进行初步的参数化,不过都是从声母参数体系中直接选取的,由于声母参数体系与基于言语知觉特性的声母区别特征体系的聚类逻辑是不一样的,如此给区别特征匹配客观参数是不太合理的。表1给出了初步参数化后的检测结果,可以发现并不理想,而且声母的区别特征的确定和客观参数的选取都是在人工切分后的孤立声母情形下进行的,如何在自然音节状态下检测到声母区别特征也是非常重要的问题。

本文从基于言语知觉特性的声母区别特征体系出发,在孤立声母情形下,观察区别特征的有无在声学线索上的表现差异,确定各区别特征对应的客观参数特性。与此同时,在自然音节状态下,设定检测探针,观察检测探针在区别特征的有无上的表现差异,确定在自然音节状态下声母区别特征的检测探针条件。最后对检测探针有效性进行分析。

表1 声母区别特征初步参数化失效性结果

图1 用于声母检测的声母参数体系 

图2 基于言语知觉特性的声母区别特征体系 

2声母区别特征参数的修正

本文中使用的语料库包括212位女生和126位男生,他们的年龄范围是18-22岁。文中使用的孤立声母语料是从发音较为清晰的单音节中,通过人工切分的方式得到,共计21类声母,零声母暂不考虑。其中40%的语料用于寻找与特征对应的参数,剩余60%用于测试这些参数的有效性。

在对区别特征进行检测之前,得先对其进行合理的参数化,声母的持续时间较短,分帧后各帧的差异不大,故使用各帧的声学参数平均值并归一化代表声母的总体特征。主要使用MFCC和美尔滤波器能量这两类声学参数,MFCC舍去一维对数能量,只保留其余12维,Mi代表第i维的MFCC值,美尔滤波器共有40维,包含有13 个线性滤波器和27 个对数滤波器。滤波器组由混迭的三角窗构成,将每个滤波器频带内的能量进行叠加作为滤波器的输出,f(i)代表第i维的美尔滤波器输出值。

求出21类声母的12维MFCC值和40维美尔滤波器输出值。由图2可知,基于言语知觉特性的声母区别特征共有13个,对于某个区别特征,声母含有该特征,标志为“+”,不含有该特征标志为“-”。观察这两类声母在两类声学参数上的表现差异,确定区分这两类声母的客观参数,该参数就是该区别特征对应的客观参数,图3给出了“浊音的”区别特征“+”标志声母l、m、n、r和“-”标志的其它声母在美尔滤波器能量上的取值情况,可发现在第一维到第三维的取值上出现差异,故设定N1=(f(1)+f(2)+f(3))/3为该特征对应的客观参数。

图3 区别特征“浊音的”涉及的声母的美尔能量曲线 

在确定好声母区别特征对应的客观参数的基础上,进一步确定各区别特征所对应的参数特性。以“浊音的”区别特征为例,计算含有“浊音的”“+”类声母和“-”类声母的N1值,图4给出了这两类声母的N1值的概率分布。

图4 “浊音的”“+”类、“-”类声母的N1值概率分布图 

设判决阈限为两曲线的交点0.52,“浊音的”区别特征参数特性为N1=(f(1)+f(2)+f(3))/3>0.52。故通过N1的取值实现有无“浊音的”区别特征判定。

同样的方法确定出其余11个声母区别特征所对应的客观参数以及参数特性,如表2所示。f(2:12)=f(2)+f(3)+...+f(12)。

对于“双唇的”区别特征并没有找到一个声学参数同时区分m和n、b p和d t g k。进一步思考,基于图2的区别特征体系,需要检测“双唇的”特征的声母主要是塞音(b p d t g k)和鼻音(m n)两种,对于这两种情形通过不同的声学参数进行“双唇的”特征的检测。

表2右侧给出的正检率是指理论上含有某区别特征的声母样本中,客观参数满足对应参数特性的声母样本所占比例。误判率是指理论上没有该区别特征的声母样本中,客观参数满足对应参数特性的声母样本所占比例。各区别特征的正检率在80%左右,误判率在20%左右。“舌尖前的”和“双唇的”正检率略低,说明匹配的声学参数不太适合,有待进一步修正。

对修正前后的参数化结果进行对比,表3给出了修正前后总体正检率和误判率的差异,可以发现,修正后总体的特征正检率有了大幅提升,总体误判率也有明显地下降,故修正后的区别特征参数化结果更加合理。

3音节中声母区别特征的检测探针

上节中为声母的各区别特征匹配了声学参数,确定了各特征的参数特性,利用这些参数和参数特性可以实现在孤立声母的情形下声母区别特征的检测。本节观察区别特征的有无在自然音节语音帧角度上的表现差异,以此设计探针实现自然音节中声母区别特征检测。

表2 声母区别特征的参数化修正后结果

表3 声母区别特征的参数化修正后结果

定义:具有某声母区别特征参数特性的语音帧为该区别特征的有效帧。

对于自然音节,声母部分语音帧的能量值要低于整个音节语音帧的能量平均值。利用此特征可以实现音节中声母位置的初判。

声母的持续时间短,分帧后各帧差异不大[10],故在自然音节中,某声母区别特征的有无将会在声母初判范围内有效帧的含量上出现差异。将音节中声母初判范围内有效帧的含量设定为该区别特征的检测探针,记为Para。图5给出Para的定义示意图。

图5 声母区别特征检测探针Para的定义示意图 

自然音节中某声母区别特征的有无,将会在检测探针上出现差异。下面将通过样本对这种差异进行分析,确定音节中检测声母区别特征的探针条件。本节所使用的样本与前1节的样本来自同一语料库,不同的是不含有静音区的自然音节。

以“浊音的”声母区别特征为例,该特征对应的检测探针Para为声母初判范围内N1>0.52的语音帧比例,记作Para1。观察理论上含有该特征的音节(A类)与理论上不含有该特征的音节(B类)在Para1概率分布,A类音节的Para1值为Para1A,B类音节的为Para1B,如图6所示。设判决阈限为两曲线的交点0.66。该特征的有无与Para1值的关系如表4所示。A类音节的Para1值一般大于等于66%。即可以通过Para1的取值来进行音节中“浊音的”声母区别特征检测。

图6 A类和B类音节的Para1概率分布图 

音节中“浊音的”特征阈值Para1范围有无66%≥66%<66%

同样的方法,确定出自然音节中其他声母区别特征的探针条件,如表5所示。

表5 自然音节中检测声母区别特征的探针条件

4自然音节中声母区别特征检测

利用第3节中表5给定的检测探针条件,在自然音节状态下对各音节样本进行声母区别特征检测。检测结果如表6所示。正检率是指理论上含有某区别特征的音节样本中,满足对应区别特征检测条件的音节样本所占比例。误判率是指理论上没有该区别特征的音节样本中,满足对应区别特征检测条件的音节样本所占比例。

由表6可知,正检率普遍在80%左右,误判率在20%左右,“舌尖前的”和“双唇的”正检率略低,与孤立声母情形下的检测结果类似。

表6 自然音节中声母区别特征的检测结果

5检测探针的有效性检验

第4节中设计了在自然音节中实现声母区别特征检测的探针,该探针的有效性主要通过自然音节状态下声母区别特征的检测效果与孤立声母下区别特征检测效果的差异来表征。从两个角度考虑:第一,总体上对比两种状态下的检测效果;第二,考察各区别特征下两种状态下的检测效果。

由表7可知,孤立声母状态下检测声母区别特征的总体结果与自然音节状态下的检测效果差异不大。具体表现在自然音节状态下特征总体正检率要略优于孤立声母状态,但同时带来的是误判率的提高。

表7 总体测试结果

在两种状态下总体检测效果相当的基础上,下面从各区别特征的角度分析,设定检测探针失效条件为:自然音节状态与孤立声母状态相比,在检测某一特征时,正检率绝对下降10%,或者误判率绝对增加10%。观察图7到9,其中,声母-正检和声母-误判表示孤立声母状态下声母区别特征的正检率和误判率;同理,音节-正检率和音节-误判表示自然音节状态下声母区别特征的正检率和误判率。可见,并没有特征满足失效条件,故可以认为用文中提出的探针在自然音节中检测声母区别特征的方法是有效的。

图7 两种状态下特征检测效果对比图(一) 

图8 两种状态下特征检测效果对比图(二) 

图9 两种状态下特征检测效果对比图(三) 

6结论

本文修正了各声母区别特征对应的声学参数,确定了各区别特征的参数特性,并提出利用探针Para实现自然音节状态下声母区别特征的检测的方法。具体工作如下:

孤立声母的状态下,对声母各帧声学参数值进行帧间平均,修正了12对声母区别特征的客观参数,参数为12维MFCC值和40维美尔滤波器输出值。利用客观参数对声母区别特征进行检测,检测效果与修正前的结果相比更加合理。

定义了具有某区别特征参数特性的语音帧为该区别特征的有效帧。在自然音节状态下,定义探针,样本训练确定出各区别特征的检测探针条件。在音节中对声母区别特征进行集内外检测,检测效果良好。

自然音节状态下的特征检测效果与孤立声母状态下的检测效果相当,且良好。这说明声母区别特征匹配的区别特征参数是合理的,并且文中提出的自然音节状态下检测声母区别特征的探针是有效的。

自然音节中声母区别特征检测的实现有助于推动基于区别特征的普通话评测技术的发展,但仅仅实现音节中声母区别特征检测问题是不够的,还得进一步考虑韵母区别特征检测问题,以及如何在将本文的结果应用在连续语流问题中,与此同时,“舌尖前的”、“塞擦的”这两个特征的检测效果不佳,可能是参数化中匹配的参数并不是很合适,下一步将为其寻找更合适的参数。

参考文献

[1]张家騄.言语知觉反映论[J].中国科学,1978,(5):519-530.

[2]张家騄.论语音技术的发展[J].声学学报,2004:29(3):193-199.

[3]吴宗济. 试论普通话语音的“区别特征”及其相互关系[J].中国语文,1980,(5):321-327.

[4]吴宗济,林茂灿. 实验语音学概要[M]. 北京:高等教育出版社,1989.

[5]陆致极. 试论普通话音位的区别特征[J].语文研究,1987,(4):10-21.

[6]张家騄. 汉语普通话区别特征体系[J].声学学报,2005:30(6):506-514.

[7]张家騄. 汉语普通话区别特征体系树状图[J].声学学报,2006:31(3):193-198.

[8]冯晓亮,孟子厚. 面向普通话辅音检测的区别特征参数测量[J].声学技术,2013,(1):297-305.

[9]章斯宇,孟子厚. 混响环境下汉语语音知觉特征的实验分析[J].声学学报,2013,(1):85-91.

[10]冯晓亮,孟子厚.舌尖辅音和舌面辅音的区别特征参数[J].北京:第八届中国语音学学术会议,2008.

(责任编辑:王谦)

Detection of The Mandarin Initials Distinctive Feature in Natural Syllables

XU Yi-hua,Liu Ya-li,MENG Zi-hou

(Communication Acoustics Laboratory,Communication University of China,Beijing 100024,China)

Abstract:According to Mandarin initials distinctive feature systems based on speech perception characteristics,objective signal parameters was corrected which correspond to the distinctive features.Initial distinctive feature was detected tin Natural syllables by parameter Para,which is based on the percentage of effective frames in the initial preliminary position.The effective frame is that speech frame containing the parameter characteristics of a distinctive feature. Initial preliminary position is determined due to energy in Natural syllables. The average detection accuracy of initial distinctive feature was about 80%.

Keywords:Mandarin initials distinctive feature;natural syllables;computer aided speech evaluation

作者简介:徐益华(1990-),男(汉),江苏盐城人,硕士研究生.E-mail:xuyihua0708@163.com

基金项目:国家自然科学基金项目(11174275)

收稿日期:2015-04-27

中图分类号:0428

文献标识码:A

文章编号:1673-4793(2015)05-0029-06