藏语拉萨话元音共振峰声学分析

2016-09-16 08:17陈小莹艾金勇
西藏民族大学学报 2016年3期
关键词:藏语辅音元音

陈小莹,艾金勇

(1.西藏民族大学信息工程学院 陕西咸阳 712082;2.西藏民族大学图书馆 陕西咸阳 712082)

藏语拉萨话元音共振峰声学分析

陈小莹1,艾金勇2

(1.西藏民族大学信息工程学院 陕西咸阳 712082;2.西藏民族大学图书馆 陕西咸阳 712082)

共振峰是表征语音信号特征的重要基本语音参数之一,对共振峰的研究分析在语音信号处理领域有着广泛的应用。本文用声学语音学和语音信号处理的方法,对藏语拉萨话单元音的共振峰数据以及不同音节结构中元音的共振峰数据分别进行了研究分析,研究结果为今后藏语语音合成和语音识别的研究提供了重要的参考数据和实践价值。

拉萨话;元音;共振峰;声学分析

一、概述

共振峰是语音信号的一个重要特征,是语音学特征中重要的组成部分,在语音信号处理领域有着广泛的应用[1](P87-90)。共振峰语音声学分析是语音科学、声学及信息科学紧密结合的一个研究课题,它是语言学中描写音系、制定音系变化规则的科学和客观依据,又是语音合成和语音识别的重要参考数据和诊断工具。因此它越来越被语言声学、语音信号处理、语言学和语音学界所重视。藏语是我国一种主要的民族语言,有着悠久的历史和众多的使用人口[2](P1-3)[3(P1-3)],利用现代语音学的研究方法对藏语的元音共振峰进行声学分析研究,建立声学参数数据库,对语音学、言语工程和信号处理方面都有着

二、实验方案

从语音交际功能即语音学、音位学和音系学的角度和言语声学的角度设计整个论文的框架,用声学语音学和语音信号处理的方法,研究藏语元音的共振峰数据特征。研究中通过对资料的收集整理得到单音节文本,录制信号后再通过语音信号处理算法和相应的批处理程序实现参数的提取,最后实现对藏语拉萨话单元音以及不同音节结构中元音的共振峰数据的研究分析。重要价值,不仅将有力地推动藏语信息处理技术的发展,而且对促进各民族之间的技术交流将起到积极的作用,推动藏族地区经济、科技、社会文化等方面的发展和进步[4]。

三、研究内容

本部分主要从单元音以及不同音节结构元音共振峰数据图两部分进行声学分析。

(一)单元音共振峰参数数据图分析

藏语拉萨话中的元音主要有八个,分别是/a、i、u、e、o、ɛ、y、ø/[5]。在录音时,用国际音标对每一个发音合作人的语音进行记录,个别发音有一些差别。所以,将多次发音的参数提取,求算术平均数后进行分析[6][7]。在参数分析之后,分别提取元音在不同音节结构中的F1、F2、F3频率值进行统计分析并作图分析。

1、元音[a]共振峰数据图分析

图1元音[a]共振峰数据对比图

从图1中的数据分析看出,[a]的开口度大,舌位低,F1的频率值较高,在1000HZ左右。F2的频率在1500HZ左右,舌位相对靠后一些。F3与F2之间的距离较大,F3已达到2600HZ。在四种音节结构中元音[a]的F1和F2的走势是一致的,呈逐渐增大的趋势,从大到小依次为CVC>VC>CV>V,F3的变化比较大。在不同的音节结构中,CVC音节结构中元音[a]的F1、F2、F3都是最大的。前置辅音相对能提升元音的共振峰数值,后置辅音相对能降低元音的共振峰值,在前置辅音和后置辅音都存在的情况下,前置辅音对元音共振峰值得影响大于后置辅音的影响。从元音[a]的共振峰数据对比图的分析来看,元音共振峰受前后辅音的影响,这可能是发音过程中协同发音的作用,通过观察不同音节内元音的共振峰变化,可以为以后研究协同发音时的共振峰变化[8]。

2、元音[i]共振峰数据图分析

图2元音[i]共振峰数据对比图

从图2中的数据可以看出,[i]为不圆唇前元音,舌位最靠前,且舌位最高,因此[i]的F1较低,而F2较高。在四种音节结构中元音[i]的F1变化趋势较为平稳,F2和F3的走势是一致的,从大到小依次为VC>V>CV>CVC。在V和CV音节结构中,CV音节结构元音[i]的F2和F3值相比V结构要小,前置辅音相对能降低元音[i]的共振峰值;在V和VC音节结构中,V音节结构中元音[i]的F2和F3相对VC结构中元音[i]的共振峰小,后置辅音相对能提高元音的共振峰值。V和CVC的F2和F3相比较而言,可以得出前置辅音相对降低共振峰的影响要大于后置辅音提高程度。而元音[i]的F1的受影响和F2和F3却相反。从图中还可以看出,F1与F2的距离相差较远,也就是说第一共振峰与第二共振峰的值相差较大。

同样,元音[i]共振峰受前后辅音的影响,也是协同发音的影响,通过观察不同音节内元音的共振峰变化,也可为以后研究协同发音时的共振峰变化。

3、元音[u]共振峰数据图分析

图3元音[u]共振峰数据对比图

从图3中的数据分析可见,[u]同样为圆唇元音,u的舌位比[o]高,因此F1比[o]低,元音[u]的F1在四种音节结构中非常稳定,几乎在一条直线上,前后辅音对元音[u]的第一共振峰几乎没有什么影响。四种音节结构元音[u]的F2和F3的走势是一致的,呈逐渐增大的趋势,从大到小依次为CVC> V>CV>VC。从V、CV到VC结构,元音[u]的F2和F3一直下降,在CVC结构中又变大,可以看出前置辅音和后置辅音相对都降低了元音[u]的第二共振峰和第三共振峰值,只是前置辅音对元音[u]的影响大于后置辅音对其的影响。

同样,元音[u]共振峰受前后辅音的影响,也是协同发音的影响,通过观察不同音节内元音的共振峰变化,也可为以后研究协同发音时的共振峰变化。

4、元音[o]共振峰数据图分析

图4元音[o]共振峰数据对比图

从图4中的数据分析看出,[o]是圆唇元音,舌位相对较高,舌位靠后。在四种音节结构中,元音[o]的三个共振峰变化趋势是一致的,F1变化比较稳定,F2和F3变化幅度较大。可以看出前置辅音能提升元音o的共振峰值,后置辅音相对降低元音[o]的共振峰值,并且前置辅音对共振峰的影响要大于后置辅音的影响。通过对比我们还可以发现,元音[o]的第一共振峰比元音[a]、[i]和[u]的第一共振峰值大,都在500以上,这与元音本身的发音特性有关,元音的性质主要取决于前三个共振峰。

5、元音[e]共振峰数据图分析

从图5中的数据可以看出,元音[e]是不圆唇元音的开口度较小,舌位高,与[a]相比F1的值较小,舌位靠前。元音[e]的三个共振峰在四种音节结构中值非常稳定,和元音[o]类似,第一共振峰比元音[a]、[i]和[u]的第一共振峰值大,都在500以上。从图中我们可以看出第一共振峰的值几乎没有什么变化,第二共振峰中,从大到小依次为CVC>CV> V>VC,第三共振峰从大到小依次为:V>CVC>CV> VC。在发音过程中,由于协同发音的影响,前置辅音和后置辅音都会对元音的发音产生影响,从而元音的共振峰数据也会相应地发生变化,只是影响的程度的大小不同。通过观察不同音节内元音的共振峰变化,可以为以后研究协同发音时的共振峰变化。

图5元音[e]共振峰数据对比图

6、元音[y]共振峰数据图分析

图6元音[y]共振峰数据对比图

从图6中的数据分析可见,元音[y]的三个共振峰在四种音节结构中变化相对比较稳定。从图中我们可以看出第一共振峰的值几乎没有什么变化,前后辅音对元音[y]的第一共振峰影响不大。第二共振峰中,从大到小依次为CVC>VC>CV>V,可以得出前置辅音和后置辅音都会相应地提升元音的共振峰值;第三共振峰从大到小依次为:VC>V> CVC>CV。在发音过程中,由于协同发音的影响,前置辅音和后置辅音都会对元音的发音产生影响,从而元音的共振峰数据也会相应地发生变化,只是影响的程度的大小不同。通过观察不同音节内元音的共振峰变化,可以为以后研究协同发音时的共振峰变化。

(二)不同音节结构元音共振峰数据图分析

将藏语拉萨话的这六个元音的F1、F1和F3的共振峰频率用图表的形式展现出来,可以很直观地观察出各个元音的共振峰位置,由此展现各元音共振峰的相互关系,这种共振峰间的相互关系构成了拉萨话各元音的不同共振峰模式。在发同一个元音时,不同的人无论男女由于发音器官的个体差异,各发音人的基频和共振峰的频率也不相同。不同的发音人在发同一个元音时,共振峰的频率和位置也不会完全重叠,彼此之间存在差异。共振峰的差异主要表现在一个频率域内,同一个元音的共振峰频率范围之内也存在差异。同一个元音的共振峰差异主要有两种原因造成,其一是不同的人发同一个元音,二是同一个人在不同的时候发同一个元音。原因在于在发音时的舌位高、低、前、后不同而且个人的发音状态也不相同。在同一个音区范围之内,同一个元音的共振峰范围是一致的。共振峰模式图反映了元音共振峰的频率范围。

1、V结构元音共振峰数据图分析

图7 V结构元音共振峰模式图

从图7中的数据分析可见,随着舌位的由高到低,即开口度逐渐增大时F1的值逐渐增大;F1最大的为开口元音[a],值为620.8Hz;而最小的是元音[i],值为408.5 Hz。F1的频率与舌位高低有关。舌位越高,F1的频率越低;舌位越低,F1的频率越高。随着舌位的从前到后,F2的值依次减小。F2的值中最大的为[i],平均值为2637.5 Hz,最小的为圆唇元音[o],平均值为1009.5Hz。F2的频率与舌位前后有关。舌位越靠前,F2频率就越高;舌位越靠后,F2的频率就越低。F3的值中最大的为[i],平均值为3391.5Hz,最小的为圆唇元音[o],平均值为1873Hz。

从图中还可以看到,第一共振峰与第二共振峰间距离最大的是元音[i],F1为408.5HZ,F2为2637.9HZ,两共振峰之间相差2229.4HZ。距离最小的是元音[o],F1值为 645.1HZ,F2值为1009.5HZ,共振峰之间相差364.4HZ。F1和F2的差值按照从大到小的顺序来看,[i]>[e]>[y]>[ø]>[u]> [a]>[o];F2和F3之间的差值从大到小为[a]>[o]>[ø]> [y]>[e]>[i]>[u],元音[a]的F2和F3之间相差最大为1765.7HZ,最小的是元音[u],F2和F3之间相差654HZ。F3的大小与嘴唇圆展有关。从共振峰的距离来看,F2和F3之间的距离主要受圆唇与否的影响。[e]和[ɛ]处于中间位置,[o]、[a]、[ø]和[y]的间距较大,而[u]和[i]的间距较小,主要是受圆唇的影响。

2、CV结构元音共振峰数据图分析

图8 CV结构元音共振峰共振峰模式图

从图8中的数据分析可见,随着舌位的由高到低,即开口度逐渐增大时F1的值逐渐增大;F1最大的为开口元音[a],值为878.6 Hz;而最小的是元音[y],值为446.7 Hz。F1的频率与舌位高低有关。舌位越高,F1的频率越低;舌位越低,F1的频率越高。随着舌位的从前到后,F2的值依次减小。F2的值中最大的为[i],平均值为2289.7 Hz,最小的为圆唇元音[u],平均值为1092.4Hz。F2的频率与舌位前后有关。舌位越靠前,F2频率就越高;舌位越靠后,F2的频率就越低。F3的值中最大的为[i],平均值为3070.3Hz,最小的为圆唇元音[u],平均值为1843.3Hz。

在图8中,第一共振峰与第二共振峰间距离最大的是元音[i],F1为476.8HZ,F2为2289.7HZ,两共振峰之间相差1812.9HZ。距离最小的是元音[o],F1值为604.9HZ,F2值为1188.7HZ,共振峰之间的相差583.8HZ。F1和F2的差值按照从大到小的顺序来看,[i]>[e]>[ɛ]>[y]>[ø]>[a]>[u]>[o];F2和F3之间

图15 VC结构元音共振峰模式图

从图9中的数据分析看出,随着舌位的由高到低,即开口度逐渐增大时除了元音a,其他元音的时长和能量基本上是递增的,这与CV结构中各元音的第一共振峰变化趋势是一致的。F1最大的为开口元音[a],值为744.3 Hz;最小的是元音[y],值为436.3Hz。可以看出藏语拉萨话中F1的频率与舌位高低有关。舌位越高,F1的频率越低;舌位越低,F1的频率越高。在VC音节结构中,元音的第二共振峰和第三共振峰收到的影响较大。随着舌位的从前到后,F2的值依次减小。F2的值中最大的为[i],平均值为2685.5 Hz,最小的为圆唇元音[u],平均值为900.2Hz。F2的频率与舌位前后有关。舌位越靠前,F2频率就越高;舌位越靠后,F2的频率就越低。F3的值中最大的为[i],平均值为3368.6Hz,最小的为圆唇元音[u],平均值为1139.3Hz,

在图9中,第一共振峰与第二共振峰间距离最大的是元音[i],F1为436.3HZ,F2为2685.5HZ,两共振峰之间相差2249.2HZ。距离最小的是元音[u],F1值为482.5HZ,F2值为900.2HZ,共振峰之间的相差417.7HZ。F1和F2的差值按照从大到小的顺序来看,[i]>[y]>[ø]>[a]>[o]>[u];F2和F3之间的差值从大到小为[ø]>[y]>[o]>[a]>[i]>[u],元音[ø]的F2和F3之间相差最大为1231.5HZ,最小的是元音[u],F2和F3之间相差239.1 HZ。F3的大小与嘴唇圆展有关。从共振峰的距离来看,F2和F3之间的距离主要受圆唇与否的影响。[a]和[i]处于中间位置,[ø]、[y]和[o]的间距较大,而[u]的间距较小,主要是受圆唇的影响。

4、CVC结构元音共振峰数据图分析

图10 CVC结构元音共振峰模式图

从图10中的数据我们可以分析看出,CVC音节结构中的F1趋势和CV和VC音节结构中是一致的。F1最大的为开口元音[a],值为745.7 Hz;而最小的是元音[y],值为459.5 Hz。F1的频率与舌位高低有关。舌位越高,F1的频率越低;舌位越低,F1的频率越高。随着舌位的从前到后,F2的值依次减小。F2的值中最大的为[i],平均值为2220Hz,最小的为圆唇元音[u],平均值为1204.6 Hz。F2的频率与舌位前后有关。舌位越靠前,F2频率就越高;舌位越靠后,F2的频率就越低。F3的值中最大的为[i],平均值为2922.8 Hz,最小的为圆唇元音[u],平均值为2146 Hz。

在图10中,第一共振峰与第二共振峰间距离最大的是元音[i],F1为467.8HZ,F2为2220HZ,两共振峰之间相差1752.2HZ。距离最小的是元音[o],F1值为598.6HZ,F2值为1204.6HZ,共振峰之间的相差606HZ。F1和F2的差值按照从大到小的顺序来看,[i]>[e]>[ɛ]>[y]>[ø]>[a]>[u]>[o];F2和F3之间的差值从大到小为[o]>[a]>[ø]>[u]>[y]>[ɛ]>[e]> [i],其中最大的[o]中,F2和F3之间相差1401.8HZ,最小的是元音[i],F2和F3之间相差702.8HZ。F3的大小与嘴唇圆展有关。从共振峰的距离来看,F2和F3之间的距离主要受圆唇与否的影响。[y]和[ɛ]处于中间位置,[o]、[a]、[ø]和[u]的间距较大,而[e]的差值从大到小为[o]>[a]>[ø]>[y]>[ɛ]>[e]>[i]>[u],元音[o]的F2和F3之间相差最大为1382.9HZ,最小的是元音[u],F2和F3之间相差750.9 HZ。F3的大小与嘴唇圆展有关。从共振峰的距离来看,F2和F3之间的距离主要受圆唇与否的影响。[e]和[ɛ]处于中间位置,[o]、[a]、[ø]和[y]的间距较大,而[u]和[i]的间距较小,主要是受圆唇的影响。

3、VC结构元音共振峰数据图分析和[i]的间距较小,主要是受圆唇的影响。

四、小结

在本文的研究中,综合不同元音共振峰对比图,我们可以得到在不同元音共振峰对比图中,所有的元音第一共振峰在不同的音节结构中变化相对第二共振峰和第三共振峰都比较稳定,受前后辅音的影响不是很大。第二共振峰和第三共振峰的变化幅度比较大,受前后辅音的影响较大,前置辅音和后置辅音对元音共振峰的影响程度不同。元音在不同的音节结构中受协同发音作用的影响,其共振峰会受到不同程度的影响,这可为以后研究协同发音时的共振峰变化。综合四种音节结构元音的共振峰模式图,我们可以看出元音的前三个共振峰都是非常稳定的,每个元音的共振峰的数值在不同的音节结构中都是在一定的数值范围内的,这也进一步说明了元音的性质主要取决于前三个共振峰。拉萨话元音的共振峰基本模式对研究协同发音有很大的参照作用,通过观察不同音节内元音的共振峰变化,来研究协同发音时的共振峰变化。本文的研究内容属于基础类的科学研究,研究的结果为后续的藏语文字和语音研究奠定了坚实的基础,这项研究将会为藏语语音的合成、识别、语音治疗和语音教学提供坚实的研究基础,同时在藏语信息科学和技术的应用方面也有着广阔的前景。

[1]吴宗济,林茂灿.实验语音学概要[M].北京:高等教育出版社,1989.

[2]格桑居冕,格桑央京.藏语方言概论[M].北京:民族出版社,2002.

[3]金鹏.藏语简志[M].北京:民族出版社,1983.

[4]瞿霭堂,金效静.藏语方言的研究方法[J].西南民族大学学报(人文社科版),1981(3).

[5]瞿霭堂.藏语的韵母研究[M].西宁:青海民族出版社,1991.

[6]鲍怀翘.藏语拉萨话语音声学参数数据库[J].民族语文,1992(5).

[7]李永宏,于洪志,孔江平.藏语连续语音语料库设计与实现[J].计算机工程与应用,2010(13).

[8]石锋.普通话元音的再分析[J].世界汉语教学,2002(4).

[责任编辑索南才让]

[校对康桂芳]

H214

A

1003-8388(2016)03-0110-06

2015-08-15

陈小莹(1983-),女,江苏宿迁人,现为西藏民族大学信息工程学院实验师,主要研究方向为实验语音学。

本文系西藏自治区科技厅项目“基于呼吸信号的藏语诗歌韵律声学研究”(项目号:2015ZR-14-19)的阶段性研究成果。

猜你喜欢
藏语辅音元音
浅谈藏语中的礼仪语
失去爆破和不完全爆破
元音字母和元音字母组合的拼读规则
BR Sounds
英语的辅音连缀
元音字母和元音字母组合的拼读规则
藏语拉达克话的几个语音特征
第二讲 元音和辅音(下)
藏语地理分布格局的形成原因
Playing with “ar”