董倩倩
元音的内在音高(Intrinsic pitch或intrinsic frequency)问题是一种曾经引起研究者们广泛注意和极大兴趣的语音 现 象 。 Crandall (1925)、Peterson&Barney (1952)、Lehiste&Peterson(1961)等较早地注意到这一问题,其后Ohala (1973)、Delos at al.(1976)、Hombert(1978)、Shadle(1985)、Ohala&Eukel(1987)等都对与元音内在音高有关的问题进行过研究。
本文首先考察汉语普通话元音内在音高的表现,对普通话中三个顶点元音[a]、[i]、[u]的基频数值进行了声学测量。实验的有关情况如下。
1.发音人情况
声学实验分析所用的语料是从 “汉语拼音发音数据库”中随机选取的四名发音人的语音材料。四名发音人均为讲地道北京话的北京人,无口、咽、腭疾病。四人以A、B、C、D标记,男、女各两人,其中A、B为男性,C、D为女性,年龄在35—50岁之间。
2.语料说明
测量所用的语料为普通话中包含[a]、[i]、[u]三个单元音的所有阴平调。每位发音人共计41个,其中带有元音[a]的单音节16个、带有[i]的10个、带有[u]的15个。
3.测量说明
语音实验测量使用Praat(4.2)软件,分别测量了上述41个音节的基频数据。采取的是多次测量求平均值的方法。基频测量的方法是:在一个单音节的全部时长中,选取中间段的200毫秒(ms),在这200毫秒中,选取均匀分布的10个点,测量基频数值,精确到十分位,最后求得平均值,保留小数点后两位,单位为赫兹。
1.元音的基频数值
关于基频的测量,按上述方法,大致看出,在某发音人所发的包含[a]、[i]、[u]三个元音的基频数值中,[a]的数值最小,[i]的数值比[a]高,[u]的基频数值最高。
2.结果分析
从不同元音来看,[a]的基频数值最低,男性大致在130—160Hz之间,女性大致在270—310Hz之间。 [i]的基频居中,男性大致在140—170Hz之间,女性大致在280—340Hz之间。 [u]的基频最高,男性大致在150—190Hz之间,女性大致在280—350Hz之间。
综观四位发音人,情况比较一致,均为三个元音的音高按[a]<[i]<[u]的顺序递增。 各元音和各发音人之间的差异大小不同,但这种总的趋势是明显的。总起来说,汉语普通话元音的内在音高在带[a]、[i]、[u]三个单元音的高平调音节中表现明显。这与Shi&Zhang(1987)的研究结果是吻合的。
关于振幅的测量,首先对发音人带有[i][a][u]的单音节进行提取,按同样方法得出结论。可以看出,元音[a]的振幅都较大,[i]的振幅居中,[u]的振幅最低。发音人B元音[i]的振幅小于[u],发音人D元音[a]的振幅略小于[i]。 除此以外则[a]的振幅总体上较大,[i]的振幅居中,[u]的振幅最低。
测量语料方法同前,得到结果,低元音[a]的时长最长,[i]的时长居中,[u]的时长最短。当然这只是一种总的趋势,三个元音之间的时长差异较小,尤其是女发音人C,差距只在三四毫秒之间。
关于不同元音时长上的差异,一般认为在其他因素相同的情况下,低元音的时长相对较长,高元音的时长相对较短。这种与元音高度相关的现象被称作“元音内在时长”(intrinsic vowelduration)。Lehiste(1970)指出英语、德语、丹麦语、西班牙语、泰语等都存在这种现象。而在同属高元音的前元音[i]和后元音[u]上,前元音的时长略长于后元音。
这样,[a]、[i]、[u]三个元音在时长上的顺序是[a]>[i]>[u],三个元音呈递减的趋势。当然这是仅就本文并不大的数据样本而言的,按推测在更大样本的测量中这种总的趋势应该会是一致的。
在上面一节中我们测量了元音的内在音高,总体的情况是元音的音高按照[a]<[i]<[u]的顺序递增。 而我们测量元音的振幅,得到的结果是元音的振幅按照[a]>[i]>[u]的顺序递减。 我们看到三个元音的时长按照[a]>[i]>[u]的顺序递减。
通过这些情况,我们可以发现以下一些规律:三个音的平均基频由高到低的排列顺序依次是[u][i][a],而振幅平均值与时长平均值的排序与此正好相反,由高到低是[a][i][u]。 也就是说,在[a][i][u]这三个元音中,基频高的振幅、时长却相应的比较低;而基频低的振幅、时长却比较高。
影响元音内在音高的原因、机制很多。Ohala(1973)曾提出舌牵引、力学相互作用的假说。Ewan(1975)曾经做过两个实验来探讨元音内在音高的原因。第一个实验是用照相技术跟踪检测喉部的运动情况。第二个实验是对阿拉伯语咽通音的考察。
[a][i][u]三个元音的内在音高存在差异,但这种差异一般的听音人是难以感知到的,相反会听为是相同的音高。换言之,[a][i][u]三个元音虽然客观的基频数值存在不同,但在听音人听起来是一样高的。这种情况得到Hombert(1978)实验的证实。Hombert(1978)合成了[a][i][u]三个元音的不同音高,由讲美国英语的5男5女作为听音人进行辨别,结果在相同音高情况下低元音[a]听为具有较高音高的可能性更大,[i]听起来比[u]更高的可能性也较大。
对于这种听觉现象,Hombert(1978)曾经给出过解释。他提出两种解释,第一是这种现象可由元音的频谱特性加以解释;第二是这涉及跟元音高度有关的F0的某种归一化。
我们认为元音内在音高现象的出现应该是由不同元音发音生理的差异引起的。Ohala(1973)正是从发音生理的角度,提出的假说及公式;Ewan(1975)的实验也从生理角度证实了这一现象。
我们测量了4名发音人普通话所有单音节中单元音[a][i][u]的音高,进一步证实了汉语元音内在音高的存在。 同时我们也测量了有关语料中[a][i][u]的振幅数据及时长数据,通过对比发现[a][i][u]的内在音高与振幅、时长存在关联。总体来说,开口度大、发音靠前的元音振幅和时长较大,而音高较低;开口度小、发音靠后的元音振幅和时长较小,而音高较高。这显示了元音的不同声学参数之间是有规律的,也是相互联系的。本文也总结了产生元音内在音高的一些原因,认为元音的内在音高应该根源于元音不同的发音生理状态。