普通话单字调阳平和上声的辨认及区分*
——兼论实验设计对声调范畴感知结果的影响

2015-05-15 01:07王韫佳覃夕航

语言科学 2015年4期

关键词：阳平声调拐点

王韫佳覃夕航

1北京大学中文系北京 100871

2湖南省外事侨务办公室湖南长沙 410011

普通话单字调阳平和上声的辨认及区分*
——兼论实验设计对声调范畴感知结果的影响

王韫佳1覃夕航2

1北京大学中文系北京 100871

2湖南省外事侨务办公室湖南长沙 410011

通过不同设计的范畴感知实验讨论两个问题,一是普通话单字调阳平和上声的辨认和区分是否存在声学参数上的范畴边界,二是刺激设计和实验任务对于声调范畴感知结果的影响。实验刺激为下降段降幅和终点音高都不同的四个降升调连续统,自变量为音高的拐点位置。实验结果表明:1)在下降段降幅较低的情况下,终点音高较高的连续统在辨认曲线上出现了较强的范畴化特征,而在下降段降幅较高的条件下,终点音高较低的连续统出现了较强的辨认范畴化特点;2)在两种实验设计中均未得到与辨认结果显著相关的区分结果,在辨认结果具有显著范畴化特点的实验条件下,区分结果呈现弱范畴化或非范畴化特点。在实验结果的基础上讨论了刺激设计和实验任务对范畴感知实验结果的影响,记忆中的音高衰减作用、普通话韵律单元中的声调变化规则以及被试完成任务的偏向策略都可能对区分实验结果产生重要影响。基于本研究的结果,调形具有相似度但并不完全相同的声调的感知类型介于范畴型和非范畴型之间。

范畴感知阳平上声区分辨认

1 引言

范畴感知和连续感知是人们在知觉中区分两个音位的两种典型模式。经典的范畴感知研究包括两个实验——辨认和区分,实验刺激为等声学间距的人工声音刺激连续统。典型的范畴型感知在辨认率曲线和区分正确率曲线上的特点分别是:1)跨范畴边界的两个相邻刺激的辨认率差别远远大于处于边界同侧的两个相邻刺激的辨认率差别;2)在声学距离相同的情况下,跨范畴的两个刺激的区分正确率高于处于范畴同侧的两个刺激的区分正确率(Liberman et al.1957)。范畴型感知意味着两个音位存在某种声学参数上的范畴边界,或者说,两个音位的声学范畴边界是清晰的。如果辨认和区分结果没有上述两个特点,那么音位的感知就是连续型的,也就是说两个音位不存在清晰的声学范畴边界。关于普通话声调的范畴感知问题,最早的工作是王士元(1976)对阴平和阳平范畴感知的实验研究。这项研究的结果表明,普通话母语者对于阴平和阳平的感知是典型的范畴化感知模式,当一个升调的上升幅度低于某个声学临界点时,普通话母语者就不再认为这个声调是阳平而是把它识别为阴平,此临界点就是阴平和阳平的范畴边界。近十年来,其他学者的重复实验都支持了王士元的结论(如Halléet al.2004;Xu et al.2006;Xi et al.2010;Peng et al.2010;王韫佳和李美京2010;张林军2010a,2010b)。

学界在后来的研究中发现了更多的声调感知范畴化现象。例如,Francis et al.(2003a)发现粤语不同曲拱的声调的感知(例如高平调和高升调,低降调和低升调)是范畴型的;Halléet al.(2004)发现台湾国语的母语者对于台湾国语的阳平和去声、上声和去声的感知也是范畴型的;高云峰(2004:100-102)发现,上海话阴去、阳去和阴平(调型不同)的感知是范畴型的;Peng et al.(2010)发现,普通话母语者对于阳平与去声的感知是范畴型的。但是,有些学者在声调感知的实验中得到了相反的结论。例如, Abramson(1979)对泰语高平、中平和低平调进行了范畴感知研究,他认为这三个平调的辨认是范畴型的,但三个平调区分曲线上都未出现范畴边界处的区分高峰,因此他认为泰语的平调感知是非范畴型感知。Francis et al.(2003a)发现,粤语的三个平调尽管在辨认中出现了范畴化倾向,但区分曲线上未出现区分正确率的峰值,这个结果与泰语平调感知的结果非常相似。此外,Francis et al.还发现粤语低升调和高升调的辨认是范畴型的,但区分却也是非范畴型的。

声调感知范畴化程度的量化研究是近年来范畴感知研究中的新进展,也就是说,仅将语音范畴的感知区分为连续型和范畴型是不够的,在典型的连续型和典型的范畴型之间还存在着一些中间状态。例如,Xu et al.(2006)发现普通话母语者对阴平和阳平感知的范畴化程度高于英语母语者,Halléet al. (2004)发现台湾国语母语者感知台湾国语的阴平和阳平、阳平和去声、阳平和上声的范畴化程度高于法语母语者,Peng et al.(2010)发现汉语普通话和粤方言母语者在普通话阴平和上声、阴平和去声感知中的范畴边界比德语母语者更清晰,张林军(2010a,2010b)发现,泰语、日语和韩语母语者对普通话阴平和阳平感知的范畴化程度都低于普通话母语者,而泰语母语者的范畴化程度又高于日语和韩语母语者。在技术上如何定量判断语音感知的范畴化程度,前人使用了不同的技术参数,本文在第2节将介绍前人使用过的部分方法。

如果认为只有辨认和区分曲线上都出现范畴化特点才能确认音位的感知是范畴型的,那么,总的来说,前人在曲拱特征不同的声调的感知中都得到了范畴型结果,而在平调的感知中多数人都得到了非范畴型结果(Xi et al.2010)。在这些结果的基础上,我们会直觉地进行这样的假设:不同调阶的平调的感知是非范畴型的,平调和曲拱调或者不同调形的曲拱调的感知是范畴型的。而Francis et al.(2003a)的结果让我们把以上假设推广为这样的问题:调形相同或者相似的声调的辨认和区分是否都是连续型的(例如平调和平调、升调和升调、降调和降调、降升调和降升调)?

需要指出的是,尽管西方在平调的感知研究和相似调形声调的感知研究中都未得到典型的范畴型结果,但国内一些研究者却得到了相反的结论。例如,高云峰(2004:14,32-41)发现上海话的低升调阳去和高升调阴去之间存在辨认和区分的范畴边界;金健(2010)发现广州话的三个平调的感知呈现范畴化或者类范畴化的特点,东海话(闽南方言潮汕片)的4个平调的感知也呈现出范畴化或者类范畴化的特点;金健和施其生(2010)还发现汕头谷融方言(闽南方言潮汕片)不同降调的感知呈现类范畴化特点。又如,荣蓉和石锋(2013)考察了位于双音节词前、后字位置上声(实验设计为低平调)和阴平的的知觉,他们认为处于前字位置时,半上声和阴平这两个平调的范畴化感知特点更强。以上这些研究都是把目标声调置于负载句甚至是有意义的词中,这种实验方法并不符合经典的范畴感知实验范式。经典范畴感知实验范式所使用的刺激为孤立音节,这样做的目的是为了避免临近的同质单位(对于声调来说就是相邻声调)以及词义信息对目标语音范畴的辨认或者区分产生影响。实际上已经有研究表明,声调感知的范畴化特点受到目标声调是否置于负载句以及在负载句中位置的影响,例如,Francis et al.(2003a)对比了粤语孤立声调与处于负载句中的声调的感知,在多数情况下处于负载句句中位置的声调在辨认中出现了更强范畴化特点,但处于句末位置的平调的区分依然是非范畴型的,Zheng et al.(2004)关于粤语平调感知的结果与Francis的结果相似。由于不同实验条件下的结果不具有可比性,因此本文将不再讨论使用负载句或者负载词所得到的声调感知的结果。

从客观的语音表现看,普通话的阳平和上声在音高曲线上是有相似之处的,阳平的音高曲线是先有略微的下降然后转向上升(沈炯1985;吴宗济和林茂灿1989:157-160;Shen&Lin 1991;石锋和王萍2006),而全上声就是公认的降升调。不过,从音系特征的角度看,普通话阳平和上声的调型并不相同——对于阳平来说,起始段的下降是整个声调曲拱“弯头”,它的区别性特征是[升];而对于上声来说,它的音系特征应该是[+低],或许还包括[+凹](见下面的文献回顾)。但是,人类对自己母语某个音位的感知是建立在各种音位变体的基础上的,即音位本身是抽象的,而音位在母语者的感知系统中具有一个特定的声学空间,从这个角度上来说,自然语言中阳平和上声在音高曲线上的相似性仍然值得我们关注。因此,我们在上面提出的问题可以借助对阳平和上声的感知进行讨论:这两个音系调型不同但音高曲线上具有相似性的声调,在感知模式上是范畴型的还是连续型的?为使行文简洁且与音系上的调型相区别,本文将音高曲线的轮廓简称为调形。

最早对阳平和上声的感知问题进行研究的当属Zue(转引自Gandour 1978)。Zue在实验中使用的是改变拐点位置(以50ms为步长)的平升调连续统(基频曲线先平后升),实验结果表明,普通话母语者和美国英语母语者的范畴感知边界都出现在拐点位置5,他们把拐点位置1-4的刺激归入“主要特征上升(predominantly rising)”型,而把拐点位置6-9的刺激归入“主要特征持平(predominantly level)”型。高云峰(2004:110-112)在改进Zue的方法(刺激仍为拐点位置不同的平升调连续统)的基础上重复了这个实验,辨认曲线和区分曲线上都出现了范畴化特征。Liu(2004)使用了降升调连续统观察普通话母语者对阳平和上声的辨认,她在实验设计中使用了两个自变量:声调的音高拐点位置和起点音高位置,她认为,无论是在声调的起点音高而是拐点位置上,阳平和上声都不存在辨认上的范畴边界。她还发现,升降调连续统下降部分的降幅对上声的辨认有显著作用,降幅越大,上声的辨认率越高,这个结果似乎暗示了把平升调连续统用于阳平-上声的辨认并不是最佳选择。王韫佳和李美京(2010)的结果表明,对于平升调连续统来说,即便在拐点位置较后且终点音高较低的情况下,在进行阴平/阳平/上升/去声的四择一辨认选择时,阳平的辨认率依然占了绝对优势,这个结果可以与Liu的结果形成照应,即,降升调连续统比平升调更适合用于阳平-上声的知觉研究。实际上,Shen&Lin(1991)在Liu (2004)之前已经用降升调连续统研究了拐点位置对阳平和上声辨认的作用,但他们没有讨论这两个声调在辨认曲线上的范畴化问题。王韫佳和李美京(2010)也使用降升调连续统考察了普通话阳、上的辨认,这个实验使用的自变量是拐点位置和终点音高,实验结果表明,在拐点位置的和终点音高的维度上,阳平和上声的辨认都出现了准范畴化的特点。王和李还指出,在Liu的原始实验数据中也可以看到起点音高和拐点位置两个维度上的准范畴化现象。也就是说,Liu(2004)的结果和王、李的结果都暗示着,使用降升调连续统至少观察到,在下降幅度、拐点位置和上升幅度三个维度上,阳平和上声的辨认出现了范畴化倾向。但是,上述两个研究都只对辨认率进行了观察而没有进行区分实验,而区分结果能够与辨认结果形成显著相关,是判断感知类型的一个重要依据,因此关于阳平和上声感知的范畴化程度问题并没有真正的结论。此外,王韫佳和李美京(2010)虽然观察到阳平和上声辨认的范畴化程度受到拐点位置和终点音高条件的双重制约,但是她们并未对不同条件下感知的范畴化程度进行量化的比较。

前人的研究表明,普通话母语者的听感中最容易相混的就是阳平和上声(Chuang et al.1969,转引自吴宗济和林茂灿1989:168-169),外国人学习普通话声调时最容易相混的也是这两个声调(最早发现这个问题的可能是Kiriloff 1969,在这个问题上国内对外汉语教学界发表过大量报告,因文章篇幅所限不——列举)。这两个声调之所以容易混淆,其原因就在于它们在调形上具有一定的相似性。知觉的范畴型和连续型,也许与两个音位在知觉中是否容易相混有关,而知觉上的相似度又往往是诱发历史音变的重要因素,因此我们认为有必要对阳平和上声的范畴感知问题继续进行讨论。而要讨论这两个声调之间是否存在范畴边界,至少可以在5个维度上展开:1)起点音高,即下降段降幅;2)终点音高,即上升段升幅;3)音高拐点位置;4)拐点音高;5)整个曲线的调阶。这个问题的研究难度不仅在于需要研究的变量较多,而且在于这些变量对于阳平和上声的感知具有交互作用,因此,在某些实验中未能发现阳平和上声的范畴边界,并不意味着在另外的条件下这两个声调一定不存在范畴边界,也就是说实验设计对实验结果会产生重要影响。由于论文篇幅的限制,本文只打算从拐点位置的角度观察阳平和上声的感知模式。我们拟讨论两个问题:1)单字调的阳平和上声是否在辨认曲线和区分曲线上都存在音高拐点位置上的范畴边界?对这个问题的讨论实际上是为了回答上文提出的“调形相同或相似的声调的感知是否都是连续型的?”2)实验中的刺激设计以及实验任务对于声调知觉实验结果的影响。

2 实验I

2.1 方法

2.1.1 听觉刺激

制作实验刺激的原始声音样本为一个普通话女声的自然音节dá,使用语音分析软件Praat修改原始样本的音高和音长,所有刺激的带音段长度都为400ms。制作了拐点位置等间距变化的低终点和高终点两个连续统。两个连续统中所有刺激的起点音高都是10st(以100Hz为参考频率),拐点音高为8st,终点音高分别为11st(低终点)和15st(高终点)。第一个拐点位置在带音段起始之后的20ms处,以40ms为步长形成7个拐点台阶,最后一个拐点位置在带音段起始之后的260ms处。这样在每一个连续统中都得到7个实验刺激。由于这两个连续统的降幅都比实验Ⅱ中的连续统小,因此称为缓降型设计。图1是两个连续统中的音高曲线示意图。

图1 缓降型连续统的音高曲线,左为低终点,右为高终点

2.1.2 被试

被试由16名北京话母语者组成,他们都出生并且一直生活在北京,年龄在20-30岁之间,听力正常。得到实验结果后发现有两位被试(女性)在低终点连续统的辨认实验中数据严重偏离均值,其中一位在所有台阶上的阳平辨认率都是100%,另一位在所有台阶上的辨认率在40%-60%的水平之间波动,在对低终点辨认结果进行分析时剔除了这两位被试的数据。

2.1.3 过程

对每个连续统都做辨认实验和区分实验。

在辨认实验中,将每个刺激重复播放10次,所有播放刺激以随机的次序呈现。每一个刺激播放之前有铃声提示,铃声结束1s之后播放实验刺激,结束之后有4s时间供被试进行判断作业,要求被试在答卷纸上对所听到的刺激是dá还是dǎ进行二择一判断。

在区分实验中,将相差两个步长的实验刺激A和B编为一个刺激对(例如拐点1和3,拐点5和7),一共形成5种区分刺激对,每一个刺激对都以AB、BA、AA和BB四种排列方式播放(即一次播放两个相同或者不同的刺激),实验时每种排列式都重复播放5次,以随机次序播放所有刺激对。每一个刺激对播放之前有铃声提示,铃声结束1s之后播放刺激对,刺激对内的两个刺激相隔0.5s播出,刺激对播放结束之后有4s的时间供被试进行判断作业,要求被试在答卷纸上对所听到的两个刺激是否一样进行"是"或"否"的判断。在进行正式实验之前使用10个辨认刺激和10个刺激对进行了辨认和区分任务的训练,训练中所使用的刺激为男声样本,音高参数与正式实验有所区别。

2.2 数据处理

2.2.1 辨认范畴边界和范畴边界宽度

设PI为刺激I被辨认为阳平(或者上声)的比率,对每一个刺激来说,阳平和上声的辨认率之和都是1。PI的计算公式为:

对辨认曲线进行probit回归分析(logit模型),得到回归方程(见Xu et al.2006):

其中S为拐点位置(计算时以拐点编号为观察值)。降升调的拐点位置本来是一个连续变量,在实验设计中观察的是人为设定的离散值,回归方程将这个参数还原为连续值,b0为回归曲线的截距,b1为斜率,b1的绝对值越大说明范畴化程度越高。

通过公式(2)可以求出任意辨认率处的拐点位置,即:

将PI=0.5时的S看成阳平和上声的辨认范畴边界(Sbc),这个边界就是阳平辨认率曲线和上升辨认率曲线的交点,通过公式(4)求得Sbc:

使用Peng et al.(2010)的方法计算辨认范畴边界的宽度Wbc,Wbc为PI=0.75和PI=0.25之间S的线性距离。范畴边界的宽度作为本文描写范畴化程度的参数之一。

2.2.2 区分峰值的位置和峰陡峭度

理论上来说,区分曲线上的区分正确率峰值位置应该与范畴边界的位置相吻合,即,通过辨认函数的probit回归方程得到的Sbc应该落在区分曲线上最高区分正确率的刺激对之内(Xu et al.2006),但是实测区分峰值也可能与范畴边界不对应。因此,这里用于计算的峰值是指实测区分曲线上的最高值。

一个刺激对(刺激A和刺激B)的区分正确率P(A,B)的计算方式为:

采用Xu等(2006)的方法计算区分曲线上的峰陡峭度(DP),用实测区分曲线上的最高峰值Ppk减去第一个刺激对(1-3)和最后一个刺激对(5-7)的区分正确率平均值,公式为:

2.2.3 区分正确率预测

使用辨认率可以对区分的正确率进行预测(Liberman et al.1957),若两个不同的刺激在辨认实验被辨认为同一个声调的比率是1,则它们在区分实验中能够被区分的概率就是0。本实验中一个刺激对有AA、BB、AB、BA四种呈现序列,因此一个刺激对能够被正确区分的概率是这四种序列能够被正确区分的概率的均值。序列AA和BB的区分正确概率(被判断为相同)分别为:

序列AB或BA的区分正确概率(被判断为不同)为:

一个刺激对被正确区分的概率,也就是预测区分正确率P*为:

预测区分正确率用于比较辨认结果和区分结果的一致性,从而可以最终确认感知类型。

2.3 结果与讨论

2.3.1 高、低两个连续统的结果

图2显示的是实测辨认曲线、回归辨认曲线、实测区分曲线和预测区分曲线,这些曲线是对所有被试的总结果进行计算而不是对每个被试的结果分别进行计算然后平均得到的。表1中列出的是图3中辨认回归曲线的截距b0(使用阳平辨认率的数据,上声的曲线与之对称,下文同)、回归系数b1、辨认范畴边界Sbc、辨认范畴宽度Wbc和区分峰陡峭度DP。

图2 两个缓降型连续统的辨认和区分曲线,左为低终点,右为高终点

表1 两个缓降型连续统范畴感知结果的对比

首先看低终点连续统的结果。辨认曲线上范畴感知的特点不算突出,表现为辨认范畴边界两侧的辨认率突变不够显著,从通过辨认率预测出的区分曲线也可以看到辨认曲线范畴化程度不高,因为跨范畴刺激对3-5的预测区分正确率与其他刺激对的区分正确率的差值并不大。根据辨认回归曲线计算出来的辨认范畴边界Sbc为5.20(拐点5之后),比实测的辨认范畴边界(拐点3和5之间)靠后,而在预测和实测区分曲线上,峰值也都位于拐点3和5之间。从均值看,刺激对3-5的区分正确率比其余刺激对都略高,最大差距为0.080。相对于范畴感知理论模型中的峰值(为1)与其他位置区分正确率(为0.5的随机水平)的差距0.5来说,这个差距显然是非常小的。对所有刺激对的区分正确率进行方差分析,F(4,52)=1.686,p=0.167。成对比较的结果表明,除了P(3,5)(即实测峰值所在处)与P(1,3)的差异边缘显著(p=0.099,P(3,5)＞P(1,3)),P(3,5)与P(5,7)的差异边缘显著(p=0.096,P(3,5)＞P(5,7))外,其余刺激对之间的差异均不显著(p＞0.150),统计结果进一步说明刺激对3-5上的区分峰值非常微弱。

再看高终点连续统的结果,辨认曲线具有较明显的范畴感知的S型特点,辨认范畴边界左右两个刺激的辨认率的差别远远大于范畴边界一侧相邻刺激辨认率的差别。通过辨认率预测得到的区分曲线上出现了明显的峰值。实测辨认范畴边界与通过回归曲线得到的辨认范畴边界都在拐点4和6之间。不过,区分结果与辨认结果存在较大差别。首先,预测区分峰值出现在拐点3和5之间,而实测区分峰值出现在4和6之间。第二,预测区分峰值比较突出,而实测到的刺激对4-6的区分正确率与其他刺激对的差距不大(最大差距为0.070)。对5个刺激对的区分正确率进行了方差分析,F(4,52)=1.300,p =0.282。成对比较的结果表明,除了P(4,6)跟P(5,7)有显著差异之外(P(4,6)＞P(5,7),p=0.018),其他刺激对之间的区分正确率差异均不显著(p＞0.150),这些结果表明这里的区分峰在统计上的意义不大,因此对实测峰值需要审慎对待。

2.3.2 两个连续统范畴边界和范畴化程度的对比

对两个连续统的Sbc差异进行了对比(配对样本),观察值为每一个被试的Sbc。结果表明两个连续统的范畴边界差异不显著,t(13)=1.400,p=0.185。也就是说终点音高对于阳平和上声在拐点上的范畴边界没有显著作用。

对两个连续统辨认曲线上的范畴宽度Wbc差异进行了对比(配对样本),对比结果表明,低终点连续统的Wbc比高终点连续统大1.24,t(13)=4.953,p＜0.001。对两个连续统的阳平辨认曲线斜率绝对值|b1|的差异也进行了对比(配对样本),结果表明,低、高终点连续统的辨认曲线斜率绝对值差异显著,前者小于后者,t(13)=-5.182,p＜0.001。范畴宽度和斜率的差别都说明高终点连续统在辨认上的范畴化程度高于低终点连续统。

对两个连续统实测区分曲线上的峰陡峭度DP进行了对比(配对样本),结果表明,两个连续统的峰陡峭度之间没有显著差异,t(13)=0.125,p=0.903。显然,区分峰陡峭度的结果与辨认函数的结果不相吻合。上文已经提到,在每一个连续统内部,区分峰值与其他位置上的区分正确率的差异并不总是有统计意义,因此,对区分峰陡峭度的对比其实并不具有太大的意义,问题的关键在于区分结果和辨认结果的不一致。

2.3.3 辨认结果与区分结果的对比

预测区分率体现的是辨认函数的特点。从图2中可以看出,预测区分正确率与实测区分正确率曲线之间的关系比较复杂。首先,两个连续统的预测曲线与实测曲线都没有出现整体上的高低关系,而是局部的交叉关系。其次,低终点连续统的预测曲线与实测曲线之间的距离较近,而高终点连续统的预测曲线和实测曲线虽然在两端的距离较近,但峰值相差较大,甚至峰值的位置也不相同。判断预测曲线与实测曲线关系的最简方法是进行相关分析。由于区分正确率是等级变量(5个等级),因此这里采用Kendall’s tau-b相关分析(Liberman et al.1957,下文同)。统计结果表明,低终点连续统的预测和实测区分正确率存在显著正相关,r=0.454,p＜0.001;高终点连续统的预测和实测区分正确率不存在显著相关,r=0.103,p=0.212。

对同一个连续统预测区分正确率峰值和实测区分正确率峰值分别进行了对比(配对样本的T检验)。低终点连续统的预测区分正确率峰值与实测峰值没有显著差异,t(13)=0.357,p=0.727。在高终点连续统中,两个峰值的差异是显著的,t(13)=5.495,p＜0.001,预测峰值比实测均值大0.223,相对于从随机水平到理论最大峰值的差距0.5来说,这个差距应该说是相当大的。

2.3.4 终点音高与辨认的范畴化程度

本实验的结果表明,在阳平和上声的辨认中,降升调的终点音高对于拐点范畴边界的清晰度有显著作用,终点音高越高,范畴边界的清晰度也就越高。从音系的角度看,阳平具有高音特征而上声没有,但在本文的结果中,当终点音高较低且拐点位置最靠后时,被试将这个声调判断为阳平的均值仍然超过了25%,而在终点音高较高且拐点位置最靠后时,声调被听为阳平的平均比率不到10%。这个结果说明普通话母语者对上声的辨认是复杂的。

我们认为造成低终点连续统辨认范畴化程度不如高终点连续统突出的原因是,低终点连续统上声和阳平特征都不够突出。在本实验中,两个连续统的降幅都只有2st,而Liu(2004)、王韫佳和李美京(2010)的结果都证明了降幅对孤立条件下上声的辨认具有显著作用。本实验中两个连续统在降幅方面的上声特征都不算强。而低终点连续统的升幅也只有3st,因此阳平的特点也较弱。这就导致,即便是在音位边界(阳平/上声辨认率为50%的地方)两侧,声调范畴的识别率也难以出现突变。而对于高终点的连续统来说,当拐点位置在音位边界之前时,上升部分长度上的优势以及音高终点较高的特点使得阳平的辨认率较高;当拐点位置移到边界之后、下降部分占有时间上的优势时,较高的终点使得下降部分的相对高度降低,上声的低音特征得到凸显,上声的辨认率便会得到较大程度的提高。也就是说,较高的终点音高使得范畴边界左右两侧的阳平特征和上声特征都得到了凸显,因此辨认的范畴化程度就得到了加大。

2.3.5 刺激排序与区分正确率的作用

由于高终点跨范畴边界刺激对的实测区分正确率与理论(预测)区分正确率存在较大差距,而这个连续统的辨认曲线出现了明显的范畴化特点,因此这里仅讨论这个连续统的结果。我们对该连续统中理论峰值位置上的区分正确率,也就是跨范畴区分正确率P(3-5)进行了观察,发现A-B和B-A两种排序方式的区分正确率不同。P(3-5)的平均区分正确率为0.275,P(5-3)的平均区分正确率为0.750,T检验的结果表明,它们的差异是显著的,t(15)=-7.550,p＜0.001。如果只看B-A序列的区分正确率,实测区分正确率接近预测区分正确率(0.786)。实际上,该连续统的其他刺激对以及低终点连续统的刺激对也存在B-A序列的区分正确率大于A-B序列的情况。

Francis et al.(2003b)在对粤语平调感知的研究中也发现了刺激排序对区分结果的作用,前低后高的刺激对比前高后低的刺激对更容易被正确区分。他们认为这是记忆中的音高衰减效应导致的:声调的音高在记忆中会随着时间降低,因此先出现的那个声调在知觉中的高度被降低。本实验中的AB序列的差别虽然比平调之间的差别更加复杂,但A刺激的平均音高高于B刺激。因此,我们认为记忆中音高衰减作用或许也是造成本实验中A-B序列比B-A序列区分正确率低的原因之一。对于A -B序列来说,A的平均音高略高于B,在记忆音高衰减效应的作用下,A与B在知觉中的差异就减弱了;而如果平均音高较低的B先出现,记忆音高衰减效应会使得A和B的差异加大,从而造成B-A区分正确率较高。

A-B和B-A序列区分正确率的不同还可以有另外一种解释,即,韵律单元中声调的变化规则使得被试对两种排序的序列进行了不同的声调识别。对于跨越了范畴边界的A-B序列来说,A相当于阳平调,B相当于上声调。刺激A和B的播放尽管相隔了0.5s,但时这种播放形式仍然与一个双音节词的语音形式接近。在普通话中,如果阳平位于孤立的双音节词的末字位置或者句末位置,其音高曲线与全上声有相似之处,具体的表现是上升特点不如在前字位置时突出,音高在低音区停留时间相对要长些(参见沈炯1985;吴宗济和林茂灿1989:161-163)。如此,后音节低音区相对较长的A-B序列很可能被母语者听成两个阳平调的相连,B被识别为A处于声调组合末尾位置的变体。B-A序列则不存在这样的问题,因为处于前面的B是相当于上声的声调,而处于后面的A是相当于阳平的声调,因此被试在区分时不会受到声调变体的干扰。Francis et al.(2003a)在解释粤方言平调感知中出现的"高-低"序列的区分正确率低于"低-高"序列时也提到,这个现象与粤方言自然语流中的音高下倾(declination)有关。

在实验结果中还发现另一个有意思的现象——上声拐点越向后,被试对相同序列刺激对(A-A或B-B)的区分正确率就越低。将7个拐点台阶上由相同刺激组成的刺激对(例如1-1,2-2,3-3等)的区分正确率加以对比(重复测量),统计结果表明组间差异显著,F(6,90)=12.686,p＜0.001。两两对比结果表明,除了P1-1和P2-2、P2-2和P3-3、P4-4和P7-7、P5-5和P7-7无显著差异外(p＞0.100),其余所有台阶上的区分正确率差异都是显著的(p＜0.05),最大的区分正确率均值为P1-1(0.913),最小的为P6-6(0.388)。虽然P7-7＞P6-6(p=0.036),但总的趋势仍然是区分正确率随着拐点位置的后移而降低。这个现象可能与普通话的连上变调规则有关。在普通话自然语流中不会连续出现两个全上声,因为前面的上声会变异为听感上与阳平无异的调子(Wang&Li 1967)。但是,这个听感上与阳平很像的调子在声学特征上仍然保留了全上声的一部分特征(参见凌锋和王理嘉2003)。在本研究中,位于范畴边界之后的各台阶上的刺激在理论上都相当于上声,当被试听到它们连续出现时(中间0.5秒的间隔在听感上小于语流中可以阻隔连上变调的停顿),很可能会在变调规则的干扰下把前面保留了上升特征的全上声辨认为阳平,因此就把相同的刺激看成了不同的刺激(范畴边界后相同刺激的最高区分正确率为0.525)。而位于范畴边界之前的各台阶上的刺激理论上来说都是阳平,对于这两个刺激的区分就不容易受到连上变调规则的影响了,因此正确率也就比较高(范畴边界前的相同刺激的最低区分正确率为0.688)。

3 实验II

3.1 方法

原始声音样本仍为一个普通话女声的自然音节dá,使用Praat修改原始样本的音高和音长。所有刺激的带音段时长均被调整为500ms(比实验I中的刺激长100ms)。制作了拐点位置等间距变化的低终点和高终点两个连续统。两个连续统中所有刺激的起点音高都是8st(以100Hz为参考频率),拐点音高为4st,终点音高分别为10st(低终点)和16st(高终点)。由于这个实验中的两个连续统下降段的降幅是实验Ⅰ中两个连续统降幅的两倍,因此称为陡降型设计。

第一个拐点位置在带音段起始后的50ms处,以50ms为步长形成7个拐点台阶。这样在每一个连续统中都形成7个实验刺激,图3显示了两个连续统的音高曲线。

图3 陡降型降升调连续统的音高曲线,左为低终点,右为高终点

被试由13名北京话母语者组成,出生且基本上生活在北京。所有被试年龄都在20-28岁之间,听力正常。实验结果显示,所有被试的实验数据均没有严重偏离均值。

对每一个连续统都进行辨认实验和区分实验。在辨认实验中,每个刺激重复播放4次,所有播放刺激都随机排列。播放完成任务的方式与2.1.3同。区分实验中刺激的排列和播放方式以及实验任务都与2.1.3相同,但本实验中每种排列式的重复播放次数为3,刺激对内的两个刺激相隔1s。实验之前仍然有10个辨认刺激和10个刺激对的任务训练。数据处理方法与2.2完全相同。

3.2 结果与分析

3.2.1 两个连续统结果的对比

图4显示的是两个连续统的辨认和区分曲线,表2列出了表征范畴化程度的所有参数。

图4 陡降型设计中低终点和高终点声调的辨认及区分曲线,左为低终点,右为高终点

表2 两个陡降型连续统结果的对比

从图4可以看到,低终点连续统的辨认曲线范畴化特点较为突显,具体表现为辨认率在范畴边界两侧的两个拐点间出现较大幅度的变化(0.50),预测区分正确率峰值也比较突出。实测峰值P(2,4)出现的位置与预测位置相同,但实测峰值比预测峰值低。对5个刺激对的实测区分正确率进行对比,F(4, 48)=2.273,p=0.075。成对比较的结果表明,实测峰值P(2,4)除了与P(3,5)的差异边缘显著外(p= 0.054),与其余刺激对的差异都是显著的(p＜0.05),峰陡峭度超过了0.1,这些结果表明区分函数有一定范畴化倾向。但是,低终点连续统的预测和实测区分正确率没有显著相关,r=0.527,p=0.207。

高终点连续统辨认曲线上的范畴化特点比低终点连续统稍弱。预测区分正确率峰值出现在拐点3和5之间,而实测区分正确率峰值却出现在拐点4和6之间。对5个刺激对的区分正确率进行对比,F (4,48)=3.314,p=0.018,比较结果表明,实测峰值P(4,6)与P(3,5)的差异不显著(p=0.188),与所有其他刺激对的区分正确率的差异都是显著的(p＜0.05),此外,除了P(3,5)大于P(1,3)(p=0.021),其他刺激对的区分正确率没有显著差异。总体来看,区分函数也出现了微弱的范畴化倾向。但是,与低终点连续统的结果相似,高终点连续统的预测和实测区分正确率也没有显著相关,r=0.600,p=0.142。

对两个连续统结果的差别进行配对样本的T检验。两个实验中b1的差异不显著,t(12)=1.679, p=0.119;Sbc有显著差异,t(12)=-3.777,p=0.003,低终点声调的辨认范畴边界比高终点的靠前; Wbc差异不显著,t(12)=-1.748,p=0.106;DP没有显著差异,t(12)=-0.439,p=0.669。从统计检验的结果看,两个实验仅在辨认范畴边界上存在显著差异,但是,需要注意的是,b1和Wbc的统计检验结果中p都小于0.150,从表2和图4呈现的均值看,两个连续统的b1和Wbc均值的差别都较大,通过辨认率预测得到的区分峰峰值也有较大差距。如果加大样本或者增加每一个刺激在实验中的重复呈现次数,这两个参数在两个实验中很有可能会呈现出显著差异。因此,我们依然认为低终点连续统辨认的范畴化要高于高终点连续统。

3.2.2 降幅和升幅对辨认范畴化程度的作用

本实验的结果与实验Ⅰ有一个重要差别,即,实验Ⅰ中高终点连续统辨认函数的范畴化程度高于低终点连续统,而在本实验中却是低终点连续统辨认函数的范畴化程度更加突出。如引言所述,音高曲线的下降幅度对阳平和上声辨认有显著效应(Liu 2004;王韫佳和李美京2010),下降幅度越大,声调被辨认为上声的概率就越大。缓降型实验设计中的结果前文已有讨论,兹不赘述。在陡降型低终点设计中,下降部分的音高降幅达到了4st,降幅是缓降型设计的两倍,而上升部分的升幅为6st,接近缓降型高终点设计中的上升幅度(7st)。如此,这个设计中的终点高度与低音点的差别仍然可以在一定程度上凸显声调的低音特征,这就使得在拐点位置后移到一定程度时上声的辨认率有较快速度的增长。在高终点设计中,终点音高与低音点音高的差距达到了12st,在下降段降幅不变的情形下,巨大的升幅虽然可以进一步凸显低音特征,但另一方面也可能导致阳平辨认率的上升,因此拐点位置后移所带来的上声辨认率的下降速度反而减慢,从而使得辨认曲线上范畴化的特点减弱。纵观两个实验的结果,我们认为实验刺激的设计对于阳平和上声辨认函数的影响是比较复杂的,从总的结果看,当阳平和上声的特点在连续统的起点和终点位置均有所体现但又不过分强势的时候,辨认曲线上才会出现明显的范畴化特征,因此在这个问题上不宜以一两个特殊设计的实验结果就轻易对感知类型下结论。

缓降型和陡降型实验设计的结果还有一个不同之处:在缓降型设计中,终点音高的变化对阳平和上声范畴边界的效应不显著,而在陡降型设计中,终点音高的升高使得拐点的范畴边界向后移动,这可能是因为在升幅过大的情形下,上声的辨认需要相对较长的下降段。

3.2.3 区分实验任务对结果的影响

我们实验Ⅰ中观察到刺激排序与区分正确率之间的复杂关系,因此这里也有必要对这个问题进行分析,为节省篇幅,我们只讨论辨认范畴化程度较高的低终点连续统的情况。首先观察跨范畴边界刺激对(2-4)在A-B和B-A两种排序条件下的区分正确率,PA-B＜PB-A(t(12)=2.635,p=0.022),二者的均值分别为0.282和0.513。再看相同序列刺激对的正确区分正确率与拐点位置的关系。统计结果表明,不同拐点位置上相同序列刺激对之间的差异边缘显著,F(4,48)=2.325,p=0.070。成对比较的结果表明,P1-1和P4-4、P3-3和P4-4、P3-3和P5-5之间有显著差异,其他位置间的差异不显著。但相同序列刺激对在所有拐点位置上的区分正确率都大于0.79,而且也没有像缓降型高终点连续统那样表现出拐点位置越向后区分正确率越低的趋势。我们认为发音人可能在整个区分实验中出现了完成任务的偏向(bias),这个偏向就是对所有听感上差别不够明显的刺激都选择"相同"(这种策略Francis等(2003b)也报告过),这就导致了相同序列刺激对的区分正确率在所有拐点位置上都较大程度地超过了0.5的随机水平,也导致了跨范畴的不同序列刺激对的区分正确率较低,跨范畴的PB-A仅为0.513。

在2.3.5中我们对刺激排序与区分正确率之间的关系进行过讨论,我们认为声调在多音节词末字位置的变体以及连读变调规则可能是被试对刺激顺序敏感的原因之一,鉴于这个认识,我们在实验II中把区分任务中刺激对内部的时间间隔增加到1s。但如上所述,排序对区分正确率依然有显著作用。我们认为这个现象依然是普通话的韵律特征对于阳平的作用所导致的:虽然两个刺激之间的距离增加到1s,但两个刺激组成的刺激对在听感上依然是一个韵律单元,或者说是一个类似句子的韵律单位,而阳平音节在韵律单元或句末结束位置上的上升特征不如在非末尾位置突显(沈炯1985;杨顺安1992),所以被试仍然有可能把A-B对内单独听起来像上声的刺激B当作韵律单位末尾位置的阳平。当然,记忆中的音高衰减效应也依然是导致A-B区分正确率低于B-A的可能原因之一。

4 一般性讨论和结论

4.1 辨认和区分实验结果的不一致

在典型的范畴感知中,通过辨认结果预测出的区分正确率应该和实测区分正确率接近或者有显著相关。本研究中最令人困惑的结果是,当辨认曲线出现范畴化感知的特点时(缓降型高终点连续统和陡降型低终点连续统),区分结果中却没有出现可以与辨认结果匹配的范畴化结果(陡降型低终点连续统的区分结果有一定的范畴化倾向,但区分峰值与预测峰值差距较大),通过辨认率预测得到的区分正确率和实测区分正确率不相关或弱相关。

造成本研究区分实验结果与预测结果相距甚远的原因较为复杂,我们在上文的讨论中已经对这个问题进行了阐述,例如刺激排序和较大韵律单元的韵律特征对知觉的作用。尽管辨认实验和区分实验迄今为止依然是范畴感知研究中被多数学者采用的两项任务,但也有人认为,传统的语音范畴感知研究范式存在严重问题。例如,Schouten et al.(2003)认为,传统的区分实验任务存在固有偏向(inherent bias),而这种偏向有时候会造成区分实验的结果与通过辨认实验预测到的区分正确率之产生显著相关。他们在另外一个研究中发现,一旦在实验设计中克服任务带来的偏向,区分实验和辨认实验的结果就不呈现显著相关(Gerrits&Schouten 2004);在这项研究中他们还认为,语音信号是否存在范畴感知实际上是由区分实验的任务形式来决定的。虽然我们不能完全同意Schouten等人"是否存在范畴感知取决于区分实验任务"的论断,但我们的结果也表明区分实验的任务的确会对实验结果产生严重影响,虽然这种影响与Schouten等人所提到的影响并不是一回事。我们猜测,记忆中的音高痕迹的衰减和声调在不同韵律位置上的变体,是刺激排序对实验结果产生作用的最可能的原因,而本研究的两种区分实验设计(改变刺激间隔和刺激长度)都无法消除这种影响,因此,对于本研究的区分结果我们必须审慎对待。改进区分实验任务可能会减少排序问题和被试的消极猜测策略对结果带的影响,例如,Gerrits& Schouten(2004)使用了在目标刺激前后分别增加侧翼刺激的序列,实验任务是要求被试对偏差刺激的位置进行判断而不是要求被试判断两个刺激相同与否,这样的方法也许可以削弱刺激排序以及被试的消极猜测策略对区分结果的作用。

范畴感知的实验过去都是行为实验,而行为实验的结果在很大程度上依赖于被试的配合,被试在实验中如果注意力不能高度集中,实验结果往往会大打折扣,因此也就会出现种种令人困惑的结果。使用脑电实验也许能够解决这些问题,例如,我们可以通过观察声调感知中的ERP(事件相关电位)来分析阳平和上声的范畴感知问题,因为在ERP实验中,无论是偏差刺激还是标准刺激都是独立出现的,而实验任务是非注意的任务,因此可以较好地消除刺激排序和被试注意力不集中以及使用猜测策略等因素对感知结果的影响。

4.2 调形相似性与感知类型的关系

我们在引言中提出的问题是:声调感知的范畴型和连续型,是否取决于两个声调在调形上的相异性?前人的研究已经表明了汉语粤方言和泰语中不同调阶的平调的感知是非范畴型感知,斜率不同的孤立升调的区分也是非范畴型的,本文的两个实验所使用的连续统都没有从根本上改变调形,特定音高条件下的辨认曲线呈现出范畴感知的特点,但在辨认曲线上未能发现范畴化特点。

Abramson(1979)和Francis et al.(2003a)都认为泰语或汉语粤方言平调的辨认是范畴型的,而区分是连续型的。从Abramson的实验结果看,泰语的低平调和中平调辨认曲线有一定的范畴化特点,而中调和高调的辨认率接近匀速变化,也就是说在音位边界两侧的两个刺激间并没有突变。由于他未对辨认曲线进行回归分析,因此我们无法用辨认曲线的斜率讨论他所得到的辨认曲线的范畴化程度。不过,Francis等给出了用平调的辨认率预测得到区分曲线,我们从预测区分曲线上可以看到峰值较低(均在0.6左右,随机水平为0.5),因此可以认为辨认的范畴化程度并不高。总的说来,我们并不认为以上两个关于平调的研究中出现了辨认和区分结果的重大冲突。如果把辨认结果和区分结果放在一起看,基本上可以认为平调的知觉是连续型的。

但本文的结果与泰语或粤方言平调的结果并不相同。我们对辨认曲线上的范畴化程度进行了量化计算,在我们所确定的范畴化程度较高的两个连续统中,辨认率从0.25上升到0.75分别只需要1.02和1.00个步长(见表1和表2的数据),也就是说在辨认率变化最快的区域,拐点位置移动一个步长几乎就能导致辨认率的变化幅度达到0.5,与之相对应的结果是,在音位边界两侧的两个刺激之间,范畴化程度较高的两个连续统的辨认率的变化都超过或达到了0.5(参见图2和图4),通过辨认率预测的区分正确率峰值都在0.75以上(随机水平为0.5),因此,本文所得到的辨认函数的范畴化程度是比较高的。本文的结果中最令人困惑的是在辨认曲线上呈现出较为突出的范畴化特点时,区分曲线上却未出现音位边界处的正确率高峰,仅实验Ⅱ中的低终点连续统在区分曲线上出现了与预测峰值位置对应的较小峰值。虽然我们认为区分曲线的非范畴化特点很有可能是实验任务导致的,但目前我们仍然无法预测改进区分实验任务后是否一定能够得到范畴型的结果。因此,基于目前的结果我们也许可以保守地假设,在两个声调的调形有一定相似性但音高曲线并非相等函数的条件下,辨认函数会产生范畴化或准范畴化的特点,但区分函数则未必出现与辨认函数一致的结果,Francis et al.(2003a)关于粤语两个升调的感知研究结果支持我们的假设。如引言所述,高云峰(2004:32-41)发现上海话的两个升调(低升调阳去和高升调阴去)的感知是范畴型的,但他使用的刺激嵌入了负载句,因此我们对这个结果不予讨论。高还发现新派矾山话高降调(阴上)和低降调(去声)的辨认和区分曲线上均出现了较为明显的范畴化特征(高云峰2004:65-69),他所使用的是斜率不同的降调连续统,这正符合我们所界定的“调形相似但音高曲线的函数不等”。但由于他没有明确说明矾山话的听辨材料是像普通话和上海话一样的负载句还是孤立音节(高云峰2004:14),因此我们也无法对这个结果进行评论。

此外还有一个值得提出的问题:本研究中的实验自变量为拐点位置,我们还需要以拐点位置的高低以及终点音高的高低为自变量对这个问题进行进一步的讨论。

4.3 结论

本文通过四种降升调连续统讨论了普通话母语者对阳平和上声的感知类型问题。实验结果表明,降升调下降段的降幅和上升段的升幅对于辨认阳平和上声的范畴化程度有显著作用,只有在降幅或者升幅都达到一定程度且升幅也不过大的条件下,阳平和上声的辨认才出现明显的范畴化特点,而且在降幅和升幅都位于比较合适的区间时,在区分曲线上才能看到一定的范畴化倾向。以上结果说明,对于具有较复杂的曲拱特征的声调来说,实验刺激的设计会对实验结果产生重要影响,声调感知的类型需要在多种设计条件之下进行观察才能确认。

本文未能在四个连续统的区分结果中看到典型的范畴化特点,两个辨认范畴化程度较高的连续统的辨认结果与区分结果都没有显著相关,因此我们难以对普通话阳平和上声的知觉类型给出最终的判断。在区分实验的结果中我们发现了刺激排序的显著效应,我们认为这可能是记忆中的音高衰退效应和普通话韵律单元中的音高变化规则以及连读变调规则共同作用的结果,此外,被试在区分任务中使用的策略也可能对实验结果产生影响。基于本文的结果,我们认为调形相似但音高变化函数不同的声调的区分情况可能介于调形完全相同或完全不同的声调的区分情况之间,即,在辨认函数中可能出现较强的范畴化结果,而在区分函数中范畴化程度不高。普通话的阳平和上声是否存在区分上的范畴边界,还需要通过观察更多的自变量、改进区分任务或者使用脑电技术来进一步考察。

Abramson,Arthur S.1979.The Noncategorical perception of tone categories in Thai.Frontiersof Speech Communication Research,ed.by Bjorn Lindblom,Sven E.G.Öhman&Gunnar Fant,127-134.London:Academic Press.

Francis,Alexander L.,Valter Ciocca,&Brenda K.Chit NG.2003a.On the(non)categorical perception of lexical tones.Perception&Psychophysics 65(7):1029-1044.

Francis,Alexander L.,&Valter Ciocca.2003b,Stimulus presentation order and the perception of lexical tones in Cantonese.Journal of Acoustical Society of America 114(3):1617-1627.

Gandour,Jackson T.1978.The perception of tone.Tone,a Linguistic Survey,ed.by Victoria A.Fromkin,41-76. New York:Academic Press.

Gao,Yunfeng(高云峰).2004.Shengdiao Ganzhi Yanjiu声调感知研究[AStudy on Tone Perception].Shanghai Shifan Daxue Boshi Xuewei Lunwen上海师范大学博士学位论文[Ph.D.dissertation,Shanghai Normal University].

Gerrits,Ellen,&Bert Schouten.2004.Categorical perception depends on the discrimination task.Perception&Psychophysics 66(3):363-376.

Hallé,Pierre A.,Yue-Chin Chang,and Catherine T.Best.2004.Identification and discrimination of Mandarin Chinese tones by Mandarin Chinese vs.French listeners.Journal of Phonetics 32:395-421.

Jin,Jian(金健).2010.Guangzhou fangyan he donghai fangyan pingdiao de ganzhi yanjiu广州方言和东海方言平调的感知研究[A perception research of level tone patterns on Cantonese and Donghai dialect].Fangyan方言[Dialect] 2010.2:145-155.

Jin,Jian(金健),&Qisheng Shi(施其生).2010.Shantou Gurao fangyan duoge jiangdiao de shengxue fenxi he ganzhiyanjiu汕头谷饶方言多个降调的声学分析和感知研究[An acoustic analysis and perception research on the falling tones in the Shantou Gurao dialect].Zhongguo Yunwen中国语文[Studiesof the Chinese Language]2010.6:544-556.

Kiriloff,C.1969.On the auditory perception of tones in Mandarin.Phonetica 20:63-167.

Liberman,Alvin M.,Katherine S.Harris,Howard S.Hoffman,&Belver C.Griffith.1957.The Discrimination of speech sounds within and across phoneme boundaries.Journal of Experimental Psychology 54:358-68.

Ling,Feng(凌锋),&Lijia Wang(王理嘉).2003.Putonghua shangsheng shenceng xingshi he biaoceng xingshi普通话上声深层形式和表层形式[The underlying and surface forms of tone3 in Mandarin].Diliujie Quanguo Xiandai Yuyinxue Xueshu Huiyi Lunwenji第六届全国现代语音学学术会议论文集[The Proceedings of the 6th Phonetics Conference of China],413-416.Tianjin:Tianjin Daxue Chubanshe天津:天津大学出版社[Tianjin:Tianjin University Press].

Liu,Juan.2004.Perceiving the boundary between the lexical rising tone and the falling-rising tone.Joy of Research:a Festschrift in Honor of Professor William S-Y.Wang on His Seventieth Birthday,ed.by Feng Shi&Zhongwei Shen,222-233.Tianjin:Nankai Daxue Chubanshe天津:南开大学出版社[Tianjin:Nankai University Press].

Peng,Gang.,Hong-Ying Zheng,Tao Gong,Ruo-Xiao Yang,Jiang-Ping Kong,&William S-Y.Wang.2010.The Influence of language experience on categorical perception of pitch contours.Journal of Phonetics 38:616-624.

Rong,Rong(荣蓉),&Feng Shi(石锋).2013.Yingao he shichang dui putonghua yinping he shangsheng de tinggan yingxiang音高和时长对普通话阴平和上声的听感影响[Perception of the boundary between Mandarin Tone 1 and Tone 3:Effects of pitch and duration].Yuyan Kexue语言科学[Linguistic Sciences]2013.1:17-26.

Schouten,Bert,Ellen Gerrits,&Arjan van Hessen.2003.The end of categorical perception as we know it.Speech Communication 41:71-80.

Shen,Jiong(沈炯).1985.Beijinghua shengdiao de yinyu he yudiao北京话声调的音域和语调[Pitch range of tones and the intonation in Beijing Mandarin].Beijing Yuyin Shiyanlu北京语音实验录[Experimental Studies on speech sounds in Beijing Mandarin],ed.by Tao Lin,Lijia Wang et al.,73-125.Beijing:Beijing Daxue Chubanshe北京:北京大学出版社[Beijing:Peking University Press].

Shen,Susan X.,&Maocan Lin.1991.A Perceptual study of Mandarin tone2 and tone3.Language and Speech 34(2): 145-156.

Shi,Feng(石锋),&Ping Wang(王萍).2006.Beijinghua danziyin shengdiao de tongji fenxi北京话单字音声调的统计分析[A statistical study of the tones in Beijing Mandarin].Zhongguo Yuwen中国语文[Studies of the Chinese Language]2006.1:33-40.

Wang,William.S-Y.1976.Language change.Annalsof N.Y.Academy of Science 280:61-72.

Wang,William S-Y.,&Kong-Pu Li.1967.Tone 3 in Pekinese.Journal of Speech and Hearing Research 10:629-636.

Wang,Yunjia(王韫佳),&Meijing Li(李美京).2010.Diaoxing he diaojie dui yangping he shangsheng zhijue de zuoyong调型和调阶对阳平和上声知觉的作用[The effects of tone pattern and register in perceptions of Tone 2 and Tone 3 in Mandarin].Xinli Xuebao心理学报[Acta Psychologica]2010.9:899-908.

Wu,Zongji(吴宗济),&Maocan Lin(林茂灿).1989.Shiyan Yuyinxue Gaiyao实验语音学概要[An Introduction to Experimental Phonetics].Beijing:Gaodeng Jiaoyu Chubanshe北京:高等教育出版社[Beijing:Higher Education Press].

Xi,Jie,Linjun Zhang,Hua Shu,Yang Zhang,&Ping Li.2010.Categorical perception of lexical tones in Chinese revealed by mismatch negativity.Neuroscience 170,223-231.

Xu,Yisheng,Jackson T.Gandour,&Alexander L.Francis.2006.Effects of language experience and stimulus complexity on the categorical perception of pitch direction.Journal of Acoustical Society of America 120(2):1063-1074.

Zhang,Linjun(张林军).2010a.Riben liuxuesheng hanyu shengdiao de fanchouhua zhijue日本留学生汉语声调的范畴化知觉[Categorical perception of Chinese tones by Japanese students learning Chinese as a foreign language]. Yuyan Jiaoxue yu Yanjiu语言教学与研究[Language Teaching and Linguistic Studies]2010.3:9-15.

Zhang,Linjun(张林军).2010b.Muyu jingyan dui liuxuesheng hanyu shengdiao fanchouhua zhijue de yingxiang母语经验对留学生汉语声调范畴化知觉的影响[On the influences of native language on the categorical perception of Chinese tones].Huawen Jiaoxue Yu Yanjiu华文教学与研究[TCSOL Studies]2010.2:15-20.

Zheng,Hongying,Gang Peng,Peter W-M.Tsang,&William S-Y.Wang.2006.Perception of Cantonese level tones influenced by context position.The Proceedings of Speech Prosody 2006.Dresden:Germany.

王韫佳,1968年生,江苏海安人。博士,北京大学中文系教授,研究方向为语音学。

覃夕航,1987年生,湖南人。硕士,湖南省人民政府外事侨务办公室。

The Identification and Discrimination of Tone2 and Tone3 in Mandarin:The Influence of Experimental Design on Categorical Perception of Tones

Wang Yunjia1Qin Xihang2

1Department of Chinese Language and Literature,Peking University,Beijing 100871
2Foreign and Overseas Chinese Affairs Office of the People’s Government of Hunan Province,Changsha,Hunan 410011

This paper aims to investigate two questions by categorical-perception experiments. The first question is if identification and discrimination of Tone2 and Tone3 are all categorical,and the second is how stimuli design and experimental task influences perceptual results.The stimuli consist of four continuums of falling-rising tones with different falling magnitudes and different ending pitches,and the independent variable is the pitch turning position on a falling-rising pitch curve.The results demonstrate two facts:1)Identification of Tone2 and Tone3 is categorical under the condition of small falling magnitude and high ending pitch,or large falling magnitude and low ending pitch;2) The results of discrimination in the two experiments are all unrelated to those of identification,and the discrimination is slightly categorical or non-categorical when the corresponding identification is strongly categorical.We hold that pitch decay in memory,allophones of Tone2 and Tone3 in continuous speech,and response bias of subjects in discrimination tasks probably have effects on discrimination results.We hypothesize that the perceptual pattern of two tones that have similar but not totally identical contours is between typically categorical and non-categorical.

categorical perception;Tone2;Tone3;discrimination;identification

H014

1671-9484(2015)04-0337-16

2014年5月24日 [定稿日期]2015年4月6日

10.7509/j.linsci.201504.029558

*本研究得到国家社科基金项目(11YB047)和教育部人文社科研究项目(09YJA40006)的资助。感谢《语言科学》编辑部及匿名审稿人提出的意见。

普通话单字调阳平和上声的辨认及区分*——兼论实验设计对声调范畴感知结果的影响

1 引言

2 实验I

3 实验II

4 一般性讨论和结论

普通话单字调阳平和上声的辨认及区分*
——兼论实验设计对声调范畴感知结果的影响