第二语言学习者汉语声调范畴浮现的模拟研究

2012-10-15 01:51陈默
中文信息学报 2012年1期
关键词:阴平阳平零起点

陈默

(北京语言大学 汉语进修学院,北京100083)

1 引言

由于很多汉语声调偏误的形成主要是因为第二语言学习者没有形成较好的声调范畴,不能区分不同调类之间的差异,从而形成了各种各样的“洋调”。对于无声调语言母语者而言,汉语声调范畴的建立是一个从无到有的过程,是习得的难点和重点,所以对汉语声调范畴浮现的研究是十分重要的。笔者发现,目前汉语声调范畴的研究主要是横向的感知研究[1-3],对声调范畴认知发展过程的研究很少,对声调范畴习得机制的探讨也很少。

声调范畴的实验研究存在着一定的局限性,不能综合考察语音特征之间的相互作用,不能观测到多层面因素特征相互作用随时间变化的特性等。所以目前的实验研究还不能全面地分析声调范畴是如何在多层面特征的相互作用下浮现而出的,这也是对声调范畴习得机制了解不够深入的主要原因。因为不同的特征(声调特征、母语音段特征、二语音段特征以及外部环境特征等)在声调范畴浮现的过程中起着不同的作用,所以我们应该把这些声调特征融合在一起,来探讨声调范畴的浮现。

因为声调范畴的浮现涉及声调特征相互作用的过程。笔者在模型中加入的声调的主要声学特征有:(1)调值,也就是基频高度;(2)调形,即基频曲线;(3)调长,即声调时长;(4)调域,即高音点音高与低音点音高的距离。另外,模型涉及母语语音特征和汉语语音特征,这样做的优势一是可以动态地研究各因素相互作用的过程,二是可以直观地观测不同层面的特征相互作用的结果。

神经网络方法在汉语汉字和语音识别的研究中已经得到广泛的应用[4-6],但是由于语言习得的动态性,常规的神经网络难以直接使用。本文利用生长型树形结构自组织特征映射神经网络(GTSSOFM)来模拟英语母语者汉语声调范畴的浮现过程。通过建立零起点、初级和中级三个子模型,来考察三个子模型的声调特征的聚类过程、三个子模型不同类声调之间的距离以及三个子模型声调混淆的数量和类型。综合这三个方面对三个子模型声调范畴的浮现进行研究,是为了跟行为实验研究[7]进行比较,以更深入地发掘汉语声调范畴的习得机制。

模拟研究跟行为实验研究[7]的不同点在于,行为实验研究是利用实验语音学的方法来分析被试的物理声学特征,通过语音软件来提取语音参数,用多因素方差分析来考察特征之间的关系。模拟研究是通过计算机模型的构建来实现声调范畴学习的。从提取的声调特征来看,行为实验只考察了调值特征,而模拟研究综合考察调值、调形、调域和调长四类特征,可以更好地观察声调特征之间的相互作用以及声调特征和外部因素(知识的变化和语言水平的变化)相互作用的结果。从研究对象来看,行为实验由于受实验条件的限制,采取的是横向研究方法,而且被试分属于不同的无声调语言国家,存在着一定的个人差异。而模拟研究更类似于纵向研究,选择的是一种母语背景,可以保证被试的同质性。所以,我们可以通过计算机模拟的方法来验证行为实验的结果,同时也能提供行为实验观察不到的结果。

2 声调范畴浮现模型的建立

2.1 算法实现

本研究采用笔者建立的动态生长型树形结构自组织映射模型(GTS-SOFM),具体实现上主要包括以下几个关键考虑:1)动态的神经元添加策略以及合理的神经元排列方式设计;2)起始神经元权重初始化以及优胜邻域的设计;3)自组织树在生长阶段中的获胜神经元搜索方法;4)有效的学习函数以及加入弱近邻抑制效应的参数调整方式;5)神经元生长阈值随着网络的扩大而动态增加,控制网络的规模和稳定性;6)网络趋于稳定时合理的收敛条件的设置和判断。跟以往的动态自组织模型相比较[8-10],GTS-SOFM既克服了Kohonen自组织特征映射网络的固定网络结构的限制以及容量的有限性,又克服了上述几个类似动态网络的较弱的拓扑映射特性,从而方便用于语言认知习得的研究,既具有良好的拓扑映射特性,又保证了神经元的动态生成能力。

2.2 表征

由于本研究模拟的是英语母语者汉语声调范畴的浮现,所以要建立一个双语模型。英语作为基础模型,在此基础上建立零起点、初级和中级三个子模型。英语表征借鉴Li和MacWhinney的PatPho表征方案[11],主要从发音方法和发音部位来表征元音和辅音。汉语语音表征是在Zhao和Li的汉语音素表征[12]的基础上加入了汉语声调的表征,汉语声调的表征参考了前人的诸多研究成果[13],抽取出汉语声调的最主要特征(表1):1)调值。阴平和去声为高,阳平和上声为非高;2)调形。分成平、升、降升和降四类;3)调域。四类声调根据高音点和低音点的距离,阴平为窄,阳平、上声和去声为宽;4)调长。阴平、阳平和上声为长,去声为短。对声调特征进行定义后,根据声调特征之间的差异程度,对声调特征进行赋值(表2)。

表1 汉语语音表征

表2 汉语语音的数值表征

2.3 训练样本

结合《英语常用词词典》[14]和《牛津英汉双解小词典》[15]选出1 000个英语常用词,其中单音节词535个,双音节词465个,其中重音在前的双音节词282个,重音在后的双音节词183个。这1 000个词涵盖了英语所有的发音模式(图1),从而建立英语基础模型。

选择《汉语教程》[16]作为训练样本,建立三个汉语水平的模型。零起点学习者相当于学习了《汉语教程》半个月左右,初级学习者(初级上)相当于学习了《汉语教程》半年左右,中级学习者(中级上)相当于学习了《汉语教程》1年左右。训练样本的选取遵循两个原则:一是保证样本的累积效应,即在零起点学习过的样本同样还会在初级和中级出现,初级的样本会在中级出现;二是保证所选择的样本能代表实际整体样本的频次分布。

图1 英语训练样本在输出层的映射图

2.4 训练和测试

对三个子模型分别进行训练。训练前,模型接受前测。因为要和行为实验结果[7]进行比较,所以用行为实验的测试音节表(见附件1)对三个子模型进行前测。每类声调30个音节,一共120个音节,即每个子模型都要接受120个音节的前测。前测结束,开始进行训练。训练样本的选择采取从高频到低频样本的等间隔选取法,零起点子模型的100个训练样本是从939个样本中频次≥20的664个样本中选取出来的。初级子模型总共选取了200个训练样本。其中100个和零起点子模型的完全一致,另外100个是从频次≥8的798个样本中选取出来的。中级子模型总共选取了400个训练样本。其中200个和初级子模型的样本完全一致(其中包含了100个零起点的样本),另外200个是从所有939个样本中等间隔选取出来的。三个子模型训练结束,进行后测。后测文本和行为实验后测文本[7]一样(见附件2),后测是对三个子模型分别用120个音节测试表进行测试,然后和前测结果进行比较。

3 模拟结果和分析

对三个子模型声调范畴发展的研究,是通过三方面的考察进行的。一是三个子模型的声调范畴图比较;二是三个子模型在输出层上不同类声调之间距离的比较;三是三个子模型声调混淆数量和类型的比较。综合这三个方面对三个子模型声调范畴的浮现过程进行研究。

3.1 三个子模型的声调范畴图比较

为了更好地看出声调范畴的发展,对三个子模型输出层进行部分截图。如图2、3和4(数字1、2、3和4分别表示阴平、阳平、上声和去声)。

图2 零起点子模型声调范畴部分截图

图3 初级子模型声调范畴部分截图

根据四类声调的聚类情况,笔者在图2、3和4上画出相应的范畴,从而可以直观地看出三个子模型的声调范畴的动态发展情况。据图示,零起点子模型的四类声调还没有形成范畴,四类声调的混淆情况很多,阴平和阳平相混,阴平和去声相混,阳平和上声相混,阳平和去声相混。初级子模型去声和阴平的聚类最好,上声次之,阳平最差,可以说初级子模型已经开始形成了一定的声调范畴。但仍然还有声调相混的情况。例如,阳平和上声相混的很多,另外有很少量的阴平和去声相混以及阴平和阳平相混。中级子模型声调范畴继续发展,去声的聚类最好,其次是阴平,阳平和上声最不好。据图来看,可以说中级子模型的声调范畴好于初级子模型,初级子模型的声调范畴好于零起点子模型。

图4 中级子模型声调范畴部分截图

3.2 三个子模型的声调距离比较

通过对输出层上不同类声调距离的计算,可以对声调范畴的发展状况进行量化。衡量的标准是距离越长,不同类声调之间的区分越清楚,声调范畴发展得越好。通过对两类声调所有样本之间激活神经元距离的计算,笔者对三个子模型六对声调之间的距离(即阴平和阳平、阴平和上声、阴平和去声、阳平和上声、阳平和去声以及上声和去声这六对声调)进行了统计。如表3和图5所示。

表3 声调距离平均值

图5 三个子模型声调距离的比较

非参数检验结果(Man-Whitney test)显示,零起点和初级子模型的声调距离差异显著(p=.004),初级子模型的声调距离明显高于零起点子模型。零起点和中级子模型的声调距离差异显著(p=.004),中级子模型的声调距离明显高于零起点子模型。初级和中级子模型的声调距离差异不显著(p=1.000),初级和中级子模型之间的声调距离没有明显差异。以上结果表明初级和中级子模型的声调范畴发展得比零起点好。

3.3 三个子模型声调混淆数量和混淆类型的比较

通过统计声调的混淆数量和混淆类型,可以清晰地看出声调范畴混淆的具体情况。混淆的数量和类型越少,说明声调范畴发展得越好;反之,则声调范畴发展得不好。图6是对零起点、初级和中级三个子模型声调混淆数量的统计,从中可以看出声调混淆数量的变化过程。

图6 三个子模型声调混淆数量的比较

非参数检验结果显示,零起点和初级子模型的声调混淆数量差异显著(p=.000),初级子模型声调混淆数量明显比零起点子模型的少。零起点和中级子模型的声调混淆数量差异显著(p=.000),中级子模型声调混淆数量明显比零起点子模型的少。初级和中级子模型的声调混淆数量差异不显著(p=1.000)。从模拟结果可以看出,初级和中级子模型的声调范畴发展得比零起点子模型好。

为了更好地考察混淆类型的发展变化,笔者又对不同混淆类型的数量进行了统计,统计结果见表4。

表4 三个子模型六对声调混淆类型的数量

把三个子模型的声调混淆类型做成图7,可以更好地看出变化趋势,如图7所示(数字1、2、3和4分别表示阴平、阳平、上声和去声四类声调)。

根据表4和图7可以看出,零起点子模型有四对声调混淆,分别是阴平和阳平、阴平和上声、阴平和去声以及阳平和上声。其中阳平和上声的混淆最多,其次是阴平和去声。阴平和阳平以及阴平和上声的混淆比较少。初中级子模型有三对声调混淆,分别是阴平和阳平、阴平和去声以及阳平和上声。其中阳平和上声的混淆数量最多,阴平和去声以及阴平和阳平的混淆数量较少。初级和中级子模型的声调混淆类型明显少于零起点子模型,这也说明初级和中级子模型的声调范畴发展得比零起点子模型好。另外,阳平和上声的混淆数量在三个子模型里都是最多的,而且初级、中级子模型跟零起点子模型相比,阳平和上声混淆数量的减少并不明显。

图7 三个子模型的混淆类型数量的比较

4 讨论

从三个子模型的声调范畴图、声调距离以及声调混淆数量和类型的比较结果看出,初级和中级声调范畴的发展明显好于零起点,阴平和去声的混淆以及阳平和上声的混淆是最主要的混淆类型,阴平和去声的聚类程度好于阳平和上声。模拟结果和行为实验结果[7]总体上是吻合的,由此可以得出以下结论。

(1)英语母语者汉语声调范畴的发展是一个从无到有的渐进过程。初级和中级子模型声调范畴的发展明显比零起点子模型好,中级子模型虽然从声调距离、声调混淆数量以及类型的比较上跟初级子模型相比无显著差异,但是从声调范畴图(图3和图4)的比较来看,中级声调范畴的发展明显好于初级子模型。可以说零起点子模型是声调范畴的萌芽期,初级子模型是声调范畴的初始形成期,中级子模型是声调范畴发展的稳定期。另外,第二语言学习者不同调类声调的聚类程度不一样。例如,三个子模型都是去声和阴平的聚类程度好于阳平和上声。这说明阳平和上声的声调范畴较难建立。由于阳平和上声在调值特征和调形特征上都存在着共性,例如,调值上的低调性质、调形上的拐点特征以及后半部的升调性质,这些因素共同制约着阳平和上声声调范畴的发展,无声调语言母语者在发出汉语声调时,需要同时利用这些语音特征,但是注意资源的有限使得阳平和上声的区分难度大大增加。

(2)第二语言学习者的汉语声调系统是一个复杂适应性系统,自组织机制是支配第二语言学习者汉语声调浮现的主要机制。汉语声调范畴的浮现基于汉语声调特征的自组织,声调特征的发展决定了声调的发展。无声调语言母语者首先对声调特征进行提取,然后进行特征比较,对不同的声调特征赋予不同的权重,把具有共性的特征进行聚类,然后形成声调范畴。其实,声调范畴的混淆也体现出了“共性特征的聚类”。例如,阴平和去声都属于高调,阳平和上声都属于非高调,所以这种调值上的相似点,使学习者把阴平和去声调值聚在一起,把阳平和上声的调值聚类在一起。阳平和上声都有拐点,这种调形上的相似点也会使学习者把阳平和上声聚类在一起。声调特征自组织的过程也要受到母语语音特征和汉语音段特征的影响。也就是说声调特征之间存在着相互作用,声调特征和母语语音特征以及汉语音段特征之间也存在着相互作用。模拟研究建立的双语模型正好可以直观地展现出不同特征之间相互作用、自组织的动态过程,这是行为实验无法做到的。

(3)外部因素对声调范畴浮现的结果具有重要影响。这里的外部因素指的是语言知识的增加和难度的提高,也就是模拟研究中的训练样本的变化。训练样本的选取遵循两个原则:一是保证样本的累积效应,即在零起点学习过的样本同样还会在初级和中级出现,初级的样本会在中级出现;二是保证所选择的样本能代表实际整体样本的频次分布,即所挑选的样本能比较真实地模拟实际学习中的样本情况。原则一体现了知识的增加和累积,原则二体现了知识难度的提高。语言知识的累积对汉语声调范畴的发展有两种影响。一是知识累积促进了声调范畴的发展。第二语言学习者随着语音知识的增加,不断调整声调特征的权重,使汉语声调范畴的发展不断进步。二是知识的累积和知识难度的增加造成了声调范畴浮现中的种种变异现象。例如,声调距离的比较结果显示出中级子模型略微有些退步,这就体现了浮现过程中时常发生的“倒退”现象。

虽然模拟研究基本上验证了行为实验[7]的结果,但是还存在着一些差别。例如,行为实验中的初中级被试不能区分两对声调范畴,模拟研究中的初中级子模型不能区分三对声调范畴。从混淆类型来看,对于零起点阶段来说,行为实验中的被试能区分阴平和阳平以及阴平和上声之间的声调范畴,而模型能区分阳平和去声以及上声和去声。对于初中级阶段来说,行为实验被试不能区分阴平和去声以及阳平和上声,模型不能区分阴平和阳平、阴平和去声以及阳平和上声。笔者认为存在差异的原因主要是因为,行为实验被试来自于三个无声调语言国家(英语、西班牙语和德语),模拟则只研究了英语。行为实验提取的是调值特征,而模拟提取了调值、调形、调域和调长四项特征。语言背景跟特征提取的差异,会使模拟和行为实验的结果存在一些不同之处。但是由于模拟研究较好地保证了被试的同质性,并且能够直观地考察不同因素间动态的相互作用过程,可以说模拟研究具有较强的可信度和解释力。

5 小结

本研究对英语母语者汉语声调范畴浮现过程的模拟研究,动态地表现出声调范畴在自组织机制的支配下是如何逐渐浮现的。声调范畴模拟研究的理论假设是:声调范畴的获得是基于声调特征的自组织过程,声调范畴的浮现过程是学习者对声调特征聚类的过程。同时,也是母语语音特征和二语语音特征之间以及内部语音特征和外部环境因素特征(时间的变化、知识量的增加以及知识难度的提高等)相互作用的过程。模拟结果和行为实验结果的吻合,证明了笔者的理论假设,说明声调特征的自组织机制就是声调范畴发展的内在机制。

声调范畴浮现的模拟研究也可以为声调教学提出一些有益的建议。学习者在开始学习汉语声调时,对声调范畴没有概念,教师可以多设计一些声调听辨和感知的练习,让学习者了解六对声调之间的差异所在。在初、中级阶段重点让学习者练习阳平和上声以及阴平和去声的差异。并且要把这些声调放在多音节短语或者语流中,对学习者进行范畴感知和产出的练习。尤其对于无声调语言母语者来说,声调范畴的感知和产出训练可以使他们对声调间的差异逐渐敏感,促使声调范畴浮现。

虽然模拟研究能够动态地展现不同特征之间相互作用的结果,但是未能明确地表现出母语语音特征和汉语音段特征对声调范畴发展的影响的具体程度,所以笔者会继续改进GTS-SOFM模型,同时设计新的行为实验,将母语语音特征(英语语调或者重音模式)和汉语音段特征(音节)作为两个因素进行考察。另外,无声调语言母语者声调范畴的建立是一个从无到有的过程,也是一个从低层次到高层次的发展过程。声调语言母语者(如泰语母语者)汉语声调范畴的浮现跟无声调语言母语者不一样,汉语声调的浮现是一个相似范畴的建立过程。如果我们能够建立一个声调语言母语者汉语声调范畴浮现的模型,可以更好地解释汉语声调范畴的习得机制问题以及母语对声调范畴浮现的影响。下一步笔者会利用GTS-SOFM模型对声调语言母语者声调范畴的浮现进行研究。

附录A

表A1 前测音节之一

续表

表A2 前测音节之二

[1]Leather,J.F0pattern inference in the perceptual acquisition of second language tone[M]//A.James and J.Leather(eds.),Sound patterns in Second Language Acquisition.Dordrecht:Foris Publications,1987:59-81.

[2]Stagray,J.R.,and Downs,D.1996.Differential sensitivity for frequency among speakers of a tone and nontone language[J].Journal of Chinese Linguistics,1993,21,143-163.

[3]HalléP.Y-CH.,Chang.C.Best.Identification and discrimination of Mandarin Chinese VS.French listeners[J].Journal of phonetics,2003.

[4]陈学德,陈玲,曾碚凯,等.一个基于神经网络的手写文字分类/识别模型[J].中文信息学报,1993,7(3):16-25.

[5]张德喜,马少平,朱绍文,等.基于统计与神经元方法相结合的手写体相似字识别[J].中文信息学报,1999,13(3):33-39.

[6]顾明亮,沈兆勇.基于语音配列的汉语方言自动辨识[J],中文信息学报,2006,5:77-82.

[7]陈默.无声调语言母语者汉语声调浮现过程的实验和模拟研究[D].北京语言大学博士论文,2009.

[8]Alahakoon D,Halgamuge S K,Srinivasan B.Dynamic self-organizing maps with controlled growth for knowledge discovery[J].IEEE Trans.on Neural Networks,2000,11(3):601-604

[9]王莉,王正欧.TGSOFM:一种用于数据聚类的动态自组织映射神经网络[J].电子与信息学报,2003,25(3):313-319.

[10]陶骏,洪国辉.基于生长的自组织映射的数据挖掘[J].计算机应用,2005,25(2):309-311.

[11]Li,P.,MacWhinney,B.PatPho:A phonological pattern generator for neural networks[J].Behavior Research Methods,Instruments,and Computers,2002,34:408-415.

[12]Zhao X,Li P.An online database of phonological representation for Mandarin Chinese monosyllables[J],Behavior Research Methods.2009,41(2):575-583.

[13]吴宗济,林茂灿.实验语音学概要[M].高等教育出版社,1989.

[14]方庭钰等.英语常用词词典[M].外语教学与研究出版社,1991.

[15]牛津英汉双解小词典(第9版)[M].英国牛津大学出版社.外语教学与研究出版社,2008.

[16]杨寄洲.《汉语教程》系列教材[M].北京语言大学出版社,2003.

猜你喜欢
阴平阳平零起点
偷渡阴平
太谷方言阴平阳平教学初探
孟家拉国留学生汉语单字调声学实验分析
云南蒙自方言的连续变调
小学一年级实现“零起点”教学意义重大
山东、福建严格实施“零起点”教学
浅谈零基础留学生的汉字教学
养子