钟毅平,雷 潇,屈卫国
(湖南师范大学 教育科学学院,湖南 长沙 410081)
熟悉性对中文成语理解的影响:事件相关电位研究
钟毅平,雷 潇,屈卫国
(湖南师范大学 教育科学学院,湖南 长沙 410081)
中文成语是惯用语的一种重要形式,采用中文四字成语作为实验材料,以事件相关电位为实验手段,通过N400和P600两种成分考察中文成语的认知理解过程。操纵两个因素,即熟悉程度(熟悉与不熟悉)和词语类型(成语、短语),要求被试对词语进行正误判断。结果提示,与四字短语相比,四字成语在大脑的理解加工存在区别。实验结果支持中文成语加工的构造模型。
中文成语;构造模型;分级显性意义模型
中文成语,是指中文语言词汇的定型的词组或短句,它有固定的结构形式和固定的说法,表示一定的意义,在语句中总是作为一个整体来应用。它有3个基本特征:习用性(Idiomaticity),语义整体性(semantic unity)和结构稳定性(structural stability)。它是一种非直义的语言,个体一般按它的比喻义来理解。四字成语是中文成语的常见形式。
目前,西方关于惯用语(Idiom,中文中的成语、谚语、歇后语都属于惯用语的范畴)的理解主要有两类认知加工模型,即构造模型和分级显性意义模型。Cacciari和Tabossi(1988)首先提出构造模型(Configurational model)。该模型假设个人记忆中词语的结构分为惯用和非惯用的。当大脑有足够的线索认知该结构时,这些结构的直义意义通常被激活。但是,当大脑认为该结构不固定且会随表达的不同而改变时,就由“idiomatic key”来辨别它们,这个“key”取决于该惯用语表达的可预测性以及语境的影响。
Titone和Connine(1994)扩展了该模型,认为有4个因素影响了惯用语的处理:熟悉度(Familiarity),预测度(predictability),直义度(Literality),及分解度(Compositionality)。熟悉度是指它出现的频率,熟悉度高的惯用语则是指它会经常使用;反之亦然。预测度是指一个惯用语能被个体迅速认知的可能性,一般是指呈现前半部分后是否能快速想到后半部分的可能性。直义度是指该惯用语能按它组成词语的意思来理解的程度,有些惯用语字面意思和它的比喻义接近,则直义度高,易于理解;反之亦然。分解度是指构成惯用语的每个字词的意思对惯用语整体比喻义的贡献。
由此可见,构造模型认为直义和非直义语言的加工有不同之处,对惯用语这种非直义语言来说有很多因素限制了对它的理解,如熟悉度,语境(上下文)等因素。Qualls(2003)调查青少年,特别是乡下的青少年在惯用语学习上的情况。该研究试图了解什么因素影响了青少年的惯用语理解能力,包括语境的影响,熟悉程度和基本词语理解能力等。结果表明,语境和熟悉度都会影响理解惯用语的准确性。语境对乡下的青少年来说可以促进他们对惯用语的理解。因此,阅读能力强的人惯用语理解能力强,可能源于他们通过阅读获得丰富的词汇量。Cacciari(2006)等人研究了失语症病人对单字惯用语的理解。被试的任务是在4个选项之中选择关于惯用语的正确解释:其中一个与比喻义有关,一个与直义有关,还有两个无关的意思。结果表明,判断能力受到损害(特别是额叶和/或颞叶受到损害)的病人,他们更多地选择了与直义有关的错误选项。研究者认为这可能暗示病人成语的认知/激活的禁止机制受到损害。
然而,Giora(1997)则提出了一种新的惯用语理解的观点,即分级显性意义假说(the Graded Salience Hypothesis GSH),该理论用显性-非显性来代替直义和比喻义的区别,显性程度是指语意(字、词、句3个水平)在心理词汇层面进行的编码。影响词语意义显性程度的因素有熟悉性、出现频率、典型性、习俗性等4个因素,与直义和非直义无关。对语言材料进行加工时,遵循显性语义优先加工原则,不论情境是否一致,优先加工该词的显性语义。直义句与非直义句均体现这种优先性。该理论假设了一种从下而上的词汇存储机制,认为编码信息只与熟悉性、出现频率、典型性、习俗性等4个因素相关而不取决于语境的影响,对一个词语来说首先激活的是它的显性意义,不管是直义还是非直义语言。
按照分级显性意义假说,熟悉的非直义语言,它的比喻义(该词的显性意义)能很快被大脑认知加工,而它的字面义反而难以激活。不熟悉的非直义语言,它的字面义是该词的显性意义,因此先被激活,然后再激活它的比喻义。熟悉的惯用语在倾向于直义(该词的非显性意义)的语境中比在倾向于比喻义(该词的显性意义)的语境中阅读时间要长,不熟悉的惯用语在倾向于比喻义(该词的非显性意义)的语境中比在倾向于直义(该词的显性意义)的语境中阅读时间要长。Tabossi(2009)等人发现,惯用语的句法和语用原则并不是特质的,而与直义语言相同。
这两种模型的主要区别在于分级显性意义模型否认直义和非直义语言加工的理论和结构,认为两者之间并无区别,可以用意义的显性程度来考察。两类模型都有相应的实验证据支持,包括对精神病患者、抑郁症、失语症以及老年痴呆病人的研究(Cacciari et al.,2006;Iakimova et al.,2006;Papagno&Caporali,2007;Martina,Giuliano,Daniela,Stefano,2008)。然而,综观其研究方法,都是采用阅读时间的测量等传统方法(Cacciari,2007;Cain,Oakhill&Lemmon,2005;Levorato,Nesi&Cacciari,2004;Levorato et al.,2007)。这种阅读时间的测量方法无疑受到其他因素的影响,因此方法的局限性影响了综合判断两种模型真假的价值。当前比较热门的事件相关电位技术可以避免阅读时间等测量方法的局限性,在做出表征、处理、神经活动之间的关系假设后,可以用来区分不同性质的处理机制。N400和P600是已经确定的与语言处理相关的ERP成分。N400是一个负波且峰值在400ms左右。Kutas和Hillyard(1984)指出在语义违反时会出现N400,然而,并不是只有语义违反才导致N400效应。一些研究指出N400会出现在一些语义正确但是自己没有预测到的词语上。此外,Kutas和Hillyard(1984)发现N400在词语补全时波峰会发生反转。
P600是一个句法(即按照造句规则)违反时出现的正波,一般在500ms左右出现且可以扩展到800ms。在词语的处理中,P600效应发生在:1)句法违反;2)不是首选的句法结构;3)一个复杂的句法结构中(Hagoort,2003;Kuperberg et al.,2003)。P600反应了许多句法处理过程中的困难,如句法分析、句法整合等(Kim and Osterhout,2005)。Van Herten等人(2005)提出一个假设,认为P600在句法违反时出现是因为观察到的和自己按文法预测的情况不匹配而导致的。这种情况就会触发P600效应。
Hahne和Friederici(2002)提出了一个基于ERP的脑电语言认知模型,认为在句子处理过程中有3个阶段,即100-300ms为初始的字词水平的句法处理,300-500 ms对词汇语义的理解,500-1 000ms对不同信息进行整合。可见N400处于第二阶段,P600处于第三阶段。由此可以看出,N400表示大脑对语义的理解,P600反映对句法的整合过程。在此基础上,Laurent等人(2006)通过事件相关电位考察法语惯用语的认知加工,结果支持显性度假说。Zhou(2004)用中文成语做材料,通过SPM(t)发现在3个阶段中在大脑许多区域有显著差异。在其研究中,发现120-150ms期间,ERHN可能反映初始的句法处理和视觉的字-形状错配的处理;在320-380ms的阶段(N400阶段)的负波可能是整合句法和语意的分析;在480-540ms的阶段(P600阶段)的正波可能反映对成语的再分析和整合单字意义获得成语的整体意义。
中文成语是如何进行认知加工的?是按照构造模型还是分级显性意义模型?通过N400和P600来考察中文成语的认知理解过程是一个比较好的选择。为此操纵两个因素,即熟悉程度(熟悉与不熟悉)和词语类型(成语、短语),让被试判断词语的对错来考察成语的认知加工。
按照分级显性意义模型推断,熟悉的成语和熟悉的直义4字短语在N400和P600上波幅和潜伏期没有显著区别(都是激活它们的显性意义),同样地,不熟悉的成语和不熟悉短语在N400和P600上波幅和潜伏期没有显著区别(都是激活它们的非显性意义)。以构造模型推断,熟悉的成语和熟悉的直义短语在N400和P600上波幅和潜伏期有显著区别(成语和短语分别属于非直义和直义语言,结构类型不同,大脑处理也不同),同样地,不熟悉的成语和不熟悉短语在N400和P600上波幅和潜伏期有显著区别。
某大学随机抽取大学生10人,母语为汉语,视力或矫正后视力正常。实验后给予被试一定报酬。
分别从《新华成语词典》(商务印书馆,2002)、《现代汉语词典》(商务印书馆,2005)中随机选出300个4字成语和300个4字短语,30名本科生对这600个词语通过七点量表,从熟悉性和词频两方面进行评价。经过统计分析,选取高熟悉度、高词频的四字成语和四字短语各80个,低熟悉度、低词频的四字成语和四字短语各80个,具体数据见表1。F检验表明,熟悉组和不熟悉组之间有显著差异。分别将这4组各80个词语的一半,即40个词语的最后一个字改动,如“大海捞针”变成“大海捞家”,“美丽大方”变成“美丽大心”。
表1 不同词语类型和熟悉度的七点量表比较(n=7)
被试安坐在屏幕前,离电脑屏幕80 cm。实验开始时,先呈现指导语,被试先进行练习实验,直到被试操作熟练再进入正式实验。练习实验和正式实验一样,但使用的词语和正式实验不同。被试的任务是判断屏幕中随机呈现的词语(共320个)其最后一个字是否正确。正确按反应盒上的“1”键,错误则按反应盒上的“4”键。实验流程如下:首先在屏幕中央呈现一个“+”,持续时间400 ms,然后在屏幕中央呈现目标刺激(1个四字成语或四字短语),持续时间为800 ms,黑屏400 ms,时间到则进入下一个trail,被试没有反应或者反应错误都不会有提示。整个实验有2个block,中间被试休息2 min,以缓解眼部疲劳。
使用Neuroscan公司生产的ESI-64导脑电记录分析系统和Ag/AgCl电极帽,连续记录每个trail的64个单极导联的EEG,电极位置采用10~20扩展电极系统。另有4个电极记录垂直眼电和水平眼电,参考电极置于左右乳突,接地点在FZ和FPZ连线中点。滤波带通为0.01~50 Hz,A/D采样频率为250 Hz,脑电采样增益为500,头皮电阻小于5 kΩ。
连续记录原始脑电,并离线叠加,截取每个刺激呈现前200 ms到后1 000 ms的脑电,并以刺激呈现前200 ms的脑电为基线,排除眼电伪迹。
根据头皮分布和电极之间的关系,选取代表性电极(CZ,FZ,PZ,C3,F3,P3,C4,F4,P4) 进行分析。为了分析 N400 和P600,根据前人研究及脑电图所示,确定分析时段为350~450 ms,550~650 ms。实验只分析被试反应正确且第四字为正确的词语的脑电,而被试反应正确但第四字为错误的词语的脑电暂不分析。用SPSS13.0分析N400和P600的峰值和潜伏期,采用四因素重复测量方差分析,包括词语类型(2水平:成语、短语),熟悉度水平(2水平:高、低),脑区(3水平:C 区、F区、P区)和电极位置(3水平:左、中、右,如 CZ、C3、C4)。采用Greenhouse-Geisser校正p值。
对N400的波幅和潜伏期进行四因素重复测量方差分析,包括词语类型(2水平:成语、短语),熟悉度水平(2水平:高、低),脑区(3水平:C区、F区、P区)和电极位置(3水平:左、中、右)。N400和P600的脑电比较如图1、图2所示。
N400的波幅如表2所示,词语类型的主效应不显著,F(1,9)=4.159,p>0.05;熟悉度水平的主效应不显著,F(1,9)=1.151,p>0.05;脑区的主效应边缘显著,F(2,8)=3.545,p=0.05,P区的波幅与其他两区相比有显著差异。电极位置的主效应不显著,F(2,8)=0.859,p>0.05。熟悉度水平和电极位置之间有显著交互作用,F(2,8)=5.922,p<0.05。简单效应的进一步分析发现,左侧电极的不同熟悉度水平差异最大。脑区和电极位置之间有显著交互作用,F(4,6)=6.135,p<0.05。简单效应的进一步分析发现,中间电极的脑区差异与左右两侧有显著不同。
N400的潜伏期如表3所示,词语类型的主效应不显著,F(1,9)=4.384,p>0.05;熟悉度水平主效应也不显著,F(1,9)=0.452,p>0.05;脑区的主效应显著,F(2,8)=5.146,p<0.05,P区的潜伏期大于其他两区潜伏期。电极位置的主效应不显著,F(2,8)=3.530,p>0.05。词语类型和熟悉度水平之间有显著交互作用,F(1,9)=10.743,p<0.05。简单效应的进一步分析发现,熟悉成语和熟悉短语潜伏期没有显著差异,而不熟悉短语潜伏期与不熟悉成语潜伏期有显著差异,不熟悉短语潜伏期晚于不熟悉成语潜伏期。词语类型、熟悉度水平和脑区之间有显著交互作用,F(2,8)=7.857,p<0.05。
表2 不同词语类型和熟悉度的N400波幅比较(uV)
图1 高熟悉度情况下成语(实线表示)和短语(虚线表示)之间的脑电比较,9个电极,刺激呈现后-200~1 000 ms的脑电情况
图2 低熟悉度情况下成语(实线表示)和短语(虚线表示)之间的脑电比较,9个电极,刺激呈现后-200~1 000 ms的脑电情况
同样,P600的波幅和潜伏期进行四因素重复测量方差分析,包括词语类型(2水平:成语、短语),熟悉度水平(2水平:高、低),脑区(3水平:C区、F区、P区)和电极位置(3水平:左、中、右)。
P600的波幅如表4所示,词语类型的主效应不显著,F(1,9)=1.013,p>0.05。熟悉度水平主效应也不显著,F(1,9)=0.185,p>0.05。脑区的主效应显著,F(2,8)=14.960,p=0.001<0.05,P区的波幅与其他两区相比有显著差异,要小于其他两区。电极位置的主效应显著,F(2,8)=8.319,p=0.012<0.05,中部电极与左右两处相比有显著差异,它的波幅最大。熟悉度水平和电极位置之间有显著交互作用,F(2,8)=13.434,p=0.002<0.05,简单效应的进一步分析发现,中部电极不同熟悉度水平之间波幅与其他两区相比有显著差异。脑区和电极位置之间有显著交互作用,F(4,6)=8.168,p=0.002<0.05。简单效应的进一步分析发现,中间电极的脑区之间波幅与左右两侧电极相比有显著差异。词语类型、脑区和电极位置之间有显著交互作用,F(2,8)=2.942,p=0.048<0.05。
P600的潜伏期如表5所示,词语类型的主效应不显著,F(1,9)=4.345,p>0.05。熟悉度水平的主效应也不显著,F(1,9)=0.010,p>0.05。脑区的主效应不显著,F(2,8)=2.476,p>0.05。电极位置的主效应不显著,F(2,8)=0.355,p>0.05。词语类型和熟悉度水平之间有显著交互作用,F(1,9)=26.786,p=0.001<0.05。简单效应的进一步分析发现,熟悉的成语潜伏期早于熟悉的短语潜伏期,而不熟悉短语潜伏期和不熟悉成语潜伏期之间没有显著差异。词语类型和电极位置之间有显著交互作用,F(2,8)=8.344,p=0.008<0.05。简单效应的进一步分析发现,左侧电极的不同词语类型之间潜伏期与其他两侧相比有显著差异。词语类型、熟悉度水平和脑区之间有显著交互作用,F(2,8)=5.152,p=0.025<0.05。
表4 不同词语类型和熟悉度的P600波幅比较(uV)
熟悉成语和熟悉短语的潜伏期之间没有显著差异,不熟悉短语与不熟悉成语的潜伏期之间有显著差异(分别为444.59 ms与418.73 ms)。根据分级显性意义假说的假设,直义和非直义语言在大脑进行认知加工时没有明显区别。从结果中可以发现,大脑在处理熟悉成语和熟悉短语的语义时符合以上假设,但在处理不熟悉成语和不熟悉短语的语义时却不符合该假设,证明大脑在处理不熟悉的语言时对直义和非直义语言会区别对待,符合构造模型的假设。可以认为大脑在处理熟悉的词语时,由于大脑中储存了大量与之相关的信息,可以快速地对语义进行判断,减少非直义和直义语言所带来的区别。但是,大脑在处理不熟悉的词语时,没有足够的信息帮助,非直义和直义语言所带来的区别就比较明显了。中文成语特别是不熟悉成语很多来源于古代典故,被试对它们的语义不太理解,也无法按照常规语义来理解,这也是非直义语言的特点,因此N400出现时间较早。而对于不熟悉短语来说,虽然不常见,但还是可以通过字面意思来判断,与成语相比语义加工要长一些,因此N400出现时间较晚。
N400的脑区之间波幅有主效应,P区的波幅小于其他两区,可能该区在N400阶段激活程度不高,该区对语义的加工参与程度较少。熟悉度水平和电极位置之间波幅有交互作用,左侧电极的不同熟悉度水平差异最大,可能暗示了左脑在处理不同熟悉度水平的词语语义时有差别。左脑善于利用更高层次的信息,选择与语境相关的唯一意义,非显性的意义在左脑被抑制,左脑具有显性敏感性。假设在N400阶段左脑也参与了对语义的分析加工,但没有右脑优势现象,而实验结果也表明在脑区之间N400没有显著差别。此外,脑区和电极位置之间波幅有交互作用,分析发现,中间电极的脑区差异与左右两侧有显著不同,可能暗示该区域在认知活动中的特殊性。
熟悉成语潜伏期快于熟悉短语潜伏期(分别为547.37 ms与589.83 ms),而不熟悉短语和不熟悉成语潜伏期之间没有显著差异。可以认为大脑对熟悉成语进行句法加工时不再考虑句法是否违反而直接进行最后的整合,因为被试知道成语就算违反句法也可能是对的,成语不是按字面意思去理解的,而大脑对短语的加工则更多地依赖句法的加工来判断。因此熟悉成语的P600出现的时间要提前,这是非直义语言和直义语言的区别导致的,符合构造模型的假设。不熟悉短语和不熟悉成语潜伏期没有显著差异,也可以用非直义语言和直义语言的区别来解释。虽然大脑可能不考虑不熟悉成语句法是否违反,但是它和熟悉成语的区别在于最后的整合阶段。由于缺乏必要的信息,如N400阶段语义信息的欠缺,被试无法判断成语的正误,因此P600的出现时间较晚,甚至比不熟悉短语潜伏期还要略晚。与不熟悉短语比较而言,不熟悉成语更难被大脑最后认知,符合构造模型的假设。
P600的词语类型和电极位置之间潜伏期有交互作用,结果显示左脑在处理成语时要比处理短语的潜伏期要早些,可能暗示了左脑在处理不同类型的词语句法及最后整合时有差别,左脑对成语更敏感。Papagno(2006)发现,LBD(left brain-damaged)的失语症患者与 RBD(right brain-damaged)的失语症患者相比,在成语的图片匹配任务中他们的成绩明显差些,可见左脑在非直义语言理解中有重要作用。结合本实验的结果,可以推测左脑是非直义语言句法及最后整合的一个重要区域,左脑损伤会降低对它们的理解能力。
前面提到的N400波幅分析结果中,P区的潜伏期落后其他两区,P600也有同样情况,可能暗示P区在语言处理过程中激活程度均不高。实验发现P600阶段不同电极位置之间波幅有显著差异,即中间电极与其他位置不同。此外,P600的脑区和电极位置之间波幅有交互作用。分析发现,中间电极的脑区差异与左右两侧有显著不同,这些可能暗示该区域在认知活动中的特殊活跃性。目前还没有类似研究,这也是以后可以考虑的研究方向。
综合分析实验结果,构造模型能较好地解释中文成语的认知加工,虽然在N400阶段,大脑在处理熟悉成语和熟悉短语时并没有显著差异。与西方的惯用语相比,中文成语在结构、意义解释等方面都有很大区别,基本上没有直义意思,可以说中文成语具有独特的归类。因此,大脑中应该有相应的识别系统,而不像西方的惯用语,可以直接表达直义意思。所以构造模型更适合中文成语这种特有的非直义语言的理解,它的特殊结构导致它的认知加工与其他类型词语有不同之处。此外,这次实验没有探讨中等熟悉度成语和短语的区别,这是未来研究应该考虑的。
以事件相关电位为实验手段,考察成语的理解加工过程,结果表明,与四字短语相比,四字成语在大脑的理解加工存在区别,从而支持中文成语理解加工的构造模型。
[1]Cacciari,C.,Padovani,R.,Corradini,P.Exploring the relationship between individuals'speed of processing and their comprehension of spoken idioms[J].European Journal of Cognitive Psychology,2007,(19):417-445.
[2]Cacciari,C.,Tabossi,P.The Comprehension of Idioms[J].Journal of Memory and Language,1998,(27),668-683.
[3]Cacciari,C.,Reati,F.,Colombo,M.R.,Padovani,R.,Riz zo,S.,&Papagno,C.The comprehension of ambiguous idioms in aphasic patients[J].Neuropsychologia,2006,(44):1305-1314.
[4]Cain,K.,Oakhill,J.,&Lemmon,K.The relation between children's reading comprehension level and their comprehension of idioms[J].Journal Experimental Child Psychology,2005,(90):65-87.
[5]Giora,R.Understanding figurative and literal language:the graded salience hypothesis[J].Cognitive Linguistics,1997,(8):183-206.
[6]Hagoort,P.Interplay between syntax and semantics during sentence comprehension:ERP effects of combining syntactic and semantic violations[J].Journal of Cognitive Neuroscience,2003,(15):883-899.
[7]Hahne,A.,&Friederici,A.D.Differential task effects on semantic and syntactic processes as revealed by ERPs[J].Cognitive Brain Research,2002,(13):339-356.
[8]Iakimova,G.,Passerieux,C.,&Hardy-Baylé,M.C.Interpretation of ambiguous idiomatic statements in schizophrenic and depressive patients:Evidence for common and differential cognitive patterns[J].Psychopathology,2006,(39):277-85.
[9]Kim,A.,&Osterhout,L.The independence of combinatory semantic processing:Evidence from event-related potentials[J].Journal of Memory and Language,2005,(52):205-225.
[10]Kutas,M.,&Hillyard,S.A.Brain potentials during reading reflect word expectancy and semantic association[J].Nature,1984,(12):161-163.
The Impact of Familiarity on Chinese Idioms Comprehension:an Event-related Brain Potential Study
ZHONG Yi-ping,LEI Xiao,QU Wei-guo
(College of Educational Science,Hunan Normal University,Changsha,Hunan 410081,China)
Chinese idiom is an important form of idiom,this paper used Event-related potential(ERP) to investigate the cognitive process model of four-character Chinese idioms.The present study manipulated familiarity(familiar/unfamiliar)and word type(idiom/phrase).Subjects were asked to judge whether the final word is right which stochastic presented in the screen.The result showed that there is no significant difference between familiar idioms and familiar phrases in N400 amplitude,but have a significant difference between unfamiliar idioms and unfamiliar phrases;the P600 latency was quicker for familiar idioms than for familiar phrases,but there is no significant difference between unfamiliar idioms and unfamiliar phrases.Therefore,the comprehension of four-character idioms is different from four-character phrases,and configuration model adequate to explain the present findings.
Chinese idiom;configuration model;graded salience model
B84
A
1671-6124(2011)04-0116-05
2011-02-12
教育部留学回国人员科研启动基金资助[教外司留(2008)890号]
钟毅平(1965-),湖南汨罗人,湖南师范大学教育科学学院教授,博士生导师。