汉语搭配信息对词汇识别的影响

2016-12-16 10:36吕行施家炜
心理与行为研究 2016年4期
关键词:搭配汉语

吕行 施家炜

摘要 采用词汇判断任务,探究汉语词汇识别中搭配信息的作用。研究表明:(1)汉语母语者对搭配信息敏感,高频搭配能显著促进词汇识别;(2)与高频搭配在语义关系上高度相近的词对词汇识别无促进效应;(3)以逆序形式呈现的高频搭配亦能促进词汇识别,但其效应弱于正序。本研究为词汇搭配知识的存储和加工方式的理论建构提供了依据:互为搭配关系的词语在词汇层面建立了具有方向性的联结,其联结强度取决于语言使用中的搭配共现频率:而在对搭配信息的前词汇加工过程中没有语义作用的参与。

关键词 词汇识别,汉语,搭配,近义,词序。

分类号 B842

1 引言

词汇是语言的重要组成单位,每种语言的词汇都极为丰富,每一个词又都有其特定的意义和用法。然而。面对数量庞大的语言材料,母语者却能够在极短的时间内实现准确的理解和产出。这不禁使我们发问——人类大脑究竟是运用怎样精密的机制来完成这一系列复杂加工的?词汇知识又是如何存储于人脑中的?需要承认的是,母语者极快的词汇加工速度使得人们对词汇知识存储和加工的研究存在很大难度。然而由于诸多因素均会影响词汇的加工,因此,对影响因素的考察不仅其本身有重要价值,还可以作为我们深入探究词汇的记忆方式和加工机制的有效途径。本文将从语境因素对词汇识别的影响这一视角切入展开研究。

语境因素对词汇加工的影响是近年来研究的热点,对该因素的考察主要在词汇关系层面和句子层面两个方向上展开。相较而言,后者的研究成果更多(任桂琴,韩玉昌,于泽,2008;任桂琴,韩玉昌,刘颖,2012),然而,词汇关系层面对词汇识别的影响是更为基础的,很多看似由句子层面带来的影响其本质仍涉及到词汇关系层面的问题。因此,本文就将围绕词汇关系层面——即以某种关系相互联系的词对对词汇识别的作用展开探讨。在这一问题上,广为探讨的理论模型为扩散激活模型。该理论认为,人脑记忆中存在扩散激活,对某一词的激活会促进临近词的激活。Meyer和Schvaneveldt(1971)首次运用词汇判断任务为扩散激活模型提供了证据。研究发现,若所呈现的两词有联想关系,则被试做出肯定判断的反应速度更快。值得注意的是,该研究及后续的一系列研究均是在词义的联想关系这一层面上展开的,然而部分研究却对这一关系提出质疑,指出被试之所以对语义上具联想关系的词对在判断任务中有更好的表现,是因为这两个词语在语言使用中频繁共现,从而导致二者有较强的词汇联结,而并非是因为其意义有交叠(Trevor,2008)。也就是说,共现关系可能是语境影响词汇识别的更本质的因素。在语言使用中,搭配关系即是一种典型的共现关系。Kjellmer(1987)指出,在各种语境中。搭配是在话语中大量出现的、不可忽视的重要成分。基于此,本研究将围绕搭配关系展开研究。

对于词语间的搭配关系,Firth(1957)首先提出“搭配”的概念,并将其界定为词与词共现的特征,指出搭配关系是词与词间的组合关系,且体现了一种相互预期。Mitchell(1975)则将词类、句法、意义等因素纳入到了对搭配关系的考量中。Sinclair(1991)提出了语言使用的“惯用原则”,即语言使用者拥有大量的搭配词组作为其语言使用的备选材料。基于以上学者的观点。本文将高频搭配界定为符合句法结构和语义关系的、且在语料库中呈现高共现率的词对。对于语言中的搭配关系,已有相关研究多集中在计算机识别研究、基于语料库的研究或基于语言本体的研究(王霞,2005;程月,2007;Kennedy,2003,2005;辛平,方菊,2012;丁继亮。2012)等几个方面,然而其却不能揭示母语者对搭配信息的认知方式。本研究将从心理语言学视角切入,对搭配信息是否影响母语者的词汇识别进行考察。

Hoey(2005)从认知视角指出,如果单个词的启动效应的发生与另一词发生联系,则建立了搭配关系。Ellis,Frev和Jalkanen(2009)采用词汇判断任务,在被试的上下视野同时呈现互为高频搭配关系或非搭配关系的词对。研究发现,词汇识别对高频搭配敏感。Ellis等由此认为,词汇识别加工受语言使用中特定搭配经验的影响,因此高频搭配比低频搭配更易识别。与之相似的是,Durrant和Doherty(2010)运用启动任务发现了高频词汇搭配的启动效应,证实了语言使用中的搭配关系对词汇识别的作用。然而,前人对搭配信息在心理语言学视角上的考察均是在英语中展开的,对于词汇识别对搭配信息的敏感是否具有跨语言一致性却鲜有关注。本文将对汉语的搭配关系进行研究,考察其是否影响汉语母语者的词汇识别。

此外,更值得关注的是,Ellis。Frey和Jalka-nen(2009)发现,若两词仅在语义上相匹配,却并未在实际的语言运用中呈高频搭配,那么词汇识别并不能得到促进。Ellis等由此推测,流畅的词汇识别只与记忆特定的词汇搭配密切相关,而在这一加工层面上并无自上而下的语义作用对其产生影响。

本研究将围绕这一问题继续进行考察。在本研究中,对搭配信息的考察除高频搭配(如:采取-措施)和控制组(即无关非搭配,如:开设-措施)外,还引入另一水平,即与高频搭配中的动词互为同义/近义关系的词语与原搭配中的宾语组成的词对(如:采用一措施)。这一关系在下文中将用“近义非搭配”来指代。

对近义非搭配的考察有重要意义。首先,其能对母语者在词汇识别的过程中对高频搭配的敏感程度和特异性程度有深入认识。与高频搭配在语义关系上形成高度干扰的近义非搭配在词汇识别中的作用究竟更接近于高频搭配还是无关非搭配?若更接近于无关非搭配,则表明母语者对高频搭配的敏感程度高,特异性强,加工中不易受到干扰。第二,对近义非搭配的考察能对搭配关系对词汇识别的影响中是否有语义作用的参与提供证据。若有语义作用的参与,那么与无关非搭配相比。对近义非搭配的识别应得到一定程度的促进,因为同义/近义词间语义上的扩散激活会使近义非搭配词对之间的联结强于非搭配词对之间的联结。若没有语义参与,那么近义非搭配则应与无关非搭配一致,不对词汇识别产生促进作用,基于前人的研究成果,我们的研究假设支持后者。

此外,由于搭配是由词与词组合而成的。那么在搭配词对中,哪个词在前、哪个词在后,即组成搭配的词语的顺序,同样也是搭配信息的重要组成部分。已有研究(Koriat,1981)在对语义上具联想关系的词对的考察中,发现语义启动效应的发生可能是双向的(如词对lamp-Hght当lamp作为启动词先于目标词light呈现时,被试对light能够更快地识别;而当light在前时,light也能启动lamp),然而这种情况何时发生却并未得到确定,且启动程度上也有可能存在差异(McNamara,2004)。那么,对于语义上具联想关系的词对来说,这种可能存在的双向启动效应意味着其在心理词典中呈现怎样的存储模式?而对于本研究中所关注的搭配,互为搭配关系的词对之间又是否有类似的双向效应?对这一问题的考察不仅能够让我们对搭配内部词语顺序的作用有深入认识——即在搭配对词汇识别的影响中,词序是否发挥作用;更能为我们深入探究组成搭配的词语在母语者心理词典中的存储模式提供重要依据——当搭配以逆序形式呈现时,若词汇识别不能得到促进,我们则推测,词汇搭配可能是以整体为单位进行储存和提取的,因而当形式上发生改变时,原搭配不能得到有效提取。而若词汇识别在逆序呈现时能得到部分的促进。那么我们则倾向于认为,组成搭配的两词在心理词典中存在不同程度的、区分方向的联结。

综上,本研究旨在探讨:在汉语中,高频搭配是否能促进母语者的词汇识别?近义非搭配在词汇识别中的作用更接近于高频搭配还是无关非搭配?词序因素是否影响搭配中的词汇识别?

2 研究方法

2.1 被试

本实验的被试为北京语言大学学生33名,所有被试均为汉语母语者,其中男性16名,女性17名,(矫正)视力正常。

2.2 实验设计

本实验为3×2的被试内设计,两个自变量分别为搭配因素和词序因素,其中搭配因素分为高频搭配、近义非搭配、无关非搭配三个水平,词序因素分为正序和逆序两个水平。因变量为被试完成词汇判断任务的反应时和错误率。

2.3 实验材料

本研究将实验材料限定为汉语动宾搭配,以对搭配类型本身可能带来的影响做出控制。实验材料分为三组。第一组为高频搭配词对,如:采取-措施、干涉-内政、改善-条件、坚持-原则、增强-意识、表示-感谢等,该组动宾高频搭配的选择标准是:(1)运用CCL现代汉语语料库,以两词间隔字符不超过五个字的范围作为检索标准,所选词对在这一标准内均有较高的共现率,共现的语料数目平均为2170条。(2)以笔者本人的母语语感作为参考,排除一些在语料库中两词有较高共现率,却在语义上并不形成典型搭配的情况,如:“提高-群众”等。第二组为近义非搭配,即所呈现词对中的动词与语言使用中真实存在的动宾高频搭配中的动词为同义/近义关系(同义/近义关系的确定以《现代汉语同义词词典》、《汉语近义词词典》为依据),如:采用-措施、干扰-内政、改进-条件、保持-原则、增长-意识、表现-感谢等。这组词对在语义关系上与高频搭配有很高的相似度,但在客观的语言使用中(由于语义上的细微差别、语义韵的差异、或是语用习惯)却呈现为非搭配(两词在语料库中的共现率为高频搭配的2%以下)。第三组为无关非搭配,即所呈现词对中的动词与语言使用中真实存在的动宾高频搭配中的动词语义无关,且与对应宾语不构成其它动宾搭配,两词在语料库中的共现率为高频搭配的2%以下。在此基础上。每一组词对均有正序呈现和逆序呈现两种方式。

本研究对实验材料中词语的笔画数和词频进行了控制,三组实验材料均不存在显著差异,排除了这两个因素对实验结果可能造成的影响。全部实验材料包含28对高频搭配、30对近义非搭配、30对无关非搭配,三组材料基本匹配,保持宾语一致,仅动词不同。

本研究采用被试内设计,每一名被试均需在6种条件下完成任务。对于每一名被试来说,包含相同材料的词对只呈现一次。此外,实验材料中配以与正确反应试次等量的错误反应词对,每组错误反应词对中有且仅有一词为假词。

2.4 实验过程

本实验沿用Ellis,Frey和Jalkanen(2009)的方法,采用词汇判断任务,让被试对同时呈现的词对进行判断。实验用E-prime软件进行编写,被试在PC上逐一完成实验。在每一个试次中,首先给被试呈现一1000ms的注视点,随即在被试的左右视野同时呈现一组词对,要求被试在保证正确的条件下尽可能快地对所呈现的两个词语是否均是词做出按键反应。判断完成后,将呈现2500ms的空屏,以尽可能地减弱前一试次对后一试次的干扰,随后进行下一试次。所有试次随机呈现。在实验正式开始之前有指导语和练习(练习部分包含14个试次)。

需要说明的是,为考察词序效应,本研究对Ellis,Frey和Jalkanen(2009)的实验范式做了部分改动,将词对在上下视野呈现的形式改为了在左右视野呈现,词对之间有4个字符的距离,并将注视点置于左视野,以引导被试按照与正常阅读习惯相一致的顺序从左至右完成识别。

3 结果

以判断任务的正确率达85%为标准进行筛查,剔除3名正确率低于该标准的被试,剩余30名有效被试:对于每名被试,将与其平均反应时相差3个标准差以上的极端数据用其平均反应时替代。

30名被试在6种条件下完成词汇判断任务的平均反应时和错误率见表1。

重复测量方差分析结果显示,搭配的主效应显著,F(2,58)=24.05,p=0.000;词序的主效应达边缘显著,F(1,29)=3.875,p=0.059;且搭配和词序两因素之间的交互作用达边缘显著,F(2,58)=2.678,p=0.077。进一步进行简单效应检验。对搭配因素的检验结果显示,在正序情况下,搭配效应显著,F(2,58)=23.58,p=0.000,说明汉语母语者对搭配信息敏感。然而在正序的高频搭配、近义非搭配和无关非搭配三个水平上,究竟哪些水平之间的差异真正存在?围绕研究设计。我们感兴趣的问题有两个:(1)高频搭配和非搭配之间是否有差异;(2)在非搭配中,近义非搭配与无关非搭配之间是否有差异。对这组正交对比的检验结果显示,以正序形式呈现的搭配关系和非搭配关系之间差异显著,F(1,29)=36.49,p=0.000,说明高频搭配能够显著促进汉语母语者的词汇识别:而以正序形式呈现的近义非搭配与无关非搭配之间差异不显著(p>0.05),说明汉语母语者对近义非搭配的识别并不由于其与高频搭配在语义关系上的高度相近而发生促进。以上结果见图1。

在逆序情况下,对搭配因素进行简单效应检验,结果显示,搭配作用亦显著,F(2,58)=6.08,p=0.004,说明当搭配信息以逆序形式呈现时,汉语母语者对其也表现出敏感。进一步的正交对比显示。以逆序呈现的高频搭配和非搭配之间差异显著,F(1,29)=9.71,p=0.004,说明以逆序形式呈现的高频搭配亦能促进汉语母语者的词汇识别:而以逆序形式呈现的近义非搭配与无关非搭配之间差异不显著(p>0.05),说明汉语母语者对以逆序形式呈现的近义非搭配的识别同样并不因其与高频搭配在语义关系上的高度相近而发生促进。以上结果见图2。

从以上结果中看到,无论高频搭配以正序还是逆序形式呈现,均对汉语母语者的词汇识别产生促进作用。那么,汉语母语者是否对搭配中词语的顺序敏感?对词序的简单效应检验结果显示,在高频搭配中,词序效应显著,F(1,29)=6.91,p=0.014,说明汉语母语者对以正序形式呈现的高频搭配的词汇识别要好逆序:而在近义非搭配和无关非搭配中,词序效应均不显著(p>0.05)。以上结果见图3。

4 讨论

本研究在汉语词汇识别中发现了搭配信息所起到的重要作用,为Ellis,Frey和Jalkanen(2009)与Durrant和Doherty(2010)的研究结果提供了跨语言一致性证据。在此基础上,本研究通过关注与高频搭配形成高度语义干扰的近义非搭配,发现了汉语母语者在词汇识别中对高频搭配的敏感度高、特异性强,因此,对近义非搭配的反应与对无关非搭配的反应一致,并没有对词汇识别产生促进。此外,本研究还探讨了搭配呈现的词序对词汇识别的影响——对以上问题的考察均为揭示人类对词汇搭配信息的记忆和加工方式提供了有力依据。

由实验结果看到,高频搭配更容易被识别,也就是说,语言使用经验能很大程度上影响汉语的词汇识别一语言识别系统对语言使用中高频共现词语进行统计和计算,从而实现对其的优先加工。值得进一步讨论的是,这种基于统计的搭配共现率信息,是如何在心理词典进行存储,又是如可实现对其的加工的?我们将从以下两个方面尝试回答这一问题:(1)互为搭配的词对究竟是以语块的形式进行整体储存的。还是仍以单个词语为单位进行储存,同时在其间建立了一定程度的联结?(2)搭配信息对词汇识别的影响究竟是否有语义作用的参与?

对于问题(1)。联结主义普遍认为,心理词典的意义层面由很多意义单元构成,两个词语的共有意义单元越多,其在词汇系统中的存储距离就越近:而两个词语在一起出现的频率越高,两词之间建立的联结也就越强。由此可见,联结主义强调词语间的联结,而前提则是其仍以单个词语为单位进行储存。然而,部分学者则持语块存储的观点。Bolinger(1976)认为,搭配是一种预制语块,在学习中被整体记忆或提取。Dabrowska(2004)也指出,对于语言中重复性高的成分,人们会将其作为预制语块进行整体储存,以减轻语言信息处理的压力,提高语言加工效率。易维和鹿士义(2013)的研究也表明,语块也是心理词典的单位,具有心理现实性,是整体存储加工的。

那么,搭配信息究竟是以语块的形式进行整体储存,还是在心理词典中建立了词语之间的联结呢?对于这一问题,我们要以人类信息加工的高效性原则作为讨论的基础。需要明确的是,对于特定词语来说,能与其形成搭配的词语极为丰富,如:汉语中一个动词可能与多个宾语形成搭配,同时,一个宾语也可能与不同的动词形成搭配,如果这些搭配信息均以语块的形式逐个进行存储,显然会使记忆量过大,同时也不利于信息的加工和提取。因此,我们更倾向于认为,搭配信息以单个词语为单位进行储存,同时在词对间建立了复杂交错的联结。那么,其联结方式是怎样的呢?本研究发现,当词对以逆序形式呈现时,搭配信息对词汇识别也有一定的促进作用,这提示我们。互为搭配关系的词对之间的联结可能是双向的。同时,本研究还发现,被试对高频动宾搭配的正序呈现要比对逆序呈现有更快的识别,说明不同方向间联结的强度存在差异,而这种差异可能正来自于语言使用中不同形式的搭配的共现率的差异——对于汉语来说,部分动宾搭配可以变换结构,以逆序形式进行表达(如:条件的改善、经验的积累),只是在语言使用中这一形式的搭配与更为基础的动宾搭配相比频率较低。那么,搭配词对之间联结关系的建立究竟是否完全基于语言使用中的共现频率呢?若是,我们则可预测,如果某种搭配的逆序形式在语言中使用中出现的频率极低。那么其在心理词典中将只有单向联结。对于这一预测,仍有待后续研究的验证。当然。存储方式也可能并不绝对——对于共现频率极高的搭配来说,以语块的形式进行整体储存的可能性更大,以实现更高效的加工;而对于其它大部分词对来说,词语间根据不同的共现频率而建立不同程度的、区分方向的联结则可能是更普遍的模式。

对于问题(2),本研究发现,被试并不会因为同义/近义词在语义层面上的高度一致而在对近义非搭配词对的判断中发生促进效应,而是表现出与对无关非搭配一致的反应。这一结果支持了Ellis,Frey和Jalkanen(2009)的观点,即在前词汇加工阶段,词汇识别对搭配信息的敏感并不受语义作用的影响。由此。我们可以进一步推测搭配信息的存储模式。依照联结主义的观点,互为近义词的词对由于其享有较多的意义单元而在词汇系统中形成临近关系,也就是说,近义词之间所建立的联结是以语义作为桥梁的,扩散激活效应的发生也正是基于此。然而,尽管互为搭配关系的词语在某种程度上也可能存在语义上的联系,但句法组合上的制约以及语用习惯上的限制使得搭配词对间的语义关系相对间接,因此,人脑对搭配信息的存储不选择语义作为词汇间联结的桥梁,而是在词汇层面建立更直接的联结,这一存储模式使得基于词语共现频率的联结无需语义的参与即能在词汇识别中发挥作用。

5 结论

本研究结论为:(1)汉语母语者对搭配信息敏感,高频搭配能显著促进母语者的词汇识别。(2)同无关非搭配一样,近义非搭配并不能促进汉语母语者的词汇识别。(3)当高频搭配以逆序形式呈现时。汉语母语者的词汇识别亦能得到促进,但与其相比,正序呈现的高频搭配对词汇识别的促进效应更强。

猜你喜欢
搭配汉语
学汉语
韩国语 "V+ " 与汉语"V+死了"对比研究
关于日语中汉语声调最新变化的考察
关于日语中汉语声调最新变化的考察
追剧宅女教汉语
色彩在主题餐饮空间环境中的应用
浅析色彩在室内设计中的应用
《约翰·汤普森简易钢琴教程》教材之我见
基于语料库的英语动词open的搭配研究
“反而”的语义韵考察