王 岩
(北京航空航天大学外国语学院,北京 100191)
基于语料库的英语同义词辨析
——以“引起类”动词arouse, provoke和evoke为例
王 岩
(北京航空航天大学外国语学院,北京 100191)
语料库语言学的发展为同义词辨析提供了新的视角与方法,本文基于COCA语料库,从语域分布、类联接、搭配词、语义偏好和语义韵五个方面对一组表示“引起类”的同义词进行辨析研究,以期准确区分出这三个同义词之间的差异,为英语教学以及英语学习提供一定的启示意义。
语料库;同义词辨析;启示
英语中同义词占有很大比例,据统计,英语语言中同义词、近义词的数量约占总词汇量的60%以上(贺晓东 2003)。同义词的大量存在给英语词典编纂,英语教学以及英语学习带来很大的挑战,也使同义词辨析成为语言研究的重点问题。传统的英语同义词辨析主要借助于字典上的描述,对同义词的词目意义进行归纳总结,然而这种方法过于依赖直觉内省,很难完全掌握同义词之间的细微差别,因此在实际运用中存在很多问题。近年来,语料库语言学的迅速发展为英语同义词辨析提供了新的视角和方法。语料库因其语料真实丰富、覆盖不同文体语域、反映语言全貌、易于检索分析等根本优势,在很大程度上弥补了过去词语辨析因语言材料不够充分而多依赖主观自省的不足,使词语辨析开始从传统的直觉经验方法转向基于实验和统计的方法(潘璠、冯跃进 2000)。
本文采取语料库以及定量分析与定性分析相结合的研究方法,基于COCA(Corpus of Contemporary American English)语料库,对一组表示“引起”类的同义词arouse,provoke和evoke进行辨析研究。经笔者调查发现,目前还没有关于这组同义词的辨析研究,仅王璇、任培红(2009)基于BNC语料库,对arouse和provoke的语义韵做过比较研究。本文基于COCA语料库,对这三个关键词进行检索统计,通过观察提取的索引行,来揭示这一组同义词各自不同的语域分布、类联接、搭配、语义韵、语义偏好等语言特征,对这一组同义词进行比较辨析,揭示同义词之间的差异,以期对英语教学和英语学习带来一定的启示。
2.1 arouse, provoke和evoke在不同语域的词频分布
语域(register)指的是语言因其使用的语境不同而出现的语言变体,它与语言的使用者、语境及语言的正式程度有密切的关系。Palmer曾提出同义词也许属于不同的语域,有不同的搭配方式,表现说话人不同的态度等。统计同义词的语域分布有助于将同义词区分开来,并提高学习者的语域意识,从而提高语言使用的准确性和得体性。COCA收词量达到5.2亿,涵盖了美国英语口语、小说、流行杂志、报纸、学术期刊五大类型的语料,根据COCA中的Chart功能,我们很容易得出同义词在这五个语域中的分布情况。具体如下图所示:
表1 arouse,provoke和evoke的语域分布
Arouse, provoke和evoke在COCA语料库中出现的总频次分别为782次,2264次和2219次,该图表显示的是每百万词中三个词出现的频数。总体而言,provoke与evoke出现的频率要远远高于arouse,说明比起arouse,provoke与evoke更常用。就不同语域分布而言,provoke出现在口语语域中的频次要远远高于arouse和evoke,说明provoke相对而言更加口语化。Arouse和evoke在学术语域出现的频率要远远高于其他语域,说明这两个词的书面语特征比较显著,而provoke在除学术语域之外的其他几个语域分布比较平均。Arouse较少出现于口语,杂志和报纸语域,evoke较少出现于口语和小说语域。
2.2 arouse,provoke和evoke的类联接统计分析
类联接(colligation)是词语搭配研究中的一个重要概念,指语法范畴间的结合。类联接不是与词语搭配平行的抽象,而是更高一级的抽象(Firth 1957)。类联接是词语搭配发生于其中的语法结构和框架,一个类联接代表了一个搭配类(卫乃兴 2002)。统计分析同义词的类联接类型,有助于我们对同义词进行区分。由于arouse,provoke和evoke三个词出现的频次较高,笔者对每个词随机抽取100条索引行来统计其类联接情况。
表2 arouse在COCA语料库中的类联接统计
通过以上三个表格我们可以看出,arouse,provoke和evoke三个词最高频的类联接都是V+N,分别占到所有类联接的91%,91%和99%。此外,V+NNon-human+in+NHuman也是三个词共有的类联接。Arouse的类联接比较丰富,有4种类型,分别是V+N,V+in+NHuman+N或V+N+in+NHuman,V+ NHuman+to+V+ NNon-human和V+ NHuman+to +N,并且这4种类联接和provoke重合,其中V+in+NHuman+N或V+N+in+NHuman出现的频率6%要高于provoke的2%,V+ NHuman+to+V+ NNon-human出现的频率2%要低于provoke的5%。 Provoke的类联接最为丰富,共有5种类型,并且具有arouse和evoke没有的类联接V+NHuman + into(doing) + NNon-human,这说明在这种语法结构中,我们只能采用provoke这个词。Evoke的类联接最少,只有两种类型,且V+N的形式占据较大比例。
表3 provoke在COCA语料库中的类联接统计
表4 evoke在COCA语料库中的类联接统计
2.3 arouse,provoke和evoke的显著搭配词和语义偏好统计分析
词语搭配研究之父Firth(1957)曾说:“You shall know a word by the company it keeps.”即词的意义从与它结伴同现的词中体现。根据Firth的观点,词项的结伴规律、结伴词项间的相互期待与相互吸引、搭配成分的类联接关系等都是词语搭配的形式属性,都是词语搭配研究的重要内容(卫乃兴 2002b)。语料库证据表明,每一个词项都有其独特的搭配行为(Partington 1998)。因此,同义词虽然具有相同或相近的概念意义,但是在搭配词选择上可能存在不同。语义偏好(semantic preference)指某个节点词与其经常搭配的词的共同的语义特征,它关注搭配词的语义特征或类别(McEnery et al. 2006)。通过研究同义词的显著搭配词以及其语义偏好来区分同义词是一种行之有效的方法。
从上文中我们得出,arouse,provoke和evoke三者的colligation主要是V+N,即作为及物动词,后边直接跟宾语。在COCA中的Collocates一栏中,我们将跨距为[0/L, 6/R],搭配词选择[nn*],勾选MI值,同时在“隐藏选项”GROUP BY中选择LEMMAS。COCA自动生成100个显著搭配词(MI>3)。下面我们对arouse, provoke和evoke的这100个显著搭配词分别进行一一分析。
经统计,关键词arouse的显著搭配词可以分为以下4类:
1)表示怀疑,愤怒,敌对,害怕,痛苦,嫉妒,困惑等情绪或者心理活动的名词,如suspicion,anger,resentment,hatred,hostility,opposition,fear,pathos,bemusement等;
2)表示兴趣,激情,喜爱,羡慕等情绪或者心理活动的名词,如interest,curiosity,desire,passion,enthusiasm,admiration,affection等;
3)表示感觉,情绪,意识,注意力,关心等的名词,如feeling,emotion,concern,attention,sense,consciousness,awareness等;
4)表示人的名词,如viewer,reader,audience,Jew,neighbor,listener,visitor等。
关键词provoke的显著搭配词分为以下6类:
1)表示反应类的名词,如response,reaction;
2)表示战争,暴乱,对抗,冲突,攻击,危机,反抗等事件类的名词(并且这一类名词占据绝大比例),如warfare,riot,bloodshed,violence,confrontation,conflict,attack,crisis,resistance,rebellion,strife,disturbance,uprising,clash,chaos,protest,unrest等;
3)表示讨论,对话,争论,辩论等的名词,如discussion,debate,controversy,argument,conversation等;
4)表示生气,焦虑,愤怒,怀疑,嫉妒等情绪类的名词,如anger,anxiety,wrath,ire,rage,jealousy,suspicion等;
5)表示思想,思考的名词,如thought, reflection, thinking, insight,reconsideration,rethinking等;
6)表示人的名词,如viewer,classmate等。
关键词evoke搭配的主要为抽象名词,具体分为以下5类:
1)表示反应的名词,如response,reaction等;
2)表示心理意象,记忆,联想等的名词,如image,imagery, memory,association等;
3)表示情绪或者是心理活动的名词,如melancholy, pity,fear,anxiety, hatred,tension,sadness,passion,excitement,joy,happiness 等;
4)表示抽象概念的名词,如beauty, elegance, simplicity, notion等;
5)表示人的名词,如reader,listener,viewer,Knight等。
通过以上的分析我们发现,arouse,provoke和evoke在搭配词方面既有差异,也有相同之处。Arouse主要搭配表示心理情绪的名词,provoke既可搭配表示心理情绪的名词,也可搭配表示具体事件类的名词,evoke多搭配表示抽象概念的名词。三者都可以搭配情绪类的名词,也都可以搭配表示人的名词。此外,provoke和evoke都可以搭配反应类名词。通过高频搭配词以及语义偏好分析,我们更全面地看到三个同义词的相同以及不同之处,有助于我们正确掌握这三个词的运用。
限于篇幅,我们仅把arouse,provoke和evoke的前十位搭配词列举如下:
表5 arouse,provoke和evoke前十位显著搭配词
2.4 arouse,provoke和evoke的语义韵分析
语义韵(semantic prosody)的概念在1987年由Sinclair首次提出,此后成为语料库语言学研究的热点问题。研究发现,有些节点词总是习惯性地吸引某一类具有相同或相似语义特点的搭配词,其语义相互感染,相互渗透,在语境内形成一种语义氛围(卫乃兴 2006)。不同的词项具有不同的语义选择倾向,因此语义韵分为积极(positive)、消极(negative)和中性(neutral)三类。积极的语义韵指的是节点词所吸引的搭配词大多是具有积极语义特点的词语,与之相反,具有消极语义韵的节点词所吸引的搭配词大多具有鲜明的消极语义特点,而中性语义韵的节点词既吸引积极语义特点的词语,也吸引消极语义特点的词语,形成一种错综的语义氛围,卫乃兴(2002a)也将其称为错综(mixed)语义韵。
语义韵与上文提到的语义偏好既相互区别又相互联系。语义偏好指节点词的搭配语义特征,比较具体,而语义韵指语境内所弥漫的某种语义氛围,相对来说较为抽象。语义偏好的存在是语义韵赖以形成的原因,而语义韵又制约了语义偏好的词项选择。语义韵的研究为同义词辨析提供了新的途径,同义词可能呈现出不同的语义韵。
通过上文中对arouse,provoke和evoke三个词的显著搭配词统计以及语义偏好分析,我们很容易得出来这三个词的语义韵。关键词arouse所吸引的既有表示怀疑,愤怒,反抗等消极情绪的名词,也有表示兴趣,激情等积极情绪的名词,还有表示感觉,意识,注意力等中性色彩的名词,因此我们可以确立关键词arouse为混合语义韵。关键词provoke所吸引的搭配词中,不论是表示动作,事件类的具体名词,还是表示心理活动,情绪类的抽象名词,都带有显著的消极色彩,而诸如response, reaction, laughter,interest等带有积极或者中性色彩的名词只占很小的一部分,因此我们可以确立关键词provoke为消极语义韵。Evoke所搭配的主要是一些抽象名词,这些抽象名词中既包括一些消极语义明显的名词,如melancholy,pity,fear,anxiety,disgust,hatred,sadness,ghost等,也包括joy,happiness,beauty,elegance等语义积极的名词,还有诸如emotion, feeling, atmosphere等中性名词,但是究竟哪类名词占得比重最大不好确定,因此我们先不对evoke的语义韵下定论。
为了验证以上所确立的arouse和provoke语义韵的客观准确性以及确定evoke的语义韵,我们再针对每个关键词,随机抽取100条索引行,来研究它们的语义韵情况。
表6 arouse的语义韵
表7 provoke的语义韵
表8 evoke的语义韵
Evoke的搭配词频数百分比语义韵1Surprise,glamour,optimism,interest,joy,brightness,etc.1313%积极2Poverty,sadness,grief,despair,fear,pain,misery,rage,etc.3131%消极3Words,connection,images,reaction,response,notions,etc.5252%中性4Her,friends,instructor,him,etc.44%中性
通过观察以上三个表格可以发现,arouse所吸引的搭配词中,30%呈现出消极语义特征,24%呈现出积极语义特征,40%呈现出中性语义特征,因此我们确定arouse为错综语义韵;provoke所吸引的搭配词中,61%呈现出消极的语义特征,36%呈现出中性语义特征,而积极语义特征的搭配词仅占3%,因此我们确定provoke为消极语义韵;evoke吸引的搭配词中,13%呈现出积极语义特征,31%为消极语义特征,56%为中性语义特征,因此我们确立evoke的语义韵为中性偏消极。由此我们发现,arouse,provoke和evoke尽管为同义词,但是它们吸引具有不同语义色彩的词项,因此呈现出不同的语义韵。
通过以上的数据分析我们发现,arouse,provoke和evoke作为同义词,在语域分布,类联接,显著搭配词,语义偏好与语义韵方面都呈现出很大的不同,这启示我们在英语教学以及英语学习中应该透过同义词同义的表面,去关注它们的内在差异,而不能仅仅依赖字典上的解释,或者仅仅依赖于自己的直觉经验。另一方面,从语域分布等五个方面的展开的同义词辨析让我们对同义词使用的场合,语法结构,词语搭配,语义选择以及语境氛围方面有了全面透彻的了解,从而有助于我们今后正确得体地使用这三个同义词。此外,该研究也体现了基于语料库的同义词辨析方法的优越性,语料库给研究提供了大量真实自然的语料,定量分析与定性分析相结合的方法使研究结果更加客观准确,因此语料库可以作为英语教学与学习的有效工具。
Firth, J. R.1957.PapersinLinguistics1934-1951 [C]. London: Oxford University Press.
McEnery, T., R. Xiao & Y. Tono. 2006.Corpus-BasedLanguageStudies[M]. London & New York: Routledge.
Palmer, F. R.1981.Semantics[M]. Cambridge University Press.
Partington, A. 1998.PatternsandMeanings—UsingCorporaforEnglishLanguageResearchandTeaching[M]. Amsterdam: John Benjamins.
Sinclair, J. 1987.LookingUp[M]. London: Collins.
贺晓东.2003.英语同义词词典[Z].北京:商务印书馆.
潘璠、冯跃进.2000.基于语料库的同义词差异性特征调查[J].山东外语教学(4).
王璇、任培红.2009.基于语料库的英语同义词辨析[J].河南理工大学学报(社会科学版)(1).
卫乃兴.2002a.语义韵研究的一般方法[J].外语教学与研究(4).
卫乃兴.2002b. 基于语料库和语料库驱动的词语搭配研究[J].当代语言学(2).
卫乃兴.2006.基于语料库学生英语中的语义韵对比研究[J].外语学刊(5).
2016-07-27