基于COCA语料库的近义词辨析

2016-05-30 17:51:27李慧
校园英语·上旬 2016年1期
关键词:语料库

李慧

【摘要】本文通过运用语料库,从使用频率,语体特征,类联接,搭配四个方面辨析二者之差异。旨在为探索在语料库背景下的英语近义词教学拓展新的思路。

【关键词】COCA 语料库 使用频率 语体特征 类联接

一、引言

美国当代英语语料库(COCA)是一个大型免费在线语料库,也是当今世界上最大的英语平衡语料库。这种按照语体的差异构建语料库的方式能够更好的帮助大家学习和研究语言。本文将以“worthy”和“worthwhile”为例,通过COCA在线语料库比较两者的异同,从而说明语料库在英语词汇学习方面的作用。

二、研究背景

语料库可以提供大量真实的语料,这为区分英文中的近义词提供了一种有效的方法。语言学习者和教师都可以通过这一方法,对近义词进行分析和判断。国内根据语料库对词汇进行辨析的研究已有很多,研究对象以名词,动词,介词为主。基于语料库的形容词辨析研究数量仍相对较少。英文单词“worthy”和“worthwhile”是一组让英语学习者容易混淆的近义词,都可作形容词,并且含“有值得的”之意。本文将基于COCA在线语料库,从使用频率,语体特征,类联接,搭配四个方面对这一组单词进行区分,目的在于尽量清晰的再现二者之间的差别,帮助英语学习者正确识别者这一组单词。

三、worthy和worthwhile在COCA中的差异分析

1.worthy和 worthwhile 在COCA语料库不同语体中的“频率”和“频数”分布差异。COCA语料库的使用者不仅能限定任何一个子语料库的范围对某个词条进行查询,而且还可以把查询范围限定为几个子语料库的组合。根据百度百科,语体,“就是人们在各种社会活动领域,针对不同对象,不同环境,使用语言进行交际时所形成的常用词汇,句式结构,修辞手段等一系列运用语言的特点。有效的语言交流,不仅涉及内容,而且也涉及语言本身,涉及语言材料及其表达手段,组合方式等的准确选择”。本文利用了COCA的这一功能,统计出了worthy 和 worthwhile 在不同语体中的使用情况。语体意识在区分近义词中起了重要的作用,语体犹如一种标记,标记着此单词出现的上下语境。通过对比分析不同语体中的使用频率和频数可以很好的区分两者。

语料库语言学中我们通常用到的分析数据的单位是频率和频数。首先,频数:统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数,而频率就等于频数除以总数,其可以反映语言在社会生活中的活跃程度,隐射出人们社会心理的变化。

通过COCA数据分析可得到表一,从以上数据可以看出,worthy 和 worthwhile 在不同语体中的频率和频数都存在很大差异。从总频数上看,worthy约是 worthwhile 的2.2倍(6656/3042),从总频率上看,worthy 也约为 worthwhile 的2.2倍(71.84/32.71)。由此可以判断出:在美国英语中,worthy 比 worthwhile 更常用。尤其是在小说和报纸两种语料中,worth 和 worthwhile 这两种语料存在明显差异,在特别是在小说中,worthy 是 worthwhile 的3倍多(12.74 vs 4.06)。然而差异最不明显的是畅销杂志,worthy 仅是 worthwhile 的1.5倍。值得一提的是,除了小说和畅销杂志,其余的各种语料中,无论是从频数方面还是频率方面分析,worthy 都是worthwhile 的2倍多。我们还可以纵向分别分析worthy 和 worthwhile 这两个单词的语体特征。Worthy 在口语这种语体中出现的频数相对较少,说明其较多的在正式文体中出现,而在畅销杂志和学术期刊上出现的频数相对较多,说明了worthy 的语体使用倾向为杂志和学术期刊。Worthwhile 在学术期刊上出现的频率相对较高,畅销杂志和报纸其次,在口语和小说中相对较少,并且在各种语体中的使用频率差异颇大,说明其具有明显的语体特征。

2.worthy 和 worthwhile 在COCA中类联接方面的差异。类联接是关于句法结构和范畴的表述,搭配则是类联接在词语层面的具体体现。严格意义上的词语搭配应当是指位于同一语法结构内的词与词之间的组合。因此,类联接就是词语搭配出现于其中的语法结构和框架。一个类联接代表了一个类别的词语搭配,可称为“搭配类”。比如,N+V 就是一个类联接,它代表一类搭配,在研究中常称之为N+V搭配类。类联接和词语搭配是紧密相联的:在研究中,一个类联接的确立必须以足够的词语搭配行为为依据,词语搭配行为的研究则应在类联接的框架内进行。本文将分别从类联接和词语搭配两个方面来分析worthy 和 worthwhile 这一组词语的不同。

为了简便分析,笔者采取随机抽取的方式,各抽取了200个检索结果,对这两个词的类联接情况进行了分析。

3.Worthy 和 worthwhile 在COCA 中搭配方面的差异。COCA美国当代英语语料库查询网页上有四个基本显示区域,我们利用左边的“显示及查询条件界定区”的“COMPARE”功能,可以让使用者比较两个不同词或短语的搭配情况,当选择比较单词时显示方式区(DISPLAY)中的查询排列方式(SORT)将自动变为RELEVANCE(相关度)对结果进行排列。按相关度排列是非常有用的选项,它能给出所查询的词与哪些词的关系最为紧密,但却过滤了高频搭配的噪音词(主要指那些empty words)。使用按相关度排列功能时依据比较的信息不同而有细微差异。通常情况下,查询结果按所查询的词的互信息值的高低排列。互信息是对随机的两个词相关性的度量,要查询的词和可能性搭配词在所有语料库中的共现搭配比重决定了其互信息的值。根据上述功能,笔者打开COCA页面,在“DISPLAY”部分选择“COMPARE”,在“WORD(S)”这一列分别输入“worthy”和“worthwhile”。因为要分别分析者两个单词与名词和形容词的搭配情况,所以分别对“COLLACATES”作出名词和形容词的限制。

4.结论和启示。本文利用COCA美国当代英语语料库,对worthy 和 worthwhile 这对单词进行了辨析。得到以下结论:

(1)美国英语中,worthy 比 worthwhile 使用面更广。

(2)worthy 和 worthwhile 都具有明显的语体特征。worthy 的语体使用倾向为杂志和学术期刊,Worthwhile 在学术期刊上出现的频率相对较高。

(3)在过去的二十年中,worthy 的使用趋向呈折线,近几年呈下降趋势,而worthwhile 的使用趋势呈下降趋势。

(4)worthy 的类联接至少有八类,worthwhile 的类联接有五类。Worthy 最常见的类联接为be+worthy of something,worthwhile 最常见的类联接形式为be + worthwhile。

(5)从总体上而言,worthy 比 worthwhile 更倾向于和名词或形容词搭配,但在某些语境下两个词语可以共用。

语料库浩瀚生动的语料不仅为语言研究者提供了一个观察语言变化的平台,也能够为语言学习者提供良好的学习工具。在英语词汇的学习过程中,通过大量阅读语料库中的语料来区分意思相近的词不失为一良方,既避免了传统课堂单一讲解语法的枯燥,又可以让学生从这些地道的语料中受到母语国家语言习惯的熏陶,这对于学生跨文化意识的培养是大有裨益的。语言的学习不仅仅局限于词汇和语法各自零星的知识,更重要的是要把这些知识系统化并且能够理解其在真实语境中的涵义。

参考文献:

[1]杨惠中.语料库语言学导论[M].上海:外语教育出版社,2002.

[2]汪兴富,Mark Davies,刘国辉.美国当代英语语料库(COCA)[J].外语电化教学,2008(123):72-80.

[3]许佐萍.曾国秀.《旅游英语》网络课程的建设与研究[J].开封教育学院学报.2014.10.

猜你喜欢
语料库
《语料库翻译文体学》评介
基于语料库的“はずだ”语义用法分析
基于语料库“隐秘”的词类标注初步探究
广东蚕业(2019年3期)2019-05-14 05:37:40
把课文的优美表达存进语料库
基于COCA语料库的近义词辨析 ——以choose和select为例
口译不宜“任性”:基于语料库的外事翻译等效探索
语言与翻译(2015年3期)2015-07-18 11:11:04
基于JAVAEE的维吾尔中介语语料库开发与实现
语言与翻译(2015年4期)2015-07-18 11:07:45
基于英汉双语平行语料库的无根回译研究
外语学刊(2014年6期)2014-04-18 09:11:50
基于语料库的近义词辨析研究——以suspect和doubt为例
低碳经济英语语料库建设与应用