基于BNC语料库的近义词辨析
——以produce和generate为例

2016-06-21 09:41:32何伟嘉
怀化学院学报 2016年3期
关键词:语域近义词频数

何伟嘉

(中南大学 外国语学院, 湖南 长沙 410000)



基于BNC语料库的近义词辨析
——以produce和generate为例

何伟嘉

(中南大学 外国语学院, 湖南 长沙 410000)

摘要:英语系统中存在着大量近义词,课堂上往往只教授近义词的表层意思,却脱离了实际的语境,使得学生们在看到词汇的时候可以理解,但在实际应用时,却无法恰当的选择。相对于人的主观思维,语料库中的数据显得更加客观,真实,这为近义词的深层理解,辨析,提供了一种更可靠的方式。以BNC语料库为基础,对取“产生”一意的produce与generate进行分析,在分布,频率,语义韵等方面做了比较辨析。

关键词:近义词;语料库;语义韵

一、引言

语料库语言学(corpus linguistics)是基于语言应用的实例的语言研究,由于使用了大量实际存在的真实文本作为研究对象,借由概率的统计分析这种方法来得出结论,所以语料库语言学本质上是一种实证性的学科。语料库语言学可以对自然语言进行语法和句法分析,也可以研究不同语言之间的关系或是对于相同语言,本族使用者与外来学习者的异同。由于其独特的理论体系和实证性的验证方式,近年来,语料库语言学愈发受到人们的关注,应用范围也扩大至语言分析,语言教学,词典编纂等等领域。

二、名词解释

Firth在1957年提出将搭配(collocation)作为一个语言学方面的概念来讨论,他认为,搭配即是词与词的结伴使用[1]12,后来Halliday[2]75和Sinclair[3]170又将该概念进一步发展,界定搭配是词项的线性共现。

类联接(colligation)同样由Firth于1957年提出,这里的“类”,指的是语法类别或者是词类,类联接则是词类或者语法类别之间的结合[1]12。

语义韵这一命名最初由Firth提出,后被Sinclair加以拓展将其应用范围延伸至词汇范畴。Sinclair认为,语义韵是由于那些具有相同或者相似的语义特征的词汇反复的与关键词在文本中搭配出现,从而生成的一种在语境内的特殊语义气氛[3]170。在1998年,Partington指出,语义韵应该是超越了单个词汇界限的具有隐含意义色彩的扩散[4]60。语义韵的关键词往往本身不具有褒义或者贬义,其存在语境中的感情色彩来源于与其搭配的搭配词项。

语义韵的划分方法有两类,第一类将语义韵划分为积极语义韵,消极语义韵和中性语义韵。积极语义韵的相关搭配呈现一种积极的态势,表达一种有益的,向上的气氛。而消极语义韵正好和积极语义韵相反。中性语义韵的节点词中,一部分其搭配词主要呈现中性语义,除此之外的部分节点词,其搭配词有积极倾向也有消极倾向,同时还有中性倾向,显示出复杂多样的语义特征,因为没有压倒性的积极或者消极倾向,故划分为中性语义韵。语义韵的第二类划分将其分为了四种,分别是积极语义韵,消极语义韵,中性语义韵和复杂语义韵。

三、文献综述

过去几十年间,国内已经有许多关于语义韵的研究,其中很多是以本族语语料库与英语学习者语料库为基础对词汇语义韵进行的对比研究。如王海华,王同顺的在2005年发表的“generate语义韵的对比研究”[5],卫乃兴在2006年发表的“基于语料库学生英语中的语义韵对比研究”[6]等。而另一方面,也有许多研究者把目光放在了以本族语语料库为基础的近义词词义辨析研究上。比如杨元媛在2007年发表的“基于语料库的awfully和bitterly两词用法研究”[7],和王龙吟2008年的“语义韵研究在同义词辨析中的应用”[8]等。

2010年刘丹丹在“基于语料库数据的近义词辨析——以insist和persist为例”中发现,英语本族语使用者相比较persist,更加倾向于使用insist一词,且insist具有中性语义韵,而persist有消极的语义韵[9]。2012年翟霞在“基于BNC语料库的近义词辨析——以‘each’和‘every’为例”中发现,each更多出现在口语及小说中,every则更多出现在学术文章里,every比each更加的正式,语义韵方面,两者皆为中性语义韵[10]。2013年霍艳娟在“基于BNC语料库的近义词用法对比研究——以‘event’和‘affair’为例”中指出,event比affair的总出现频数要高,这两个词汇的语体相对正式。另外作者还指出,event多为中性语义韵,而affair则既有中性语义韵也有消极语义韵[11]。

四、研究方法

本文使用KWIC的检索方式,对“produce”和“generate”两词在本族语语料库BNC中进行检索,之后对索引行进行观察,描述,分析,以对两者进行辨析。

本文所使用的BNC语料来自1960年至1993年的英语出版物,其中覆盖了小说,报纸,杂志,学术期刊,以及口语记录等领域,是具有很高代表性的单语种语料库,在线进行注册后即可免费使用。

五、基于BNC的produce与generate对比分析

1.generate与produce在不同语域的分布情况

语域,指的即是在不同的使用场合,情况下,语言所发生的各种不同的变体,该概念常常用于近义词之间的辨析。首先,先考察produce与generate在BNC预料库中不同语域内的差别。

不区分语义的情况下,在BNC语料库中分别于全语料库,口语、小说、杂志、报纸及学术期刊里分别检索这两个词的全部形式,进行分类归总,如表1。

表1 produce和generate在语料库出现的频数和频率

从频数来看,produce和generate在语料库出现的频数总和分别是30257和5365,相差十分的大,有几乎6倍,这说明相较于generate,本族语使用者更多的使用produce。而在进行调查的主要五个语域中,口语语域中produce的频数是1381,generate的频数是191,小说语域中produce的频数是1066,generate的频数是98,杂志语域produce频数是2695,generate是234,报纸语域produce频数是2640,而generate频数是259,两者频数都相差巨大,差距的倍数从7到11倍不等,只有在学术期刊语域中,虽然依旧有很大的差距,但倍数缩小到了4倍。从频率上来看,produce和generate在学术期刊内的出现频率都大大高于在其他语域出现的频率,且除了小说语域外,它们的书面语域频率都高于口语语域频率,这说明produce和generate都更加偏向书面语化,且常用于学术写作中。

2.Produce与generate语义韵对比

本文主要对作“产生”意义时的produce与generate进行分析,由于produce一词有多种意义,故在BNC语料库中以produce为节点词,前后跨距为+5/-5进行检索,在频数大于等于5,MI值大于等于3的搭配词索引行中随机抽取作“产生”意义的100行进行分析。Generate也以同样的方式提取100行索引作研究。介于篇幅,只将100行中平均提取的10行列出以作参考。

首先是produce的索引行:

(1)the Shiremoor Open with three cod for 15 lb.Newbiggin Promenade at high water produced good results,mainly cod to lug and mussel.Lyneburn cod to 10 lb...

(2)than 600 physicists taking part.Like all the four LEP detectors,L3 has produced excellent results.It has not,to Dr Ting’s disappointment,produced any...

(3)but,one hopes,not afflicted by the Hubble mirror’s distortions...and produce images good enough to make out an object the size of a paperback book.

(4)of wood,agricultural wastes and domestic refuse to produce electricity and fuels.If these products replace those derived from fossil...

(5)reproduction.In the following years,scientists discovered the biochemical codings by which cells produced proteins and exactly replicated themselves(the information’ packets’ in DNA)...

(6)to go on and try collographs.using the surface textures of everyday items they produce lively images full of expressive pattern and rhythm.The technique is detailed here...

(7)any value at all,both materials should be used in the way that will produce the best results.If,for example,you compared real,unground coffee...

(8)in the last three months of pregnancy during which period a hormone called relaxin is produced.This causes temporary softening of the ligaments in preparation for the birth.Too...

(9)Sporting performances # Sports doctors at a conference in Austria have concluded that female competitors produce better results in sport after what is daintily referred to as a’ turbulent amorous...

(10)and Brown(1977).This supply of cholesterol to the cell by LDL produces feedback inhibition of intracellular cholesterol synthesis by repression of the rate-limiting enzyme.

Produce和generate都是动词,在索引中,它们的主要类联接为V+n和BE+V+by+n。在produce抽取的索引中,搭配词result出现的次数最多,其余还有output,electricity,image,carbon,documents,dioxide,hormones,inhibition等搭配词,这些词汇并没有明显的语义倾向,单由其字面意思无法判断语义韵,于是进一步分析整个句子。通过对整个句子的观察可以看出,当produce与result搭配时,往往呈现出积极的语义韵,如produce索引例子里的(1),(2),(7),(9)等,在result的前面带有good,excellent,the best,better等表示积极意义的词汇。而当produce与electricity搭配时,有时呈现出中性的语义韵,但更多时候呈现出好的语义韵,如例(4)中,虽然但从节选部分无法看出其具体的倾向,但如果将文本拓展,会发现文章说的是对于再生能源的开发研究如果成功,则可以替代现在依赖化石燃料来发电的局面,从而减少温室气体的排放,从整体来看,例(4)的语意韵应属积极类。在与image搭配时,produce同样更多的呈现出积极的语义韵,如produce(6)中的produce lively image,拓展文本后可以发现文章讨论的是作画技巧,而从句中得知,如果灵活使用日用品的表面织构会使得画面更具表现力与韵律,produce在句中毫无疑问表现出了积极语意韵。在与dioxide,carbon搭配时,文章大多是在讨论全球的温室效应,produce也相应的多呈现出消极语义韵。总体来说,在非学术的语料中,produce较多的呈现出积极的语义韵,而在学术期刊等语料中,produce呈现出一种复杂的语义韵,有积极的,也有消极的,也有不带倾向的中性语义韵。

然后是generate的索引行:

(1)GENERATORS # The knife-fish and the mormyrids generate their electricity in columns of modified muscle cells.The output from these is...

(2)unfair competition.Meanwhile state-owned energy monopolies have come up with their own solution to generating more electricity without angering local environmentalists: moving their power stations to Eastern Europe...

(3)30 years.In the future there will be fewer farmers and farms able to generate sufficient income to survive from farm production alone.The decline in agriculture is likely...

(4)pools take around 33 percent from the pool.A Lotto-type pool here could generate big profits on a deduction of no more than four percent’.

(5)copy of every newspaper published’.City Lives may eventually generate income as material is published—a book based on the interviews.

(6)heavily dependent upon the precision of this balance since tasks which are too difficult invariably generate frustration or anxiety while those which are too easy soon lead to boredom and a...

(7)indicators demonstrates).# Relationship between demand,supply and revenue If business people generate greater demand for their products through good marketing,they can increase the supply and...

(8)fundamental factor behind the decline in profitability.The intense demand for labour which it generated both tended to depress the profit rate directly by dragging up product wages and provided...

(9)attacks from a non-Anglican monarch,and needed better legal securities.Anxiety here was generated by the fact that William was a Calvinist,hardly more attractive as head of...

(10)body means that the material of the body is being flexed,and this will generate heat.The energy for tidal heating can come from a reduction in rotational energy...

在索引中出现的最多的generate的搭配词是electricity,其次是income,之后还有heat,ideas,energy,demand,profit,revenue,profit,signal,anxiety等等。其中绝大多数搭配词单从语义上来看无法判断语义韵,必须要观察句子整体的倾向。Generate与electricity搭配时呈现积极语义韵与中性语义韵混杂的情况,如例(2)中提到“generate more electricity”,说的是把发电站移至东欧,这样就可以在不惹怒当地的环境保护主义者的情况下使得发电量增长,带有一定的积极倾向,在例(1)中,则只是描述了刀鱼和象鼻鱼的发电机制,并没有什么特别的语义倾向。在与income,profit等与金钱收入有关的词搭配时,generate基本表现出积极的语义韵,如所举例子中的(4)和(5),例(4)中提到了乐透彩票,文中说道乐透彩票即使在彩票总额中只占一小部分,依然可以带来大量的利润。而例(5)经过拓展后,说的是虽然现代英国依赖电子媒体,但城市生活最终还是会由于实体出版物而获益,这其中的“generate”应该属于积极语意韵。当与demand搭配时,generate一般表现出消极倾向,如例(8),经过扩展后会发现,这个句子说的是由于对劳工的需求紧张最终导致国家间竞争激烈。Generate与heat搭配时一般呈现中性的语义韵。由上面的观察可以发现,generate语义韵十分的复杂,三种倾向均有分布,因此判断,generate具有中性的语义韵。

六、结语

本文通过对produce和generate两词在BNC语料库中的表现进行分析,发现它们在语域的分布,出现的频率,语义韵方面都有许多异同。类连接方面,produce和generate的类联接都多为V+n和BE+V+by+n。Produce出现的总频数远高于generate,但它们两者又都更多的用于书面语多过口语,且常用于学缩写作中。语义韵方面,produce在非学术语域内总体呈现一种积极倾向,但在学术语域内呈现中性语义韵,而generate的语义韵则呈现错综复杂的情况,归类于中性语义韵。

通过语料库对近义词进行研究可以加深人们对外语近义词之间异同的认识,由于一般词典上只表明读音,词汇本身含义及少量例句,使得词典查阅者得到的帮助有限,在词汇的理解及应用上与本族语使用者存在偏差,无法更好的掌握使用的时机和场合。而教师在对学生进行词汇教学时也同样更着重词义及其用法,虽然在学习例句时可以部分感受到词汇的语意韵,但如果在教学的准备阶段就将语意韵纳入考量,无疑会让学生更直接的掌握词汇的应用。本文将produce和generate进行了使用领域及语意韵的比较,将其应用到词汇教学中,能提高老师教学的效率,减少学生们对词汇的不当使用,语料库研究的成果也将对词典编纂有所贡献。

参考文献:

[1]Firth,J.Papers in Linguistics[M].Oxford:OUP,1957.

[2]Halliday,M.A.K.System and Function in Language[M].Oxford:OUP,1976.

[3]Sinclair,J.Corpus Concordance Collocation[M].Oxford:OUP,1991.

[4]Partington,A.Patterns and Meanings-Using Corpora for English Language Research and Teaching[M].Amsterdam:John Benjamins,1998.

[5]王海华.王同顺.CAUSE语义的对比研究[J].现代外语,2005,28(3):297-307.

[6]卫乃兴.基于语料库学生英语中的语义韵对比研究[J].外语学刊,2006(5):50-54.

[7]杨元媛.基于语料库的awfully和bitterly两词用法研究[J].宁波教育学院学报,2007,9(6):56-61.

[8]王龙吟.语义韵研究在同义词辨析中的应用[J].乐山师范学院学报,2008,23(3):84-87.

[9]刘丹丹.基于语料库数据的近义词辨析——以insist和persist为例[J].湖北广播电视大学学报,2010,30(5):103-104.

[10]翟霞.基于BNC语料库的近义词辨析——以“each”和“every”为例[J].外语艺术教育研究,2012(2):36-39.

[11]霍艳娟.基于BNC语料库的近义词用法对比研究——以“event”和“affair”为例[J].长春大学学报,2013,23(10):1334-1337.

A BNC-Based Distinction of Synonyms:A Case Study of“Produce”and“Generate”

HE Wei-jia

(DepartmentofForeignLanguages,CentralSouthUniversity,Changsha,Hunan410000)

Abstract:There are large numbers of near-synonyms exist in English system,but it seems that students can not choose the appropriate one when they are talking even though they know these near-synonyms’ meaning and that’s because our near-synonym teaching is divorced from the real context.The data in corpus is more objective compared to human thoughts,it’s a more reliable way to distinguish near-synonyms.Based on BNC,this paper makes a distinction of“generate”and“produce”from the point of view of distribution,frequency and semantic prosody.

Key words:near-synonyms;corpus;semantic prosody

收稿日期:2015-12-15

作者简介:何伟嘉,1990年生,女,湖南长沙人,硕士研究生,研究方向:理论语言学。

中图分类号:H313

文献标识码:A

文章编号:1671-9743(2016)03-0104-04

猜你喜欢
语域近义词频数
怎样辨析近义词
找找近义词
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
不由分说
频数和频率
不劳而获
意义隐喻与语域的关系——基于自建英语新闻语料库的研究
盗汗病治疗药物性味归经频数分析
中医研究(2014年5期)2014-03-11 20:28:52
浅析语域的特性及教学模式探讨
科技视界(2013年23期)2013-08-15 00:54:11