基于BNC和COCA两大语料库探析动名词搭配
——以三个典型搭配为例

2022-02-18 11:32余涵彬
今天 2022年14期
关键词:语料语料库检索

余涵彬

(武汉文理学院 湖北 武汉 432200)

学习一门语言,语法和词汇犹如鸟之两翼,缺一不可,由此可看出词汇的重要性。搭配对于词汇意义的表达至关重要,词语搭配能力也是语言学习者要掌握的一项重要的语言能力[1]。词语搭配包括词汇搭配和语法搭配,前者指实词间的搭配,后者指实词和虚词或者语法结构的搭配[2]。国外学者Cowie根据语义关系将词汇搭配分为自由搭配,限制搭配,比喻成语和纯成语[3]。Hausmann根据词性将词汇搭配分为六种,即动词+名词,动词+副词,形容词+名词,副词+形容词,名词+名词,名词+动词[4]。国内学者陈传礼将词汇搭配分为七类,把第一种动词+名词又进一步划分为了两类[5]。

采用实证方法研究语言事实的语料库语言学近年来兴起[6]。所以本研究立足真实语料,以动名词搭配为切入点,具体到三个常见的短语搭配来进行实证分析。英语本族语者的言语习惯会形成相应的固定表达,致使两个及以上词项的习惯性共现,从而产生一些约定俗成的规则限制,即地道的英语表达。本文章侧重于动词+名词这类词汇搭配,并利用两大具有代表性的英美语料库来验证三个动名搭配实例,以期为英语教学提供些许有用的借鉴意义。

1.实义动词(搭配词)+名词(节点词)

在CLEC1中出现过许多常见词语搭配的错误用法,这说明许多中国学习者在表达英语的时候还是带着中式思维的方式,停留在汉语的维度,加之平时阅读积累量不够,所以未形成英语语感。比如“保全面子”和“学习知识”这两个短语,很多人会按照字面义把其拆成两个对应的单词,认为“保全”就用keep,“学习”就用learn,用同义词或近义词替代,分别直译成keep face和learn knowledge,而问题也就出现在这里,根据对BNC2和COCA3语料的检索显示,地道正确的英语表达应该是save face和gain/acquire knowledge。下面以“学习知识”这个动名搭配为例进行详细分析。

分 别 在BNC和COCA语 料 库 的 Collocates模 块 以knowledge为节点词,以动词为搭配词,设置跨距为左一,对其左一的动词进行检索,然后按照频数排名观察前三个且互信息值(Mutual Information,简称MI)大于等于3的数据来观察。因为MI值能够显示两个词之间的搭配强度,该值越大表明两个词之间的搭配强度就越大,搭配显著程度就越高。通常以3作为临界值,MI≥3表明节点词和搭配词之间的关系是显著的。

通过观察发现不管是在BNC还是在COCA里面,和名词knowledge搭配最高频的都是动词acquire,require和gain,只是二者的排序略有不同,并且MI数值都大于3,搭配关系显著,说明表达“学习知识”这一概念时最地道的英语表述应该是gain/acquire knowledge,而不是CLEC里面出现的诸如learn knowledge这样的言语失误。

2.虚化动词(搭配词)+名词(节点词)

动词里面值得一提的还有虚化类动词的误用问题,这类动词本身不表达实际具体的意义,常常需要依附于其后的名词来表达具体意义,比如“做晚饭”和“取得进步”,很多中国学习者将其分别译为do supper和get a progress,用英语中的虚化动词do和get分别对应了动词“做”和“取得”,看似完美,实则是一种误用,是对非词汇化动词的泛化使用。这种语内错误经常出现,尤其在学习者不知道如何表达时会选择用一个最熟悉常见的单词。通过英美两个语料库的鉴检索发现地道的表达应该是make/cook supper和make a progress。由此可见,虚化动词的选择也并非是任意的,虚化动词虽然可以和许多名词搭配使用,但也并非是万能通,加之与搭配词之间的理据不明显,所以易出现滥用情况。下面以“做晚饭”为例进行详细解读。

分别在BNC和COCA语料库的 Collocates模块以supper为节点词,以动词为搭配词,设置跨距为左一,对其左一的动词进行检索。因为涉及到动词,所以会有时态上的不同,但归根结底这些不同形式其实都是同一个动词。研究发现,不管是BNC还是COCA,和supper搭配频数出现最多的动词都是eat,make和cook,虽然二者在具体排名上略有区别。考虑到“做晚饭”的对应表达,我们可以用虚化动词make和实义动词cook,构成短语make supper和cook supper。

除此以外,笔者还分别在BNC和COCA的List模块里面直接输入do supper来进行检索,结果显示在BNC语料里面无相应记录,在COCA里面显示只有2条记录,分别出现在小说和电视里面,出现时间是1990-1994年以及2010-2014年期间,并且每百万词(PER MIL)中出现的频率都是0.01,从这个低频率可以看出该用法是非地道用语。

3.动词(节点词)+名词(搭配词)

在BNC的Collocates模块以动词contact为节点词,以名词为搭配词,设置跨距为右一,对其右一的搭配名词进行检索,研究发现排在前三搭配频数最高的都是表示人的一些表达,如MR(先生),POLICE(警察)和MRS(夫人)。这说明contact及物动词的用法,可以归纳为contact sb.。笔者发现如果不限制动词词性,检索出来的contact后面经常会和介词with以及between搭配出现,根据句法环境分析contact是名词词性,也就是说名词性contact后面会经常和介词with和between搭配,比如make contact with, be in contact with, lose contact with, keep in contact with等,而动词性contact后面经常直接跟名词。

搭配错误在二语学习中经常出现,导致误用的因素也多种多样,本文选取了其中三个比较典型的搭配实例来具体分析动名这一类型,很多错误搭配有时候没有违反语法规则,但却不是符合英语母语者习惯的地道英语表达。母语负迁移是导致搭配错误的一项重要原因。田绪军认为我国英语教学强调语法,在种类繁杂的词语搭配教学中也侧重语法搭配而忽视了词汇搭配,往往孤立静止地看待词项,这无疑无助于学生掌握原本规则就不明显的词汇搭配。史逢阳曾经在利用CLEC语料库分析动名搭配错误原因的过程中提出词块教学法来帮助学生提高词语搭配能力[7]。

语料是最好的教学资源,也是最权威的数据证明,可以让学习达到知其然,知其所以然的效果。语料会提供真实的语境去理解词义而非仅是词典里面给的中文解释,因为有时候中文可能无法准确描绘其词义或表达其用法,甚至会造成理解上的泛化,所以建议用英语解释英语,尽量减少歧义,避免误解。语料是真实地道的本族语体现,也是权威词典里面单词词义和用法的证据,各种词语搭配规则甚至语法结构都是在大量的真实语料基础上归纳总结出来的,有理据性和明显清晰的规则,也有一些不那么明显甚至有例外的规则,这些都是基于真实语料而非天马行空。所以让学生接触大量语料,树立搭配意识很重要。

二语习得者需要克服母语语言和文化带来的影响,减少本族语的负迁移。Wray曾言:“掌握固定表达法,包括成语、搭配、句型,对成功学习一种语言是很有帮助的”[8]。在英语词汇教学中应该注重搭配,利用大量真实语料让学生进入沉浸式教学氛围,加强词语应用,帮助学生掌握固定搭配或者词组短语,在潜移默化中培养学生对英语的语感,学会地道的表达。数据驱动学习有助于学生在探索中发现并掌握语言的结构模式。积极引导学生在学习的过程中多积累,不断丰富扩充词汇量,学会借助网络等高科技工具及时解决疑惑,实现自然地道的语言输出[9]。

注释:

1.中国学习者英语语料库(Chinese Learner English Corpus,简称CLEC)涵盖了中国高中生和大学生出现的言语失误。

2.英国国家语料库(British National Corpus,简称BNC)是收集了1980s-1993年间1亿个词汇集合的英语平衡语料库,可以免费在线使用,涵盖了地道纯正的英式英语表达。

3.美国当代英语语料库(Corpus of Contemporary American English,简称COCA)目前收录了1990-2019年共计10亿字的文本,并且还在保持更新来确保语料的时效性,是免费的英语平衡语料库,也是公认的适合观察美式英语发展变化的英语语料库。

猜你喜欢
语料语料库检索
基于归一化点向互信息的低资源平行语料过滤方法*
《语料库翻译文体学》评介
专利检索中“语义”的表现
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
Reliability assessment consideringdependent competing failure process and shifting-threshold
国际标准检索
国际标准检索