基于语料库HOLD的对比研究

2016-08-16 06:57孙寒忠陈泽如
关键词:本族语频数介词

孙寒忠,陈泽如

(华南师范大学 外国语言文化学院,广东 广州 510631)



基于语料库HOLD的对比研究

孙寒忠,陈泽如

(华南师范大学 外国语言文化学院,广东 广州510631)

语料库的问世为词汇研究创造了有利的条件。基于语料库的研究方法,对比分析高频词HOLD在本族语语料库和学习者语料库在频数、语义分布、搭配词等方面的差异。研究发现本族语者和中国英语学习者在产出HOLD时,其频数、语义、搭配词都呈现一定的差异。这对外语教学有一定的启示:注重词汇的深度学习,建立更多形式-意义的联系,重视搭配的习得,以产出更为自然、真实、地道的表达。

语料库;对比研究;HOLD

语料库语言学是当代语言学与计算机科学相互结合的产物。它用计算机手段对巨量的语言资源库进行高速检索、统计和展示,以揭示真实语言使用的倾向性规律及其所传递的意义、功能乃至思想意识(何安平,2012)。词汇是语言的核心(Zimmerman,1997),是理解语言和表达语言的基础(王海燕,2011)。语料库的问世为词汇研究提供了大量真实可靠的语料,通过检索语料库能清晰地呈现语言使用的规律和特征,这为词汇研究创造了有利条件。近年来,不少学者基于语料库对英语词汇进行研究。学者采取纵向的研究视角,对某个词的习得样貌进行深入的探析,以揭示出一定的习得规律(张淑静,2002;张岩,2006;王立非、张岩,2007);也有学者采取横向的对比研究视角,探讨某词项的习得差异,从而为教学和学习提供一定的参考(李晓红,2004;娄宝翠,2004;张萍、周敏,2007;钟珊辉,2009;徐芝苹、赵秀莲;2010)。目前,基于语料库探讨学习者与本族语语言使用的差异性研究得到了学术界的广泛关注,但对某一词项语义、搭配等方面的对比分析的研究还不多见。鉴于此,本文基于语料库真实自然的客观数据,比较和分析高频动词HOLD①在英语学习者语料库和英语本族语语料库中的使用情况和差异。这不仅有助于了解英语学习者和本族语者在词汇使用的异同,而且对英语词汇教学也有一定的参考价值。

一 研究方法

基于语料库,本文采用定量研究与定性分析相结合的研究方法,探讨了HOLD在英语学习者语料库和英语本族语语料库中的用法差异。学习者语料库选取中国英语学习者语料库(简称CLEC),该语料库中的语料取自于不同层次的中国学生的作文。本族语语料库选取FLOB和FORWN,组成一个混合语料库,两者分别来自于英国和美国的出版物,其特点是权威、有代表性、语料真实地道。两类语料库单词容量虽有差异,但不影响比较,因为在之后的量化比较中,所有数字均转换成百分比和标准数(梁茂成、李文中、许家金, 2010)。此外,两类语料库都能真实反应出HOLD的使用情况。

本文探讨了HOLD在学习者语料库和本族语者语料库中的用法差异,其具体研究问题展开如下:(1)HOLD在两类语料库中出现的频率是否有差异?(2)HOLD在两类语料库中的语义分布是否存在不同?(3)HOLD在两类语料库中的搭配词是否存在不同?

本文所选取的语料均来自于华南师范大学外国语言文化学院机房语料库。借助AntConc 3.4.4软件(http://www.laurenceanthony.net/software/antconc/)检索并一一统计。

二 结果与讨论

1. HOLD在本族语者和学习者语料库中的频率分布。

首先,我们对HOLD在两类语料库中的频数和频率做描述性统计,结果如表1所示。由于所选的两类语料库总词数存在差异,本族语语料库总词数(250万)远远多于学习者语料库(100万),因此在计算HOLD频数时,我们统一转换成标准频数,即每百万词中HOLD出现的次数。由表1可以看出,HOLD在学习者语料库的次数(1473/百万词)多于本族语语料库(414/百万词)。换言之,HOLD在学习者语料库中更常用。可能由于HOLD是一个高频词,且可以表达相对多的概念,在外语课堂教学中重复输入,因而导致产出增加。而本族语者词库中存在着更多HOLD的同义词,部分替代了HOLD的产出。也有可能与所选的语料库性质相关。学习者语料库中包含的主要是学生的作文,表达的概念相对简单,而本族语语料库是正式出版的语料,内容相对正式,会用更加正式的词汇来替换HOLD。

表1 HOLD在本族语者和学习者语料库中的频数分布

2.HOLD不同词性在本族语和学习者语料库中的比较。

由于HOLD可以用作不同词性,即动词和名词,接下来有必要对这两类词单独讨论,以进一步比较HOLD在两类语料库中的差异。表2结果显示,在本族语语料库中,V_HOLD②和N_HOLD③的标准频数分别为951和65,比例为14.6,在学习者语料库中这两项的频数分别为1397和61,比例为22.9。由此可以推测,在学习者语料库中,HOLD更倾向于动词(94.84%),而HOLD的名词用法在本族语中使用频率相对更大(6.27%)。

表2 HOLD动词词性和名词词性在两个语料库中的比较

注:“其他”包括HOLD是以复合词、固定词组等形式出现

3.动词HOLD在本族语和学习者语料库中的比较。

对V_HOLD的讨论主要集中在语义、介词搭配和固定搭配上。

(1)动词HOLD的语义在两类语料库中的比较。

HOLD作为一个高频词,有多种常用的意思。根据《朗文当代高级英语辞典(英英·英汉双解)》(第4版),我们选取了V_HOLD前10种意思,然后尝试对语料中所有动词HOLD逐一归类,结果如表3和表4所示。我们发现前10种意思的V_HOLD在两类语料库中的比例接近(尽管两类语料库中10种意思不尽相同),本族语语料库的比例为73.82%(702/951),学习者语料库中该比例为75.66%(1057/1397)。就词义条目而言,本族语语料库中比例大于10%的有5项,5项总比例为83.05%,而在学习者语料库中比例大于10%的只有3项,总和为90.35%。这说明学习者对动词HOLD的掌握主要集中在3个意思,即“举行”“拿,握”和“认为”,而本族语者掌握的主要意思更丰富、更多元化,还包括“任职”和“拥有”。值得注意的是,学习者和本族语者掌握的主要意思中,“举行”和“拿,握”分别都是第一和第二,这一点是共享的。不同的是,学习者掌握的“举行”意思占据了54.12%,比例远远超过本族语者(23.50%)。总体而言,在动词HOLD的常用意思中,本族语语料库更加多样。“小词活用”体现了一定的语言水平。学习者平时接触的语言材料可能比较单一,这受制于课堂教学和教材,因而产出的语义也比较单一。

表3 V_HOLD在本族语语料库中最常见的10种意义

表4V_HOLD在学习者语料库中最常见的10种意义

意义列举频数(%)2.tohaveameeting,party,electionetc.inaparticularplaceorataparticulartime572(54.12)1.tohavesomethinginyourhand,hands,orarms222(21.00)9.tohaveaparticularopinionorbelief161(15.23)4.tohaveaparticularjoborposition,especiallyanimportantone43(4.07)11.tohavethespacetocontainaparticularamountofsomething22(2.08)8.tokeepsomeonesomewhere,andnotallowthemtoleave15(1.42)3.tomakesomethingstayinaparticularposition8(0.76)10.toofficiallyownorpossessmoney,adocument,acompanyetc.8(0.76)13.tostayataparticularamount,level,orrate,ortomakesomethingdothis4(0.38)5.tohaveaparticulartitleorrecord2(0.19)1057(100)

(2)动词HOLD的搭配词在两类语料库中的比较。

“动词+介词”是一个常用的类联接结构,动词HOLD后面可以接不同的介词构成不同的动词搭配。在Antconc软件中,我们先检索出所有的动词HOLD (检索词为hold/holds/held/holding),并手工剔除部分名词hold/holds,接着凸显动词HOLD右边第一个词,整理后如表5所示。从介词的数量来看,“V_HOLD+介词”在学习者语料库中出现的频数更多,但从介词的种类来看,本族语语料库中介词搭配词更加丰富。我们又对固定搭配这类进行了整理,如表6所示,发现本族语中的HOLD搭配更加丰富多样。

表5 两类语料库中V_HOLD介词搭配词(右)分布情况

表6 动词HOLD的固定搭配在两类语料库中的分布

4.名词HOLD在本族语和学习者语料库中的比较。

对名词HOLD的讨论主要集中在动词搭配词上,构成“V+ HOLD”词组。鉴于两个语料库中名词HOLD的频数并不多,因此我们采取手工归类的方法,对其左边的动词搭配词逐一进行归类,结果如表7所示。由此可见,“V+HOLD”在本族语(11种搭配词)中搭配更加多样化。学习者语料库中,catch hold (of) 这一搭配用法频数最多,可能的原因在于 catch hold (of) 的意思刚好就是catch, 学习者在运用hold词组表示“抓住”的意思时,想当然的就会用catch,因为意义和形式刚好可以匹配。而在本族语语料库中,take hold (of) 和get hold (of) 的频数远远高于catch hold (of), 此时的take和get已经失去了原先“带走”和“得到”的意思,它们所起的作用只是表明一种行为,是词汇的虚化用法,或“小词活用”,这体现了一定的语言水平。中国学习者在这方面缺乏一定的语言输入,从而导致搭配词的输出匮乏。

表7 名词HOLD的动词搭配词(左)在两类语料库中的分布情况

体现出语言功底的另一方面可以从固定搭配的用法可以看出,表8列出了名词HOLD的一些固定用法,这类搭配的意思不能单由其字面意思推导出来,我们称之为“构式”。构式的种类在本族语语料库中更多样。

表8 名词HOLD在两类语料库中的固定搭配

三 结论与启示

本文基于语料库客观真实的数据,对比了高频词HOLD在本族语和学习者语料库中的频数、语义、搭配词等方面的差异,得到如下结论。

1.学习者产出HOLD的频率更大,这可能跟HOLD本身和语料有关。HOLD是一个常见的高频词,形式和意义形成一对多的映射关系,且本身表达的概念都相对简单,因此产出频率高。而本族语者大脑词容大,形式和意义可以形成一对多、多对一的映射关系,有部分可能取代了HOLD的产出。如表达“举行一场派对”,本族语可能会表达为throw a party。

2.HOLD在两类语料库中语义分布均不平衡,偏向某几个主要语义(比例大于10%)。本族语中HOLD的主要语义分配比例相对均衡。学习者语料库中主要语义之间比例相差较大,且主要偏向了“举行”,这跟课堂教学、教材有一定的关系,学生的语言输入也比较单一。

3.无论何种词性,本族语语料库中HOLD的搭配行为比学习者都要灵活。中国学习者在产出HOLD时,搭配词相对匮乏,尤其是固定搭配,原因主要是缺少积极主动的、地道的语言输入。

因此,在今后的学习中,更应该注重词汇深度学习,建立更多形式-意义间的联系,“小词活用”,重视搭配的习得,以产出更为真实、地道的表达。教师可以借助语料库的工具,在比较中选择性地教授词汇,有所侧重,以便学生能接触到丰富、自然的语言。

注释

①大写形式的HOLD代表其所有可能会出现的形式。

②V_HOLD表示动词词性的HOLD,形式有hold, holds, holding, held。

③N_HOLD表示名词词性的HOLD,形式有hold, holds, holding。

④词义前的数字代表的是词典中的标号,下同。通常数字越小,越靠前,词义越常用。

[1]何安平. 语料库语言学[J]. 中国外语, 2012 (5):1-1.

[2]Zimmerman C B.Historical trends in second language vocabulary instruction[A] .In Coady J & Huckin T (eds.) . Second Language Vocabulary Acquisition[C]. Cambridge:Cambridge University Press,1997:5-19.

[3]王海燕. 以Control为例浅谈基于语料库的词汇教学研究[J]. 新乡学院学报,2011,25(3):196-198.

[4]张淑静. 中国英语专业学生make的使用特点调查报告[J]. 解放军外国语学院学报, 2002, 25(4):58-63.

[5]张岩. 基于语料库的中国大学生议论文中的指示词研究[J]. 外语与外语教学, 2006(6):27-29.

[6]王立非, 张岩. 大学生英语议论文中高频动词使用的语料库研究[J]. 外语教学与研究:外国语文双月刊, 2007, 39(2):110-116.

[7]李晓红. 基于语料库的EFFECT搭配行为对比研究[J]. 外语教学,2004 (6): 21-24.

[8]娄宝翠. 英语常用词搭配使用的对比: 以 health为例 [ J ] . 外语与外语教学, 2004 ( 7): 56 -58.

[9]张萍, 周敏. "Besides":基于语料库的对比研究[J]. 外语教学理论与实践, 2007 (2):46-53.

[10]钟珊辉. 基于语料库的Seek搭配行为对比研究[J]. 外国语文:四川外语学院学报, 2009, 25(5):36-40.

[11]徐芝苹, 赵秀莲. 基于语料库的动词look的搭配和类联接对比分析[J]. 中国电力教育, 2010 (25):208-210.

[12]梁茂成,李文中,许家金. 语料库应用教程[M]. 北京:外语教学与研究出版社,2010.

Class No.:H319Document Mark:A

(责任编辑:郑英玲)

Contrastive Study on Hold Based on Corpus

Sun Hanzhong,Chen Zeru

(School of Foreign Studies, South China Normal University, Guangzhou,Guangdong 510631,China)

The advent of corpus has created favorable conditions for lexical study. Adopting a corpus-based perspective, this paper makes a comparative analysis of a highly frequent word HOLD in corpora among native speakers and language learners, in terms of frequency, meanings and collocates. Results show that there are some differences in these aspects. Pedagogical implications are discussed in light of these findings. Firstly, the depth study of vocabulary learning should be emphasized. Students are encouraged to create more form-meaning links. Secondly, collocation should be paid more attention to in order to produce more authentic, real and natural expressions.

corpus; contrastive study; HOLD

A

孙寒忠,在读硕士,华南师范大学外国语言文化学院。

1672-6758(2016)08-0085-4

H319

陈泽如,在读硕士,华南师范大学外国语言文化学院。

猜你喜欢
本族语频数介词
介词和介词短语
介词不能这样用
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
频数和频率
基于语料库的中国大陆与本族语学者英语科研论文模糊限制语比较研究——以国际期刊《纳米技术》论文为例
盗汗病治疗药物性味归经频数分析
从迁移理论看研究生英语视听说课中学生的偏误
看图填写介词
最容易发的音与最难发的音