基于语料库的词语搭配对比研究:以make为例*
李国敬
(中共烟台市委党校,山东 烟台 264003)
摘要:本文以单词make为例,使用语料库方法,探讨中国学习者对常用词的掌握深度,观察学习者对该词的使用特点。研究发现,与本族语使用者的语言使用模式相比,学习者某些搭配模式存在着过度使用、使用不足以及搭配不当的问题。词汇习得中,大多数学习者重视扩大词汇量,而忽视了对于熟悉单词使用模式的掌握。语言教师应尽可能向学生提供真实语料,使他们认识到学习词汇搭配知识的重要意义,并把偏离纳入教学。
关键词:词语搭配;类联接;语料库;中介语对比分析法;偏离
收稿日期:2015-08-11
基金项目:教育部人文社科项目(10YJC740007).
作者简介:李国敬(1971-),男,山东栖霞人,中共烟台市委党校副教授.
中图分类号:H314.1
1引言
Chomsky的生成语法把研究重点放在新句的产出,致力于纯句法结构的研究,这使得传统教学过分强调语法规则的学习。这一导向的结果是有的学生词汇量很大,语法很精通,但仍不是一个熟练的目的语使用者。而实际上,语言并非象乔姆斯基所认为的是一种自由搭配,它所采用的纯句法分析法也无法对所有的英语语句作出解释。现实生活中存在着大量的已建构待用的组合,即词语的搭配。Wallace认为[1],语法和词汇是融会贯通的,不能割裂开来,单词很少单独出现,都有其固定的搭配模式。曹雁更从学术论文英文摘要语步上指出具有不同的搭配特点[2,3],因此,习得词汇的过程中,在扩大词汇量的同时,也要强调掌握单词搭配知识的重要性。
1.1 搭配的界定
五十年代,英国语言学家J. R. Firth首先使用“搭配”这一术语,他认为搭配是“具有结伴关系的词项之间的相关期待”。他提倡研究单个词项的习惯性共现,进而对相关的词义关系作出更为明晰透彻的分析。他的思想为而后的语言学家从较高的层次上研究词项搭配奠定了基础。随着语篇语言学的发展,人们开始从语篇衔接的角度去理解词项搭配。Halliday & Hasan将搭配视为实现语篇衔接的词汇手段之一[4]。与Firth所说的一般意义上的句子中同一结构内的词与词的搭配不同,他们拓宽了“搭配“这一术语所涵盖的范围,不再仅指一个词组或一个句子内部的词与词的横向组合关系,而且包括了跨句和跨段落的词项的习惯性共现。他们指出,共现词在词义上是相关的,但研究这种相关关系本身并不重要,重要的是搭配在实现其语篇衔接功能中的作用,即其组织信息和预测语篇发展的作用。
需要强调的是无论是狭义的句内同一结构中的搭配,还是广义语篇意义上的搭配都具有很大的研究价值,两者都把词项的共现作为研究重点,同时都指出搭配研究应该是词汇和语法研究的结合。本文的研究重点是中国学习者对狭义的句内搭配的掌握深度。
1.2 搭配的教学意义
在英语中,人们“face problem and interpret dreams”,而在现代希伯莱,人们“stand in front of problem and solve dreams”。正是因为各种语言在搭配的使用中存在的极大差异使之成为外语学习的一个主要难点。尽管中介语在形式上并没有违背语法规则,但它在本族语使用者听来是不自然的语言,无论学习者目的语语法学得多么透彻,如果没有词汇搭配知识来表达丰富的含义,也就很难实现有效的交流。D.Becher是最早提出应重视教学中词语搭配知识的语言学家之一,指出应系统对待这类大量出现的性质相同的词语。随着交际法教学的发展,Sinclair和Renouf同样指出学习的重点应是语言中的常用词,其主要模式以及典型搭配[5]。因此,词汇学习的重点应从形式转移到内容上,从单个词语的学习和单纯扩大词汇量集中到词语搭配上,这对外语的学习至关重要。
1.3 中介语对比分析法
中介语对比分析法[6](Contrastive Interlanguage Analysis,简称CIA)的研究目标是中介语,即学习者的语言。中介语研究不仅能在各个层面作错误分析,而且为研究其它不同于本族语的语言特点提供渠道。换句话说,中介语不仅可以分析学生的错误用法,而且可以从其正确的使用方法中获得有价值的信息。大型学习者语料库的建立以及计算机软件的不断改进使定性分析和定量分析得以完美结合,使中介语的分析方法日臻科学。通过比较目标语语料库和学习者语料库,CIA分析法一方面可以从目标语语料库中获得典型信息,另一方面系统指出了中介语在各个层面使用中的非母语特性,例如规避、简化、过度概括等等,进而发现语言学习中的主要困难,对语言教学和学习产生良好后效。
钟珊辉通过语料库方法研究了seek的搭配行为[7],尽管seek是比较正式的英语词汇,但是中国英语学习者使用较少,不具有很强的代表性。本文以中国学习者以及本族语使用非常多的常用动词make为例,通过对比两者的差异,调查中国学习者对其搭配知识的掌握程度。
2研究设计
本项研究的具体步骤如下:①确定研究对象。我们选择中国大学生对常用英语单词搭配的掌握情况为研究对象,并以单词make的使用模式为例,对其在不同语料库中的呈现模式进行对比与观察;②确定研究的数据。本项研究的数据基于两个语料库,分别是中国学习者语料库(简称CLEC)和Brown料库;③对语料库进行检索,在此基础上对研究对象进行分类、对比和讨论。
2.1 研究问题
探讨make在写作中的搭配表现,试图发现:①中国大学生使用该词是否存在一定的模式;②中国大学生对该词的使用模式与本族语的使用模式是否存在偏离;③如果存在偏离,具体表现形式又是什么;④造成偏离的原因。
2.2 研究数据
在语料库的选取上,对于中国学习者语料,一般都采用中国学习者语料库(CLEC)的大学非英语专业学习者作文子语料库。对于本族语语料,比较权威的有来自英国的英国国家语料库BNC和美国的Brown语料库,钟珊辉在研究Seek搭配行为时就采用了BNC。CLEC是我国第一个大型的学习者语料库,容词大约100万。它收集了中国不同水平的英语学习者的作文,包括三个子语料库,主要用于两个范畴的研究:①对学习者差错的分析;②集中于母语与非母语的差别的分析。鉴于学习者写作能力与英语实际水平之间的密切联系,观察和对比学习者英语写作将为英语教学提供大量可靠数据,对英语教学产生积极后效。Brown语料库产生于美国,容词量为100万,是第一个被编辑用于语言学研究的语料库,它包括500篇文章,每篇大约2000个英语单词。它取材各种文体,具有广泛代表性。
2.3 研究方法
本项研究采用的研究方法是语料库方法。语料库方法是定性研究和定量研究的结合。由于结合了现代的计算机技术,采用数据驱动的实证主义研究方法,给语言学工作者带来了一种新的理念,揭示了一种新的研究方法。不同于以往研究中采用的直觉性数据和诱导性数据,语料库语言学的数据对实际使用中的语言事实进行定性定量的描写和概括,使得相关领域的研究更具有科学性和准确性,并已广泛应用于语言学研究、辞典编篡、机器翻译、语言教学等诸多领域。这其中,包括搭配在内的词汇研究的发展成为语料库研究最具新意和富有成果的领域之一。借助语料库和计算机软件,词汇学研究不仅取得了有重要意义的发现,而且揭示了许多细微而且有趣的事实[8]。我们使用的检索分析工具是Antconc 3.2,分别在CLEC子语料库和Brown语料库中对make一词进行检索,然后使用SPSS(v19.0)统计软件进行数据分析和处理。
3研究结果与分析
韩礼德提出的及物性系统包含参预者、过程和环境三要素。其中,以动词为主的过程是最重要的因素。因此,动词及其搭配模式的学习是语言学习的重要一环。根据夸克对词语的分类标准(1998),动词分为以下三种:词汇动词、主要动词和情态动词。词汇动词是其中最常用的一类动词。在LSWE语料库(the Longman Spoken and Written English Corpus)中,每一百万单词中词汇动词出现频率在十万次以上,约占十分之一。词汇动词make是各类文体中最常用的动词之一,我们以此为例,在分析其类联接及语义韵的基础上对其搭配作对比研究。研究分为三个层面:①对该次与名词搭配的比率和模式在两个语料库中的对比研究;②对该词的语态的比率和搭配模式的对比研究;③对该词其他主要类联接的比率和模式的对比研究。
我们使用Antconc对make在两个语料库中进行检索,然后进行归纳、统计和计算,得到如下数据:
表1 make在CLEC及BROWN中的使用频率及占比
结果表明,make一词在学习者语料库中出现的频率要比在Brown高得多,说明该词在中国学习者中存在过度使用。进一步观察发现,中国学习者非常明显地倾向于使用Make + n + adj./adv.这一类联接,频率高达122次,几乎占make各种用法的三分之一。而这一用法的比率在 Brown语料库中落至19次,只占总数的12%。卡方检验结果显示,学习者与本族语使用者在该搭配的使用频率上存在显著性差异(卡方值=4.780,p值=0.036)。例如,中国学习者经常使用如下搭配:make us surprised, make me feel annoyed, make each family happy, make it beautiful。学习者过度使用该搭配的原因来自母语的负迁移。而实际上,本族语使用者会以其它更常见的形式取代这一搭配,如可以用make 后面的形容词或副词的动词形式取代make:annoy me, cheer each family member, surprise me等;或使用其被动语态,如: is making the situation much worse可表达为 the situation being made much worse。
另一显著不同是中国学习者对make一词被动语态使用不足。其被动语态在CLEC和 Brown中的比率分别为6%和21%。卡方检验同样显示,中国学习者与本族语使用者在被动语态的使用上存在显著性差异(卡方值=5.342,p值=0.015)。而且中国学习者只局限于几个固定搭配并在使用中以高频率反复出现。例如 be made of,be made in,be made up of 等。与此形成鲜明对比,在Brown 语料库中,此类搭配呈现多样化,其类联接可分为以下四类:①n + made 如,progress made in each country. ②made + to do 如,be made to prepare the speech. ③made + adj.如, be made worse ④made + prep. 如, recommendations made by the club。在学习者语料库中,没有发现上述四类搭配。
而在观察被动语态时进一步发现,与本族语使用者相比(4%),中国使用者过度使用一般过去时(28%),这与他们现在完成时和过去完成时的使用不足正好吻合,表明学习者对动词时态的掌握并不完善。
动词make与后续名词的搭配在比率上未发现明显差异,但不能仅凭这一点认为学习者已经完全掌握这一搭配形式。结果显示,中国学习者似乎仅把make在字典中的第一条含义与汉语中的“做”等同,过于概括了make的含义,而忽略它的其它语义。CLEC中的名词搭配如,make some exercises, make wine, make tea, make holes。而本族语学习者常用的表达方式却没有为学习者所掌握,例如:make a difference, make a visit, make respond, make sense, make mischief, make effort, make a deal, make guess, make choice 等。
关于make的其他类联接,语料库研究同样显示,中国学习者也存在使用不足现象。例如常见搭配make sure 在 Brown中出现十次,而在CLEC中一次也未出现。Make + n + n也是本族语使用者乐于使用的一种搭配,例如,make this goal a reality, make it the nation’s second largest manufacture, make us the largest Medicare,但在CLEC中仅有三个句子拥有此类搭配。
在各种导致偏离的原因中,语言迁移是过度使用make和逃避使用其被动语态的主要原因。但语言迁移本身并不能解释所有的中介语特性。学习者的过度概括,语言发展顺序,以及文化干预都可能成为语言偏离的因素。而就迁移本身而言,语言迁移也不是唯一因素。 L.Selinker认为,除了语言迁移之外,教学迁移、交际迁移及策略迁移都是中介语的基本特点[9]。比如,策略迁移会致使学习者过分关注词汇量的扩大,有意规避、概括、简化某些常用模式及搭配同样导致语言习得失败。
4 结论与启示
根据以上分析,本项研究得出以下结论:①中国学习者过度使用make + n + adj./adv.模式。②中国学习者对被动语态形式使用不足。③中国学习者在使用make名词的搭配时存在问题。总的来说,中国学习者没有完全掌握make及其各种搭配。
鉴于以上问题,语言教师应当为学生提供大量真实的而不是主观推断出的语料。教师作为主要的语言提供者,是给学生创造语言环境的主导因素,因此提高教师运用语言和加强师资培训至关重要。其次,词汇教学过程中,教师在试图让学生扩大词汇量的同时,要强调真正掌握已知词汇和常用词汇搭配模式的重要性;教师还应教授学生一定的学习策略,定期进行词汇测试,让学生意识到单单知道一个词的发音、拼写和意义并不意味着掌握了这个词,要训练他们对词语搭配模式的敏感度。
遵照典型性思想,教科书和词典都应首先考虑最典型的信息,在典型的基础上纳入偏离则更为教师和学生提供了难得的参考信息,对提高产出能力(production needs)有莫大的价值。
本研究的主要不足之处在于所选对比语料的局限性。Brown语料库是本族语语料库,语料由美国的报刊文章构成,选材具有相对的广泛性,文章主题可能涉及社会生活的各个方面,因而词汇的搭配模式会更加广泛。如表1中所示的Brown语料库中,make除了文中所述三种搭配之外,其它的搭配方式占比达63%,超过半数;而CLEC是学习者语料库,他们的阅历和视野相对而言也有一定的局限性,对一种学习到的语法或惯用法熟悉之后就更倾向于这种表达,进而产生过度使用的问题,而其它表达方式则较为少见,这些也是造成两个语料库词汇搭配模式差别的一个因素。如表1中CLEC语料库检索结果所示,其它(Others)多样化的搭配法则只占30%。尽管如此,这项基于语料库的中国学生词语搭配模式研究仍会对未来词汇学习和教学提供有价值的信息和启示。
参考文献:
[1]Wallace.M.J.Teaching Vocabulary[M]. London: Heinemann Educational Books Ltd, 1982:104-125.
摘要[2]曹雁,牟爱鹏.科技期刊英文学术词汇的语步特点研究[J].外语学刊,2011(3): 46-49.
摘要[3]曹雁,肖忠华.从语篇交际功能看科技期刊英文存在的问题——基于语料库的对比与分析[J].编辑学报,2015(2):130-133.
[4]Halliday.M.A.K.An introduction to functional grammar[M].Beijing: Foreign Language Teaching and Research Press, 1976:330-334.
[5]Sinclair.J.&A.Renouf. A lexical syllabus forlanguage learning[C]/R. Carter & M. McCarthy, Vocabulary and Language Teaching. London:Longman, 1988:234-256.
[6]俞燕明.中介语对比分析法及其对词汇教学的启示[J].国外外语教学,2004(3):30-35.
[7]钟珊辉.基于语料库的Seek搭配行为对比研究[J].外国语文,2009(10):36-40.
[8]Kennedy.G.Amplifier collocations in theBritish National Corpus: Implications forEnglish language teaching[J].TESOL Quarterly, 2003(3):467-487.
[9]Selinker.L.Interlanguage[J].International Review of Applied Linguistics, 1972,10 (3):209-231.
(责任编辑李沛茜)