中国英语学习者英语词块使用情况纵向研究
——基于语料库的实证研究

2011-11-02 09:54柯应根
关键词:词块二语语料

董 艳,柯应根

(巢湖学院 a.外语系;b.大外部,安徽 巢湖 238000)

中国英语学习者英语词块使用情况纵向研究
——基于语料库的实证研究

董 艳a,柯应根b

(巢湖学院 a.外语系;b.大外部,安徽 巢湖 238000)

从准确性、多样性和使用频率三个维度考察中国英语学习者大学四年来词块使用情况的变化,并比较了不同类型词块,其发展路线的异同。结果显示:中国英语专业学生经过四年大学学习,其笔语词块的运用呈现出整体向上的趋势。但不同类别词块在准确率、多样化和使用频率不同层面变化模式互不相同,各有特点。

词块;中国英语学习者;语料库;二语习得

一、引言——困惑与思考

在日常生活和教学中,笔者发现学龄前儿童在学习汉字的时候,往往会识得儿歌中的词语,却认不出其中的每个字,会说几句英语日常用语,但却不懂得其中包含的单词的含义。这有悖于传统的由字母到单词,单词到短语再到句子的语言学习思想,似乎不合常理。同时,中国英语学习者花费在英语上的时间不可谓不多,精力不可谓不大,但是在流利性和地道性上却难以收获对等的绩效,这也有违中国人一向秉承的“一份耕耘,一份收获”的信念。“词块”概念的提出和词块理念的传播给上述现象提供了合理性解答,这也是笔者此项研究的最初动力和缘由。

二、文献回顾

国外对“词块”或类似词块的概念的提出和现象的研究可追溯到20世纪70年代中期,Becker和Bolinger率先指出了英语中类似“预制板块”的多词词汇现象,提出了“词块”(prefabricated chunks)的概念;而Sinclair明确提出了“词汇大纲”(lexical syllabus)的概念,认为任何英语学习者的学习重点都应当是:语言中最常用的词形;这些词形的核心用法形式;由这些词形构成的典型词语组合[1]。Lewis指出,语言知识的获得和交际能力的提高是通过扩大学生的词汇块、搭配能力和有效掌握最基本词汇和语言结构而实现的,由此,他提出了词汇法教学 (lexical approach),即帮助学生通过有效地整体使用预制语块而无需理解其组成部分,实现流利表达[2]。国外学习者二语预制语块习得和加工的研究取得一些进展,但仍处于初级阶段。当前的研究主要集中在3个问题上:a)二语预制语块发展的过程;b)不同二语学习者语块习得的差异;c)二语预制语块的教学。[3]

国内有关二语习得过程中词块知识习得和运用的研究也刚刚起步,基本发端于本世纪,而大多数的研究是对国外词块理论的梳理和肯定,以及在国内二语教学中的提倡,实证研究较少。(罗凤文等2002;丁言仁和戚焱 2005;石本俊 2007;周超英 2008);其中,词块使用的纵向研究更不多见,而研究中也基本不包括句子层面的词块。 针对以上研究背景,笔者基于中国英语专业大学生笔语语料库SWECCL(南京大学建设),探讨英语专业大学生笔语中词块的使用特点及发展规律。

三、研究问题

本研究主要试图回答两大问题:

1.中国学生笔语中词块使用在大学四年中是如何变化的(准确率、多样化和频率)?

2.不同类型的词块发展变化的规律和特点如何(准确率、多样化和频率)?

四、研究设计

1.语料库和语料的选取

本研究中使用的语料选自南京大学文秋芳等建设的中国英语专业大学生口笔语语料库SWECCL的笔语部分。SWECCL语料库的设计总规模为200万词,所有的语料收集自南京大学英语专业的学生。本研究从笔语语料库的发展语料中抽取120篇是一到四年级学生的笔语语料,每个年级各30篇做具体分析。

2.词块的界定和分类

由于涵盖范围及研究侧重点的不同,对词块的定义各有不同,本研究关注的是学习者在语言输出中是否将其视为一个词块,是否整体记忆、保留和提取,因此采用Wray的定义“一串预制的连贯或不连贯的词或其它意义单位,它整体存储在记忆中,使用时直接提取,无需语法生成和分析”。[4]由于对词块定义和名称的表述不一,给词块的分类也造成了一定的困难。研究者从不同角度对词块进行了众多分类,其中有些过于繁琐,有些很局限,操作性不强,而Lewis和 Nattinger& DeCarrico[5]的分类相对比之下简洁实用,更易操作。本研究根据学习者心理词库特点,揉合了两种分类并做修改,做出以下分类:Polywords:固定多词 (不可替换,词义模糊)Collocations:搭配组合词Institutionalized utterances:惯用话语Sentence frames and heads:句子框架(包括句子层面或篇章层面的衔接词如:firstly---secondly---last but not least)

3.数据收集和分析

(1)将文本文件转换为word文档以便于后期标注与操作;

(2)对语料中所有词块做人工标注,以若干本权威字典为依据,依据上述定义和分类进行认定和正误判断;

(3)对所有词块进行分类;

(4)收集待分析的数据,即每篇语料中各类词块的数量,形符、类符,错误词块数;

?

(5)数据分析,首先通过excel工具,将上述数据进行计算,得出实验对象词块使用的频率,准确性和多样性,variance、accuracy和每一种词块的使用 variance和 accuracy,frequency,计算方式为

准确率=每篇文章正确使用词块的类符/每篇文章使用词块的总量

多样性=每篇文章的形符/每篇文章使用词块的总量

使用频率=每篇文章使用词块的总量

将结果输入SPSS软件(15.0),并使用其中的Wilcoxon工具进行统计汇报平均数、方差、平均数差和P值,看学生词块使用总体情况四年来的变化及各类词块四年来的变化。

五、结果和讨论

(一)词块使用四年来总的发展情况

1.词块准确率发展情况

如表1所示,中国英语学习者词块使用准确率从大一到大二迅速提高,第三年继续增长并达到最高值,第四年有所下降,但仍然高于一年级的准确率。学习者词块使用准确率呈现升——升——降的趋势。表1为Wilcoxon统计结果,显示一年级到二年级,三年级到四年级的P值分别为0.012 和 0.014( <0.05),有显著差异。

?

2.词块多样性发展情况

词块多样性的发展和正确率十分相似,同是升——升——降的趋势,一年级到二年级增长最为显著,并持续增长到三年级达到顶峰,而后开始下跌。Wilcoxon统计(见表2)显示一年级到二年级的P值为0 .037(<0.05),有显著差异。

?

3.词块使用频率发展情况

词块使用频率四年来的变化和其它两个指标不同,在前三年里,学习者作文里的词块数量相差无几,但在最后一年,词块使用数量飞速提高,Wilcoxon统计 (见表 3)P值为 0.012( <0.05),差异显著。

?

4.原因讨论与分析

中国学习者英语词块使用情况四年来的变化可能的原因如下:首先,前三年准确率和多样性的近线性发展可归因为学习者二语能力的发展。英语专业学生入学后接触各类词块的机会大大增多,方式多样。因此,写作中词块能力的某种提高是合理的。准确率和多样性的提高可以看作是语言进展的两个标志。虽然在前三年词块使用的数量变化不大,但准确率和多样性进展显著,并在第三年达到最高值,可能的原因是学生侧重准确率和多样性,而在数量上不够关注的折衷效应(trade-off effect)。其次,三年级到四年级,学习者的词块数量急剧上升,可能的情况是学习者在前三年在准确率和多样性上投入较多,并得到了很大的进展,这样在最后一年他们有足够的精力来扩充词块的数量。而词块数量的急速增长也可能是准确率和多样性在最后一年有所下降的原因。根据计算公式,数量是分母,分子不变,分母越大,得数越小。另外,其它一些内在和外在因素也可能导致了四年级的变化趋势,如:学习者的态度和课程设置等。一方面,大四学生可能觉得话题过于简单而不愿花费气力,或者他们忙于找寻工作无暇顾及该任务。另一方面,课程设置也很有可能是导致四年级词块准确率和多样性的下降的原因。我国英语专业听说读写等技能课通常开设在低年级,高年级通常减少或免除了这些旨在提高语言能力的课程,这样的教学安排可能会导致上述词块能力在四年级的下降。

(二)不同类型词块使用四年来发展情况比较

1.不同类型词块准确率变化比较

从以上数据中可以看到一个有趣的现象,四类词块无一例外的以升——升——降的模式发展变化,一年级到三年级准确率呈线性上升,最高值都在三年级,第四年准确率下降较多,但都比一年级时有所上升。也就是说,尽管有所反复,四年级学生的使用各类词块的准确率都要高于一年级学生。数字显示,四类词块的准确率发展大致相同,三年级最佳。因此,可以推断,三年级和二年级是词块学习的黄金期。而三年级升到四年级,学习者会遭遇词块学习的高原期,词块能力踟躇不前。二语习得的高原现象不仅在本研究中得到验证,也在其他研究者的研究中多次反映[6]。另外,诸多研究证明,随着学习者二语水平的提高,学习者的某种语言能力也会得到相应提高。本研究中这种能力表现为词块使用能力。 另外一个值得关注的现象是第二类词块也就是搭配组合词的准确率无论哪一年都是四类词块中最低的。这是因为,跟其它类别词块不同,搭配一直是被学习者所忽视的。而且搭配组合词既有灵活性,又有一定的搭配限制,其迷惑性给中国英语学习者带来了困难。因此,笔者建议学习者要更多关注这个层面的学习。

2.不同类型词块多样性变化比较

数据分析结果显示第三类词块也就是惯用话语的多样性最高,也就是说中国英语学习者在作文中使用惯用话语的重复率最低。原因很简单,惯用话语包括谚语、格言、社交套话以及所有使用者作为整体存储和使用词块。这些词块可能是完整的句子,可无需更改直接使用,具有确定的语用意义;也可能是句头,需添加其它词条使其完整。这类词块的特点决定了在一篇约三百五十字的短文里,重复的可能性较小。

就多样性发展路线而言,第一类词块即固定多词四年内的进展颇少,甚至有些许的退步。这符合语言学习中某些语言结构习得不受时间和包括教学干预在内的外在环境影响而“石化”的现象。造成这种石化可能还有一种原因,中国英语学习者从中学起就非常关注包括成语在内的这类词块,大学期间已经没有太多提升的空间。第三类搭配组合词多样性的发展模式升——升——降为本研究中最为普遍的模式,前面已经解释,不再赘述。

第四类词块句子框架的多样性从一年级到二年级发展较快,三年级有些许下降,但四年级又较快回升并达到最高值。由于这类词块涉及到句子的框架和结构,甚至包括篇章结构,对于初学者来说,比较困难,因此一年级的多样性较低。而随着学习者语言水平的提升,该类词块的多样性也得到了相应发展。三年级是其高原期,越过高原期,四年级的多样性得到了最大提高,这说明了四年级学生能够用更多不同的词块来组织句子和篇章。

3.不同类型词块使用率变化比较

不同类别词块的使用频率差异较大。其中二类词块(搭配组合词)相比之下使用频率最高,并且在第四年大大提高。 第一类词块(固定多词)使用频率次之,但也远低于二类词块的使用频率。中国学习者使用三、四类词块的数量最低。

二类词块使用频率呈线性发展,即升——升——升的模式。其它类别词块使用频率四年内变化不大,究其原因,可能是词块能力不同方面的“折衷效应”。学习者在线注意力资源有限,对词块使用某个维度的重视会以牺牲另一个维度为代价。

正如Lewis所指出的,搭配是“某些单词在自然文本中以大于随机的频率共同出现”(the readily observable phenomenons where by certain words co-occur in natural text with greater than random frequency)[7]。跟其它类别词块不同,搭配组合词可以也应该在写作中广泛使用来表达必要的思想。这也是为什么它的使用频率最高的原因。而且,几年的积累,四年级学生掌握了更多搭配,这也验证了词块能力和语言发展的同步。

总而言之,不同类别的词块由于其特性不同,发展也不尽相同。也就是说,在准确率、多样性和使用频率三个指标上,不同类别词块的发展模式并不一定相同,它们各有其最佳时期和起伏。这给词块教学提供了指导和启示。

六、结论与启示

本研究以若干本权威字典为依据,对学生语料中的词块进行手工标注、辨误、分类和计算,并将取得的数据输入SPSS统计软件进行分析。根据分析结果,本研究得出如下结果:中国英语专业学生经过四年大学学习,其笔语词块的运用呈现出整体向上的趋势。其准确率和多样性上呈升——升——降路线发展,而使用频率呈降——升——升路线发展。总得来说,词块习得的黄金期在二、三年级,特别是三年级,这也验证了其它研究(文秋芳 2006)关于“学习黄金期”[8]的假设。与此同时,不同种类的词块,在准确率、多样化和使用频率不同层面变化模式互不相同,各有特点;在词块学习和应用的发展过程中,学习者群体的进步、停滞,甚至退步表现不一,没有统一的规律,在教学中要充分认识到这种差异性,提高学习者的词块意识,根据学习内容的特点,因材施教,从而达到最好的学习效果。

本研究对词块研究的主要贡献在于:1)为先前有关词块的较为丰富的理论研究提供了必要的实证性证据;2)对中国英语学习者的词块能力进行了调查,揭示了词块能力和学习者语言水平的关系;3)对词块进行了尝试性的划分,涵盖了句子层面的词块,并研究了不同类型词块的发展规律。同时,本文所采用的研究方法也可用于英语中其它语言现象的研究以及其它语种的类似研究。

此外,由于受到样本规模、语料库类型等因素的影响,本研究结论的可推广性受到了一定程度的限制,还需要有更大样本、多种类型语料对本研究的结果加以补充和验证,应用语料库对词块的实证研究还有待加深和完善。本研究为结果导向而非过程导向,建议在今后的研究中将二者结合起来,提高研究的信度。

最后笔者呼吁,我们不仅要在今后的教学中渗透词块理论,同时也可以在原有大纲词表的基础上,尝试利用语料库等工具创建“词块表”,使词块“登堂入室”,正式列入学习者学习的对象,将词块理论落入实处,从而提高学习者英语使用的地道性和流利性,这也是对本篇之初所提困惑之尝试性解答,有待商榷。

[1]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.

[2]Lewis,M.The Lexical Approach[M] .Hove:Teacher Training Publications,1993:9 - 21.

[3]王立非,张大凤.国外二语预制语块习得研究的方法进展与启示[J].外语与外语教学,2006(5):17.

[4]Wray,A.Formulaic Language and the Lexicon[M].Cambridge:Cambridge University Press,2002:9.

[5]Nattinger & DeCarrico.Lexical Phrases and Language Teaching[M].Oxford:Oxford University Press,1992.

[6]文秋芳.英语专业学生口语词汇变化的趋势与特点[J].外语教学与研究,2006(5):193-194.

[7]Lewis, M.The Lexical Approach[M] .Hove:Teacher Training Publications,1993:9 - 21.

[8]文秋芳.英语专业学生口语词汇变化的趋势与特点[J].外语教学与研究,2006(5):193.

H314.2

A

2095-0683(2011)02-0144-04

2011-03-18

安徽省教育厅人文社会科学研究计划项目“基于语料库的词块研究与‘词块表’创建”(2008 sk371);巢湖学院教研课题“词块理念在英语教学中的应用”(JYXM2009-06)

董艳(1977-),女,安徽无为人,巢湖学院外语系讲师,硕士;柯应根(1973-),男,安徽巢湖人,巢湖学院体育系讲师,硕士。

责任编校秋晨

猜你喜欢
词块二语语料
高中英语词块教学现状调查研究及应用策略分析
“透视”第二语言习得心理过程*——关于二语加工的一次学术访谈
当代二语习得研究中介语对比分析方法理论与实践
基于语料调查的“连……都(也)……”出现的语义背景分析
词块中心教学法在高职英语教学中的应用初探
《教学二语习得简介》述评
华语电影作为真实语料在翻译教学中的应用
词块在初中英语写作教学中的应用研究
二语习得中母语正迁移的作用分析
《苗防备览》中的湘西语料