赵晓平 王巧宁
(西安理工大学,陕西西安)
外语学习者在写作中面临的一个主要问题是词汇的贫乏或语法使用的不准确。这也是中国的英语学习者作文中普遍存在的问题,在一定程度上妨碍了他们产出高质量的作文。Yoon(2008:45)认为,正确掌握词汇和准确使用语法能够“增加学习者的自信并有可能提高他们的整体写作质量。”然而,就多年的写作教学实践看,给学习者直接提供准确的语言形式并未有效地减少他们写作中所犯的语言或语法错误,反而导致学习者懒惰和缺乏主动性,不利于其写作能力的发展。因此,对外语学习者和老师而言最有效的方法可能是“促使学习者自己去发现正确的语言形式”(Corder,1981:11)。
Johns(1991)提出的数据驱动式学习一直被认为是解决这一问题的有效途径,因为该学习方法基于语料库的使用,提倡归纳式、发现式为导向的学习。首先,语料库为学习者提供了足量真实的语言输入;其次,学习者可以使用语料库检索到高频使用的语法化的词汇(Flowerdew,2015);并且,学习者通过观察和分析检索到的语料,归纳检索词的使用规则,进行自主探索式的学习。所以从理论上说,语料库对外语学习者而言是一种有用的参考工具,帮助他们写出更地道、更准确的作文。实际上,在过去十多年里,许多二语/外语研究者把语料库融入写作课堂,他们的研究证明了基于语料库的数据驱动式学习是一种可行的方式,它能够帮助学习者习得语法化的词汇,从而提高他们的写作质量(Coxhead&Byrd,2007;Tribble,2009;Flowerdew,2010)。
然而,在英语作为外语的中国,有关如何把语料库融入到写作从而帮助学习者提高他们的写作质量的实证研究非常少。究其原因,主要有三点:首先,语料库作为检索工具不易为学习者掌握(Kosem,2008),或者检索到的语料文本不易被学习者理解(Kennedy&Miceli,2010);其次,许多英语老师缺乏对语料库的认识和培训,老师自身需要花大量时间了解语料库的使用;最后学生习惯于以老师为中心的教学方式,习惯于基于老师的纠错反馈修改作文。为了解决这些问题,选择合适的语料库与充分的语料库培训非常必要。本研究首先回顾了语料库应用到二语/外语写作课堂的相关研究与使用语料库所要考虑的问题,然后设计和讨论了实证研究,旨在探讨语料库应用到大学本科基础英语写作课堂对学习者写作能力发展过程带来的影响。
语料库应用于二语/外语写作的相当一部分研究着重于语料库检索对写作中改错的影响。在这些研究中,学习者经过一段时间的语料库检索培训后首先完成研究者布置的写作任务,然后通过查询语料库对作文中的错误进行修改,错误来自研究者的纠错反馈或者学习者自己的发现。例如,Chambers和O’Sullivan(2004)与O’Sullivan和Chambers(2006)的两次研究关注基于语料库的数据驱动式学习对不同类型错误的修改产生的效果,结果表明该方法在强化学习者对语法化词汇用法的意识和提高改错的准确率方面有着明显的优势。Gilmore(2009)利用BNC和COBUILD语料库来帮助日本学生修正英文写作中的语法错误,结果表明,修改后61.14%的学生的语言准确性得到了提高。
同时,由于词汇学习和写作是相互关联的两个领域,所以有必要在此回顾一下使用语料库对词汇学习影响的实证研究。Stevens(1991)最早研究学习者进行查询书面语料活动对词汇学习的影响。在他的研究中,一组大学生被指导做填空练习,填空材料是一个单句或者是一组索引行。学生在这两组练习中的表现表明他们在后一组练习中更成功地从记忆中提取词汇。Cobb(1997)进一步扩展了这一研究。他对比了在线词汇索引练习与传统词汇练习对词汇习得的影响,一个学期中每周的词汇测验结果表明前者更有效地帮助学习者习得词汇。Boulton(2008,2010)基于书面语料库的索引材料,检验和讨论了数据驱动学习对低水平英语学习者词汇习得的影响。两次研究结果都表明基于语料库的词汇索引练习比传统词汇练习更有助于词汇学习。以上研究揭示了把语料库应用到二语/外语写作可以提高学习者对语法化词汇的意识,应用到词汇学习则可以有助于学习者习得词汇,从而提高他们写作中词汇使用的准确性。
其次,许多研究者都强调在学习者成功使用语料库之前需要对他们进行语料库培训。比如,Granath(2009)发现高水平的学习者更能从数据驱动学习方法中受益,但是经过充分的培训,低水平学习者也能像高水平的学习者一样从语料库中受益,由此,他得出结论:为了帮助学习者掌握语料库使用技巧,教师需要付出很大的努力,同时培训需要花大量时间。Chang和Sun(2009)在他们的研究中发现在有老师引导的培训后学生在改错任务中表现得更好。Kennedy和 Miceli(2010)则强调了语料库培训过程的复杂性并研究了学习者语料库使用发展的过程。为了了解语料库使用的过程并最终找出有效培训的方法,他们把语料库使用过程分为四个步骤,即列出查询词、找到检索方法、解读检索结果、得出结论。他们认为,解读检索词所在的拓展文本对于学习者而言是最难的,也是导致语料库使用时出现问题的主要原因。据此,他们强调正规的语料库培训需要花费大量的时间和努力。Vannestal和Lindquist(2007)也提到学生在独立使用语料库之前有必要花费大量的时间进行反复的操作练习。
最后,语料库的类型和大小可能会决定数据驱动式学习的效果。语料库在学术英语写作中使用的研究表明研究者越来越多地对专业性的语料库感兴趣,因为这些语料库与学习者写作的题材和领域高度相关,更直接地适应了学习者的写作需求(Lee&Swales,2006;Kennedy&Miceli,2010)。然而,这些专业性的语料库由于一些实际的因素并没有在二语/外语研究或者课堂实践中广泛应用(Yoon,2008;Park,2010;Charles,2014)。首先,许多专业性的语料库是针对个别学术英语课程或者研究项目编写的,本身没有被专业以外的学习者所使用;其次,大型语料库的编写耗时并需要丰富的知识和高超的技巧。所以,现成的一般性语料库如英语国家语料库(BNC)、柯林斯COUBUILD语料库经常被应用在不少研究中(比如,Yoon和Hirvela,2004;Yoon,2008;Gilmore,2009)。实际上,随着互联网的高速发展,出现了更多对使用者界面友好并且操作起来方便的语料库如美国当代语料库(COCA),它为普通的学生和老师提供了更好的选择。
以上的分析首先表明语料库无论是对于学习者的词汇习得还是写作修改都是一种有益的研究或参考工具。考虑到在中国大学基础英语教学写作依附于阅读课程的这一实际情况,本研究拟把语料库应用到阅读中词汇学习部分和写作修改部分来探索该方法对学生写作发展情况的影响。其次,许多研究都是局限于一次性、限时的改错任务,而且只有语料库作为学习者唯一的参考工具。结合上述分析中语料库培训中出现的问题,本研究把语料库培训融于课堂教学,进行历时一学年的研究,把在线双语词典与COCA结合起来进行语料库培训,并且研究中学生完成的写作任务不是为研究目的专门设计的,而是实际教学中布置的一系列写作作业。
本研究设计了如何把语料库融入大学基础英语写作课堂,主要解决以下问题:
基于COCA的数据驱动式学习方法对学生的写作质量有没有产生显著的影响?
基于COCA的数据驱动式学习方法与传统的学习方法相比,哪种更有助于促进学生的写作发展?
受试为某高校大一非英语专业两个平行班的学生,来自不同的理工科专业,平均年龄18岁,有至少6年的英语学习经历。最先参与实验的学生共有116名,其中有15名学生因为没能准时完成布置的写作作业而被剔除,最终参与实验的人数101名,两个班分别是49和52人。参照入学英语分级考试的成绩,所有的受试都是中低水平的学习者,并且两个班的英语分级测试相近,测试结果没有显著性差异(F=.145,p=.532)。笔者随机选取一个班为实验组(49人),另外一班为对照组(52人)。两班由笔者任教并使用相同教材,教学方法相当。所有的受试被告知他们要准时完成所布置的写作和修改作业,这些表现将被记为平时成绩的考核。
3.3.1 写作测试
本研究在前测与后测中采用同样的作文题目,即手机对生活带来的影响。限时30分钟,字数不限。
3.3.2 COCA
COCA是由美国Brigham Young University的Mark Davies教授开发的高达5.2亿词汇的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。它有三大优势:第一,它具备了一个好语料库的三项最基本条件∶规模、速度以及词性标注,并且每年都增加约2000万词的新语料;第二,它已收集过去20年(从1990年起)美国境内多个领域的语料,涵盖美国的口语、小说、流行杂志、报纸和学术期刊五大类型的语料;第三,用户可以免费注册使用。
3.3.3 双语词典
本研究中使用的中英双语词典为有道词典与金山词霸。首先,它们是两款基于搜索引擎技术的全能免费语言词典软件,都收录了完整的柯林斯高级英汉双解词典,词库大而全,查词快且准;其次,它们都有手机版与桌面版,有自动取词和划词功能,方便用户使用。
3.3.4 句酷批改网
句酷批改网是由北京词网科技有限公司开发的基于语料库和云计算技术自动在线批改作文系统,通过测算学生作文与语料库建模作文的“距离”远近来给样本给作文综合打分。本研究使用它的主要原因有三个:一是它给出的分数和人工分一致率可以达92.03%(张金福,2012);二是它逐句点评,指出作文每个句子中的拼写、搭配、用词等错误,并给出修改意见,学生可以在线多稿修改;三是它自动计算出了每篇作文的长度,类符形符比,提供了衡量写作流利度和词汇复杂度的数据。
实验从2015年9月开始到2016年6月结束,历时一个学年。实验过程分成三个阶段:实验前准备阶段、实验阶段和实验后阶段。
在实验前准备阶段,即在学期第二周,笔者首先就作文格式如标点符号和空格的使用对学生做简单说明,因为这些问题会影响计算机对作文的统计分析,导致统计数据不准确或统计错误;之后,分别对实验班和对比班进行前测;在接下来的三周,笔者利用课堂时间,分三次(每次2小时)对实验班进行了语料库知识的培训。培训材料参照汪兴富(2008)列出的两个关于COCA检索功能的表格,结合笔者使用COCA的亲身经历,提前制定。培训材料主要包含:COCA主界面不同区域功能介绍、单词/短语/句型的检索、词性(POS)标签的使用、同义词检索、近义词比较、词的搭配检索。每一个检索功能的讲解都由笔者用实例操作,用投影仪向学生展示,学生同步用自己的手机、笔记本或ipad当堂练习。
实验阶段分为两个小阶段。第一个阶段为第一学期的6到15周,在老师指导下,学生利用COCA进行修改作文的练习。第二个阶段在第二学期的2到15周,在没有老师的指导下,学生课下利用COCA进行修改作文的练习。每个阶段都分为两部分:词汇学习和作文修改。具体操作流程为:用COCA查询学习《新视野大学英语读写课程》(1、2册)课文A重点单词→课后完成与单元话题相关的作文(要求使用所学的重点单词)→提交到批改网→老师讲解重点语言错误(参照批改网提供的错误分布)→老师课堂示范用COCA改错,学生课后使用COCA修改剩余错误(参照批改网的错误报告)→学生把修改稿发给老师存档(修改的错误要求做出标注)。需要说明的是,老师课堂示范用COCA修改作文这一步骤在第二学期取消。此外,学生在理解中心词所在的索引行或拓展文本遇到生词时,要求他们利用在线双语词典帮助理解。对于对照组,教学进程和要求同实验组一样;不同的是,采用传统的方法来进行词汇学习和改错,不引入语料库辅助的方法。两个组在第一学期完成4篇作文,第二学期完成6篇。
实验后阶段在第二学期的最后一周进行,对两个组进行了后测,题目同前测作文相同。
本实验属于定量研究。为了回答两个研究问题,对在前测与后测中收集的学生作文从流利度、准确度和复杂度三个变量进行了对比。首先,流利度通过计算作文的平均字数来衡量(Storch,2005),数据从批改网上学生作文的体验报告中获取。其次,准确度通过计算无错T单元和T单元数量之比(EFT/T)以及错误率(错误总数/文章长度*100,简称E/W*100)来衡量。一个T单元被Larsen-Freeman(2006)定义为“一个带有从属句和修饰成分的最小终止单位或者独立句”。参照这一定义,笔者与课题组成员把学生作文中的T单元做出标注,统计了无错T单元和所有T单元数量。错误总数由批改网自动计算出,然后人工剔除了拼写错误。最后,复杂度通过计算词汇复杂性和语法复杂性衡量。词汇复杂性取决于类符形符(Larsen-Freeman,2006),相关数据也从批改网提供的维度概述中获取。语法复杂性通过计算每T单元中平均从句数量来衡量。笔者与课题组成员对学生作文中所有从句做出标注并统计其数量。
为了检验COCA辅助的学习方法对实验组学生写作质量产生的影响,运用了SPSS17.0对从实验组作文中获取的数据进行配对样本T检验,结果如表1所示。统计结果显示,在写作的流利性和准确性方面,学生在前测中的作文与在后测中的作文有着显著差异。平均字数增加了31,p值为.000。从这一点可以推测,学生可能在使用COCA学习词汇和修改作文的过程中扩大了他们的词汇量,因为普遍认为大的词汇量有助于学生产出长的作文。另一方面,后测作文中的EFT/T值同前测作文中的数值相比增加了将近0.2,每100词中的错误数量从11.1758减少到了7.9296。这两点表明经过一个学年使用COCA进行的词汇学习和写作修改活动后,学生能够写出更多准确的句子,犯更少的语言错误。然而,从复杂性的两个指标来看,COCA辅助的学习方法对学生写作的发展没有产生明显的影响。
表1 实验组写作质量配对样本T检验
为了检验实验组和对照组写作质量的差异,对获取的相关数据进行了独立样本T检验,结果如表2所示。首先,统计数字表明,实验组与对照组在后测作文的流利性方面有着显著性的差异(p=0.040),而在前测作文的这一指标上则无很大差异(p=0.615)。这一点证明了基于COCA的数据驱动学习方法在提高写作的流利性方面比传统的学习方法更有效。其次,在准确性的两个指标上,两组在前测作文中的表现没有显著差异,但在后测作文中的表现均达到了统计上的显著差异,EFT/T的p值为0.005,每100词中的错误数量的p值为0.008。这一结果表明实验组使用不同的学习方法后产出了更多准确的句子,更大地减少了写作中的错误。因此,在提高写作的准确性上,COCA辅助的学习方法同传统的学习方法相比产生了更积极的影响。最后,关于复杂性两个指标的统计数据显示实验组与对照组在前测写作与后测写作中的表现均无明显差异。这一结果说明,与传统的学习方法相比,COCA辅助的学习方法在提高写作的复杂性方面没有明显的优势。
表2 实验组与对照组写作质量独立样本T检验
研究结果表明辅助的词汇学习和写作修改对学习者写作发展的流利性和准确性产生了积极的影响。此外,与传统的以老师为中心的灌输式的方法相比,基于COCA的学习方法更有效地提高了学习者写作的准确性和流利性,但是在提高写作的复杂性方面没有明显的优势。
流利性是衡量学习者写作能力的一个重要指标。为了进一步探究实验组与对照组在这一指标统计数据上显著差异的原因,笔者在批改网上分别检索了两组后测作文中关于常用词“make”的搭配,剔除掉“also make”、“later make”之类的搭配后,发现实验组使用“make”与名词搭配的短语31次,对照组则使用了19次。显然,基于COCA的学习方法提高了学生使用搭配的意识。这证明了Chambers和O’Sullivan(2004)与O’Sullivan和Chambers(2006)的研究结果,即写作中使用语料库有助于学习者注意并学会使用语法化的词汇。这可能促使在规定的时间内实验组比对照组写出更长作文的原因。此外,在与语料库数据的互动中,学习者可能无意识中习得了一些新词,扩大了词汇量,一定程度上提高了写作的流利性。
准确性往往是影响老师评价写作质量的一个重要因素(Canagarajah,2002;Hegelheimer,2006;Yoon,2008)。词语使用不够准确和地道是外语学习者在写作中遇到的一大问题。本研究中,实验组比对照组在写作的准确性方面取得了明显的进步。在使用COCA进行修改写作的过程中,学生花费了较多的时间找到正确的语言表达并进行改错,这可能加强了他们对语言错误以及正确语言表达的记忆,在后来的写作中他们很自然地提取了正确的语言表达,避免了犯同样的错误。正如Corder(1981)认为,促使学习者自己去发现正确的语言表达对他们更为有益。而对照组的学生在写作中遇到问题时通过查字典或者搜索百度很直接地得到了答案,没有经过仔细的思考。Reynolds和Anderson(2015)在他们的研究中曾说到,被动的学习者很少去回顾修改过的错误,而回顾对于内化所学到的语言很有必要。因此,他们可能在下次写作中犯同样的错误。此外,基于COCA的数据驱动式学习方法让学习者了解并掌握了高频使用的真实的语言表达,这无疑有助于他们产出更准确、更地道的作文。
复杂性是评估学习者写作水平的另外一个重要因素。本研究的结果表明,基于COCA的数据驱动式学习方法对写作的词汇复杂性和语法复杂性都没有产生显著的影响。究其原因,可能有两个:首先,学生可能无法掌握所有的语料库查询技巧,尤其是对pos标签的使用无法熟练运用,这一定程度上影响了他们查到更复杂的句式表达。Sabti和Chaichan’s(2014)在他们的研究中陈述到,计算机技能是阻碍计算机技术在语言学习中使用的最大障碍;其次,词汇和语法知识的产出性使用能力的提高需要花相当长的时间。一学期的语料库培训可能不足以让学生课后独立地使用语料库进行学习。
本研究探讨了基于COCA的数据驱动式学习方法对中国的英语学习者写作的流利性、准确性和复杂性发展的影响。结果证实了把语料库应用到词汇学习和写作修改中对提高写作的流利性和准确性产生了积极的影响,而对写作的复杂性的发展的影响则没有达到统计上的显著效果。此外,语料库辅助的学习方法比传统的学习方法更有效地提高了学习者写作的流利性和准确性。然而,这并不意味着语料库辅助的学习方法对提高写作的复杂性没有一点作用,只是写作的复杂性的提高需要花相当长的时间。因此,有关语料库辅助的学习方法对写作水平特别是复杂性的影响需要进行更多的纵向研究。
最后,需要花费多少时间和努力才能让学习者独立的熟练使用语料库值得进一步探讨。本研究中的一个学年显然不足以帮助学习者成为高超的语料库使用者,或许,语料库的使用应该长期融入到英语写作课堂中,与其它的参考工具如词典一起帮助学习者提高他们的写作水平。所以,需要更多的外语研究者与老师通过课堂实践去探讨语料库与其它参考资源结合起来对学习者的写作发展带来什么样的影响。