吴 军
(安阳师范学院 外国语学院,河南 安阳 455000)
现代信息技术对语言教育发展具有革命性影响,语料库是其中的重要组成部分。它以前所未有的巨量语言信息储备、高速精确的计算机提取方式和鲜明突出的语境共现界面取胜。自语料库产生以来,其应用范围逐渐扩大,特别是使词典编纂方面取得了较大突破。基于语料库的英语词典现已成为世界各国英语学习词典的主流,如根据Cobuild语料库编纂的词典Collins CBUILD English Language Dictionary,以朗文语料库(Longman Corpus Network)为基础编纂的词典Longman Dictionary of Contemporary English。利用语料库编写的语法著作也成果显著,例如Sinclair根据Cobuild语料库编写的语法书Collins CBUILD English Grammar,Biber等基于朗文英语口语和笔语语料库编写的语法著作Longman Grammar of Spoken and Written English。进入新世纪以来,语料库研究成果也逐渐应用到英语教学中。语料库与教学相关的应用涉及大纲制定、教材编写、阅读材料的选择、语言研究等多个环节。国际上直接利用语料库资源辅助语言教学的先行者是Tim Johns和Chris Tribble。他们开创的做法一般被称为“数据驱动学习”(Data-Driven Learning, 简称DDL)或“课堂索引练习”(classroom concordancing)。DDL的基本原理是引导学生利用海量的语料库数据,观察、概括和归纳语言使用现象,自我发现语法规则、意义表达及语用特征。DDL的学习方法符合“以学生为中心”的理念,也被称为“发现式学习”方法。我国近三十年来也涌现出了一些相关研究成果,例如何安平编著的《语料库语言学与英语教学》(2004)以及《语料库辅助英语教学入门》(2010)探讨了语料库语言学应用于外语教育教学的理论与实践,重点阐释了如何利用自建子语料库辅助英语教学。梁茂成、李文中、许家金编著的《语料库应用教程》(2010)用一个章节讲述了外语教学中语料库的应用,重点介绍了利用现有的大型语料库和软件工具创建微型文本辅助外语教学。
然而语料库在日常外语教学中的运用正如Graeme Kennedy(2000)指出的那样:“一直是语料库语言学的薄弱环节”;语料库在国内英语教学中的应用并不普遍,甚至“几乎空白”,或者只是刚刚起步(陈建生,2004)。何安平教授(2010)认为:在国内,业内人士虽然越来越认同语料库作为一种新资源和新技术对外语教育教学有巨大的潜在价值,但是语料库辅助的教学还未能确实进入外语教学的主流(即课堂教学)。
笔者认为语料库辅助英语教学的复杂性和低效性是制约普遍应用的瓶颈。语料库语言学是一门交叉学科,许多人心虽向往,力有未逮(梁茂成等,2010)。在语料库应用方面,许多教师面临使用技术难题:如何进行单项及多项检索?如何编写正则表达式?如何建设和加工微型教学语料库?语料库的巨大容量,语料库语言来源的多样性以及语料库检索的复杂性等多种原因给英语教学中语料库的应用带来诸多困难。梁茂成(2010)认为基于语料库的DDL尽管理论上是一种很好的英语学习方法, 但是在实践中存在着诸多问题,因此至今并未形成太大气候。DDL最突出的问题是如何保障学习效率;教室里为每个学生配备一台微机也难以实现;自建微型语料库辅助英语教学让众多英语教师望而却步。然而,这对于功能强大的语料库而言无疑是一种极大的资源浪费。语料库专家冯志伟(2010)认为:语料库中蕴藏着无比丰富的知识等待我们去挖掘,如果我们使用 “文本数据挖掘”(text data mining)的技术,既可以挖掘语言学的知识,也可以挖掘非语言学的知识,就像从矿石中挖掘出黄金一样,这些知识可以弥补传统语言学的不足,克服研究者的主观性和片面性……这种知识获取方法上的巨大变化,有可能引起整个语言学研究的“战略转移”;我们中国的语言学家应当敏锐地关注“战略转移”问题,做出我们应有的贡献,千万不要错过这个在语言学历史上千载难逢的良机。卫乃兴教授(2010)认为:中国的语料库研究应当也必须为外语教学服务,语料库帮助一大批学子获得了硕士、博士学位,却未能有效帮助外语教师和学生提升教学效果。如何在英语教学中简便、高效利用语料库资源提高教学效果是值得研究的课题。
鉴于我国当前英语教学环境和现状,笔者认为DDL对于我国英语学习者而言可操作性较低,因此可以在借鉴DDL的基础上加以改进:将以学生为中心的数据驱动学习法改革为DDL与其他教学法相结合的综合方法;基于语料库的英语教学不仅包括利用语料库,还包括利用语料库研究成果辅助教学。具体思路和方法如下:
利用语料库辅助备课是指教师备课时利用一些免费的网络在线大型英语语料库,如COCA, BNC, COHA等。这些免费在线语料库是由美国杨百翰大学Mark Davies 教授开发的利用价值很高的英语教学宝库,特别是COCA—— 美国当代英语语料库(Corpus of Contemporary American English) (http://corpus.byu.edu/coca/),是当今世界上最大的语言资料库,COCA从1999年创立至今依然持续更新,每年更新大约2000万的词汇数量,到2015年年底为止已经拥有5亿2000万的庞大词汇语料。用户只需注册免费帐户,便可以无限制地使用搜寻功能。COCA具备了一个好语料库的三项最基本条件:规模(Size)、速度(Speed)以及词性标注(Annotation),涵盖美国英语口语、小说、流行杂志、报纸和学术期刊五大类型的语料,并且在这五个类型方面基本呈均匀平衡分布。教师可以根据教学内容编写正则表达式检索语料库,通过观察语境共现行、频率、语域分布等数据,辨析词语、分析词语搭配、揭示语义韵、归纳词语类联接和句式用法,获取典型例句,编制练习题等。
例如:Cyber-这一组合语素表示“计算机的,因特网的” ,根据COHA的检索结果,该组合语素是20世纪末、21世纪初活跃起来的新的组合语素,构成了不少新词。为给学生介绍一些以cyber-构成的常用名词,教师检索一下COCA便可得到真实、可靠的答案。在COCA界面上搜索框内输入cyber*,点击LIST选项进行检索,便可获取以下较高频率的词语及其总频数(表1):
表1 cyber-构成的常用名词及总频数
通过点击这些常用词,便可得到以下来自COCA的真实语料例句:
These real-world and cyberspace groups have more in common than names seemingly lifted from comic books.
I have to admit that I was often regarded as one of the first Japanese cyberpunk writers.
The United States has repeatedly declined to enter into negotiations, arguing instead that improved law enforcement cooperation among countries is all that is necessary to combat cybercrime and cyberterrorism.
教师可以用这些句子作为教学例句使用,也可以作为填空练习或翻译练习使用。点击CHART选项进行检索,还可获得cyber-构成的词语在不同语域中的词频分布和在不同年份的词频分布柱形图(图1):
图1 cyber-词语在不同语域中的词频分布及在不同年份的词频分布柱形图
Cyber-词语在不同语域中的词频分布图显示:cyber-词语在报纸和杂志语域中使用频率较高;cyber-词语在不同年份的词频分布柱形图显示:cyber-词语在2010-2015时间段的使用频率最高,总频数是3036,远远高出其他时间段的总频数,说明人们在该时间段对计算机网络的使用和关注明显增多,因此有必要掌握一些高频率的cyber-词语。
课堂教学中为学生呈现基于语料库的真实语料及统计数字,可以让学生汲取语料库中新鲜、珍贵的营养,提高教学效果。
利用语料库研究成果辅助备课是指教师备课时查阅基于语料库的词典和语法专著完善教学内容,包括真实的例句、语言现象的语域分布及频率信息、与结构相关的词汇信息以及词串等语言特征。自语料库产生以来,它在语言领域的研究成果是显著的,特别是基于语料库的纸质词典和语法专著,含有大量基于语料库的真实语料。然而许多学习者对这些纸质工具书并不时常查阅,笔者认为教师备课时可以利用这些研究成果。尽管应用在线语料库资源能为教学提供大量的有价值的材料,但对多数教师来说,检索语料库会消耗时间和精力;而有些不了解语料库的人员会对这项工作望而生畏。显然,利用语料库研究成果辅助备课会省时省力。
例如,用《朗文当代英语辞典》查单词commence,可以看到在该词条下的图表(图2),显示了commence, start和begin在英语口语和书面语中的使用频率柱形图。该图表显示,在英语口语中start是这三个动词中最常用的一个,使用频率是其他两个动词的25倍之多;在书面语中begin更常用。不论在口语和还是书面语中commence使用率都不高,比其他两个动词要正式得多。
图2 commence, start和begin在英语口语和书面语中的使用频率柱形图
“名词+名词”是英语中常见的名词作前置修饰语的结构,该结构比介词短语等后置修饰语简洁。查看《朗文英语口语和笔语语法》一书便可轻松获得基于朗文语料库的检索结果:新闻中名词常用作前置修饰语以节省空间,在所有前置修饰语中名词的比例达到40%。该语法书还列出了常见的修饰语名词:四个前置修饰语名词government(政府), police(警察), home(家庭), world(世界)不仅非常多产(与100多个不同的名词中心词搭配使用,实际上与government和police搭配使用的名词中心词有200多个),而且使用率高(作为名词修饰语每百万词出现100次以上),书中列举了大量来自朗文语料库的常见搭配:government + action / agencies / approval / bonds / control / decision等;另外大约150个前置修饰语名词相对多产(与50多个名词中心词搭配使用),这些词的大多数作为名词修饰语每百万词出现不超过50次,例如:bank, company, insurance, media, television, court, sports, defence, holiday, night, child, cancer。这些有用的资料会帮助学生深入了解该结构的真实使用情况,学习常见搭配。
笔者认为,在线语料库与语料库研究成果可以结合起来加以综合利用,提高备课效率。
该方法是指通过任务教学法激发学生使用在线语料库检索词语结构,解决问题,获取真实的语料,探索发现新的语言规律,通过这种方法培养学生的自主学习能力、科研能力及创新能力。鉴于我国的教学环境,笔者将学生课堂上的数据驱动学习改成课下完成,具体步骤如下:1. 介绍在线语料库COCA的界面和基本功能(COCA界面有详细的使用说明),要求学生课下练习检索;2. 根据教学内容及课后练习中学生出现的问题,教师向学生布置任务,要求学生课下以小组为单位利用COCA完成任务,制作PPT;3. 课上安排一定时间让学生展示讲解PPT,以问答形式展开讨论;4. 教师做点评。
例如:根据课文中出现的表达语,教师布置如下任务:lack一词常用作名词,而且常有形容词作前置修饰语。课文中出现搭配词语a striking lack,用COCA检索lack最常见的前置修饰语(至少10个);观察语境共现行,总结名词lack常用结构及搭配语。
语法结构布置任务举例:most可用作限定词后接名词,也可用作代词后接of-phrase,在COCA检索框内分别输入most of和most NOUN,检索LIST选项,查看总频率差异;观察语境共现行,总结搭配语异同。
根据学生作文中出现的问题,教师布置如下任务:大家作文中knowledge一词常用的搭配动词有learn, study, teach, get等,用COCA检索名词knowledge最常见的搭配动词(至少10个),每个动词获取至少2个例句,解释例句意义,观察knowledge后接结构及搭配语。
语料库的建立极大影响了我国英语教学研究,然而语料库仍未真正走进日常英语课堂教学。来自国外的数据驱动学习法需要中国教学文化环境的改良适应,需要中国本土化,才能获得较好效果。本文探讨了英语教学中简便、高效利用语料库资源提高教学效果的综合模式,以期对一线英语教师有所启发和帮助。