周 韵
(咸宁学院 外国语学院,湖北 咸宁 437100)
语料库语言学与英语教学*
周 韵
(咸宁学院 外国语学院,湖北 咸宁 437100)
如何提高英语教学的质量是教育者们一直思考的问题。本文从语料库语言学的视角,指出使用语料库能够确保为英语教学提供反映语言使用本来面貌的语言材料并协同教师确定教学重难点,此外在促进学生自主学习等方面也起到了重要作用,语料库推动下的英语教学将成为现代英语教学的主旋律。
语料库语言学;语料库;英语教学
在我国,英语教育的重要地位毋庸置疑。从小学甚至是幼儿园阶段开始,英语教育就如影相随。在大学阶段,虽然学习的专业范围有所不同,但是在很多高校,学生们还是被统一要求参加CET4/6,其中CET4成绩是否合格被许多大学作为授予学士学位的一项重要依据。在硕博入学考试中英语作为一门公共课被纳入考试范围,甚至在走上工作岗位之后的职称考试中,英语也占有一席之地。既然英语的地位如此重要,那么如何提高教学质量一贯是广大英语教育者们研究探索的问题,随之也出现了不少行之有效的教学方法。近年来,随着语料库语言学的发展,语料库在英语教学中日益发挥着重要的作用,语料库与英语教学及研究的结合无疑是一条值得深入探索的科研之路。
语料库,顾名思义,就是存放语料的仓库。根据《朗文语言教学与应用语言学词典》一书,语料库是为研究人员和想知道单词和其他语言项目是如何使用的教材开发人员而搜集和比较的一批自然语言材料。语料库可以是一些句子,也可以是一套书面文本或者录音。在现阶段我们所说的语料库多是指电脑语料库,是一个由大量在真实情况下使用的语言信息集成的,可供计算机检索的,专门做研究使用的巨型资料库。它以其容量大、语料真实、检索快捷准确等独特的优势在现代语言学研究和语言教育中正发挥着越来越重要的作用[1]。
语料库的设计通常有其特定的目的,不同的目的决定了语料库的不同分类。大致来说,语料库有其以下几种类型:
专门语料库(specialized corpus):某一类型文本的语料库,如学术文章、学生写作等。
通用语料库或者参考语料库(general corpus or reference corpus):由很多不同类型文本组成的大型语料库,通常用于语言学习(如词典)的参考材料或者用来作为专门语料库比较的基础。
可比较语料库(comparable corpora):包含同等类型和相同数量文本,可进行差别比较或者对等比较的不同语言或者语言变体的两个或者多个语料库。
平行语料库(parrallel corpora):两个或者两个以上不同语言的语料库,由一种语言翻译成另一种。
学习者语料库(learner corpus):以收集语言学习者产生的文本或者语言样本而得到的语料库。
作为应用语言学的一个分支,语料库语言学是一门将语料库与语言学相结合的学科。Crystal(1991)指出“以语料为语言描写的起点或以语料为验证有关语言的假说的方法称之为语料库语言学。[2]”继Bloomfield之后的一些美国结构主义语言学家开始利用语料库研究语言,这些语言学家受实证主义和行为主义观点的影响,认为语料库中的材料是语言学研究的主要素材[3]。何安平(2004:2)将语料库语言学的发展划分为三个阶段:19世纪末至20世纪70年代为第一阶段。早期阶段主要是纸质文本语料库,用作编撰语法书或者是词典的依据。20世纪60年代至70年代先后建成了BROWN,LOB以及LLC三大经典语料库,为现代语料库语言学的发展奠定了坚实的基础。语料库语言学发展的第二阶段是20世纪80至90年代,在此期间各国都开始建设自己的语料库甚至国与国之间共同建立语料库。20世纪90年代中期以来是语料库语言学发展的第三阶段。这一时期的特点主要表现在由于电子计算机技术迅猛发展所带来语料库的大规模建设以及预料路在于语言相关的各个领域的广泛应用。
在我国英语语料库语言学的研究是20世纪80年代初兴起的。我国第一个专门用途英语语料库(JDEST)是于1982年由上海交通大学的黄仁杰、杨惠中教授主持建立,开始了语料库语言学在中国的研究。2003年,桂诗春和杨惠中教授主持完成了中国学习者语料库(Chinese Learner English Corpus).除此之外,还有南京大学创建的中国学习者英语口语语料库(Spoken English Corpus of Chinese Learn-ers)以及上海交通大学建立的大学英语学习者口语英语语料库等。随着各类语料库的兴建,语料库语言学在中国的研究也蓬勃兴起,其中既包含有语料库的直接应用,即直接采用语料库手段进行课堂教学,也有通过对目标语或者中介语的语言特征进行描述和分析的间接应用。除此之外,语料库建设以及其检索工具的应用开发也层出不穷。
我国英语教育时间长,投入大,但是所产生的效果不佳。按照西方标准来衡量的话,中国的英语教育是一个里程碑式的失败,因为中国的通过了CET4/6的大学毕业生只能阅读和理解相当于美国公立小学三年级水平的基础英语,并且缺乏他们的听力写作以及会话技巧[4]。导致这种现象出现的一个重要原因就是我国使用的英语教材与英语的实际使用状况脱节。英语教学的中心任务是培养学生的交际能力,因此向学生提供真实有效的输入是确保教学效果的有效途径。然而如今市场上林林总总的英语教科书是否起到了这个作用呢?根据Lam(2009)对比会话小品词“well”在香港英语口语语料库和教科书语料库中的用法发现一些重要分歧:well在语料库中出现的频率要远远高于其在教科书中出现的次数。就well在句子中的位置而言,语料库分析显示96%的well都出现在句首和句中,而教材数据中则表明90%的well来自于句首[5]。该研究显示教材的内容体系与该语言的实际使用情况有出入。
教材中语言使用的范例应该尽量贴合语言的实际使用情况,而语料库则是对语言使用情况的一个真实反映。但是在我国目前出版的绝大多数教材和教学参考书都未能体现高频语言现象优先的原则,还停留在均衡对待语言现象的基础上[6]。教材的编写如果不能体现该语言使用的真实面目,那么学生就难以掌握其精髓,因而难以达到与本族语使用者相似的水平。借助语料库,我们可以将教材编写的关注点转化为一些具体的可量化的检索项,通过提取和观察其呈现频数来作为考察教材质量的评判点。例如,一本英语教材中所涉及到的词汇量直接决定了该教材的难易程度。Nation(1990)年的研究中指出:英语语篇中87%的单词都是来自于2000个最常使用的高频词。如果教材的编写重点没有凸显这些高频词的重要地位,学生所掌握的内容则不是英语使用真实情况的反映,好的教学效果就得不到保证[7]。要衡量一本教材中所涉及到的词汇情况,可以用来自国外大型语料库的英语基本词汇表和教材语料库所生成的词频表作对比,调查该教材在广度和深度上对目标与最基本词汇及最常用意义、搭配的覆盖情况,以此确定该教材在词汇角度优劣。
语料库研究表明:成年本族语使用者高达70% 的语言呈公式化特征,并在普通语言表达中,单词和词组的组合方式远比语法允许范围内的可能性少。无论是口语还是书面语,都主要由框架式搭配构成[8]。教师在教学过程中应该有意识的提醒学生注意程式语的存在并且着重进行熟记和使用。但是英语中有大量的程式语存在,如何确定教学的重点及目标呢?张彦斌在1982年指出,对于在教学大纲中规定的在教材中出现的要求学生掌握的词汇及其意义、用法必须给予词频统计(word frequency count)只有那些经常被使用的高频词才应该被纳入使用范围,而每个词条下不同词义出现的百分比也应该列出作为教师教学的参考[9]。恰当的使用语料库可以帮助教师确定教学的重心。例如,在英语中有大量的有at+the+noun+of结构构成的短语。借鉴语料库工具可以迅速有效的帮助学生掌握此种类型的短语或者是此类短语中出现频率高的部分。在网站http://corpus.byu.edu/bnc/中检索 at the[nn ﹡]of得到一系列短语,按照频数高低排列如下
表1 at+the+noun+of结构短语使用频率
从表1中可以看到at+the+noun+of结构的短语中使用频率最高的是at the end of,其次分别为at the university/top/time/beginning of等。通过观察以上短语可以发现此类结构多用来表示起止点(at the beginning/end of)时间或年龄(at the time/age of)亦或是空间方位地点等(at the top/centre/bottom/edge/unicersity of)教师在教学中可以有意识的注意引导学生留意此类短语的主要表现形式和意义。
如果换用chart方式察看,则会发现at+the+noun+of结构的语体特征:在期刊杂志类中出现最多,其次是在学术性文章和小说中,在口语中则出现的最少。从上述结果可以发现此类型段与主要用于正式严谨的书面语中,口语中的使用频率则相对低些。
表2 at+the+noun+of结构短语使用语体特征
语料库还可以用来帮助教师设立练习。上述的搜索结果在KWIC方式下,则能够显示该类型短语在各种不同语境中的使用情况。例子的出处均来自本族语使用者的真实经历,而绝非语法规则基础上凭空想象的产物,对于帮助学生掌握原汁原味的英语有很大的作用。教师也可以将这些句子设计成练习形式,以便学生尽快掌握相似类型的不同短语。表3是由at+the+noun+of结构的例句去掉中间的名词后设计成为填空题,考查学生对此结构类型短语的掌握情况。
表3 基于语料库设计的填空题
随着电子技术的迅猛发展和日益深化的教育改革,自主学习越来越成为当前教与学的一个重要渠道。但是,自主学习并不是不需要教师指导的一种学习。恰恰相反,它更需要教师进行指导、规划,并评估学生的学习效果,语料库技术支持下的数据驱动学习无疑是对自主学习的一个好的尝试。数据驱动学习的基本理念符合“以学习者为中心”的思想,由学生观察教学材料,进行推断假设和相互讨论最后归纳出答案。教师在教学过程中可以向学生推荐一些可以免费使用的语料库网站。比如http://www.natcrop.ox.ac.uk;http://corpus.byu.edu.time;http://corpus.byu.edu/coca等。以上三个语料库各有不同的侧重点:第一个网址是包含有一亿词汇的英语国家语料库,收集了从1980年至1993年的口笔语语料。第二个网址则是关于美国《时代》杂志从1923年至2006年一亿词的书面语料库,从中体现了美式书面英语八十多年的变迁。第三个网址则是当代美国英语语料库(COCA)包含有425 million词次,时间跨度为1990-2011年,主要体现近现代美式英语的使用情况。以上这些语料可以用来帮助学生检查自己的语言使用是否正确得体。在写作中,学生常会遇到无法确定模棱两可的表达,想使用某种搭配但是又不知道是否可行。求助于字典吧,字典上只列出了有限的几种搭配用法,而学生们想知道自己的这种用法是否正确。这时,他们可以将所拟采用的词组或者搭配输入语料库的搜索项中。如果搜索结果显示没有匹配项,那么则表明这种用法并不被本族语使用者所采用。例如:如果学生想知道charge的具体用法,可以将该词输入COCA语料库search string一栏,并在collocate一栏选择不同的数字以限定charge一词前后出现的单词的个数。经过相关操作,可以发现最常使用的词组有in charge(of),take charge(of),charge against等。通过语料共现,学生能够看到各类型短语使用的语境,帮助他们掌握其用法。除此之外,语料库还可以用来帮助辨析近义词等等。
随着信息时代的到来,传统的英语教学将面临着越来越大的挑战,只有如实体现英语作为本族语使用特点的教学才能帮助学生尽快掌握该门语言。语料库与英语教学的结合无疑是值得探索的一条新路。
[1]何安平.语料库语言学与英语教学[M].北京:外语教学与研究出版社,2004.
[2]Crystal,D.Stylistic profiling.In English Corpus Linguistics Studies in Honor of Jan Swartvik[M].London:Longman,1991.121 ~238.
[3]Leech,G.The state of the art in corpus linguistics[M].In Adjmer,K.and Altenberg,B.(eds.)1991.
[4]Wolff,M.Of the students,by the students and for the students[M].Cambridge Scholars Publishing,2010.
[5] Lam,P.W.Y.Discourse particles in corpus data and textbooks:the case of well[J] .Applied Linguistics.2009,31/2:260~281.
[6]潘璠,冯跃进.语料库语言学与外语教学思路的转变[J].外语学刊,2000,(4).
[7] Nation,I.S.P.Teaching and learning Vocabulary.[M].N ew York:Newbury House,1990.
[8]Altenberg,B.On the phraseology of spoken English:the evidence of recurrent word combinations[A].In A.P.Cowie(Ed.).Phraselogy:Theory,analysis and applications[C].Oxford:Oxford University Press,1998.
[9]张彦斌.理工科公共英语教学大纲的制定[J].外语教学与研究,1982,(1) .
G642.4
A
1006-5342(2011)11-0091-03
2011-08-20