语料库资源和技术与英语教学的融合
—— 《语料库与语言教学》评介

2014-03-31 11:41孙海燕
关键词:语料库短语语法

孙海燕

(河南师范大学外国语学院,河南新乡453007)

一、引 言

语料库语言学是一门独具特色的语言研究学科,随着计算机技术的迅速发展,语言研究中以实证为基础的研究方法已得到肯定。语料库语言学的研究成果对外语教学具产生了深刻的影响,在语料上为我们提供大量原始数据,在技术上为我们提供了许多适合教学使用的软件。语料库语言学的发展改变了我们关于语言使用特征的观点,我们也期望在课堂中应用语料库数据和技术。近年来,基于语料库数据的学习者词典、语法书和教学参考书相继问世。但是,语料库在课堂上的应用要远远落后于大量的语料库语言学研究。在理论上,语料库和二语习得、外语教学之间的关系尚未明确。在实践中,以下问题还未得到很好的回答:语料库应该如何应用于教学中?语料库方法和传统教学法之间如何保持平衡?针对这些问题, 《语料库与语言教学》介绍了一些语料库语言学家的独到见解,对语料库与二语习得的关系、语料库在教学中的应用进行详细地剖析,展示了如何利用新型语料库来应对教育挑战,为我们的英语教学提供了很好的启示和借鉴[1]。

二、内容简介

《语料库与语言教学》描述了语料库在英语教学中的直接应用和间接应用,全书由四部分组成。第一部分分析了语料库与二语习得的关系,第二部分展示了如何将语料库直接应用于教学,第三部分阐述了间接语料库方法,第四部分讨论了新型语料库对外语教学的启示。

第一部分“语料库与二语习得的关系”包括语料库语言学领域两位专家Granger和Johansson的文章。作为学习者语料库的先驱,Granger在“学习者语料库对二语习得和外语教学的贡献”一文中,以批评的眼光评价了学习者语料库的作用。她讨论了有关学习者语料库的几个关键话题,认为语料库语言学和二语习得彼此需要,而学习者语料库为两者提供了很好的结合点。在语言学习中的社会、认知、心理因素已经在二语习得领域得到深入研究,熟悉二语习得的研究成果有助于研究学习者语言。“掌握二语习得理论知识是解释数据的先决条件”[1]。关于语料库的规模,她认为,库容并非越大越好,在建库时应该控制影响学习者语言产出的变量。在探讨语料库和语言教学的关系时,Granger根据材料的收集及其后的教学应用方式,把学习者语料库分为两类:延时教学应用 (delayed pedagogical use)和即时教学应用 (immediate pedagogical use)。以往的语料库大多属于延时教学应用类,语料库作为教学材料没有直接用于产出数据的学习者。近年来,一种新型的语料库开始出现——即时教学应用语料库,它指学习者不仅是语料库数据的产出者,同时又是使用者。教师把搜集资料作为正常课堂活动的一部分,学生可以分析自己产出的话语,有助于培养学习者的自主学习能力。

通过对语料库与二语习得的相关问题的思考,Johansson比较了显性教学与隐性教学的效果。早在20世纪60年代,在瑞典一些学者就外语教学的方法展开过激烈的辩论:人是如何学习外语的?外语教学的最好方法是什么?一方面,有些学者相信机械论的学习模式,提倡教学应通过接触和使用外语,进行大量句型操练而毋需解释,在教学中尽量避免使用母语。而另一派主张心灵主义学习模式,强调解释的必要性,认为需要将外语和母语进行对比。Johansson强调使用控制实验来比较基于不同理论的外语教学方法,介绍了一个对显性教学和隐性教学进行比较的教学实验,结果表明对于成年学习者来说隐性方法更为有效,实验支持了学生参与形成假设和验证假设的观点,频数信息研究的成果也认为学习者可以得益于自己去发现重复使用的词汇语法模式。该实验引发了语料库和二语习得中的一些问题:语料库在教学中的应用在何种程度上可以得到实验验证?语料库的应用在何种程度上建立在语言习得理论基础上?

第二部分:直接语料库方法,介绍了课堂上不同类型的基于语料库的学习活动。直接语料库方法意味着在课堂上学习者可以和语料库直接互动,学习者可以接触到真实的语料库材料,语料库提供的索引行可以作为教学活动的例句。包括三篇文章:“谁是使用语料库的受益者?”“Oslo互动英语:语料库驱动的网络练习”,“语料库研究和实践:教师需要什么帮助,我们能提供什么?”。

在“谁是使用语料库的受益者?”一文中,Granath讨论了语料库如何成为语法课程的一部分,认为大量的语料可以展示语法差异以及句法结构引起的意义差异,从而提高学生的口语和书面语水平。当语法规则比较笼统无法反映语言的真实使用情况时,语料库技术尤其有用。比如,老师和学生可以查询集体名词一致性用法的各种情况。另一方面,调查也表明许多学生还不适应这种归纳式的方法,而且这种学习方法不一定适合所有类型的学生。

关于语料库与网络技术的结合,Ebeling描述了Oslo大学基于网络的互动学习平台,以鼓励使用信息和交流技术这一较为灵活的学习方式。Oslo互动英语的目的是为语料库的使用提供介绍性课程,学生通过使用语料库数据批判性地思考语法书的规则。关于网络互动平台使用频数的统计显示它的受欢迎程度在不断增长,但是更加深入的分析表明许多人只是浏览一下网站,并非真正来做练习。要想改进这种情况,必须把网络学习和课堂学习结合起来。

Romer提倡把语料库研究和实践相结合,通过设计问卷调查了德国中学英语老师的工作条件,发现现有的教学材料无法为老师提供足够的语法和词汇参考,老师通常查询的资源按几率高低有以下几类:词典、本族语者、同事、网络、斯旺实践英语用法、语法书、搭配词典、语料库。在以上几类资源中,语料库排在最后一位,只占查询资源的1.56%,几位汇报者指出,通过词典查询单词比较费时,他们常常想咨询本族语者,大多数老师并不认为大型语料库可以代替词典或语法书。对于现有教科书往往缺乏真实有趣的实例这一现状,Romer认为语料库还有很大的应用空间。

第三部分:间接语料库方法,包括三篇文章,“瑞典高级学习者英语写作中的主题”,“挪威学习者英语议论文的主题选择和立场表达”,“基于语料库的描述对英语学习者的作用”。

关于学习者语料库,基于国际英语学习者语料库 (ICLE)有大量研究,Herriman和Aronsson的研究对比了瑞典英语学习者和本族语者议论文的信息组织方式,焦点放在主题和主题变化的选择上。结果表明学习者倾向将其观点主题化,尤其值得注意的是学生过多使用I think,what I want to say,瑞典学习者还过多使用分裂句使其观点主题化或表达评估性评论。学习者的主题选择会造成一种劝服或强调的风格,这一点和本族语者的议论文有很大不同。学习者过多使用某些类型的主题的原因,包括母语语言结构和文化规约的迁移,学习者策略(比如程序性语言的使用)等。

Hasselgard研究了挪威学习者主题结构的选择,发现学习者将挪威语的语序模式迁移至英语,他们没有掌握英语相关体裁的语法和风格规范。挪威学生尤其过多将副词放在句首,他们还多用外置结构。和瑞典学习者不同的是,他们没有过多使用分裂句;相似之处在于他们都喜欢提到自己,如I think等相关结构。以上两个对学习者的研究结果表明,学生较好得掌握了主题结构和主题变化,但不知道在哪些合适的风格或体裁中使用,他们过多使用的许多结构具有口语特征。

近年来从短语学角度分析学习者问题的研究不断增多。语料库使我们注意到复杂的结构和短语,Hunston研究了如何将语料库频数信息和短语学习结合起来,以及如何将这些信息呈现给学生。她建议采用语料库驱动的方法,重视与单词相关的短语。该研究焦点是多词单位,其频数可以和单个单词一样进行排序。她认为,我们不仅要知道总体频数,多词单位内成分之间的搭配强度也要考虑。而且,同一词目下不同词形的出现概率也不尽相同,某一词形可能和一个特定的补语结构或情态意义有关。这些信息在教学材料的设计方面非常重要,教学重点应该放在学生最需要的功能、词汇和语法项目上。

第四部分:新型语料库,包括三篇文章:“Income/interest/net:利用内部标准确定文本的关于性”,“新型语料库应对新的教育挑战:搜集、标注、利用教材资料语料库”,“高级英语学习者会话语法:学习者语料库及教学启示”。

在论文“Income/interest/net:利用内部标准确定文本的关于性”中,Winnie Cheng基于语料库研究了经济金融领域的典型短语,以描述文本的关于性。关于性研究的焦点是建立关键词的搭配轮廓和搭配词,将某一文本的特定模式和参照语料库进行比较。文本中的关键词可以反应文本是关于哪一方面的,如果文本是关于某个特定领域,那么关于性尤为明显。Scott和Tribble曾研究了整体BNC和按领域划分的语料库,查找主题关键词能否反应文本的关于性,得出的结论是:“如果文本的领域更明确,关于性就更显著”[2]。以往对词语框架的研究揭示了短语学中非连续序列的模式,如the past…year,但由于技术所限不能处理位置上的变化。而新开发的搜索引擎Conc Gram可以识别每个文本中的短语句型,不仅能处理连续性上的变异 (如AB,A*B),还能处理位置和结构上的变化 (如AB,BA),能够自动检索高达5个词的词串。该方法对于专门用途英语教学有重要意义,可以提高学习者的语言意识,增进对特定学科话语“关于性”的理解。

“新型语料库应对新的教育挑战”研究了普通教材的编纂,讨论了语料库资源对教材编写的影响,Meunier和Gouverneur建立了一种新型的教材语料库,该教材语料库包括700 000词的国际英语教学市场的教材。该语料库针对练习类型进行了和教学有关的标注,可以用来提供针对某一特定水平进行练习的单词表。该语料库还可以用来调查教材中的元语言类型以研究术语的使用是否一致。

基于口语语料库的研究表明,口语语法的形式及语法结构与书面语不同,但是对口语结构和形式的教学仍是一个受忽视的领域,目前许多口语教材中的对话不够真实,接近书面语。在论文“高水平英语口语学习者会话中的语法:学习者语料库数据及教学启示”中,Mukherjee重点研究了德语高级学习者口语中的句法特点,基于LINDSEI口语语料库的德语部分进行了三个个案研究。第一个就搭配的数量、类型、范围比较了学习者口语和书面语的不同,表明口语中学习者动名搭配的使用范围比书面语有限,在口语中这些数量较少的搭配使用得更为频繁,而且学生使用的许多搭配不够地道。第二个主要是关于话语标记词,如you know、well、sort of等,这些词语在口语交际中十分频繁,可以实现人际功能。学习者和本族语者都使用话语标记词,但使用的方式和频数不同。第三个研究比较了口语产出中重复和停顿现象,由于学习者的计划压力更大,口语显得不太流畅自然。个案研究的结果表明,在课堂上应该更加重视口语语言中典型的形式和结构。这些形式不仅包括话语标记词,还包括一些可以使学生口语更加流利的预制结构。我们可以针对口语设计一些数据驱动的学习活动,使学生掌握程序性语言的使用,提高学习者的语言意识。

三、语料库语言学在英语教学中的应用

虽然语料库资源和技术已经逐渐在英语教学中得到应用,但还有许多问题悬而未决。下面我们探讨语料库研究和应用的一些热门话题,包括中介语对比研究方法的评述,基于语料库的短语学研究的价值,以及语料库技术培训的重要性。

自从Granger提出中介语对比研究方法后,许多从事语料库研究的学者都采用了该方法分析学习者语言,取得了丰硕的成果。但有些学者对这种对比方法提出质疑,认为用本族语语料库作为对比目标并不合适[3]。Granger在本书中做出了回应,认为把一语和二语的比较作为强有力的探索式方法,可以展现尚未发现的学习者语言特征,并从严格的二语角度进行分析。事实上,即使那些并非基于语料库的二语习得文献也表明,这种所谓的“对比误区”其实是以一种隐藏的形式广泛存在的。比如,所有的关于不同水平阶段的学习者研究都以某种潜在的一语规范为基础,因为在对水平进行评判时,我们都以一语为目标。Granger在文章中提出了一种新型的语料库:即时教学应用语料库,目前这种语料库尚不多见,建立即时教学应用语料库有待语料库研究者和授课老师的密切结合。

语料库数据驱动的短语学研究对于探讨语言的使用特点具有重要价值[4]。Hunston认为,我们在研究多词单位时,不仅要知道绝对频数,而且要考虑相对频数,词语的搭配强度根据多词单位和其组成成分的频数来计算[5]。在外语教学中,我们在选择单词和其相关短语时要参考频数信息,重视高频使用的短语。和传统的孤立的词汇讲解相比,基于短语将单词放在有意义的语境中进行教学更加有效。正如Sinclair所言, “单词并非研究意义的最好出发点,因为意义往往由特定的词语组合展现出来”[6]。语言的形式和意义有密切联系,意义单位往往由固定或半固定短语实现,是语法和词汇共选关系的体现。卫乃兴介绍了对比短语学的研究方法,基于平行语料库分析了汉英中的翻译对等现象[7]。利用短语学的研究成果进行英语学习可以提高学生语言产出的地道性,短语在日常交际中具有重要的功能,对语言产出的流利性等交际核心要素有很大影响,英汉中的常用短语及对等关系应该成为外语学习的重点。

语料库和基于语料库的研究对大纲设计、教材、词典和语法书的编纂产生了很大影响。许多词典都以语料库为基础,越来越多的语法书建立在真实的语料库例子上。我国的语料库语言学研究从建库之初就和外语教学息息相关,国内第一个语料库(上海交大科技英语语料库:JDEST)为我国大学英语教学大纲的制定提供了参考,对教材编写、词表统计做出了有益的贡献。学习者语料库可以较为全面地展现了学习者的语言使用特征,目前国内已建成多个学习者语料库,如中国学习者英语语料库[8],中国专业英语学习者口语语料库[9],这些语料库取自学生产出的真实语言材料,许多学者利用先进的检索软件对学习者语料库进行了研究,客观地描述了学习者语言习得的特征,使我们可以有针对性地解决学生语言学习中的问题。但是,由于大多师生习惯了传统的教学方式,真正将语料库引进外语课堂中的教学活动很少,有些技术和应用问题亟待解决。目前许多教师和学生还不了解如何在课堂上使用语料库,在本书中Granath主张把语料库的使用作为教师培训的一个重要方内容,“如果关于如何使用语料库的培训整合到大学课程中,和其他课程诸如句法、写作、翻译一样,将来查询语料库会和查询词典或语法书一样自然”[1]8。在这一方面,《语料库与语言教学》为我们提供了有益的借鉴。

四、结 语

语料库为语言教师提供了丰富的资源,但不能代替教师和语言教学。Hunston认为,“我们自己的角色也会改变。从某种程度上说,我们的生活会更加简单,诸如‘在何种情况下人们更倾向于某种表达方式’此类问题更容易回答。另一方面,我们的生活会变得更加复杂,因为我们很难忽视语言本身无尽的复杂性”[5]。语言学习是一个复杂的过程,涉及到形成和验证假设等一系列过程。语料库为语言学习提供了大量真实语料,采用数据驱动的学习模式有助于培养学生自主学习的能力,学习者通过观察语料分析词语的句法特点和典型搭配,这种发现式学习方式有助于提高学生学习的积极性。语料库技术及方法对外语教学模式的改革具有重大意义,语料库在未来的外语教学中起着举足轻重的作用,但是语料库软件和技术应用需要普及,教学理念需要更新,语料库语言学家要应对老师和学生的挑战,任重而道远。

[1] KARIN A.Corpora and Language Teaching[M].Amsterdam:John Benjamins Publishing Company,2009.

[2] SCOTT M.,TRIBBLE,C.Textual Patterns.Key Words and Corpus Analysis in Language Education[M].Amsterdam:John Benjamins,2006.

[3] GRANGER S.From CA to CIA and back[C] //K Aijmer,B Altenberg M Johansson.Language in contrast.Sweden:Lund University Press,1996:37-51.

[4] 刘冰.语料库语言学视阈下的当代文批评 [J].河南理工大学:社会科学版,2013(02):208-211+217.

[5] HUNSTON S.Corpora in Applied Linguistics[M].Cambridge:CUP,2002.

[6] SINCLAIR J M.Trust the Text[M].London:Routledge,2004.

[7] 卫乃兴.基于语料库的对比短语学研究 [J].外国语,2011(4):32-42.

[8] 桂诗春,杨惠中.中国学习者英语语料库 [M].上海:上海外语教育出版社,2003.

[9] 文秋芳.中国学生英语口笔语语料库 [M].北京:外语教学与研究出版社,2008.

猜你喜欢
语料库短语语法
《语料库翻译文体学》评介
跟踪导练(二)4
Book 5 Unit 1~Unit 3语法巩固练习
基于COCA语料库的近义词辨析 ——以choose和select为例
《健民短语》一则
基于JAVAEE的维吾尔中介语语料库开发与实现