崔维霞王均松
语料库与语言教育
——思想、方法和技术
崔维霞王均松
语料库语言学是最近 30年以来在国外迅速发展起来的跨领域学科,在教学中引入语料库是当今语言教育发展的新趋势。 本文重点探讨了语料库在语言教学中的具体应用:1)语料库作为教学资源;2)语料库作为教学手段;3)语料库作为研究中介语的平台。目前,语料库应用于语言教学虽然面临一系列的问题和挑战,但其未来的发展前景无限广阔。
语料库 语言教育 问题和挑战
语料库语言学是20世纪中后期兴起的一门语言研究科学。在过去的几十年中,语料库不仅用于语言研究,而且在语言学习和教学方面也发挥了重要的作用。近年来,越来越多的研究人员和教育工作者开始利用语料库进行语言教学方面的尝试,并在各自领域取得了一定的成果。本文主要探讨语料库作为语言教学资源、教学手段以及中介语研究平台三个方面的具体应用,并对语料库应用于语言教学所面临的问题和挑战进行了分析和讨论。
在《语料库语言学导论》一书中,杨惠中指出语料库是指按照一定的语言学原则,运用随机抽样方法,通过收集自然出现的连续语言运用文本或话语片段,而建成的具有一定容量的大型电子文本库。根据研究目的、用途、加工程度以及语料库所代表的语言类型等方面,语料库可以分为多种类型。黄昌宁和李涓子就曾把语料库分成四种类型:异质的、同质的、系统的和专用的。此外,按照语料的语种,语料库也可以分成单语的、双语的和多语的。按照加工程度,语料库又可以分为原始语料库和赋码语料库。按照采集语料的时间跨度,语料库还可以分为共时语料库和历时语料库。总之,语料库的类型多种多样,其在语言教学中的应用也各不相同。
1.语料库作为教学资源
语料库是大量真实语言材料的集合,在教学过程中通常被用作教学资源库。语料库作为教学资源的一个重要体现就是主要作为大纲设计和教材编写的依据。何安平指出,在制定教学大纲和编写教材的过程中,语料库提供的信息是非常重要的参照,它关系到是否能让学生在有限的时间内最先学到最常用往往也是最有用的语言知识。比如,Mind 将情态动词、将来时表达法和条件句在英语母语语料库中的分布频率与这些结构在德国热门英语教材中的教学次序作了比较,结果发现:凡是没有基于语料库的教材中,这些语言结构的出现顺序“往往与人们预想的口语和书面语中的出现情况不一致”。他指出教学大纲的编写应以实证为依据,而不是以直觉为基础,要以实际语言使用的频率数据为指导来安排教学的先后顺序。其次,语料库还可以直接用作课堂教材。在讲授某一具体的语言点的时候,教师从语料库中选取一批实例,根据难易程度稍作筛选之后便可拿到课堂上使用,这样既能让学生接触到大量真实鲜活的语料,还能激发学生主动探索和学习的积极性。有的老师甚至指导学生自建与日常教学相关的语料库,然后应用到外语写作、翻译、语音和口语等多种课程教学之中。
另一方面,学习者还可以直接利用大量免费在线的语料库进行自主学习。其中“美国当代英语语料库”(COCA)是目前世界上最大的英语平衡语料库,并且免费对公众开放。该语料库由杨柏翰大学的 Mark Davies 教授开发,库容规模达到 4.5 亿词汇,语料涵盖了口语、小说、流行杂志、报纸和学术期刊五大类型,时间跨度为 24年(1990—2014),并且每年至少更新两次。利用该语料库,学习者只需在检索框输入要查询的词汇和结构,便可以获取大量的索引行,通过归纳和总结可以很快地掌握该词汇或结构在具体语境中的意义和用法。当学习者无法确定某种用法或搭配是否地道或典型时,也可以借助该语料库进行验证。此外,该语料库还可以用于同义词辨析方面。将需要区分的同义词分别输入检索项,确定搭配词的词类和跨距,然后对搭配词进行统计和分析。通过比较同义词的搭配词可以对二者的意义和用法进行区别,如果要作进一步的区分,还可以考查二者在频率和语域分布方面的差异。
2.语料库作为教学手段
语料库不仅能为语言学习提供丰富的教学资源,而且也是一种重要的教学手段,代表了一种先进的教学理念。20世纪 90年代Tim Johns 提出的“数据驱动学习模式”(Data-driven Learning)就是基于语料库数据的一种新型外语学习方法,它的主要思想是指引语言学习者充分利用网络和语料库资源,通过观察和分析大量客观真实的语料,发现语言语法规则、意义表达及语用特征,积极主动地解决问题。下面以词汇教学为例来演示这种基于语料库的数据驱动学习模式。
在一次题为 Pocket Money 的作文互评中,对于短语“such as”是否可以与短语“and so on”连用的问题上学生之间产生了分歧,一部分同学认为可以连用,另一部分同学持相反的意见。经过调查发现,同学们对于短语“such as”的掌握普遍不够全面和准确。对此,授课教师要因势利导,将数据驱动的学习方式引入课堂,引导学生主动探究词汇的意义和用法。具体步骤如下:
首先,预设问题。除了存在分歧的问题外,教师还要针对语言点的具体用法提出更多问题供学生思考和回答。在这个具体的例子中,预设的问题包括:
1)“such as”是否可以与“and so on”连用?
2)“such as”后面除了接名词以外,是否还可以接其他句子成分?
3)“such as”列举事物的数目有没有限制?
其次,选取语料并观察。在语料库中检索包含短语“such as”的语言实例,并将索引行以关键词居中(KWIC)的形式呈现给学生。在选取语料时,数量既不能太多也不能太少,数量太多会增加观察的负担,使学生产生厌烦心理;太少则不具备代表性,影响结论的准确性和客观性。Sinclair 的做法是对索引行进行抽样,只取其中的 30 行(一屏)左右进行观察,必要时进行再次抽样。索引行的语言难度也要适中,剔除难度过大或不相关的索引行。在观察的过程中也要给予一定的指导,不仅要左右看还要上下看,注意归纳总结语言使用的规律和特点。
最后,总结和汇报。将学生分为若干小组(每组 4—5人),针对预设问题进行讨论和总结,然后每个小组选出代表进行汇报。在讨论的过程中,教师要鼓励学生勇于探索和发现,敢于质疑和挑战传统词典和教科书的权威。在讨论和汇报结束后,教师还要对讨论的过程进行评价,对讨论的结果进行总结。基于语料库的数据验证发现:1)“such as”和“and so on”的搭配强度很弱,二者连用的频率非常低;2)“such as”后面除了接名词以外,还可以接其他的词类(如代词、动名词等)和句子;3)“such as”列举事物的数目没有严格的限制,既可以是单个,也可以是两个或多个。
3.语料库作为研究中介语的平台
20世纪 90年代, 基于学习者语料库的中介语对比分析(CIA) 逐渐成为二语习得研究的新方法,这种对比分析方法能为外语教学提供极有价值的资源和信息。学习者语料库是通过收集语言学习者各种书面语和口语的自然语料而建立的一种学习者语言数据库,其目的在于对学习者的语言特征和语言发展进行全面和系统的对比分析,而不仅限于对学习者的错误进行分析。例如,比利时学者 Dagncaux 曾基于“国际英语学习者语料库”(ICLE) 对法国大学两种不同英语水平的大学生写作语料进行全面的错误类型调查。首先由以英语为母语的教师和以法语为母语的英语教师联合批改作文,然后对各种差误进行半自动的系统标码,最后通过检索差误标码调查学生的差误类型和频率分布。结果发现,高年级学生无论在总体出错次数上还是具体某些类别的差错上都明显地少于低年级学生。但在差误类型上则有较大的差异,如低年级学生的出错集中于助动词的使用,而高年级的学生的动词时态出错率要多于助动词。这些信息可以反映学生在不同阶段的语言学习的特征以及存在的主要问题,对于教学具有重要的参考价值。
总而言之,学习者语料库的优势在于能够提供有关学习者语言发展的全面信息。在外语学习和教学中,基于学习者语料库的研究,能提供学习者学习的典型困难以及在某一具体方面的主要障碍的反馈信息。另外,通过对不同类型学习者的语言对比,可以发现学习者在某一发展阶段的共同特征和个体特征,从而将这些信息反馈到外语教学的大纲设计、教材开发以及课堂教学等方面,使教学更加适应学习者的需求。
尽管语料库在语言教育中的重要作用已经得到广泛的关注和认可,但是依然面临很多问题和挑战。首先,语料库的优势之一就是能够为语言教学提供频率信息,然而有学者认为在语言学习中使用语料库会不恰当地关注高频语言,而舍弃那些不太常用却又十分重要的表达法。其次,有的学者赞成使用赋码语料库,因为它们可以为语言教学提供充足的信息。同时,有的学者反对使用赋码语料库,正是因为它们提供了太多的信息,有些信息甚至是误导性的。而另一方面,原始语料库虽然简洁、真实,但是毕竟提供的信息很有限。再次,将语料库引入课堂教学是一项费时费力的工作,很多尝试数据驱动教学模式的教师反映备课时间要比普通备课时间多 1—2 倍。而学生虽然对新的教学模式表现出浓厚的兴趣,但是在课下使用语料库进行自主学习的则寥寥无几,部分原因是学生对语料库软件和操作界面不熟悉,或者是因为从语料库中检索出来的语言实例和信息量过大且没有进行筛选和加工,学生们对此往往是望而生怯,知难而退。此外,目前针对语言教学的语料库的数量还太少,由于语料来源的版权问题,语料库的规模、代表性以及流通的广泛性都受到了限制,因此如何实现教学语料库的共建、共享,充分发挥语料库在语言教学中的作用是目前亟待解决的一个重要课题。
[1]Mindt,D.:English corpus linguistics and the foreign language teaching syllabus,In J.Thomas& M.Short,(eds.):Using Corpora for Language Research(London:Longman,1996)P232-247.
[2]Johns,T.: “From printout to handout:Grammar and vocabulary teaching in the context of data-driven learning,”English Language ResearchJournal,no.4(1991):P27-45.
[3]Dagncaux,E.,Denness,S.&S.Granger.: “Computer-aided error analysis,”System,(no.26Feb.1998):P163-174.
[4]杨惠中:《语料库语言学导论》,上海外语教育出版社,2002。
[5]黄昌宁、李涓子:《语料库语言学》,商务印书馆,2007。
[6]何安平:《语料库语言学与英语教学》,外语教学与研究出版社,2004。
作者单位:崔维霞 西安外国语大学高职部 陕西西安
王均松 西北工业大学外国语学院 陕西西安
本文为教育部人文社科基金 “基于双向平行语料库的话语标记语对比研究”(编号:15YJC740083)、陕西省教育厅项目“话语标记语:基于语料库的跨语言对比研究”(编号:16JK1623)、西安外国语大学科研基金项目“基于语料库的专门用途英语主题词表的创建及应用研究”(编号:11XWB01)的阶段性成果。