语料库数据驱动与二语词汇自主学习探究

2009-05-05 01:47
关键词:数据驱动语料库自主学习

陈 颖

摘 要:语料库数据驱动与自主学习理念均倡导在真实的语言材料中自我探索和发现语言事实的主动学习过程。利用 CLEC、BNC语料库和Sketch Engine检索工具,结合实例,从词语搭配、同义词辨析和语义韵三个层面探讨数据驱动方法在二语词汇自主学 习中的应用及价值。数据驱动方法能极大激发学习者的求知欲和探索精神,促使学习者获得的语言知识地道自然、体系性更强、储存更长 久。

关键词:词汇;自主学习;语料库;数据驱动

中图分类号:H319.3文献标识码:A文章编号:1672-1101(2009)04-0066-04

A study on corpus-based data-driven method and autonomous

learning of second language vocabulary

CHEN Ying

(School of Foreign Languages,Jiangsu Polytechnic University,Changzhou,Jiangsu 213164,China)

Abstract:Both data-driven learning (DDL) and autonomous learning advocate active learning to explore anddiscover language rules from authentic materials.With the help of Sketch Engine and examples based on CLEC and BNC,the paperattempts to discuss,from the perspectives of word collocation,synonym discrimination and semantic prosody,the application and valueof DDL in English vocabulary autonomous learning.Inspiring learners' curiosity and explorative spirit,DDL can make the acquiredknowledge idiomatic,more systematic and lasting.

Key words:vocabulary;autonomous learning;corpus;data-driven learning

词汇是语言永恒的主题[1]。近十年来,人们从认知心理学、认知语言学、语义学、语体学、语用学等多角度对词汇教学进行了广 泛深入的探讨。随着计算机、网络和多媒体技术的迅猛发展,语料库与二语教学结合得日益紧密。已有不少研究探讨语料库的技术和方法[2-3]、语料库工具在语言教学中的应用[4-5]以及基于语料库的教学模式和策略[6-7]。纵观以上研究,可以看出:第一, 语料库在语言教学中的作用正日益引起人们的关注,但此方面的探索尚不完善;第二,相当一部分研究是对语料库及其检索工具、使用方 法的介绍或概述;第三,多数研究是从教学主体即教师的角度切入探讨语料库在课堂教学中的效用,语料库在学习者课外自主学习领域的 研究和普及未得到足够的重视。本文将从学习主体角度出发,从词汇学习的三个重要层面,探索学习者如何利用语料库数据驱动方法自主 习得二语词汇。

一、自主学习理念

自主学习是学习者自我负责管理语言学习的能力,即由自己决定学习目标,确定学习内容和进度,选择学习方法和技巧,监控学习过程及 自我评估学习效果[8]。自主学习理念以建构主义理论为支撑,认为知识的获得是学习者个体与外部环境交互作用的结果,学习 过程是人的思维活动的主动建构过程,即学习者根据自己的需要、兴趣、爱好,利用原有的知识结构对外部信息进行主动选择、加工和处 理,强调学生通过充分利用信息资源主动建构所学知识的体系。自主学习极大制约着学习者的外语学习成败,外语教学的最终目的之一是 帮助学习者获得和发展自主学习能力。《大学英语课程教学要求》明确指出新的教学模式应以现代信息技术为支撑,使英语教学不受时间 和地点的限制,朝着个性化学习,自主性学习方向发展。面对当今学习者自主学习意识普遍淡薄的客观现状,如何寻找突破口,运用科学 的手段和方式对学习者予以积极有效的引导,使他们获得进行自主学习的平台、方法、策略和技能成为当今我国教学改革迫在眉睫的重要 任务之一。

二、数据驱动学习的原理及特征

计算机网络的飞速发展和普及促使语料库技术日益成熟,并已成为外语教学界热门话题。语料库是“应用计算机技术对海量自然语言材料进 行处理、存储,以供自动检索、索引以及统计、分析的大型资料库”[9]。语料库因容量大、语言翔实、来源广泛、形式多元化、 检索快捷准确等独特优势而成为语言学研究不可缺少的基础资源。数据驱动学习是二十世纪九十年代初由Tim Johns提出,鼓励学习者积极 、主动从真实的语料中观察、概括和归纳语言事实[10]。数据驱动方法的原理通常是由学习者提出一个需要解决的问题,利用大 量的语料库数据,运用检索软件,独立地搜索、分析、处理语料,在真实的语言事实中去经历、归纳语言规律,掌握语言知识。以上过程 与自主学习理念所倡导的问题性、主动性、独立性和体验性高度吻合,其特征可总结为[3]19-20:(1)以学生的自主学习为中 心,强调学习者个性特点的发挥;(2)以翔实、丰富的语料为语言输入,建构学习者深入学习的环境,促进语言习得;(3)强调自我探 索和发现的学习过程,使知识更加有意义、体系化和长久;(4)主张自下而上的归纳式学习。可见,数据驱动学习与传统的教学模式存在 很大区别,是一种以学习者为中心的自主性、发现式学习。

三、数据驱动方法在词汇自主学习中的应用

语料库数据驱动为词汇自主学习提供了良好的平台和有力的支持。词汇学习涉及到词汇意义不同层面的记忆以及词汇的搭配使用、语体意 识等产出性词汇能力的培养和形成。然而,传统的词汇教学通常以“词义驱动”为主,学习者往往只通过机械记忆单词及中文对应意思扩大词 汇量,较少涉及搭配、语用规则和语境等深层次的内容,即便他们已掌握了相当数量的词汇,但当把这些单词放进语篇时,理解和应用也 经常出现问题[11]。词汇学习效果不佳是令教师、学习者长期困扰的问题。认知学说认为学习是对意义亲身发现的过程,学习者 应独立或较少受控制地去认识学习对象的各种关系和解决相关的问题。数据驱动下的词汇学习模式最显著的特点是,学习者通过专业软件 检索语料库得到以关键词为中心的索引行,对索引行进行观察、分析,自行发现所查询关键词的语言规则和运用语境。下文将利用CLEC (Chinese Learners English Corpus,中国学习者英语语料库)、BNC(British National Corpus,英国国家语料库)和Sketch Engine检索工 具,结合实例,从词汇学习的三个重要方面,即词语搭配、同义词辨析和语义韵,探讨数据驱动方法在二语词汇自主学习中的应用 及其价值。

(一)词汇搭配

词汇学习包括量和质两个不可或缺的方面。词汇学习量的提高强调对单词的积累和增加,而词汇学习质的提高偏重于词与词之间的组合行 为,强调词组的搭配习惯[12]。词语搭配无疑是词汇学习和研究的重点。Sinclair将搭配定义为“两个或两个以上的词在文本中短距离内的共现”[13]。传统的词 汇搭配教学方法是教师凭借自己的学习经验或查字典教给学生词汇搭配规律。通过内省的定性方法,或依靠词典,很难对词的搭配做出全 面、明确的解释,结果学生对于一个词的记忆和认识往往是死板、片面的。借助语料库来学习和研究搭配的具体办法是利用索引软件从语 料库中将关键词的所有搭配词提取出来,采用Z值或M值等统计手段来测量各种搭配词与关键词共现的显著程度以确定该词语的典型搭配频 率以及模式等。现以ability为例展示如何利用数据驱动方法自主学习词汇搭配。首先分别在CLEC和BNC的检索界面输入关键词ability,搜索 出与之搭配的动词。统计显示,中国学习者经常使用的与名词ability搭的一些动词在本族语语言中几乎不存在,如,学习者习惯将display、 perform、practice、prove等动词与ability搭配使用,表达“展示能力”之意,而这些搭配为英语本族语者所不用,本族语者频繁使用 demonstrate ability表达上述含义,这样的搭配学习者却使用甚少。ability是使用频率较高的单词之一,但在母语负迁移、词语用法习得单 一等多因素共同作用下,学习者对ability一词的搭配存在明显误用情况。数据驱动的定量分析使学习者得以看到以往凭直觉无法发现的问题,纠正学习过程中出现的错误,学会词语的地道搭配方法,且印象深刻 、持久。在这样一个探索性的自主学习过程中,学习者已经成为了研究者,变被动接受为主动发现,从而牢记、内化通过自己的努力所发 现的语言知识。

(二)同义词辨析

英语词汇中有大量同义词和近义词。同义词辨析是外语教学中一大难题。传统的近义词辨析方法是教师凭“语言直觉”或词典解释,辅之以少 量例句。教师经验式定性分析和词典释义往往脱离具体语境,远不足以描述同义词语义上的细微差异,不能对近义词的各义项进行有效的 分析,这种方法效率低、效果差[14]。数据驱动方法可以很好地解决这个问题。它提供给学生的语言数据具有两大特征,一是其 高质量输入,二是其大数量语言的输入。在语料库这样真实、有意义的语言环境中,学习者可根据自己已有的语言知识,积极主动地发现 同义词之间的语义、语用差异,准确使用词汇。

在众多的检索工具中,Sketch Engine代表了新一代语料库检索程序,具有对同义词的常用搭配和习惯用法进行对比的强大功能,这些功能 为同义词辨析提供最具说服力的例证。下面以preserve和conserve为例介绍Sketch Engine用于同义词辨析的方法和步骤。在SketchEngine窗口顶部选择Sketch-Diff,依次在lemma框内输入preserve和conserve,并设置好所对应的参数,点击Show Diff,然后与两个词 在BNC中搭配的词分别被提取出来(截图略)。在此仅分析这两个动词的宾语情况。与preserve 和conserve搭配的名词按所统计的搭配频 率和搭配显著性分别自动排列。借助查询结果,根据动词后所跟宾语的情况,学习者可提炼、归纳出preserve和conserve的词义区别: preserve宾语多为抽象概念的名词,如preserve integrity (保持完整)、preserve peace (保持和平/平和的状态)、preserve independence(保持独立)、preserve balance (保持平衡)、preserve status quo(保持社会现状),因而可判断preserve突出“保持(状态)”的意义;与 conserve比较突出的搭配多为表示“能量”、“资源”等具体意义的词,如conserve energy(保存能量)、conserve heat (保存热量)、 conserve water (保护水资源)、conserve resource (保护资源)、conserve residue (保留残余物),等,可见conserve更加强调“保存”、“保 护”、“保留”之意。至此,preserve 和conserve这对近义词的语义差异跃然纸上。

学习者利用语料库的数据驱动方法,通过独立思考,在大量、原汁原味的自然语境中得以洞察同义词之间的微妙差异,真正成为了 学习的主人。通过自我探索而发现的语言事实会留给学习者更深刻的印象,其知识体系更强,记忆储存也因此更长久。

(三)语义韵

语义韵是现代词语研究中的一个重要概念,最早由Sinclair提出,指关键词项的典型搭配词在其语境中营造出的语义氛围[13]。英 语中某些词项会习惯地吸引某一类具有相同语义特点的词项,构成搭配,显示一定的语义趋向。这些具有相同语义特点的词项和关键词在 文本中高频共现,后者“传染”上了有关的语义特点,整个语境就弥漫着某种语义气氛,这就是语义韵。语义韵大体可分为积极语义韵、中性 语义韵和消极语义韵三大类[15],无论是哪一类情况,关键词的搭配行为都有规律可循,都隐含或明确表达语言使用者的态度与评价意义,实现某种语用目的或功能 [16]。

本族语者对词项的语义韵有某种直觉而能下意识地自如运用,但对于二语学习者来说无疑是个难题。如果在词汇学习中不注意词项的典型 搭配行为,其语义韵就会受到破坏,导致词语用法错误、翻译错误或跨文化交际失误。下面以cause为例阐述如何运用数据驱动方法获得其 语韵特征。运行Sketch Engine的word sketch功能,输入关键词cause,所有与之搭配的词项顷刻呈现(截图略)。从使用频率来看,排在 前十位的搭配词项分别为problem、damage、death、injury、harm、difficulty、confusion、disruption、distress以及chaos;与其搭配显 著值最高的词项是damage、harm、stir、problem、disruption、trouble、havoc、injury、distress和delay。通过观察,发现cause通常与表 示问题、破坏、死亡、伤害、困难等不愉快的事物或概念相联系,在文本中吸引的搭配词无一例外具有消极语义特点,呈现明显的消极语 义韵。由此可判断学习者语料库中出现的cause of progress/success/boom(进步/成功/繁荣的原因)属典型的语用错误,其根本原因在于 学习者对该词的语义韵规律了解甚少。

在词汇学习过程中引入语义韵概念十分必要。学习者依据语料库中海量、翔实的语言实例,通过数据统计、观察、分析和概括,便能够科 学地描述出词项可能的语义韵,增强语义选择趋向意识,这种变“学习者”为“探索者”的数据驱动过程更利于调动学习者的创造性思维和钻研 精神,有助于提高学习者的词语搭配能力乃至语用能力,有利于习得自然、地道的语言。

四、结语

数据驱动方法代表着教学模式的转变,揭示了新的学习理念。数据驱动自主学习以翔实的语言材料、便捷的提取功能和突出的比较特点为 学习者提供了一种开放、探究式的学习环境,充分体现学习者是认知的主体,能有效地激发学习者的求知欲和探索精神,激活其学习内驱 力,触发内在习得机制,掌握、巩固语言知识。在我国英语教学改革的促进下,基于信息技术的数据驱动方法在二语词汇自主学习领域的 应用前景将十分广阔。

参考文献:

[1] 马广惠.二语词汇知识理论框架[J].外语与外语教学,2007(4):22-24.

[2] 杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002:33.

[3] 甄凤超.语料库数据驱动的外语学习:思想、方法和技术[J].外语界,2005(4):19-27.

[4] 李文忠.语料库索引在外语教学中的应用[J].解放军外国语学院学报,2001,24(2):20-25.

[5] 濮建中.英语词汇教学中的类联接、搭配及词块[J].外语教学与研究,2003(6):438-445.

[6] 梁红梅.语料库驱动下的外语在线自主学习模式[J].外语电化教学,2005(6):29-32.

[7] 腾延江.基于语料库的英语写作教学新模式[J].外语电化教学,2006(6):49-54.

[8] Holes H.Autonomy and Foreign Language Learning [M].Oxford:Pergamon,1983:20.

[9] 李文中.语料库、学习者语料库与外语教学[J].外语界,1999(1):51-55.

[10] Hunston S.Corpora in Applied Linguistics [M].Cambridge:Cambridge University Press,2002:170.

[11] 楚向群.高级英语词汇自主学习的语料库方法[J].外语电化教学,2007(5):12-16.

[12] 鲍贵.在线Cobuild检索和搭配取样器在外语教学中的应用[J].外语电化教学,2006(6):63-69.

[13] Sinclair J.Corpus,Concordance,Collocation [M].Oxford:Oxford University Press,1991:170.

[14] 杨节之.语料库搭配索引与英语同义词辨析[J].外语电化教学,2007(8):41-46.

[15] Stubbs M.Text and Corpus Analysis [M].Oxford:Blackwell Publishers,1996:176.

[16] 卫乃兴.基于语料库学生英语中的语义韵对比研究.外语学刊,2006(5):50-55.

[责任编辑:吴晓红]

猜你喜欢
数据驱动语料库自主学习
《语料库翻译文体学》评介
基于网络与数据智能化的数码印花产品设计定制模式研究
数据驱动理念在大学英语课程中的应用
大数据背景下的警务模式创新研究
中职学校“生本课堂”的调查研究与实践
践行少教多学,构建高效课堂
对学生自主学习的探索
元认知策略在大学非英语专业自主学习中的应用
《计算机控制技术》课程教改探讨
基于JAVAEE的维吾尔中介语语料库开发与实现