学习者语料库与英语学习型词典编纂*

2010-08-07 03:00
辞书研究 2010年3期
关键词:本族语高阶学习型

徐 海

(广东外语外贸大学外国语言学及应用语言学研究中心 广州 510420)

一、引 言

对外语学习者产出的语言错误进行诊断、分类和系统解释,并不是一种新的研究手段。Corder于上世纪六七十年代就提出错误分析(error analysis)这一概念,指出可通过调查语言错误了解中介语的发展过程。学习者语料库(learner corpus)的诞生,为大规模、系统的错误分析注入了新的活力,为新一代学习型词典编纂奠定了基础。“研究学习者语料库,即研究大多数学习者易犯的各种错误类型,所得到的结果对ESL词典编纂确实产生了很大的影响。”[1]

学习者语料库由外语学习者产出的书面语和口语语料构成,语料通常来源于非本族语学生的作业或考试答卷,其建立是为了揭示外语学习者与本族语者之间的语言差异以及第二语言的发展规律。在建设学习者语料库时,应当考虑学习者因素和任务因素的影响。[2]学习者因素包括其年龄、二语水平、母语背景等;任务因素含语料的类型(作文、信函、考试答卷等)、语料的文体风格、语料覆盖的话题等。国际上比较著名的英语学习者语料库包括1200万词次的朗文学习者语料库(Longman Learners'Corpus,LLC)[3]、3500万词次的剑桥学习者语料库(Cambridge Learner Corpus,CLC)[4]和约400万词次的国际学习者英语语料库(International Corpus of Learner English,ICLE)[5]。我国也于上世纪90年代开始重视学习者语料库的开发,比较著名的有广东外语外贸大学和上海交通大学联合开发的100万词次的中国学习者英语语料库(Chinese Learner English Corpus,CLEC)及北京外国语大学文秋芳、梁茂成等开发的中国学生英语口笔语语料库(Spoken and Written English Corpus of Chinese Learners,SWECCL)[6]。

二、学习者语料库在学习型词典编纂中的作用

学习者语料库在以下几个方面有助于学习型词典的编纂:

首先,学习者语料库有助于选词立目。研究发现,最常用的2000词覆盖80%以上的口语或书面语语篇。[7]这些高频词必然要收录进词典。2000词以外的词目词如何确定?Tono认为可通过对比本族语语料库与学习者语料库,了解英语学习者更常用哪些词,而这些词正是他们英语表达时想要的,应当立目详解,满足其交际需求。[8]

学习者语料库与本族语语料库对比亦能揭示在外语学习的某一阶段哪些词泛用或少用。可以利用 WordSmith Tools、AntConc等语料库检索工具中的word list功能,分别生成本族语语料库词表和学习者语料库词表。再通过keywords功能了解外语学习者泛用和少用的词。例如,CLEC与FLOB(Freiburg-LOB Corpus of British English)语料库对比发现,中国学习者比本族语者过度使用we,people,I,can,water,job,my,is,do,our等词,而较少使用 let's,legalize,government,faster,clean,agony,honor,province,examination,furthermore等词。词典在立目时可通过适当的标记符号提醒学习者避免泛用或少用被过度使用的这些词。另外,学习者语料库中易拼写错误的词,例如在CLEC中,survey错写成servey、convenient错写成 convinient等,也应当在学习型词典中予以警示。

学习者语料库还能显示各个阶段二语词汇的发展。外语学习中一个值得注意的现象是泛用nice、happy之类的普通形容词。表1显示CLEC各子语料库[9]中这两个形容词的使用状况。显然,初学者最易过多使用这些形容词,而高阶学习者开始注意用更准确的词来替换泛用的形容词。学习者语料库所提供的相关信息将有助于词典编纂者针对不同水平的学习者的需求确定词目词的详解程度。

表1 形容词nice和happy在CLEC各子语料库中的词频

其次,学习者语料库有助于词典编纂者针对特定学习者的常见错误进行判断和归类,更有效地设置用法说明等。学习型词典有设置错误警示的传统,例如,《剑桥高阶英语学习词典》(2003)中对“pay for”的用法设有如下说明:

pay for

Remember that payis always followed by the preposition`for'if there is a direct object,except in certain phrases such as`pay a bill/fine,etc.'You have topayfor the tickets in advance,I'm afraid.You have to pay the tickets in advance,I'm a fraid.

该用法说明提醒英语学习者注意正确使用pay后面的介词for。英语学习型词典所囊括的错误警示大致为五类:(1)词汇选择错误(例如,说 damage someone's health而不说 injure someone's health);(2)动词的语法形式错误(例如,have problems to do something是错误说法,应为have problems doing something);(3)动词句型错误(例如,可以说He proposed a possible solution to me.,但不说He proposed me a possible solution.);(4)词在句中位置错误(例如,especially不出现在句首);(5)语法或词汇搭配错误(例如,I have to do a speech.是错误的,可改为I have to make a speech.)。[10]

尽管现行英语学习型词典中列举的这些错误信息很有价值,但也存在不足:词典中所提供的错误有时缺少事实依据,很多为编纂者预测外语学习者可能会犯的错误,因而未能针对学习者的特定外语水平设置错误警示。例如,《剑桥高阶英语词典》在词条“talk”中设的一个错误警示“She talks excellent French.” ,显然低估了那些会查阅高阶词典的学习者的语言水平。

另一方面,英美国家出版的学习型词典因服务于世界各地学习者,难以完全针对中国英语学习者所犯的语言错误而设置相关的用法说明。以单词knowledge为例,检索CLEC不难发现,可能受汉语影响,中国学生倾向于使用短语learn knowledge:在CLEC出现的921例knowledge中,有124例与learn连用,为出现频率最高的短语。然而,检索英国国家语料库(BNC)发现,经常与knowledge搭配的动词依次是acquire,gain,require,deny,possess,impart,lack,share,use,test,extend,pool,glean,accumulate,disseminate,develop,update,increase,apply等,而未见一例learn knowledge。在五大学习型词典中,仅有两部最新版的词典在knowledge条设有用法说明。《麦克米伦》(第2版,2007)在词条knowledge中设的“Get it Right”(纠错栏)中指出该词为不可数名词,后接的介词不能为in或on。而《朗文》(第5版,2009)则设了三个栏目说明其用法:“Register”(语体栏)指出在日常英语中,人们常说know about而不是have knowledge of/about something;“Grammar”(语法栏)中介绍 knowledge为不可数名词;“Common Errors”(常见错误栏)则精当地指出学习者易犯的搭配错误:“Do not say`learn knowledge'.Say gain knowledge or acquire knowledge.”

随着学习者语料库的规模不断扩大以及语料分析越来越精细,会有越来越多的英语学习型词典有针对性地警示学习者,设置更多用法栏目。

第三,学习者语料库有助于发现英语学习者与本族语者之间深层次的语言差距,发掘英语学习者隐性的语言错误,从而在学习型词典中设置新的专栏,更好地发挥词典的编码功能。与本族语者相比,外语学习者语言的一个比较大的问题是词汇和语法搭配的使用。外语学习者常较少使用甚至回避一些语词搭配。下面我们在T ono[11]研究的基础上,通过比较BNC、日本英语学习者语料库(Japanese EFL Learner Corpus,JEFLL[12])和CLEC的相关数据,考察中国英语学习者在使用动词make时可能少用及不用的搭配。表2数据显示,日本英语学习者常用money,food,breakfast,friends等具体的名词与make搭配,而本族语者在使用make时,常用抽象名词与之搭配,如sense,way,use,decision等。与之相比,中国英语学习者使用的make搭配词有自身的特点:make haste、make practice等虽系make与表抽象意义的名词搭配,然而英美人却不习惯这样搭配;make water则是不地道的表达法。因此,为中国学生编纂的词典除应多列举一些常出现的高频搭配,还应当考虑学习者的需求。具体而言,初级英语词典可多花些篇幅描述make的核心意义(即“做、制造”等义)的搭配,而高阶学习型词典应花更多篇幅列举可与make搭配的表抽象义的搭配词。

表2 动词“make”在BNC、JEFLL和CLEC中与名词的搭配

与本族语者相比,外国学生另外一个常见错误是用词与当前文体风格不符。学习者语料库显示,学生在学术英语中常误用诸如“maybe” 、“as far as I am concerned”、“I would like to talk about”等出现在口语中的词语和句式。这些用词虽没有语法错误,但不合文体要求。为帮助学习者减少学术写作中的表达问题,麦克米伦出版公司与比利时鲁汶大学语料库语言学中心合作,对国际学习者英语语料库(ICLE)进行大规模的语料分析,并与BNC中的学术英语子语料库对比,获得第一手的宝贵数据[13][14],首次在《麦克米伦高阶英语词典》(2007)中设置“IMPROVE YOUR WRITING SKILLS”(改进你的写作技能)专栏,集中介绍“添加信息”、“对比与比较:描述相似性与差异”、“举例”等12项学术写作功能以及“冠词”、“补足语:动词、名词与形容词使用句型”、“名词的可数与不可数”等6类语法要点。该栏目“应用语料库数据显性地表现出了学习者在实现某一写作功能时经常遇到的困难,以便词典使用者能掌握更适当的写作策略”。[15]例如,图1直观显示besides在本族语者的学术英语中很少出现,而英语学习者却经常在学术写作中使用该词。同时,词典用“BE CAREFUL!”警示学习者该词主要用于口语和非正式文体中。图2则对比了“similarly/in the same way/likewise”三词在学术英语中的出现频率,表明“similarly”比“in the same way”和“likewise”常用。这些基于语料库的直观信息对于改善学生的学术写作能力大有裨益。

图1 《麦克米伦高阶英语词典》对副词“besides”在学术英语中用法的提示

图2 《麦克米伦高阶英语词典》对比“similarly/in the same way/likewise”在学术英语中的出现频率

总之,对学习者语料库数据深入挖掘与应用,将有助于学习型词典开发新的专栏,防止语言错误出现,更大程度发挥其编码功能。

三、结 语

学习者语料库将在英语学习词典编纂中发挥重要作用。借助语料库检索工具,分析学习者语料库中所包含的语言错误信息,将有助于了解各个阶段、各种母语背景的学习者的中介语特点,从而有助于英语学习型词典选词立目,有助于设置用法说明、错误警示、图表对比等相关栏目。

要充分利用学习者语料库,还需要进一步解决相关理论和实践问题。学习者语料库是以错误分析理论为基础的,然而该理论从上世纪中期提出以来一直没有大的发展。实际操作方面,与本族语语料库相比,学习者语料库无论在规模、语料的代表性还是检索工具的开发等方面,依然相对落后。当今的学习者语料库规模偏小,还未有一个学习者语料库词次上亿;选取的语料缺少代表性和典型性;语料检索工具仍主要服务于本族语语料库,对学习者的词汇、句法、语用等错误不敏感。这些问题都限制了学习者语料库在学习型词典编纂中的应用。同时,词典编纂者也需要加强语料库相关知识与操作的培训,从而在编纂过程中更好地运用学习者语料库。

附 注

[1]Landau S I.Dictionaries:The Art and Cra ft of Lex icography.Cambridge:Cambridge University P ress,2001:293.

[2][13]Gilquin G,Granger S,Paquot M.Learner Co rpora:The Missing Link in EAP Pedagogy.Journal of English f or Academic Purposes,2007(4):319-335.

[3]与朗文兰开斯特英语语料库(Longman Lancaster English Corpus)和朗文口语语料库(Longman Spoken Corpus)共同构建成3.3亿词次的朗文语料库网络(Longman Corpus Network),参见 http:∥www.pearsonlongman.com/dictionaries/corpus/。

[4]为5亿词次的剑桥国际语料库的一部分,参见http:∥cambridge.org/elt/corpus/international-corpus.htm。

[5] 现包括21种母语背景的学习者产出的英语语料,参见http:∥cecl.fltr.ucl.ac.be/Cecl-Projects/Icle/icle.htm。

[6]收集的语料为全国英语专业四、八级口试语料(100万余词)与英语专业学生的议论文和说明文语料(约120万词)。

[7]Nation I S P.Learning Vocabulary in Another Language.Cambridge:Cambridge University Press,2001:13-17.

[8][10][11]T ono Y.The Potential of Learner Corpora for Pedagogical Lexicography.∥Ooi V B Y,Pakir A,Talib I S,Tan P K W.(eds.)Perspectives in Lexicography:Asia and Beyond.Tel Aviv:K.Dictionaries Ltd.,2009:105-116.

[9]五个子语料库收词相当,分别为20万词次左右。

[12] 参见http:∥jefll.corpuscobo.net/。

[14][15]Rundell M.语料库词典学的最新发展和未来趋势(下).辞书研究,2009(4).

猜你喜欢
本族语高阶学习型
有限图上高阶Yamabe型方程的非平凡解
高阶各向异性Cahn-Hilliard-Navier-Stokes系统的弱解
滚动轴承寿命高阶计算与应用
一类完整Coriolis力作用下的高阶非线性Schrödinger方程的推导
做学习型父母 和孩子共成长
《本族语和非本族语科技写作中的词块:语料库方法在语言教学中的应用》述评
Non—Native Educators inEnglish Language Teaching述评
建设学习型党组织的实践与思考
英汉本族语者对中国英语学习者的口音感知及言语理解度的对比研究
创建学习型教师团队