学习者语料库与二语、三语习得研究:回顾与展望
李伟超
(西藏大学 旅游与外语学院,西藏 拉萨 850000)
摘要:回顾了基于学习者语料库的二语习得研究,并对三语习得研究进行了综述,发现目前学习者语料库在三语习得研究中的运用还很少。最后论述了建设少数民族学生学习者语料库时的难点,并对少数民族学生学习者语料库的建设以及基于学习者语料库的三语习得研究提出有针对性的意见。
关键词:学习者语料库;二语习得;三语习得;学习者语料库建设
收稿日期:2014-10-10
作者简介:李伟超(1987-),男,河南开封人,助教,从事语料库语言学和应用语言学研究。
中图分类号:G442文献标识码:A
收稿日期:2014-11-24
基金项目:河南省教育厅人文社科青年项目立项课题(2014-qn-432)
一、学习者语料库与基于学习者语料库的二语习得研究
(一)语料库与学习者语料库
语料库(corpus)是应用计算机技术对海量自然语言材料进行处理、存储,以供自动检索、索引以及统计分析的大型资料库[1]。1961年,第一个机读英语语料库——布朗语料库(Brown Corpus)由美国Brown大学创建,之后英国Lancaster大学与挪威Oslo大学、Bergen大学联合创建了LOB语料库,此后,欧美语言学家们展开了对这两个语料库的大规模研究,随着计算机科学的发展,越来越多的大型语料库涌现出来,各国学者对语料库语言学(corpus linguistics)的研究也呈现出快速发展的态势。在我国,上海交通大学杨惠中教授在上世纪八十年代末主持建设了交大科技英语语料库(JDEST),主要用于大学英语教学大纲的制定和教材开发。
学习者语料库是通过收集语言学习者各种书面语和口语的自然语料而建立起来的一种学习者语言数据库[2]。在国外,针对外语学习者建立的学习者语料库有:朗曼学习者语料库(LLC)、国际学习者英语语料库(ICLE)等。近十几年来,我国也陆续建成了多个学习者语料库,如中国学习者英语语料库(CLEC)、中国学习者英语口语语料库(COLSEC)、中国大学学习者英语口语语料库(SWECCL)。可以说,我国外语学者建设学习者语料库以及基于学习者语料库的研究方面取得了丰硕的成果。
(二)基于学习者语料库的二语习得研究
二语习得(Second Language Acquisition,简称SLA)研究涉及三大领域:中介语研究、学习者内部因素研究、学习者外部因素研究[3]。基于学习者语料库(learner corpus)研究是第二语言习得研究中的一个新兴领域[4]。实践证明,在近二十年里,基于学习者语料库的二语习得研究取得了丰硕的成果。Granger认为基于学习者语料库的二语习得研究可以分为两个方向:中介语对比分析(Contrastive Interlanguage Analysis,简称CIA)和计算机辅助失误分析(Computer-aided Error Analysis,简称CEA)[5]。换言之,也就是对学习者语料库中出现的错误进行归类和分析;对比本族语语料库和学习者语料库,找出二者间的差别再进行分析。
学习者语料库在二语习得研究中发挥了巨大的优势,对二语习得研究起到了积极的推动作用。研究者可以调查学习者语料库中学习者的语言形式错误和语用错误,比如桂世春和杨惠中从宏观层面对CLEC中出现的语法和词汇使用错误进行了系统分析[6];不少研究者多从微观层面,对词汇使用方面进行考察,如拼写错误[7]、冠词误用[8]、搭配错误[9]等。通过分析错误产生的原因,对错误进行分类,并且进一步分析学习者在学习过程中使用学习策略的具体情况,教师可以有针对性地调整教学重点,改善教学。此外,还可以通过对比本族语语料库和学习者语料库对中介语进行对比分析,或者通过学习者语料库来描写学习者的语言特征,发现学习者语言使用中的“过多使用”、“过少使用”、“误用”现象。研究者多从以下几个方面进行对比分析,如高频词汇[10]、词语搭配[11]、情态动词[12]、话语标记词[13]、词块[14]、语义韵[15]、句子时态[16]等。当然,也有不少学者指出,在学习者语料库建设和发展过程中,以及基于学习者语料库的二语习得研究中,也存在一些不足之处。首先,从国内外学习者语料库的建设来看,面临着书面语与口语语料比例失衡的状况,造成这种状况的原因也是在于口语语料难搜集、语音转写耗时耗力等原因;再者,由于过多依赖于语料库的计算机自动分析,大多数研究更加重视对学习者语言形式的描写,却忽视了对学习者语言功能的分析。尽管如此,学习者语料库仍具有四大优势:先进的语料处理手段、真实的语言数据、严格的设计标准、独特的分析模式。因此,基于学习者语料库的研究在描述学习者语言特征,揭示学习者语言发展规律方面取得了丰硕成果,对二语习得研究的发展起了积极的推动作用[4]。并且,传统的二语习得的研究方法采用内省法和实验诱导法,显然通过这两种研究方法获得的语料数据更容易受到某些主观因素的影响,而学习者语料库却带来了崭新的改变,为二语习得研究提供了真实可靠的语言运用信息及相关数据,为保证研究结果的准确性提供了坚实的基础。
二、三语习得研究综述
(一)三语习得的缘起与发展
三语习得指的是在学习者的母语或一语和已经掌握的二语之外,学习的一种或者多种语言。从国际范围来看,与二语习得作为独立学科形成的时间相比[17],三语习得(Third Language Acquisition,简称TLA)研究起步较晚。1987年Rimgbom出版了《第一语言在外语学习中的作用》,书中分析了第一语言和第二语言对学习第三语言的影响,标志着“三语习得”研究的正式开始[18]。
三语习得研究缘起于欧盟的多语政策。在欧盟各国的少数民族地区,学校的教学语言最初是本民族的语言,学生首先习得的是少数民族语言,在小学三、四年级开始学习第二语言,即本国的官方语言,在小学高年级之后开始学习第三语言——英语。这样的多语政策对推动欧盟多语一体化的进程起到了积极的作用。正是由于这样的社会背景,三语学习以及三语习得研究引起了学者们的注意,逐渐成为语言学研究的热点。
(二)三语习得与二语习得的关系
在国外,有些学者将三语习得看做二语习得的下属或分支[19]。他们认为,广义的二语习得指的是母语或第一语言以外的任何一种语言习得,这其中就包括狭义的二语、外语、三语学习等。但是也有些学者将三语习得看做独立于二语习得的研究领域[20-21]。国内的学者也讨论了二语习得与三语习得之间的关系,如曾丽、李力比较和分析了二者之间的差异,发现二者密切相关,但又存在非线性、复杂性、习得过程多样性及认知差异等不同特征,因此三语习得是一种独特的现象,应作为独立的研究领域[22]。从三语习得的角度对三语学习者的学习过程及语言运用进行系统研究,具有重大的理论和实践意义。但是不可否认的是,三语习得与二语习得的关系十分密切。
(三)国内外的三语习得研究
在国外,三语习得研究在近二十几年中取得了突飞猛进的发展。研究者从社会语言学、语言教育、普遍语法等多个角度渗透到三语习得研究的诸多方面,如一语、二语对三语习得的影响,二语习得与三语习得的差异,儿童三语现象及其与成人三语习得的差异,三语习得中的跨语言影响及相互作用,三语语用产生与语用意识等[23]。从国内来看,我国有五十五个少数民族,同欧盟各国的少数民族地区一样,我国的聚居少数民族学生也经历了“一语——二语——三语”的学习过程,因此,我国的学者们也逐渐开始对三语学习及三语习得进行相关的研究。不过国内的研究起步较晚,笔者从CNKI输入“三语习得”关键词进行文献检索,共获得157篇相关文献,其中最早关注三语习得研究的是朱静芬2000年发表于《外语教学》的一篇文章,她通过写作实验,比较分析了一外(二语)水平不同的学生学习二外(三语)时受母语(一语)和一外(二语)影响的情况[24]。从文献的发表年份趋势来看,总体数量不多,最近五年增长较快(2014年文献数量统计截至于9月),说明三语习得也得到了国内学者们越来越多的关注。
从文献来源来看,在这157篇文献中,其中仅有14篇来自外语类核心期刊,5篇博士论文,39篇优秀硕士论文,2篇来自国际学术研讨会论文集。可以看出,国内对于三语习得研究缺乏更多的领军型的学者,很多研究都是突破性较小的重复性研究。从研究内容来看,国内学者关注面广泛,如语言迁移[25],文化因素对三语习得的影响[26],三语习得研究综述[18][28],元语言意识[27]、三语教学[28]、三语学习者语料库建设[29]等,而较多的研究关注的是英语专业学生的第二外语学习。
从研究方法来看,在157篇文献中,有69篇是实证研究,包括调查问卷、定性访谈、教学实验等。 有88篇是非实证研究,包括综述、思辨、内省、经验概括等。并且在最近五年,实证性的研究所占的比例呈现出较快增长的趋势。在这些文献中,有3篇涉及到少数民族学生学习者英语语料库,其中,刘立介绍了学习者语料库在三语习得研究中的作用以及建设少数民族学生学习者英语语料库的必要性,并深入阐述了建库目的和规模、语料抽样、语料加工与标识、语料赋码等专题[29]。此外,在CNKI中搜索“少数民族学习者语料库”的相关文献也发现有其他学者就建设此类语料库提出了一些设想[30]。陈鹤的博士论文运用语料库语言学的方法,对德语的三语学习者的词汇使用错误进行了定量和定性分析[31]。李菲的硕士论文通过自建小型语料库,对苗族学生在英语写作中的语篇特点进行了描述性研究,并分析出了苗族学生在学习英语时的认知特点和规律[32]。以上两个研究无论是研究二外学习者或少数民族英语学习者,皆采用了建设学习者语料库,利用语料库语言学的方法,对三语学习者的语言运用进行了较为系统的研究。
综上所述,国内三语习得研究也越来越受到学者们的重视。目前的研究内容虽广泛,但研究方法更偏向非实证研究。尽管也有部分学者对少数民族地区的三语学习者进行了相关研究。但更多的学者关注的是英语专业的二外学习者,正如一些学者建言,在语料库语言学发展如火如荼的时代,针对少数民族外语学习者,可以建设相应的少数民族学生学习者语料库。从学习者语料库在二语习得研究中的优势和取得的成果可以得到启示,少数民族学生学习者英语语料库必然也会成为三语习得研究的新热点,少数学者的研究也证明了同二语习得研究一样,学习者语料库能更加可靠地、详细地提供三语学习者语言运用的特征,为三语习得研究的发展提供坚实的语料基础,揭示三语学习者的学习困难,帮助教师进一步改善教学方法,提高三语教学效率,进一步促进三语习得研究和少数民族地区外语教学。
三、少数民族学生学习者英语语料库建设中的问题
建设少数民族学生学习者英语语料库对三语习得研究具有广阔的应用空间,并且能促进少数民族地区英语教学的进一步的提高。目前来看,已经有少数学者详细地阐述了建设少数民族学生学习者语料库的相关专题[29-30]。且有少数学者利用自建小型的少数民族学生学习者语料库进行实证研究[32]。而通过在CNKI学术资源库中的检索以及对民族高校的调查了解发现,已经建成的大型的少数民学生学习者语料库仍未出现。早在国内第一个学习者语料库CLEC建设时,“由于能够获得的学习者语言运用材料仅包括书面语,建库语料输入只能靠键盘输入,使建库过程十分艰苦,”[1]。可以预见的是,建设少数民族学生学习者语料库的过程亦不会容易,所以有学者提出其建库时间长达5年。
笔者认为,在建设少数民族学生学习者英语语料库有两点值得特别关注:
(一)语料来源
学习者语料库包括书面语语料库(如CLEC;WECCL)和口语语料库(如SECCL;COLSEC),相对来说,以往的研究多集中在研究学习者的书面语特征。因此一些学者也提出少数民族学生学习者英语语料库的建设应一步到位,将三语学习者的书面语和口语一同纳入语料库;并且,为了使得语料库语言数据更具有广泛代表性,将小学、初中、高中三语学习者的语料也作为一项语料来源。但是,不可否认的是,在少数民族地区,英语教学水平相对较低,即使是考入民族高校的“民考民”大学生,85%的学生英语程度只相当于全日制小学或中学的水平[29]。因此,搜集三语学习者的口语语料,甚至是搜集小学、初中、高中三语学习者的书面语语料也显得不太现实。况且,已建成的口语语料库SECCL的语料也是来自于全国优秀的英语专业学生的英语专业四级口语考试,COLSEC的语料来自于全国大学英语考试口试内容。试想,三语学习者连简单的自我介绍都可能无法完成,我们又如何去获得大量的口语素材呢?就笔者自身的课堂教学感受而言,少数民族大学生的口语和写作能力不高,教师要从最基础的ABC、语音、语法教起。那么建设少数民族学生学习者英语语料库时,语料来源的控制和实际操作问题是首要解决的问题。因此,在建库前,应明确建库目的,进而选取合适的语料来源,以便增加建库的实际操作性。
(二)语料标注
对语料库进行标注是指所有为语料库附加信息的活动,包括结构标记、词性赋码、语法标注、话语标注等[33]。对于学习者语料库来说,研究学习者的语言必然离不开对其进行错误赋码。在CLEC中,该语料库设计了一套错误赋码体系,并且在100万词的库容中,对所有语料进行了人工赋码。目前的少数民族学生学习者英语语料库建设设想也提到了对语料进行错误赋码。需要注意的是:首先,对学习者错误类型的分类标准该如何确定?在借鉴CLEC错误赋码体系的同时,我们不应忽视少数民族学生作为三语学习者会出现的特有的错误类型,如何更加全面地、系统地对其进行分类标注,是摆在语料库建设者面前的重要问题。其次,由于错误赋码完全需要人工操作,所以不同的操作者对语言使用错误的理解不同,可能导致错误赋码标准不一,影响后续基于语料库研究的可信度。这就要求语料库建设者在进行错误赋码前,对所有参与者进行相关培训,统一对错误类型认定的标准;同时,在赋码时,成立若干小组,各组间进行相互检查校对,最大限度消除因错误赋码标准不一导致的问题。
四、结语
学习者语料库的发展在最近二十几年间取得了巨大的飞跃,基于学习者语料库的二语习得研究也取得了丰硕的成果,无论是从理论成果还是从研究方法方面,学习者语料库对二语习得研究起到了巨大的推动作用。鉴于二语习得与三语习得的密切联系、目前国内三语习得研究现状,以及学习者语料库的建设现状,建设少数民族学生学习者英语语料库具有一定的可行性和应用价值。在建设过程中,如何克服语料来源和语料标注等困难,是摆在学者们面前的实际问题。少数民族学生学习者语料库的建设成功,必然会给我国三语习得研究、少数民族地区英语教学、少数民族地区英语教材编纂等带来积极的推动作用。
参考文献
[1] 李文中.语料库、学习者语料库与外语教学[J].外语界,1999(1):51-55.
[2] 杨惠中.语料库语言学导论[M].上海外语教育出版社,2002:36.
[3] 文秋芳,王立非.二语习得研究方法35年:回顾与思考[J].外国语,2004(4):18-25.
[4] 邓耀臣.学习者语料库与第二语言习得研究述评[J].外语界,2007(1):16-21.
[5] Granger S,Hung J,Petch-Tyson S.Computer Learner Corpora,Second Language Acquisition and Foreign Language Acquisition[C].Amsterdam:John Benjamins Publishing Company,2002:156-179.
[6] 桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[7] 何安平.学生英语拼写错误分析[J].外语教学与研究,2001(3):199-205.
[8] 李景泉,蔡金亭.中国学生英语写作中的冠词误用现象[J].解放军外国语学院学报,2001(6):58-62.
[9] 张军,李文中.COLEC中动名搭配模式及失误分析[J].外语教学,2004(4):30-32.
[10] 陈颖,马武林.中国学习者书面语中增强词的多视角对比研究——以常用词very much为例[J].外国语,2012(1):48-53.
[11] 钟珊辉.基于语料库的Seek搭配行为对比研究[J].外国语文,2009(5):36-40.
[12] 程晓堂,裘晶.中国学生英语作文中情态动词的使用情况——一项基于语料库的研究[J].外语电化教学,2007(6):9-15.
[13] 甄凤超.中国英语外语学习者习得口语话语标记词“WELL”语用功能之特征研究——一项基于COLSEC语料库的证据分析[J].英语研究,2010(1):67-73.
[14] 许家金,许宗瑞.中国大学生英语口语中的互动话语词块研究[J].外语教学与研究,2007(6):437-443.
[15] 卫乃兴.基于语料库学生英语中的语义韵对比研究[J].外语学刊,2006(5):50-54.
[16] 张雪梅,杨滢滢.英语专业学习者的时态习得现状——一项基于中国英语专业写作语料库的研究[J].外国语文,2009 (3):133-138.
[17] Block.D.The social turn in second language acquisition[M].Edinburgh: Edinburgh University Press,2003:10-11.
[18] 曾丽.国外“三语习得”研究——缘起与进展[J].贵州民族学院学报:哲学社会科学版,2010(4):143-146.
[19] Larsen-Freeman D,Long M.H.An Introduction to Second Language Acquisition Research[M].Beijing: Foreign Language Teaching and Research Press,2000:23-26.
[20] Jorda,M.P.S.Third Language Learners'Pragmatic Production and Awareness[M].Clevedon:Multilingual Matters Ltd,2005:46-48.
[21] De Anglis,G.Third or Additional Language Acquisition[M].Toronto:Multilingual Matters Ltd,2007:35-39.
[22] 曾丽,李力.对“三语习得”作为独立研究领域的思考[J].外语与外语教学,2010(2):6-9.
[23] 袁庆玲.三语习得国内外研究综述[J].广东外语外贸大学学报,2010(6)48-51.
[24] 朱静芬.语言迁移对二外学习者英语写作的影响[J].外语教学,2000(1):51-55.
[25] 何晓军.三语习得中的语言迁移影响——以四川藏族大学生英语词汇学习为例[J].外国语文,2014(1):140-144.
[26] 李珂.三语习得及其对新疆多元文化背景下英语教学的思考[J].内蒙古师范大学学报:教育科学版,2010(9):98-102.
[27] 孙瑞霞.影响新疆少数民族大学生英语学习的元认知及相关因素研究[J].长春教育学院学报,2011(6):80-82.
[28] 雷晓敏.试论三语习得对话教学建设——以二外日语为例[J].广东外语外贸大学学报,2011(2):98-100.
[29] 刘立.少数民族英语学习者语料库建设探析[J].大连民族学院学报,2010(2):176-179.
[30] 雒作龙.西北少数民族英语学习者语料库建设研究[J].淮海工学院学报:社会科学版,2011(15):42-44.
[31] 陈鹤.中国德语学习者篇章写作中的词汇错误分析[D].北京:北京外国语大学,2014.
[32] 李菲.基于苗族高中生英语写作语料库的对比研究[D].延安:延安大学,2013.
[33] 李文中.语料库标记与标注:以中国英语语料库为例[J].外语教学与研究,2012(3):336-345.
[责任编辑、校对:梁春燕]
Learner Corpus, Second Language Acquisition and Third
Language Acquisition: Review and Prospective
LIWei-chao
(School of Tourism and Foreign Studies, Tibet University, Lasa 850000, China)
Abstract:This paper reviews the study of second language acquisition based on learner corpus.It also reviews third language acquisition study, finding that learner corpus has not been widely used as in second language acquisition. At last, it lists the difficulties of constructing minority student learner English corpus and provides some suggestions.
Key words:learner corpus; second language acquisition; third language acquisition; learner corpus constructing