殷 姣
(电子科技大学外国语学院,四川成都611731)
基于批改网的大学生英语写作词汇错误分析
殷 姣
(电子科技大学外国语学院,四川成都611731)
错误分析是分析语料的重要方法之一,而词汇又是其主要考查对象。文章采用定量与定性相结合的研究方法,以错误分析基本步骤为基础,根据批改网上的诊断、错误分布以及按句点评等功能,对批改网上提交的136篇文章进行词汇错误分析,并探索了词汇错误产生的原因从而提出相应对策。
批改网;大学生英语写作;词汇;错误分析
“听、说、读、写、译”是英语学习中的五项基本技能,其中写作又是一种极其难培养的能力。作为外语学习者,中国学生在进行英语写作时难免会出错,而这些错误一直都是教师和语言学家关注的热点。很多英语教学者在作文批阅时根据自己的知识和经验主观评判错误,这样不免缺乏科学性和系统性,难以有效提高学生的写作能力。
传统的英语写作教学中,教师无法及时对学生写作进行系统有效的反馈,因此对学生写作能力的提高成效甚微。随着多媒体和网络技术的发展,以语料库和云计算为技术支持的英语作文自动批改在线服务系统出现了,现在被我国师生广泛使用的当属句酷批改网(简称批改网)。批改网使用便捷,反馈及时,系统能对学生作文进行分析,自动识别词汇、搭配、语法等常见错误,实时给出修改建议和扩展训练,能有效地提高学生的写作能力。[1]
我国英语写作水平普遍不高,而很多情况下词汇错误是影响写作水平的重要原因。国内外很多研究表明,词汇错误占写作语言错误比例最高,但是我国对写作词汇错误分析的研究并不多,量化的实证研究更是屈指可数。由于批改网能基本识别标注提交作文中的词汇错误,所以本文意欲以批改网为媒介对词汇错误进行系统分析。
继对比分析以后,Chomsky的普遍生成语法和语言学习机制使人们意识到并不是所有的语言错误都是由于母语干扰造成的,语言的内部干扰往往更容易造成错误。20世纪60年代末,Selinker首次提出错误分析理论。Corder于1967年、1971年发表了两篇文章“The Significance of Learners’Language Errors”[2]及“Idiosyncratic Dialects and Error Analysis”[3],标志着现代错误分析的开始。错误分析通过研究学习者在运用目标语的过程中生成的中介语和本族语者产生的话语之间的差异,从中找出学习者产生错误的规律,研究它们的共性,并进一步分析产生错误的原因从而提出相应的解决方法。[4]Corder将错误分析的程序分为五个阶段:搜集学习者语料、鉴别错误、描述错误、解释原因、评价错误。国内外的错误分析研究基本都是按照这个步骤来进行的。[4]
许多研究者在错误分析的理论基础上对语言错误进行了多种子维度的研究,比如:词汇(何华清,2009)[5]、句法(王佳,2011)[6]、标点(刘斌,2005)[7]、衔接与连贯(池丽霞、王晶晶,2009)[8]、现在进行时错误分析研究(韩存新、樊斌,2007)[9]等等。研究的学习者语料也是多种多样,如:四六级作文、期末考试作文、平时作业作文、硕士论文、口语考试录音等。由于本文进行的是词汇错误分析研究,所以本文主要回顾关于词汇错误分析的文献。
Richards(1976)认为词汇错误分类的简便方法就是根据人们对词汇知识的了解来进行,可分为:形态错误(morphology)(包括拼写和发音),句法错误(syntactic behavior)、功能及情景错误(functional and situational restriction)。James (2001)把词汇错误分为两类:词汇形式错误(formal errors of lexis)和词汇语义错误(semantic errors in lexis)。[10]词汇形式错误分为三类:形式误选(formal misselection)、错误造词(misformation)、字母误写(distoration)。词汇语义错误包括意义关系混淆(confusion of sense relation)和搭配错误(collocational errors)。Granger(1994)对学习者语料库进行多年研究后提出一个分析语料库中词汇错误的框架,词汇错误由两大类错误构成:一是词汇-语法错误(lexical-grammatical errors),所有违反词法和句法规则的错误都属于此类;二是纯词汇错误,包含不存在的外语词和存在的外语词错误,存在的外语词错误又分为概念错误,语体错误和搭配错误。[11]桂诗春、杨惠中(2003)在“中国学习者英语语料库”中把语言错误分为词形、动词词组、名词词组、代词、形容词词组、副词、介词词组、连词、词汇、搭配和句法共11类错误,其中词形失误包括拼写、构词及大小写失误,词汇失误包括词序、词类、替代、省略、冗余、重复以及语义含糊失误。[12]何华清(2009)将以上提到的词形失误和词汇失误统称为词汇错误。[5]贾冠杰(2014)把词汇错误类型分为冠词、介词、易混淆词、错误形式动词、代词错误或遗漏词。[13]批改网能自动识别的语言错误包括:句子不规范,低频警示,搭配错误,用词错误,动词、介词、名词、冠词、形容词错误,词性错误,拼写错误。笔者结合前人关于词汇错误分类的文献以及实际情况,将以上错误除却句子不规范和低频警示统称为词汇错误。
据统计,在CLEC中词汇错误占总语言错误的50.89%(杨惠中等,2005)。李红(2003)[14]和文辉(2005)[15]在研究中发现,大学生书面语的词汇错误占语言错误的70%以上。由此可见,词汇错误是语言错误的重要组成部分。何华清(2009)发现,分类、拼写、大小写、词类、替代、省略、冗余错误共占词汇错误的90.88%,构词、词序、重复和歧义错误仅占9.12%,其中拼写错误犯错频率最高为35.65%,,其次为替代错误(19.88%)和词类错误(12.86%)。[5]贾冠杰(2014)的研究表明,在英语专业硕士毕业论文中冠词错误频率最高为32.91%,其次为介词(6.21%)、易混淆词(4.96%)、错误形式动词(1.86%)、词的错误形式(1.32%)、代词(0.62%)、错误或遗漏词(0.20%)。[12]
关于词汇错误分析的研究大多数都是借助“中国学习者英语语料库”(CLEC)或凭借评阅者的主观判断来进行的,然而目前没有发现有学者用批改网来进行系统的词汇错误分析。经研究表明,批改网具有很高的信度,与人工评分吻合度甚高(张荔,盛越,2015)。[16]就其效度来看,批改网以句子为单位,在词汇和语法等方面进行详细的评价(何旭良,2013)。[17]由于批改网能识别并标注提交文章中的词汇错误,所以可以被用作辅助工具来研究写作词汇错误分析。王磊等(2014)在基于批改网研究工科大学生写作错误中发现,批改网中统计错误频率最高的是低频警示和句子不规范,而频率最低的是拼写错误和介词错误。[18]在研究作文的提交次数与作文质量关系时,有研究表明,提交次数与作文成绩成正相关(张纬,2014)19](王磊、许霄羽,2014)[18],但也有研究表明作文的成绩与提交次数并无相关关系(胡学文,2015)。[20]由此观之,在作文的提交次数与作文成绩的相关关系上并未达成一致观点。至今,学术界仍没有关于作文的提交次数与词汇错误数量的相关关系研究,是不是随着自我修改,词汇错误就能逐渐减少呢?这种变化是否适用于每个个体?产生这些词汇错误的原因又是什么呢?所以,笔者在此次研究中将逐一探讨这些问题。
(一)研究问题 本研究旨在探究基于批改网的大学生写作中的词汇错误分析,具体研究问题如下:
(1)批改网中词汇错误类型有哪些?如何分布?
(2)词汇错误分布是否与作文成绩和提交次数有关?有何种关系?(横向研究)
(3)词汇错误分布随着自我修改如何变化?这种变化是否适用于每个提交者?(纵向研究)
(4)何种原因导致这些词汇错误?
(二)研究对象 本研究的研究对象为国内某“985工程”理工科院校非英语专业大二学生,主要涵盖的是工科和理科学生类别,共139人。这些学生在提交样本作文之前已多次使用批改网来进行写作,故对批改网的操作相当熟悉。教师在批改网上布置话题作文“On the Value of Univer-sities”,字数要求300字左右,满分100分。在规定期限内(2015-9-15到2015-09-30)共有136人按时提交作文,加上3篇补交作文,共有139名同学成功提交作文。学生在提交时并不知道自己的作文将会用来研究,保证了数据的有效性。但由于补交作文无法准确计算其提交次数,并且不符合写作要求,所以被剔出,最终共有136篇作文用作研究。
(三)研究工具和方法 收集数据时,笔者将批改网上学生提交的终稿作文导出生成excel(保留学生姓名,学号,作文题目,文本,成绩,提交次数),进入批改网诊断功能中的错误分布里,记录下136篇终稿作文的错误总数及各错误类型总数量,同时分别统计出每个同学终稿作文的错误总数及各错误类型数量。本研究还选取三位同学做个案分析纵向研究,探讨学生个体每次提交作文中的词汇错误分布随着自我修改如何变化,是否每个提交者都这样变化。由于错误分布中统计的是终稿作文的错误数量,而不能追踪各次提交作文的错误类型和数量,所以需将三位同学每次提交的文章进行按句点评,从中统计其错误类型和数量。最后利用SPSS 21.0统计软件对写作信息进行系统的描述统计分析。
(四)数据分析 笔者在文献综述已经提到,将批改网错误分布和按句点评中识别标注的搭配,用词,拼写,动词、介词、名词、形容词、冠词错误统一归纳为词汇错误。在此分类下,这136篇终稿作文中共出现356个词汇错误,没有出现冠词错误和拼写错误,这些错误中名词和动词错误频率最高,分别占36%和31%,其次是用词错误(14%)和搭配错误(13%),频率最低的是介词错误(3%)和形容词错误(3%)。词汇错误类型分布如图1所示:
图1 词汇错误分布图
研究将136篇终稿作文的词汇错误总数量和各词汇错误数量与该篇作文的成绩做了相关分析,结果见表1,词汇错误总数量与作文成绩成负相关关系,虽然相关性不强(r=-.203),但达到了显著水平(p=.018<0.05)。各词汇错误数量与成绩所成负相关关系均不强,只有动词错误达到了显著水平(见表1)
表1 词汇错误数量与成绩的相关关系相关检测
在探究提交次数与终稿作文的成绩和词汇错误分布的相关关系横向研究中,结果发现提交次数与作文成绩成正相关关系,相关性不强(r=.174),但达到了显著水平为(p=.042<. 05)。提交次数越多,终稿作文的词汇总错误数量越少,其相关系数为.329,非常显著(p=.000)。提交次数与各词汇错误类型基本成负相关关系,除了形容词、介词错误外相关关系都显著。结果如表2所示:
表2 提交次数与成绩和词汇错误的相关关系检测
表3 A同学提交次数与成绩的相关关系分析
图2 A同学修改次数与词汇错误数量散点图
表4 A同学提交次数与词汇错误的相关关系检测
上一个问题讨论了提交次数与终稿作文的成绩和词汇错误分布关系,这是以136篇终稿作文作为样本做的横向研究。笔者意欲探究学生个体每次提交作文中词汇错误类型及数量随着提交次数如何变化,以及想探索这种变化是否适用于每个个体。所以选取三位学生进行了个案分析纵向研究,对他们每一次提交的作文进行按句点评,统计其词汇错误类型和数量,将提交次数与每次提交作文中的词汇错误总数绘制成回归散点图,探究词汇错误数量随着作文修改如何变化。结果表明,词汇错误会随着修改而减少,但是中间会出现波动情况。如:A同学在不断的修改中成绩明显提高,成绩与提交次数的相关系数为.838 (p=.000<0.05)(见表3)。每次提交作文的词汇错误散点图显示(图2),词汇错误随着修改而减少,但没有呈线性关系。
B同学在修改过程中,提交次数与成绩也明显成正相关关系,相关系数为.811(p=.000<0.05),散点图显示词汇错误最终会减少,但是修改过程中波动比较大。然而C同学的成绩与修改次数之间并没有显著的相关关系(r=.049,p=.857),且散点图表明在多次的提交作文中,词汇错误数量均没有变化,但是最终还是较少。(由于版面限制,B、C两位同学的相关关系表和散点分布图均不一一呈现)
分析三位同学提交次数与每次提交作文词汇错误的相关关系发现,提交次数和每次提交作文的词汇错误总数量均呈现出显著的负相关关系,但是与各词汇错误数量的相关关系却因人而异。A同学的提交次数与搭配、名词、拼写、冠词错误呈显著负相关关系(见表4)。而B同学的提交次数则与动词、名词、形容词呈显著负相关关系。C同学的提交次数却只和搭配错误存在显著负相关关系。(B、C同学相关关系分析表格省略)
(一)批改网中的词汇错误类型及分布 此次基于批改网的大学生英语写作词汇错误分析研究中,统计到的词汇错误类型包括:搭配,用词,拼写,动词、介词、名词、形容词、冠词错误。其中错误频率最高的是名词和动词错误,其次是用词、搭配、介词和形容词错误,此次样本作文在批改网的错误分布功能中没有出现冠词和拼写错误[21-22],原因在于错误分布功能仅对学生提交的终稿作文进行诊断分析,而拼写错误和冠词错误已被学生在不断地修改中消除,这也从侧面反映了拼写和冠词错误在批改网的帮助下能被学生修正的几率较高。
(二)词汇错误分布与作文成绩和提交次数是否有关? 词汇错误越多,作文成绩越低。成绩与各词汇错误类型的负相关关系均不强,只与动词错误的相关关系达到显著水平。提交次数越多,终稿作文的词汇错误越少,成绩越高,但成绩与提交次数的相关关系虽达到显著水平,却不是非常显著。终稿作文中的各词汇错误数量与提交次数基本呈现负相关关系,但是介词错误和形容词错误与提交次数的相关关系不显著,笔者猜想这是由于每篇终稿作文出现介词和形容词错误的频率均很低,故而在研究相关关系时,虽然每篇作文的提交次数不同,但是介词和形容词错误出现的频率并无较大差异,因此相关关系不显著。
(三)词汇错误随着自我修改如何变化? 研究个案每次提交作文样本发现,随着不断修改提交作文,词汇错误最终被减少[23],但在修改过程中词汇错误数量会产生波动,并没有呈直线分布。这是由于学生在修改作文时,常常会添加内容,而添加的内容中难免会出现新的词汇错误。同时,虽然批改网在点评时会标注错误,但并不会将修改方式完全呈现出来,学生也许在下一次提交时并不能将错误改正。词汇错误数量与提交次数的相关关系纵向研究表明,词汇错误分布与提交次数的相关关系因人而异。在笔者看来,这是由于每个学生的思维方式、英文功底、背景知识都不尽相同,所以他们对词汇错误类型的敏感度、修正错误的能力也不会完全一致。
(四)产生词汇错误的原因 通过观察和分析样本作文中的词汇错误特点并结合前人的相关文献,笔者认为有如下原因可能导致词汇错误:
(1)英语和汉语来源不同,其形式和语法都存在很大的差异。[24]学生在用英语进行写作时难免会受到汉语思维、表达方式和习惯的影响而产生不符合本族语者习惯的中式英语。比如:汉语中没有冠词,学生往往会忽略它们在英语中的重要性而产生冠词误用、遗漏或冗余;有时受汉语表达习惯影响产生不符合英语规范的用词错误(如:“新手”译为“new hand”)。
(2)基础知识掌握不牢靠也是导致词汇错误的重要原因。中国学生在英语学习中往往输入大于输出,尽管认识很多词汇,但是缺乏足够的练习故而不能灵活运用。比如:“pay attention to”误用为“pay attention on”;形容词“perfect”本没有最高级却构造出“the most perfect”的表达。
(3)词汇错误的产生与学生的态度有很大关系。笔者研究学生每次提交的作文发现,拼写错误往往只是漏写、多写、错置字母,名词的单复数错误很多时候并不是由于缺乏能力而是缺乏注意。有的学生没有自律意识,认为运用批改网进行写作练习,老师不会亲自批阅,所以就敷衍了事,这样产生错误的频率自然就很高。
为帮助学生提高词汇使用能力,笔者提出以下对策:(1)正确区分词汇错误产生的原因,是由于疏忽大意还是词汇知识的匮乏?疏忽大意产生的错误在批改网的帮助下很容易被修正,词汇的使用能力却要靠时间积累。通过多渠道增加英语的输入量,同时要通过不断输出来练习巩固所学到的词汇。(2)正确认识母语负迁移,学会比较英汉两种语言的异同,不要自以为是地把汉语规则运用到英语当中,更要注意区分两种语言的细微差别,以免混淆。(3)端正词汇学习动机,探索词汇学习策略。词汇是构成语篇的基石,切莫在基础工作上出错误而影响整层建筑。(4)每个人的认知风格和学习风格都不同,老师要关注学生的不同风格而采取不同的教学方法和反馈方式。[25]
笔者基于批改网研究大学生写作词汇错误,探索了批改网中词汇错误的类型及分布,词汇错误与作文成绩以及提交次数的关系,自我修改对词汇错误的修正作用,并分析了词汇错误产生的原因从而提出建议。这帮助教学者知悉大学生英语写作中存在的词汇使用问题,有利于他们设计出更好更有效的词汇教学方案。学生也可根据研究结果改进词汇学习及使用策略从而提高写作水平。此研究也能加深老师和学生对批改网的认识,帮助师生进一步利用批改网来进行写作教学、反馈和练习。研究中也存在一些不足:(1)终稿作文样本中没有出现拼写和冠词错误,是否能说明拼写和冠词错误在写作出现的频率最低?还是由于它们在批改网的帮助下容易被修正?笔者更倾向于后者。但是前者应该在学生之前提交的作文中来进行检验,可又该把哪次提交的作文作为样本来分析,这值得考究。(2)分析提交次数与终稿作文成绩和词汇错误的相关关系时,有的学生前后两次提交的作文并没有实质区别,有的只是替换一个标点符号,增删一两个单词,这样难免影响研究结果。笔者考虑是否有必要人工统计有效的提交次数。(3)个案分析时,并不是所有的词汇错误类型都出现在每次提交的作文样本中,因而有的词汇错误类型随着不断提交如何变化并没有得到充分研究。所以后续研究可以在此项研究的基础上,弥补其不足,进行更深入的探索。值得一提的是,虽然批改网有助于教师进行写作教学和反馈,也能帮助学生自主练习,但是不管是对老师还是对学生来说,都不能完全依靠批改网,应该结合自己的知识对批改网的点评做正确判断。
[1]石晓玲.在线写作自动批改系统在大学英语写作教学中的应用研究——以句酷批改网为例[J].现代教育技术,2012,(10).
[2]Corder S P.The significance of learners’errors[J]. International Review of Applied Linguistics,1967,(4).
[3]Corder S P.Idiosyncratic dialects and error analysis [J].International Review of Applied Linguistics,1971,(9).
[4]H.D.Brown.Principles of Language Learning and Teaching[M].Beijing:Foreign Language Teaching and Research Press,2014.
[5]何华清.非英语专业学生写作中的词汇错误分析——一项基于语料库的研究[J].外语界,2009,(3).
[6]王佳.英语写作中句子表达错误分析及教学策略[J].产业与科技论坛.2011,(10).
[7]刘斌.英语写作中标点符号使用错误分析[J].湖南科技学院学报,2005,(9).
[8]池丽霞,王晶晶.基于余篇衔接连贯理论的大学生英语写作错误分析[J].北京工业职业技术学院学报,2009,(4).
[9]韩存新,樊斌.英语写作中现在完成时错误分析[J].基础英语教育,2007,(1).
[10]James C.Errors in Language Learning and Use:Exploring Error Analysis[M].Beijing:Foreign Language Teaching and Research Press,2001.
[11]Rod Ellis.Understanding Second Language Acquisition[M].Shanghai:Shanghai Foreign Language Education Press,2014.
[12]桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[13]贾冠杰,乔良文.英语专业硕士毕业论文的语言错误分析研究[J].外语界,2014,(3).
[14]李红.非英语专业学生写作中的语言错误分析[D].大连:大连海事大学,2003.
[15]文辉.对西南师范大学英语专业一至三年级学生英文作文错误的比较研究[D].重庆:西南师范大学,2005.
[16]张荔,盛越.自动作文评阅系统反馈效果个案分析[J].外语电化教学,2015,(163).
[17]何旭良.句酷批改网英语作文评分的信度和效度研究[J].现代教育技术,2013,(5).
[18]王磊,许霄羽.基于批改网的工科大学生英语写作错误分析[J].西安石油大学学报(社会科学版),2014,(24).
[19]张纬.句酷批改网在大学英语写作训练中的应用[J].湖北经济学院学报,2014,(4).
[20]胡学文.在线作文自我修改对大学生英语写作结果的影响[J].外语电化教学,2015,(163).
[21]李景泉,蔡金亭.中国学生英语写作中的冠词误用现象——一项基于语料库的研究[J].解放军外国语学院学报,2001,(6).
[22]王雪文,孙蓝.中国学生英语拼写错误再分析[J].外语教学与研究,2004,(7).
[23]张立新.错误分析与自主协作修改——基于在线语料库的大学生写作研究[J].外语电化教学,2008,(124).
[24]Nemser W.Approximative systems of foreign language learners[J].International Review of Applied Linguistics,1971,(2).
[25]Schmitt N &McCarthy M,.Vocabulary:Description,Acquisition and Pedagogy[C].Shanghai:Shanghai Foreign Language Education Press,2002.
责任编辑付友华
G642
A
1003-8078(2016)02-0119-06
2015-11-24
10.3969/j.issn.1003-8078.2016.02.32
殷姣(1992-),女,四川西昌人,电子科技大学硕士研究生。