刘雪丽 林丽红
摘 要:本研究考察中国高级英语学习者汉语词汇丰富性中的词汇使用错误情况。通过“复述故事”引导出受试的书面语料,然后使用ICTCLAS1.0,Anctonc3.2.1和SPSS17.0等软件对受试汉语书面表达中错别字、涂改、删除及添加等词汇使用错误情况进行分析。结果表明,高水平英语学习者的汉语词汇使用错误率明显高于低水平英语学习者。本文根据激活阈值假说对该现象加以解释。
关键词:词汇错误 汉语词汇丰富性 激活阈值假说
一、引言
词汇是语言的重要组成要素,对词汇的考查可以更早、更好地了解一种语言的使用情况。词汇丰富性(lexical richness)作为词汇的一个重要层面,指语言使用者在自由言语产出中使用词汇的丰富程度,是衡量口头或书面表达质量的关键因素。目前研究者对词汇丰富性的测量方式多采用Read(2000:200~205)的划分标准,即词汇多样性、词汇复杂性、词汇密度和错误数量。然而在大量针对中国英语学习者口头或书面表达的词汇丰富性研究中,只有为数不多的研究考查了词汇丰富性中的词汇错误情况。如万丽芳(2010)从词汇多样性、词汇复杂性和词汇错误方面测量了中国英语专业大学生的词汇丰富性;张艳、陈纪梁(2012)简要介绍了使用者词汇丰富性中词汇错误的测量方法;只有王海华、周详(2012)从词汇多样性、词汇复杂性、词汇密度及词汇错误这四个方面对词汇丰富性进行了全面分析。这些研究成果多是针对中国英语学习者的二语词汇错误,那么中国英语学习者的汉语词汇是否也会出现类似错误呢?目前国内对这类研究还鲜有涉及。Engber(1995:146)把词汇错误归为选词和形式两类,语法和句法错误不记入,重复错误只算作一次。本文在Engber对词汇错误的分类基础上根据汉语词汇及书面语的特点,将错别字、涂改、添加、删除等都看作词汇使用错误,重复错误只算一次。
二、激活阈值假说
激活阈值假说认为:1.语言的停止使用会导致其逐渐丧失;2.在二语中经常使用的一些语言成分会取代不经常使用的一语中的相应成分;3.理解比产出保持的时间长,因为自我激活时产出需要的阈值比理解低。随着二语的大量使用,一语中某些词项(items)的阈值会升高,尤其是陈述性项目,但最终程序性项目的阈值也会升高(Schmid & K?pke,2007)。也就是说当L2中的信息或准则与L1中的信息或准则发生冲突时,常被使用的L2信息或准则比不常使用的L1信息或准则更容易被激活。
对于在英语母语环境中学习英语的中国高级学习者而言,其接触英语的时间远比接触汉语的时间多,因为无论是上课、学习、工作,其使用语言大部分是英语,这就导致了其汉语输入的减少,那么,与英语相比,他们汉语词汇的激活阈值是否会升高,而导致他们在表达过程中产生词汇使用错误呢?
三、研究设计
(一)实验假设
基于上述问题,本文提出一个假设,即不同英语水平的学习者之间在汉语词汇使用错误上存在差异,且高水平英语学习者汉语词汇使用错误率高于低水平英语学习者。
(二)受试
本研究的受试为宁波大学英语专业研究生一年级学生和非英语专业本科一年级学生,分别设为实验组和控制组,其当年高考英语和语文成绩都达到合格标准,年龄范围为18~25岁。受试均自愿参与实验,实验后获得小礼物作为奖励。
(三)数据的收集和分析
实验均在正常上课时间进行,且事先没有给受试任何关于实验的信息。首先发放问卷调查表,通过问卷调查可以得到关于受试的性别、专业、学习英语的起始时间、英语水平及英语和汉语的使用频率、使用场合等信息。然后让受试观看一段长8分钟的影片《猫和老鼠》后通过“复述故事”引导出其书面语料,共得到英语专业研究生的语料36篇,非英语专业本科生的语料54篇,从中各随机选出30篇,其中男生的语料各4篇,女生的语料各26篇,然后将其原封不动地输入电脑,同时记录下相关信息,建成本研究所需的语料库。
在分析汉语词汇使用错误之前,必须先对所收集的语料进行分词处理。虽然汉语是一种以单音节为基本单位的语言,但随着汉语词汇的不断发展,过去的单音节词不断被双音节词所取代,双音节词逐渐在汉语词汇中占优势,后来又逐渐出现了三音节词、四字成语、歇后语以及一些特定短语等,因此词在汉语中是难以界定的。本研究使用北京大学中文分词系统ICTCLAS1.0将全部语料进行分词处理,经人工检验后存为纯文本格式备用。使用Antconc3.2.1测量经分词处理后的文本中的词形数,错误数与词形数的比值即错误率,使用计算机得出所有文本的错误率,然后输入SPSS17.0进行描述性统计及独立样本t检验。
四、结果
在长期学习英语的过程中,英语单词与汉字互相影响、互相干扰,因此学习者在进行汉语书面表达时常常会有提笔忘字的情况,最终会导致错别字、涂改、删除或添加现象的产生。本文对照《现代汉语词典》(2002),通过人工检测、统计各个文本中错别字、涂改、删除及添加的个数并求和得出每个文本中的错误数。根据上述方法处理数据,所得结果如下:
由上表可以看出,实验组在词汇错误率上的标准差大于控制组,说明实验组词汇使用错误情况离散程度较大,即实验组受试整体语言水平差异较大且两组受试的词汇使用错误率在统计学上存在显著性差异(p=0.048<0.05),即实验组词汇使用错误率高于控制组,与实验假设相符。
五、分析与讨论
根据激活阈值假说,在二语中经常使用的一些语言成分会取代不经常使用的一语中的相应成分。在中国高级英语学习者的学习过程中,英语词汇与汉语词汇之间相互争夺认知资源,常被使用的英语拼音文字比不常使用的汉语象形文字更容易被激活。经常被激活的英语拼音文字的阈值变低,在大脑记忆箱中被储存在上层,因此这些信息能够很快被提取;而不经常被激活的汉语象形文字的阈值就会升高,在大脑记忆箱中被储存在下层,要花费很长的时间才能获取这些信息甚至永远不能获取。学习者在寻找合适的语言表达时,通常先从错误的形式开始,反复几次后若能够获取信息则会导致其在书面表达中产生涂改、删除、添加等现象,若永远不能获取信息则最终会导致错别字的产生。
六、结语
本文对中国高级英语学习者的汉语词汇丰富性中的词汇使用错误情况进行分析,发现中国高级英语学习者的汉语词汇使用错误率与控制组相比存在显著性差异。原因是在长期英语学习过程中,英汉语之间相互干扰,经常接触的英语词汇的激活阈值变低,不常使用的汉语词汇的激活阈值升高。这一结果可以为我国汉语词汇丰富性研究尤其是词汇使用错误研究提供一定的参考。当然本文还存在不足,比如,实验设计中两组受试中的男生比例过少,这一现象可能仅说明女生的情况,需要在以后的实验中考虑性别因素。
参考文献:
[1]Engber,C.A.The relationship of lexical proficiency to the quality of ESL compositions[J].Journal of Second Language Writing,1995,(4):139~155.
[2]Read,J.Assessing Vocabulary[M].Cambridge:Cambridge University Press,2000.
[3]Schmid,M.S.& K?pke,B.Language Attrition:Theoretical Perspectives[M].Amsterdam/Philadelphia:John Benjamins Publication Company,2007.
[4]万丽芳.中国英语专业大学生二语写作中的词汇丰富性研究[J].外语界,2010,(1): 40~46.
[5]王海华,周详.非英语专业大学生写作中词汇丰富性变化的历时研究[J].外语与外语教学,2012,(2):40~44.
[6]张艳,陈纪梁.言语产出中词汇丰富性的定量测量方法[J].外语测试与教学,2012,(3):34~40.
[7]中国社会科学院语言研究所词典编辑室.现代汉语词典(汉英双语)[M].北京:外语教学与研究出版社,2002.
(刘雪丽 林立红 浙江宁波 宁波大学外语学院 315211)