张玉彪
(厦门大学附属实验中学,福建漳州363123)
从教材词汇分布特征探讨英语学习分化和高原现象
——以仁爱英语初中教材计量研究为例
张玉彪
(厦门大学附属实验中学,福建漳州363123)
英语学习中,学习者会遇到诸多困难,同时会有很多因素造成学习分化。当进入较为稳定的学习阶段后,不少学习者又会出现徘徊不前的现象,这在外语学习上被称之为“高原现象”。笔者从教材词汇统计的角度,为上述现象找到一定的实证依据,并为正在经受或可能会遇到这种现象的学习者提供指导。
英语学习;词汇;统计
众所周知,词汇是英语学习的载体,始终贯穿学习全过程,也是不少学习者面临的主要障碍。词汇量的大小在一定程度上影响学习者对学习内容及信息的准确理解。对于初学者来说,初级教材在词汇编排上具有一定的科学性和合理性显得至关重要。同时,虽然有课程标准的限定,但教材在实际用词方面和大纲规定的词汇多少会存在一些偏差,而教材中的词汇分布尤其是高频词和低频词的文本处理需要依据学习者的认知特点并要考虑到一定的时序性等。文章将通过具体数据对此进行实证性探究和验证。
(一)研究对象的选定
本次调查选用的教材语料是由北京仁爱教育研究所编著,科学普及出版社出版的《Project English》(2014版)的学生用书,供初中七年级至九年级使用。本教材是我国各地使用最为广泛的初中英语教材之一,具有一定的代表性。本次研究中统计的对象为教材中所有文本,包括课文、标题、课后练习及单元练习的全部文字材料,其中涉及到“中文人名和中文地名”等以汉语拼音形式出现的词,如Beijing,Kangkang等未纳入统计范畴,其他常见英语地名和人名皆被保留。
(二)研究的问题
本次研究首先通过与大纲词汇比较对教材词汇分布的科学性进行概述,然后针对词汇的分布特征提出以下设想:1.在初始学段,教材的词汇学习对于初学者来说意味着什么?2.教材中尤其是低年级教材中,高频词汇和基础词汇的分布特征与材料编排对初学者有什么样的影响?3.学习中的“高原现象”与学习者词汇量的实际储备存在怎样的关联度?
(三)研究程序及相关统计说明
文章统计的仁爱英语教材是最新近的版本,一共六册,每学期一册,前五册每册有四个Units,第六册用于初三下学期,只有两个Units。语料处理方式是,首先将教材文本电子化,然后对电子文本进行严格地校对并分词,最后将数据录入ACCESS数据库。整个文本处理过程中使用的是微软公司office软件“ACCESS2007、EXCEL2007、WORD2007”。数据的处理和提取主要使用的是ACCESS数据库相关查询函数,比如要查询七年级上册的不同词形数,可以使用SQL查询语句,如:
SELECT word,count(ID)AS num
FROM G7U14
GROUP BY word
文章对词汇统计中涉及的概念有形符、类符[1]、累积覆盖率等[2]具体规定为:1.形符和类符。形符指统计语料中出现的全部单词,包括相同词形重复出现的单词;类符指不同词形的单词,包括本词、曲折形式及派生词。例如help,helped,helping,helpful,helpler,helper为6个形符,5个类符;而形符和类符比反映的是词汇运用的广度或丰富的程度;2.累积覆盖率指将统计的类符频率由高到低降序排列时,每一类符与其前类符的频次之和在全部形符总数中所占的比重,所有类符累积覆盖率之和必须等于”1”。
义务教育阶段的《义务教育英语课程标准(2011年版)》(以下简称《课标》)规定,初中五级词汇量应在1500-1600词之间。实际上,教材文本中的词汇由于受具体话语环境和语境的影响,会更多的以曲折形式和派生形式出现,如help衍生出来的helps,helped,helping等曲折形式以及helpful,helpless,helper等派生形式。文中词汇的统计方式按照课文词汇出现的具体形式进行统计即包括派生形式也包括曲折形式——这两方面对于初学者来说都不可忽视——作为学习者,若要全部掌握这些类符,既需要基本的语法知识也需要形成以本词为中心的词义丰富的“词族网络”,这在学习中更具有现实意义。
(一)教材词汇总体分布情况描述
1.教材词汇与《课标》词汇对比统计
在《课标》附录中共收单词1541,这是整个初中阶段全部的五级词汇。表1是教材用词和《课标》词汇对比统计结果。
表1:《课标》词汇与教材词汇对比
表1统计结果显示《课标》词汇在整套教材中分布比例非常高,达到了95.7%,教材语料几乎全部覆盖了课程标准的规定词汇;同时教材中的非课标词也占到了47.2%,说明教材语料中也使用了大量超纲词汇,学习难度相对较高。
2.不同学段类符和形符的分布情况考察
教材三个学段全部的文本类符形符统计情况如下表2和表3。
表2:教材三个学段类符形符统计
从表2可以看出,全套教材的形符总数为108242个,类符总量是4382个,类符数是教材自有词汇量2269的两倍左右,近乎于《课标》1541个词量的三倍,充分说明具体语境中本词会以更加丰富和具体的曲折形式和派生词形式呈现。
从各年级形符和类符总量看,词汇总数从初中七年级到九年级基本呈递增趋势,说明语言输入总量从初中低年级到高年级逐年递增,这种变化趋势符合学习者的认知特点和语言能力由低向高的发展趋势。
各年级类符形符比表明,年级越高类符形符比值越高。类符与形符比描述的是词汇多样性,是考察教材语料用词丰富性的一个重要指标。类符与形符的比值越高,词汇丰富性越高。统计数据表明,低年级教材词汇重复使用高于高年级教材,词汇的丰富性随着年级的递增而增加。
表3:各学段新类符统计
从各学段新增类符看,从七年级到九年级学段分别为1865,1300,1217,占比分别为42.5%,29.7%,27.8%。七年级学段新类符总量最大,所占比例最高。低年级教材中词汇这种高比例的分布量是否具有合理性?如果七年级教材中的这些类符在整套教材中都处于高比例分布,那么在起始阶段的学习中,掌握这些基础词,对于初学者来说既是基本的认知需要也是本阶段学习的重点。通过对七年级到九年级全部类符的对比统计如下表4。
表4:三个学段相同类符分布情况统计
表4数据显示,七年级学段中有1051个类符重复出现在八年级和九年级学段。这些类符的形符总数是整个教材形符总量的85.5%,也就是说,这套仁爱英语教材文本材料的85.5%都是由这些形符构成,剩余的3331个类符的形符总数只有形符总量的14.5%,说明七年级学段的这1051个类符在整个教材中具有非常基础的地位和极高的使用频率。据此可以判断,低年级教材中的这些词汇分布是合理的,具有很强的时序性,符合认知特点,需要在学习中引起足够重视。只有当初学者储备了一定量的基础词,有效学习才有可能得以进行,否则学习困难和分化的现象很快就会在部分初学者中出现。究其原因是这部分学习者对基础词汇不够重视,词量严重匮乏,必然会对学习中的新知产生困惑,因困惑而懈怠,又因懈怠加重困惑,如此下去兴趣不复存在,分化已是必然。
因此,在精细化落实基础阶段词汇学习的基础上努力营造兴趣盎然的课堂氛围,让学习者因课堂成长而荣生成就感,因成就而自信,因自信而乐学,必将有助于减少或避免分化现象的出现。
(二)高频类符统计与分析
由上文数据得知,高频词在全册教材中分布广泛,具有非常基础性的地位。构成教材文本的“教材语言”分为“对象语言”和“叙述语言”两部分。[3]七年级学段是英语学习的起始阶段,无论对象语言还是叙述语言都主要由基础词汇和高频词汇构成,学习中应充分重视。
通过对初中仁爱教材的全文统计,高频词分布特征如下表。
表5:三个学段高频类符统计
表5中,分布在整套教材中的172个词是单个词频都在100或以上的超高频词,在全册统计材料中这些词的类符频次合计为67522次,占到全套教材形符总数108242的60.4%,说明了这些高频类符或基础性类符在学习中具有极其重要的地位。通过比照七年级学段的全部文本材料,上表中172个类符只有一个词world未出现,其他171个全部出现,这些类符在七年级学段的基础性地位毋庸置疑。因为这些超高频类符往往也是构成句子的基本成分,学习中不可或缺,需要优先掌握。现以七年级Unit3 Section C:1a的文章为例来说明掌握这些超高频类符的重要意义。
Jane and Sally are my new classmates.They are very nice.Jane comes from Canada and Sally is from America. They speak English.Many students in our class like English a lot,but I like it a little.So my English is not very good.Jane and Sally often help me with it.They like Chinese very much.But their Chinese is not good,so I help them.We are good friends and we help each other.
上述文本形符共计77个,44个类符。其中以下八个类符Sally,classmate,nice,Canada,America,speak,student,little不在高频词范围之内,高频词占到81.8%的比例。因此,对于初学者来说,在学习的最初阶段优先掌握这些最为核心和为数不多的高频类符具有非常特殊的意义。掌握了这些超高频类符,可以让初学者更加顺利地与所学材料建立一种熟识关联度,增强他们的学习信心,避免产生畏难情绪,激发他们进一步学习的欲望,从而尽可能避免潜在的分化。
(三)低频类符统计与英语学习中的“高原现象”分析
很显然,在初始阶段优先掌握一些超高频的核心词汇是极其重要的,但是仅仅依靠这些数量不多的基础词汇无法满足学习者精确理解和进一步获取深层信息的需求。而另一方面,当学习者学习进行到一定阶段,其进步常常处于停滞状态,学习者疲于努力,甚至出现厌学、焦躁等负面情绪。这种情况可能出现在初、中级学习者身上,也可能会发生在高级学习者身上(Jeremy Harmer,2000)[4],这被称之为语言学习中的“高原现象(plateau effect)”。[5]那么这种现象到底是怎么产生的,又该如何解决?下面将继续从词汇统计的角度继续寻找可能性解释。下表是不同累积覆盖率下类符的量级分布情况描述。
表6:累积覆盖率、类符与形符统计
从上面的统计数据来看,至少预设了以下现象:1.核心词或高频词数量不多但使用范围极其广泛;2.文本信息理解的完整性取决于学习者所掌握的类符累积覆盖率的比例,比例越高,文本信息理解就会越精确、完整;3.高频类符和低频类符在频次和数量方面各占优势分别处于语言学习序列的两端。
在英语学习中,词形或具体类符是构成文本的基本要件,掌握一定量级的词汇对精确把握篇章信息举足轻重。对于学习者来说要想获得全面准确的文本信息,词汇必须要有一定量的突破,体现在类符数量等级上将是成倍地增加。
图1:覆盖率和类符对照图
如上图,当学习者的词量达到535个常用类符时,预设能理解相应水平文本的80%内容,但仍会流失20%的信息,这让学习者面对文本内容的关键信息时可能会不堪甚解。如果学习者完全掌握上述的1809个类符时,理论上学习者能理解教材文本信息的95%,但仍有5%的信息流失率。信息获取的准确率看似提高了15%,却需要掌握三倍的类符量。假若直接由文本信息获取的80%提高到理论上的100%,则需要在535个类符的基础上再多掌握近3847个类符,数量上整整多出了六倍。这些多出来的庞大的类符毫无疑问需要学习者花上更多的时间和精力来熟悉和掌握,这将极大地考验学习者的坚持度和持久性。这也是很多外语学习者感到困惑的地方:为什么经过较长一段时间努力,学习效果或成绩并没有明显提升?殊不知”,也是英语学习中出现“高原现象”在词汇学习方面的合理解释。每个学习阶段词汇积累的量与该阶段所呈现的学习效果之间存在一个词汇量的平衡问题。有些学习者词汇量大大溢出本阶段的学习要求,有的学习者词汇的储备量严重不足甚至与学习内容要求严重不匹配,后者必然会在很大程度上受制于词汇量不足进而影响到信息获取和文本内容的准确理解,自然也会反映在学习效果上——短期内踟蹰不前。优秀的学习者和中等水平的人在学业上也许就差那么十几分甚至几分,若仅从词汇方面考虑,这种差异的背后极可能是二者词汇储备量存在较大差距。
对教材词汇的统计分析和分布特征描述,不仅可以制定出高频词汇量表,还对教材编写的科学性和规范性进行了检验,更重要的是明确了基础阶段词汇学习的重要性和积极作用,阐述了高频词和基础词的学习具有优先时序性和必要性,为有效学习和教学提供了可靠的数据支持,也为科学编写教材提供实证依据。对教材词汇的累积覆盖率和信息量提取两者关联性分析为陷入学习瓶颈状态的学生提供合理的解释和可行的解决方式。
[1]何舒曼,李庆燊.我国初中英语教材词汇因素研究——基于三套教材的统计与分析[J].教学与管理,2013(10).
[2]苏新春,杨尔弘.2005年度汉语词汇统计的分析与思考[J].厦门大学学报,2006(6).
[3]苏新春,杜晶晶,关俊红,郑淑花.教材语言的性质、特点及研究意义[J].语言文字应用,2007(4).
[4]Jeremy Harmer.How to teach English[M].外语教学与研究出版社,2000.
[5]王瑜生.“高原现象”与英语教学的创新[J].湖北教育学院学报,2007(7).
(责任编辑:周大明)
本文系2014年漳州市基础教育课程与教学研究课题(项目编号:ZPKTY14024)研究成果。