蔡淑华
在对外汉语教学中,汉语写作课是一门重要的语言技能训练课,教材在这门活动课中有着教学凭借的作用。《发展汉语》作为对外汉语教材中最具代表性的教学凭借之一,其难易度在一定的程度上影响着汉语作为第二语言习得者的学习效果,其中的范文只有难易适当、长短适中,才能真正发挥它的示范和可模仿性作用。中级写作是初高级过渡的桥梁,中级写作教材中范文选编的恰当与否直接影响到初级水平的学习者能否成功地实现向高级水平学习的过渡。可见,对《发展汉语·中级写作》范文难易度进行分析至关重要。
易读性是指书面材料易于阅读和理解的程度。文本易读性的研究成果主要体现在易读性公式上,大多数学者采用Fry的“阅读难度评估指示图”,众多公式中,多数把词汇难度和句法难度两方面作为公式的重点。卢伟提出汉字、词汇、语法结构、语篇等几个语言变量是影响对外汉语教材语料的难易程度的主要因素。张宁志参照Fry公式的研究方法,将对外汉语的句长、非常用词进行量化,指出每百字句子数是区分中高级教材的重要标准。
本文采用Fry公式的研究方法,从字频统计分析,生词量、词频统计分析,平均句长统计分析,篇长统计分析这五个方面对《发展汉语·中级写作》中范文的难易度进行定量分析,以明确范文在汉字层面、词汇层面、句子和语法层面、语篇层面所体现的易读性问题。
字频统计分析
字频指一个字的常用度,是测量汉字难度的一个重要指标。字频能反映汉字的难度,进而间接反映出文本的难度。《国际汉语教学通用课程大纲》是编写教材、进行教学工作的主要依据,它将常用的汉字分为六个级别,统计文本中六个级别的字频是反映文本汉字层面难度的方法之一。汉字字频与教材难度的关系是:高字频的汉字越多,教材难度越小;反之,教材难度越大。
字频统计采用传统的全文统计法,以《国际汉语教学通用课程大纲》为依据,统计每篇范文中所含汉字的等级,平均每百字三级、四级、五级、六级、超纲字数即范文中各级字数除以篇长乘以100所得。表1是对《发展汉语·中级写作》上下册各15课语料包含字频的具体统计结果。
从统计结果来看,上下两册范文难字编排上有共同之处。横向上都以三级字的数量为主,四级字数量为辅,其他次之,具体的难字数量差距为:三级>四级>五级>六级>超纲。纵向上,下册比上册在难字数量上有所提高。以1000字的范文为例,下册的三级、四级、五级、六级、超纲字分别比上册多约18.7个、36个、10.8个、2.4个和0.4个,明显提高的是三级和四级难字的数量。
对比各册内部每篇范文的汉字难度差异和增减趋势,可以看出两册前后范文平均每百字三到六级,超纲字合计值的差距波动都很大。上册中合计值呈现为两个“W”相连接的走向,出现了3个波峰和3个波谷,波动频率高,难易相间的编排交替次数多,波动的差距很大为23.1个汉字,第6课的汉字难度是最简单的只有15.93个,最难的是第12课有39.03个。下册中合计值是一个状似“M”的趋势,出现了1个波谷和2个波峰,也是难易相间的编排,波动的差距也很大,有20.99个汉字,但相对于上册要稳定,波动的频率较低次数也较少,汉字难度最简单的是第16课,最难的是第18课。
生词量、词频统计分析
范文在词汇层面的易读性问题,主要是通过对生词量、词频的统计分析而体现出来的,下面将从这两个方面进行分析。
生词量统计分析
生词量是确定语料难度的一个重要指标。教材中的生词量越多,教材难度越大;反之,教材难度越小。生词量指范文后标注的生词,对其进行手工统计,包括各课的生词量、每册的总生词量和均值,具体统计数据如下(表2)。
表2中的数据横向来说上册课文间生词量相对稳定,但变动较大,第2课最简单只有4个生词,第13课最难有10个生词;下册课文间生词量的浮动较上册相对平稳在6~9个词之间,生词数量基本都维持在生词量均值附近,第24课最简单只有6个生词。纵向对比,下册的总生词量和生词量均值较上册都有所增长,下册的总生词量比上册多14个,相当于增加了近两课的生词量均值,在生词量均值上,下册比上册多出近一个生词。这表明,下册生词量的选编较上册更加成熟,上下两册生词总量的安排是合理的,符合学习者由简到难、循序渐进的习得规律。
詞频统计分析
在一定数量的真实语料中词汇重复的次数叫作词频。词频不同,学习者对词汇的熟悉程度也不同。词频是评价词汇客观难度的一个重要指标。《汉语水平词汇与汉字等级大纲》是对教材和汉语测试的重要依据,将词汇分为四个等级,统计文本中四个级别词汇的出现频率,可以间接地反映文本词汇方面的难度。词语的词频越高,范文的难度越小,反之亦然。
词频统计采用传统的全文统计方法,以《汉语水平词汇与汉字等级大纲》为依据,结合语料库在线对范文进行分词,并手动调整分词误差,然后将分好的词语放入自制程序,统计出所有词汇对应的等级,平均每百字丙级、丁级、超纲词数即范文中各级词数除以篇长乘以100所得。表3是对《发展汉语·中级写作》上下册各15课语料包含的词频的统计,具体统计结果如下:
从平均每百字丙级、丁级、超纲词和均值来看,上下册词汇难度的差异很小,丙级和丁级词都有所增加,超纲词相对减少,词汇难度控制上具有很大的一致性。在篇长为1000字的文本中,下册比上册仅多出0.9个丙级词,6.8个丁级词,少4.2个超纲词。丁级词、超纲词所占比例是衡量中级汉语教材词汇难度层面的重要变量。在平均每百字丙级、丁级、超纲词中,上下册所占的比例均值分别为10.55和10.82。从这点看,上下册差距不明显,难度相当。从每册教材内部各主课文间词汇难度差异和增减趋势来看,上下册丁级词、超纲词都呈现波浪式难易相间的编排特点,从整体来看都是先难后易渐渐趋于平稳。上册中最难的是第3课,丁级超纲词高达15.37个,最简单的是第8课只有7个;下册中第17课最难,第28课最简单。
统计的结果表明:教材中丙级词汇明显不足,超纲词汇过多。上下两册各课中平均每百字丙级词汇平均所占都不足2个,而超纲词汇却都高达9个。丙级词是中级阶段教学的重点,在教材的安排中显然比重不足,而超纲词的比重却很大,这对于具备初级汉语水平的学习者来说,不利于其学习水平及能力的提升,且可能会起到相反的厌倦逃避作用。
平均句长统计分析
句子长度是决定课文难度的重要因素。张宁志认为,通过测量平均句长可以有效地将对外汉语教材进行入门、初级和中高级三级的区分。平均句长统计以“。”“?”“!”“;”“……”符号切分出句子,手动统计出句子数,平均句长等于篇长除以句子数,包括每课的平均句长和上下各册的平均句长,具体统计如下(表4)。
通过考察表中的数据我们发现,上册中各课的平均句长浮动范围在19.52~36.15之间,总范文的均值为27.43;下册中各课的平均句长浮动范围在22.59~50.92之间,总范文的均值为33.18,两册中各课的平均句长超过总范文均值的课数均为8课。张宁志认为通过测量平均句长可以有效地将教材分为初、中、高三个等级。《发展汉语·中级写作》上下册每百字平均句数都不到6句,属于中高级教材。在各课的平均句长和总范文均值两项统计中,下册都高出上册,这说明范文的难度在有阶段、有计划地循循上升。但平均句长差距过大,上册的平均句长差距为16个汉字,下册平均句长差距为28个汉字;两册之间平均句长的差距高达12个汉字之多。
篇长统计分析
Stern、卢伟和郭望皓都认为篇长是控制教材难度语篇层面的一个变量。篇长是测定教材语料难度的重要变量之一,二者的关系是:篇长和教材难度成正相关关系。通过把范文导入教学软件进行篇长字数统计,包括各范文的篇长和每册的平均篇长,辅以手工纠正其失误处,具体统计数据如下(表5)。
篇长统计数据显示,上下册的范文都属于中长语料,上册中范文的中长语料占比为2∶3,篇长在327~620之间,范文的均值为486.13;下册中范文都是长语料,篇长在525~750之间,范文的均值为638.8。各册范文间篇长的整体趋势都是稳步增长的,超过范文均值的数目也比较接近,下册只比上册多一课。对比各课的篇长、总范文的均值和超过均值科目数,下册都高于上册,表明范文篇长的编排合乎教学难度有阶段、有计划循循上升的原则。但各册课文之间的篇长差距较大,上册差距高达293个汉字,下册有所减缓,相差225个汉字。适当的篇长利于学生的习得和记忆,过犹则不及。
根据《发展汉语·中级写作》范文难易度影响因素各方面统计分析所发现的问题,在此我们提出以下三个建议,以供对外汉语写作教材范文选编的编写者参考。
从词句跨度的角度,我们认为应该缩小差距,适当平衡范文间各级汉字、丙级词、超纲词、平均句长和篇长。从二语习得的规律来说,同一水平的范文之间,各级汉字、丙级词、超纲词、平均句长和篇长的差距过大,会让学习者感觉突兀,增加认知和习得的难度,严重者会产生厌烦和逃避心理,这些都不符合教材编写的由简到难、循序渐进的原则,不利于学习者写作能力的提升。
从重点词语教学的角度来看,应该有阶段有步骤地增加丙级词的习得。丙级词是中级汉语词汇教学活动的中心,赵新曾谈到中级教材(中级精读教材)中丙级词至少应占 70%~80%,高级词(丁级词和超纲词)应该维持在 20%~30%。这一数据具有一定的借鉴作用,按照这个标准,教材中丙级词的数量是远远不够的,这对于具备初级水平的学习者来说,很难起到中级汉语水平的提升作用,更难以实现中级作为初高级跨越之间桥梁的目标。
从超纲词处理的角度来说,需要加强对超纲词的控制和处理。范文的超纲词主要有三个来源:专有名词中人名、地名、物名;成語和俗语;语素加上词构成的超纲词。对于专有名词中人名、地名、物名,普遍的方法是在选编时,为了降低学生的理解难度,对其进行提示标注;另一种方法是根据其常用程度,加强关注,也可以考虑是否应该选编入教学大纲。成语和俗语是中华民族文化凝聚的精华,都有其独特的内涵,应该结合语境进行恰当处理。语素加上词构成的超纲词,提示学生对词进行标注识别,并随着词汇量的扩展逐渐形成辨识推测能力,帮助其进行语料的理解。