重复测量在学生打写文本分析中的应用

2013-08-15 00:51赵兴龙
中小学电教 2013年4期
关键词:语料测量测试

☆ 赵兴龙 李 蕾 张 璇

(中央电化教育馆,北京 100031)

很多语文教师都遇到这样一个问题:学生的作文除了给写写评语之外,怎么样更科学地去测量呢?这样的问题很普遍,也非常重要。随着教师专业化发展的不断深入推进,一名好的语文教师不能仅仅会教书,更重要的是能将自己的教学实践与研究结合起来,形成指导语文教学实践的普遍规律。本文介绍的重复测量方法就是教语文教师如何科学地测量学生作文从而形成研究结论。

重复测量研究用来分析一段时间或某几个时间点个体的增长趋势或个体之间的差异[1],主要采用重复测量的多元方差分析对数值进行统计并对结果进行解释说明。所谓打写是指小学生在计算机或某种手持设备的支持下使用键盘进行输入的一种写作方式。以往类似的文本分析研究,大都采用均值说明学生打写规律的变化趋势。这种表示过于粗枝大叶[2],同时也不合适描述个体特征的发展,在实际的操作中显得过于松弛。在寒暑假后,学生的打写状态一般都会由于疏于训练而变得不稳定;在每个学期的开校前两周、期中考试周、期末考试周这三个时间段内,学生的打写水平也有可能受到各种各样因素的干扰而呈现出意料不到的波动,这些影响因素如果只用平均数去表示就有失严谨了。在语料收集中避开上述特殊时间段并选取学生打写能力相对平稳的时间点进行测量可以使研究结果更加可信和有效。通过求出多次测量之间的差值并计算出差值的多元方差以及通过正交转换之后的趋势分析,有利于在相对较长时间的动态发展中对学生打写规律进行准确和连续刻画。重复测量方法在学生打写文本分析中的应用应特别注意以下几个方面。

一、语料的选样

班级案例语料是重复测量研究中常用的语料形式。这种形式的语料可以将一个班级作为个案,选择学生较为熟悉且大家集体参与的活动进行主题打写产生语料,有效避免因为生活经历以及地区的差异而带来的研究误差。选择这种形式的语料有两个考虑:一是在不打乱正常教学秩序的前提下,很难通过班级对比实验设计来产生语料,有效的实验和可信的统计之间确实存在着难以两头兼顾的困难[3];二是对于打写测试,学生生活圈子非常有限,他们看待事物的态度以及观点表述和成人有着明显的区别,知道的就能写出来,不知道就是不知道。对于一些写作主题由于地方差异,很难达到统一。比如“雪”这个主题,北方的学生写起来津津有味,而南方有的学生从小到大根本没有见到过雪,根本不知道雪意味着什么,只是从电视或书本上了解过。

在研究中为什么不采用抽样的办法来收集语料而偏偏选择班级案例法呢?这是因为对于学生写作文本这样的语料对象而言,抽样和班级案例法有着本质的区别。抽样是部分代表总体,通过研究局部推断总体状况[4][5]。但是对于个体的打写测量能否使用抽样的方法生成语料呢?综合以往的研究,打写话题中字词的识别、对话题意义的理解、打字的速度、打写话题的熟悉度、打写测试的时间、打写过程中指导与提示以及工作记忆等这些内部因素会影响学生的打写,教师的教学风格、教师和学生之间的亲密程度、学校对写作的重视程度、学校之间的差异、地区之间的差异、家庭氛围和文化素养之间的差异、父母的文化水平等这些外部因素同样对学生的打写有着影响。试想,如果将这样纷繁复杂因素影响下的学生打写采取抽样的方式进行研究,最后得出的只能是一般化的“学术”结论,而对学生个体实际的能力培养起不到应有的作用,一般化的结果对教师而言很可能成为束缚他们自己的统计紧箍咒[6]。而对于班级案例研究而言,在自然状态下对特定的同一个班级进行长期追踪,收集不同时间点的语料进行深入细致分析。由于这个班级在追踪过程中始终是同一个教师、同样版本的教材、相同的教学模式,受到的外界变量干扰较少,所以,对于研究学生的打写有着得天独厚的优势。

二、语料的生成过程

什么样的测试方法生成的语料才能真实反映学生的打写水平呢?一般而言,打写测试方法可以分为一次测试和重复测试。所谓一次测试是指对全部被试进行一次测试后计算组间差异或前后测差异;所谓多次测试是指通过对全部被试进行一段时间或长时间的跟踪后进行同一内容或不同内容的多次测试,以保证测试的准确性。学生打写的内在差异具有动态变化的属性,单凭一次测试可能很难反映他们打写的特点,也不足以说明学生写出这样或那样内容的真实意图以及实际的写作潜能,多次测试甚至是长时间的追踪测试对于学生打写测量是必要的。

同一个班级的学生在不同时间点打写同一个话题的重复测试的语料生成方式,既能够准确地测量学生在不同时间点中语言运用能力发展的动态状况,而且能够排除一些其他因素(如不同话题之间的干扰、教学水平因素、教师自身因素)的影响,对打写的可信度起到很好的支持作用。打写测试时间的安排应避开寒暑假、节假日以及期中期末考试三个时间段。打写测试以第一次打写内容为基础,后续打写都在第一次测试的基础上进行续写或修改。有的学生因为和其他学生有点小摩擦,不再愿意写第一次写作中出现的学生,这样也是允许的。

三、打写话题的筛选原则

打写话题一般可以分为多话题测试和单一话题测试。多话题测试不可控因素过多,实施起来较为困难;采用同一个话题对被试进行多次测试的方式,与认知神经科学中领域特异化知识系统的研究成果更加贴近。为了尽量达到话题熟悉度的要求,在选择话题的过程中需要遵循四大原则:第一,话题具有延续性而不能是瞬时性的。所选话题应该是和学生的生活实际紧密相连并且能够让儿童经常参与的活动或事件,而且能够考虑不同区域的学生都能进行打写的共性特点;第二,话题具有丰富性而不能是单一的。所选话题的内容既要具有阶段性的稳定性,又要具有细节内容的变化,不管如何,这些丰富的变化是让学生能够切身体会到、感触到的;第三,话题具有集体性而不能是个体的活动。选取集体性的活动或事件作为话题就会避免一部分学生因没有话题而生搬硬套的情况;第四,话题须具有真情实感,将学生本身对生活的情感融入进去,用语言表达心声,表达自己对周围事物的认识和看法,这一条是四个原则之中最为关键也是最为核心的一条。

四、语料的预处理

由于年龄、要求以及打写的特殊性,学生打写的文本和一般交互性会话文本的处理方式有很大的不同之处,具体处理方式如下。

第一,词的定义。词的定义以2008年国家语言文字工作委员会发布的《现代汉语常用词表》(草案)为依据。该草案共收录使用频率较高的汉语普通话常用词56008个,主要以单音节词(3181个)和双音节词(40351个)为主,也收录了一些熟语和表达概念名称的其他固定短语[7]。在实际的文本电子词库中有词汇56064个,比标准多出了56个,这56个词组皆为词表一些词的同音词,如词表中是年轻,在电子词库中“年轻”和“年青”则是两个词,他们的频率号相同,都是697。值得特别注意的是,学生在打写的初期经常出现词语误打错误、音节替代现象以及乱打三类现象。

对于乱打这一类现象,处理时直接将胡乱打写的字符剔除就行。对于词语误(错)打和音节替代的现象:词语误(错)打时,误(错)打的词语在词语统计中不计算;利用音节替代的词语,在统计中也不计算;如果音节书写错误,就按照错误的词语进行剔除。

第二,分词处理使用中科院计算所汉语词法分析系统ICTCLAS,这个系统的中文分词、词性标注以及未登录词识别三大功能恰好能够解决学生打写中出现的词项频率、实词和虚词以及不经常使用的一些新词的分词问题。

第三,人名和事物名称、地名在文本预处理中视为非禁用词,计入词汇数量统计。

第四,别词、多余的词项、错用词、文不对题的部分都不计入词汇数量统计。

第五,句子处理:语文新课标规定,二年级结束后才要求使用逗号和句号。所以,对于刚入学的儿童而言,打写中利用逗号和句号区分出句子是非常困难的。对于文本中的句子,采用人工增加逗号和句号后再进行切分的办法来处理儿童打写文本中的句子。

第六,命题的计算:句子的判别主要依靠人工方式进行,一般判别以句号为准则,但是对于一些感叹句表达判断和双重否同表达判断的句子,也被归属为命题。

第七,完成全部多轮打写测试的文本才是有效文本,才能进行计算。

五、语料分析的五种参数

第一,总体特征:每轮打写的总体特征,这些特征包括人数、最小值、最大值、平均值和标准差,这些总体特征包括毛词汇量、净词汇量、IR分布度等。

第二,差值特征:后一次打写测试的总体数量减去第一次打写测试的总体数量,这些特征包括人数、最小值、最大值、平均值和标准差。

第三,多元方差分析:检验多次打写测试的总体特征、差值特征之间的均值差异是否显著,需要表述清楚F值和P值。

第四,单因变量检验分析:进一步观测单因变量检验结果,检验多次测试的均值是否存在着显著的差异性。

第五,趋势分析:经过矩阵转换,找出不同测量次数的正交多项式线性、二次和三次系数,计算出三个正交转换后的变量Lin、Qua和Cub。分别以正交转换之后的三个新构成变量为因变量进行多元方差分析,检验总体多元方差是否与差异变量Wilks’Lambda整体多元方差统计结果一致并说明单因变量分析的线性和二次、三次增长趋势是否显著。

实际上,对于语文教师而言,掌握重复测量方法是非常容易的,关键在于教师能不能坚持规范的测量方法,能不能将学生长期打写的数据保存下来。我们期望在学生打写研究中能够出现更多更为实用的研究方法,这对研究学生打写规律以及知识建构规律都是有帮助的。

[1]刘红云.追踪数据分析方法及其应用[M].北京:教育科学出版社,2005:1.

[2][3][6]徐晓东.从组间比较到个体内比较的回归:重构教育技术学研究方法论[J].电化教育研究,2009,(1):46-53.

[4]李克东.教育技术学研究方法[M].北京:北京师范大学出版社,2006:91.

[5]裴娣娜.教育研究方法导论[M].合肥:安徽教育出版社,2001:116.

[7]现代汉语常用词表课题组.现代汉语常用词表[M].北京:商务印书馆,2008:666.

猜你喜欢
语料测量测试
基于归一化点向互信息的低资源平行语料过滤方法*
幽默大测试
把握四个“三” 测量变简单
滑动摩擦力的测量和计算
“摄问”测试
“摄问”测试
“摄问”测试
滑动摩擦力的测量与计算
对外汉语教学领域可比语料库的构建及应用研究
——以“把”字句的句法语义标注及应用研究为例
测量