龚建新
[摘要] 对R县某学年度第二学期七年级和八年级语文期末考试的数据分析发现,作文书写水平和作文成绩显著相关。七年级的回归分析发现,写字分1分对作文分有1.10分的贡献;八年级的回归分析发现,写字分1分对作文分有1.52分的贡献。该结果验证了语文考试中作文的“印象分”是存在的;同时表明,通过训练书写可以提高学生的作文应试成绩。该结果提醒考试组织者,在大规模考试中需要控制考生书写水平对作文判分的影响。
[关键词] 作文书写;作文成绩;相关性;大数据
一、引言
书写工整美观,在中、高考等大规模考试中可以获得“印象分”,这几乎是人人皆知的考试技巧。有老师称:写好字就是给作文披上一件美丽(迷人)的外衣。大规模考试,由于阅卷量大、阅卷人手少、阅卷时间紧,一份作文在阅卷老师面前停留时间短,不可能慢慢推敲,书写工整美观往往可以获得好的第一印象,这完全符合人们的日常经验,也符合心理学中“晕轮效应”。但是,在中、高考(包括区域性的期中、期末统一考试)等大规模考试中,书写的“印象”对作文成绩的判分究竟有多大的相关性,能够有多大“贡献”,国内目前少有人做过深入的研究。董继文曾做过相关实验:取一篇初一女生的作文《没有手表的日子》(原版),让一字迹相当潦草的男生抄一份(男生版),再适当地运用不同的字体与字号打印一份(打印版),将3份作文各复印3份,混杂在其他考试作文中,让3个不同年级的老师评分(满分100分),最后得分如表1所示。
从表1可以看出,组与组之间的打分基本上呈递降变化,表明各年级要求不一样,打分还是比较准确的。同一篇文章,因为书写不一样,两极差高达24分,表明书写这一项的实际权重过大。如果说打印稿比较特殊,影响评分的话,那么原版与男生版相差18.34分就能说明晕轮效应的存在。董继文的实验虽然作文样本数量少,也不是针对大规模考试作文阅卷开展的研究,但足以引起我们对这一现象的重视,值得做进一步的实证研究。
二、数据搜集与研究方法
(一)研究样本的选取
以R县27所初中学校某学年度第二学期七年级和八年级语文期末考试成绩为研究样本,考试全县统一命题,统一网络阅卷,试题卷面总分为150分,其中作文60分,写字5分。阅卷采用网络阅卷,两个年级作文均由县内一所师资水平最好的学校老师阅卷,阅卷100%采用双评,误差分5分以内取两人平均分,超过5分交由阅卷组长仲裁,两个年级写字分别由一名写字水平较高的教师判分。该学年全县初中学校27所,在籍学生人数七年级5717人、八年级5931人,剔除本次缺考学生后得到有效样本数据如下:初中学校27所,七年级学生5700人、八年级学生5906人。
(二)研究過程
作文分作为因变量可能会受多种因素的影响,写字是众多因素中的一个,为了分析众多因素中写字对作文分的贡献,决定采用多元线性回归模型进行分析,以作文分为因变量,写字分、其他题的分数、学校为自变量,逐步加入自变量,一共建立8个模型。首先通过描述性统计分析,分析七、八年级主要变量的平均值和标准差,研究自变量对因变量是否有显著的影响,并呈密切的线性相关,以保证回归模型具有优良的解释能力和预测效果,为进一步分析寻找可能;然后以因变量为作文分,写字分、其他题的分数、学校为自变量,逐步加入自变量,分别对七、八年级进行回归分析,分析写字对作文分的贡献。
(三)数据分析方法
数据处理与分析均在STATA/MP 13.1中进行。
三、结果与分析
1.七、八年级主要变量的平均值和标准差
从上述描述性统计中可以看出,主要变量的观察值之间都具有较大的变差,这为下文的计量估计提供了可能。
2.七年级线性回归分析
以作文分为因变量Yi,写字分、其他题的分数、学校为自变量。模型1:单自变量线性回归,Wi代表写作分,代表截距(常数项),代表写作分对作文分的贡献(这个贡献是相关性,不是因果关系):
从表3看出,随着自变量增加,的估计值从1.9降低到1.10,但是始终在P=0.01水平上显著。1.10解读为写字分1分对作文分有1.10分的贡献。课文填空分1分对作文分有0.13分的贡献。课外阅读总分1分对作文分的贡献是0.07分。如果把课外阅读拆分成4小题分布看相关性,第一题中国古典文学与作文分负相关,不是特别显著(P<0.05);第4题比较主观,对作文的贡献稳定而且非常显著(0.33分)。
比较模型5、6和7、8,结果差不多,这说明控制学校因素是可有可无的。学校之间的差异不大。
3.八年级线性回归分析
从表4看出,随自变量增加,的估计值从2.49降低到1.52,始终在P=0.01水平上显著。
4.研究结论
尽管由于试卷难度不同,八年级的1.52和七年级的1.10不能进行比较,但从表1可以看出来,八年级作文分的标准差是3.56,写字分标准差是0.47;七年级作文分标准差是2.79,写字分标准差是0.57。结果投射到标准差上之后就是:
(1.52/3.56)/(1/0.47)=0.20
(1.10/2.79)/(1/0.57)=0.22
可以看出1标准差的写字分对作文分大约有0.2标准差的影响,这个结果在两个年级是基本统一的。
四、讨论与建议
1.这个研究结果表明:在大规模考试的阅卷中,因写字而造成的“印象分”是存在的。写字水平和作文成绩之间存在显著相关性,结果验证了语文考试中作文的“印象分”是存在的。这个结果告诉我们:一是通过训练书写,提高书写水平可以提高学生的作文应试分数;二是提醒考试组织者,在大规模考试中,阅卷组织者需要采取一定的措施控制阅卷老师因为考生书写水平影响对作文的客观判分。
2.学生书写水平对作文分贡献,除了因为阅卷者的“晕轮效应”外,也可能与书写水平和学生的非认知水平有一定的相关性。以第一题(课文默写)分数为y,其他题目作为x,做线性回归分析,在不加学校变量的情况下,七年级和八年级的coef值都约等于0.13,这个结果显示,在考虑了其他题的因素下,写字分对第一题还是有显著的正效应的,只是影响不及对作文的大。考虑学校的情况下结果还是几乎不变,写字还是对第一题有显著的正影响,但其间是否具有因果关系还有待实验验证。应该说课文默写是典型的客观题,阅卷时不会因写字而造成“印象分”,但为什么还会有显著影响,这可能和学习态度、学习习惯等非智力因素有关。有研究也表明写字训练不仅仅是技能训练,还是一个形成良好习惯、学习态度、学习兴趣、意志品格等非智力因素的过程。[2]从而对学生的语文素养产生正面影响,促进学生提升写作能力。因此,我们认为,通过训练书写可以改善学生学习态度,促进学生语文素养的整体提升,从而提高写作水平。
3.在大规模考试中是否需要单列写字分并且独立评分,可以做进一步的实证研究。有部分地区的中考语文试卷在作文中设“作文分+写字分”,这对引导学生和老师重视写字教学有一定的导向作用,但作为高考的考试,从阅卷的公平、公正角度考虑,是否需要另加写字分,是否需要安排教师单独赋分,應该做进一步的研究。因为学生的书写水平已经影响其写字分,书写水平又影响其作文得分,其中是否有重复得分和扣分?值得研究。
4.适当控制单篇作文网上阅卷的时长。阅卷速度快的教师质量未必差,而阅卷速度慢的教师质量未必好。在阅卷过程中,又好又快和又慢又差的情况都出现过。但是,不限定阅读速度的上限,就有可能出现个别教师为追求速度而忽略质量的情况。所以,网上阅卷系统一定要有限制阅卷速度过快的功能。[3]控制速度,适当延长一篇作文的阅卷时间也是降低“晕轮效应”导致的认知误差的重要方法。
本研究采用自然状态下的数据。判分误差和作文水平的实然差异都会影响学生成绩,学生的成绩在多大程度上受书写水平影响,还有待更加深入的、可靠的实验研究。
本研究数据分析由上海科技大学徐剑锋博士完成,特此致谢!
[本研究系江苏省教育科学“十三五”规划重点课题“基于大数据技术学业质量精准评价与指导的服务平台建设及应用研究”(项目编号:B-b/2016/02/105)阶段性研究成果]
[参考文献]
[1]董继文.考试作文评分误差控制研究[D].上海:华东师范大学,2004:19-20.
[2]高顺翠.从写字教学入手培养学生的非智力因素[J].连云港师范高等专科学校学报,1998(1):90-91.
[3]陈志国,芮南.高考作文网上阅卷双评过程中的质量监控[J].中学语文教学,2009(6):62-65.