摘要:本文以本校高一年级期末考试的物理成绩为研究对象,用SPSS软件对640份试卷进行了初步的统计分析,计算出了试卷的难度、区分度、信度、效度等具体量化参数,验证了一种提高试卷效度的方法,统计分析的结果增加了试卷质量评估的可靠性、科学性,为指导和改进课堂教学提供了参考基于SPSS的学科相关性分析和性别差异性分析也为学生选科和生涯规划提供一定的借鉴意义.
关键词:SPSS;考试数据;试卷分析
基金项目:苏州市教育科学“十三五”规划2016年度课题“基于提升学生核心素养的初高中物理教学衔接的实践与研究”(项目编号:16032060).
作者简介:田晓华(1986-),女,甘肃定西人,硕士,中学一级教师,研究方向:高中物理教学及研究.
考试是检验教师的教学效果和学生学习效果的一种重要手段,一份优质的试卷能为测试结果提供客观、科学有效的评价,因而试卷分析是教学工作中的一项重要内容本文通过SPSS软件对本校高一年级期末考试的物理成绩进行深度分析,以期对物理教师课堂教学策略的改进和调整提供一些参考.
1原始数据录入
本文使用的软件为SPSS21版启动软件,点击菜单“文件”→“打开”→“数据”,选择文件类型为“Excel”,将高一全年级学生的物理成绩(含小题得分)导入,SPSS会根据Excel自动添加变量名.
2试卷结构
本试卷由两部分组成,满分120分,其中选择题共38分,非选择题共82分,见表1所示.
基本描述统计数据表显示:学生总数为640人,无人缺考,全级均分8221分,最高分117分,最低分23分,全距为94分,方差235369,标准差为15342,说明本次检测中学生的个体差异较大笔者和学生沟通交流后发现原因在于:从初中进入高中,物理学习梯度较大,有部分学生还没有适应高中物理的学习,加上同时学习9门功课,部分学生往往无法合理安排学习时间,容易导致顾此失彼,甚至有个别学生产生直接放弃学习物理的念头因此教师应该在教学中做好分层教学,因材施教,特别要多关注这部分低分学生,帮助其夯实基础知识,适时做好补差工作,探索多种教学策略,调动学习物理的积极性.
32正态分布检验
为了检验试卷是否规范,需要观察学生成绩是否服从正态分布.图形可以将数据分布比较直观地呈现出来,因此笔者首先做出分数分布的直方图运行菜单:“分析”→“描述统计”→“频率”,将“总分”拖入变量框,点击“图表”对话框,选中“直方图(在直方图上显示正态曲线)”,运行结果如图1.
由图1可知,全年级成绩基本呈正态分布结合表2分析得知:峰度系数0357>0,表明该总体数据分布与正态分布相比较为陡峭,为尖顶峰;偏度系数为-0615<0,表明总体成绩略微呈负偏态分布,即高分略多.
为进一步检验,可做P-P图或者趋降P-P图.P-P图的两个坐标轴分别表示理论累计概率和实际累计概率,如果数据服从正态分布,则其中的数据点应和理论直线(对角线)基本重合趋降P-P图,反映的是按正態分布计算的理论值和实际值之差的分布情况,即分布的残差图如果数据服从正态分布,则数据点应较均匀地分布在Y=0这条直线上下[1].具体操作:点击菜单“分析”→“描述统计”→“P—P图”,在弹出的对话框中将全卷总分拖入变量框,单击“确定”,运行结果如图2所示.
由图2可知,本次测试学生的物理成绩基本服从正态分布,表明试卷命题基本合理,反映了学生的实际水平这也说明接下来的统计分析是有意义的.
33试卷的“四度”分析
331难度
难度是指测试题目的难易程度,用难度系数p表示,且0≤p≤1本文中用公式P=MW计算各题的难度系数,期中M表示全体学生某题的平均分,W表示该题满分分值试题的难度一般07以上为容易题,04~07为中等难度,04以下为较难题或难题通常期末考试为目标参照性考试,可适当偏高,全卷平均难度以07左右为宜,06~08为正常[2]
操作如下:首先在菜单栏点击“分析”→“描述统计”→“描述”,将“q1”“q2”……“q18”拖入变量框,点击“选项”对话框,选中“均值”,点击“继续”、“确定”,即可得到每题的平均分然后将“每题平均分”“每题的满分”作为变量输入相应数值,点击菜单“转换”、“计算变量”,目标变量设为“p”,数学表达式为“P=每题平均分/每题的满分”,最后单击“确定”,运行便可得到各题的难度系数,整理输出结果见表3.
全卷的难度p可取各题难度的加权平均值,或按公式P=K 来计算,其中 表示所有考生的总分均值,K表示试卷满分.
从难度分析来看,大部分题的难度大于07,选择题中1、2、3、4、8、9、10为容易题,第5、7难度中等,第6、11属于难题实验题中第12为容易题,13和14难度中等计算题中第15、16、17为容易题,18属于难题全卷的难度系数P=8221/120=0685,难度中等,有利于测量学生的真实水平和更好地控制不及格率进一步对照试卷内容,发现难度系数大于09的几道题目考察的知识点过于基础,选项过于明显,故而需要修改才能加入题库第11题难度系数较小,但该题非常新颖灵活,期末测试出现这样一道题也很正常,从另一方面,也提示教师在教学中应该多联系生活实际,注重知识点灵活应用.
332区分度
区分度是指试题对考生实际水平的区别能力,通常将试卷满分作为考生的实际能力水平,而将考生某题得分与试卷总分的相关系数作为该题的区分度.
区分度常用D表示,取值在-1~1之间,值越大区分度越好按照美国伊贝尔(L.Ebel)提出的标准,04以上表明此题的区分度很好;03~039表明此题的区分度良好,修改后更佳;02~029表明此题的区分度尚可,但需修改;019以下表明此题的区分度差,必须淘汰或改进后方可使用另外,若区分度为负值,则为消极区分,说明这个题目有问题,应删除或重新修订;区分度为0,则无区分作用.
每道题的区分度在某种程度上可以衡量该题目的优劣,而各题区分度的加权平均是衡量一份试卷优劣的重要指标,可以按照公式D=∑ni=1KiDi∑ni=1Ki 计算,式中D表示试卷的区分度,Di表示第i题的区分度,Ki表示第i题的满分.
具体操作:运行菜单“分析”→“相关”→“双变量”,在弹出的对话框中将“q1”“q2”……“q18”“总分”拖入变量框,相关系数选择“Pearson”,其它为默认值,点击“确定”,得到各题的相关系数矩阵,输出结果整理见表3.
由表3可知:第5、8、12~18题的区分度均大于04,区分度很好;第3、9、10题区分度良好;第4、6、7区分度尚可,第1、2、11题区分度很差结合难度系数还可以发现,难度系数过高或过低的题目,区分度都很不好,因此在命题时应综合考量,适当调整只有适当的难度才会增大区分度,这对试卷质量的提升具有指导意义全卷的区分度计算得D=0491,整体区分度很好.
333信度
信度指测试结果的稳定性或可靠性的程度,越高说明考生受偶然因素影响的程度越小,可以比较真实客观地反映考生的学习水平实际测量中有多种不同度量方式本文用科隆巴赫α(Cronbach's Alpha)系数来度量,取值范围0~1,一般认为大于09信度为优,07~09较好,低于07为不合格.
具体操作:运行菜单,点击“分析”→“度量”→“可靠性分析”,将变量“q1”……“q18”全部拖入项目框,模型选“α”,单击“确定”,运行结果如表4(a)和表4(b)所示.
由表4可见,本次试卷的信度为0714,属于一般.各题项已删除的 Cronbachs Alpha 值在0665~0717之间非选择题除第15题外都低于07.
影响试卷信度的因素较多,可以尝试从以下两个方面提高试卷信度:(1)增加题目数量;(2)尽可能使全卷难度系数呈正态分布.
对于方法2,由于无法重新测试,笔者尝试做出各题难度系数的直方图,并再次用P-P图进行正态性检验,方法同前,运行后输出结果见图3.
很显然,全卷各题的难度系数并不符合正态分布,这也对信度产生一定影响同时也给命题者一定的启示,为了获得较高的信度,应当在一份试卷中将各种难度的题型、题量合理搭配,尽可能使试题的难度呈正态分布.
334效度
效度是指测量结果的准确性和有效性的程度,亦即测量是否达到预期的目的效度的估计有多种方法,本文用效标关联效度,它是以测试分数和校标之间的相关系数来表示测试效度的高低效度用E表示,取值范围0~1,一般大于07为优秀试卷,04~07较好,低于04为不合格[4]
本文选择高一(上)的期中考试成绩作为校标,将学生的期考试中和期末考试成绩作为变量输入SPSS,利用Pearson相关分析,方法同前,输出结果见表6可见两次考试成绩的Pearson相关系数为0675,故认为本试卷效度较好
4学科分析
41物理与其他学科的相关性
按照新高考改革的方向,学生可以在语文、数学、英语三科之外,自由选择物理、化学、生物、政治、历史、地理中的三科作为高考考试科目,即所谓3+3模式各种选科组合给学生很多自由度,然而怎样选择搭配才较为合理科学,笔者尝试对物理成绩与其他学科成绩进行Pearson相关分析,方法同前,输出结果见表7.
Pearson相关系数用r表示,取值-1~1,当r>095说明极强相关;当r>08高度相关;当05 分析表7可知,无论男生还是女生,物理成绩除与语文无关外,与其他学科均显著相关,但相关程度有所不同男生的物理成绩与化学、生物、地理、数学呈中度相关,女生的情况也基本相同据分析,在6个选科中,高校提出选考科目所占的比重由大到小依次排列为物理、化学、生物、地理、历史、政治以上海高考为例,最多的组合是“物化生”,再次是“物化地”[5].可见,这样的选科组合也是有一定科学依据的当然,在选科时除了要符合高校对选科的要求,还要考虑自己的兴趣、爱好、特长等因素,综合考量从而制定自己的生涯规划. 42物理成绩的性别差异分析 由前所述,物理对学生的高中生涯规划尤为重要,然而很多学生、家长甚至有些教师都普遍认为“男生比女生更适合学物理”,因此笔者尝试用SPSS中的独立样本T检验来分析本次考试中男女生成绩有无显著差异. 操作如下:点击菜单“分析”→“比较均值”→“独立样本T检验”,在弹出的对话框中将全卷总分、卷1、卷2一起拖入“检验变量”框,将“性别”拖入“分组变量”框,单击“确定”,输出结果见表8. 由表8可知,“全卷”、“卷1”、“卷2”三项的第一个sig均大于005,即方差齐,因此观察方差齐性时的T检验sig值,若sig>005,则表示两组均值无显著差异;若sig<005,则表示两组均值存在显著差异结果显示,全卷sig=0759,卷1的sig=0195,卷2的sig=0882由此可以得出结论:无论全卷总分,还是卷1(选择题)、卷2(非选择题),男女生成绩均无统计学意义上的显著差异因而教师应该纠正“女生不适合学物理”、“女生学不好物理”这种性别歧视观点,强化性别平等意识,积极鼓励女生学习物理鉴于篇幅原因,其它性别差异分析将单独讨论. 5结论与启示 本文运用SPSS软件对一次考试成绩进行了初步的统计分析,得到较为客观、准确、科学、全面、清晰的量化分析,结果显示,本次试卷难度P=0685,难度中等;区分度D=0491,整体区分度很好;信度α=0851,较好;效度E=0675,较好在大规模的考试中,如果试题的难度处于03与07之间,区分度大于03的话,则可以认为试卷具有较高的质量[6]因此该试卷是一份较为成功的试卷,统计分析的结果为物理课堂教学的调整和改进提供了一定的参考意义,也对此后的命题工作提供了信息参考对物理与其他学科间的相关性分析和成绩的性别差异分析也为学生的选科、生涯规划提供了一定的参考价值. 参考文献: [1]張文彤,邝春伟SPSS统计分析基础教程[M].北京:高等教育出版社,2011. [2]王雪,邓振伟,陈玲,田七SPSS软件在试卷质量分析中的应用[J].读与写(教育教学刊),2009(3):74-77. [3]陈琪琪基于SPSS的物理试卷分析与评价[J].物理通报,2017(12):103-106. [4]赵立新,陈文艺,郭子君试卷质量的定量评价[J].华南农业大学学报(社会科学版),2004(4):136-141. [5]郑刚高考“3+3”模式下的生涯规划指导:如何选科[J].辽宁教育,2016(6):79-80. [6]章建石新高考改革背景下不同版本试卷测量学指标的比较与监测——以某年度英语试卷的分析为例[J].全球教育展望,2018(5):71-79.