纪宏伟(江苏教育学院如皋分院 江苏 如皋 226500)
基于SPSS的试卷分析与解读
纪宏伟
(江苏教育学院如皋分院 江苏 如皋 226500)
试卷质量分析是考试中的一项重要任务,也是教学效果检测的重要依据。科学、合理、有效的试卷分析显然有助于教师的教学和考试命题工作。本文通过实例,采用SPSS对数学考试进行各种定量分析,旨在为反馈教学效果、评价教学质量和科学编制试题提供依据。
SPSS;试卷分析;统计解读
试卷质量分析是考试之后的一项重要工作。根据试卷分析所得到的反馈信息,可以判断学生对知识的掌握情况,以总结教学经验和方法,反思教学过程的各个环节,及时调控教学策略和做出科学有效的决策,为不断进行教学改革、提高教学质量提供客观依据。同时,考试后对试卷进行量化分析,对于提高教师编制试卷的能力,指导课程试题库的建设,促进试卷标准化、考试科学化,都有积极的意义和应用价值。
但是,面对大量的考试数据,教师常感到束手无策,对如何分析和解读数据以及如何对考试和教学进行客观评价感到困难重重,致使考试结果中蕴藏的大量信息白白浪费,极大削弱了考试的教育评价机能。笔者的目的就是帮助广大数学教师借助SPSS对数学考试试卷进行科学、合理、有效的分析,为教学质量评价、教学水平评估和从题库遴选试题并有效施考提供科学依据。本文所述内容,对于其他学科教师而言同样具有参考价值。
(一)数学试卷结构试卷结构见表1。
表1 题型和题值分布表
(二)定义变量和数据录入
启动SPSS,在SPSS的数据编辑器界面,点击 Variable view标签,在Name标题下定义:学号(ID)、题号(T1,T2,T3,……,T18)、总成绩(sum)、平时成绩(ps)。单击Data view标签,将共计40份试卷按照各题的得分情况依次输入SPSS。平时成绩由两部分构成:作业+课堂表现,将其数据输入表格的最后一列。
(一)描述性测度分析
用来描述考试分数的数字称为描述性测度。运行菜单【Analyze→Descriptive Statistics→Frequencies】,出现Frequencies计算对话框,将要计算的变量名(sum)导入“Variable(s)”下的方框中,同时在“Frequencies:Statistics”对话框中确定要计算的描述性统计量,如“Mean”、“Range”等,最后输出结果,见表2。
表2 测度统计量表
这里是对试卷总分(sum)进行测度分析。通过计算总分的平均值(Mean)、众数(Mode)等指标,反映考生成绩集中所在的分数段,代表了考生的集体水平,通过计算总分的标准差(Std. Deviation)、 方 差(Variance)等指标,反映考生之间的差异,通过偏度(skewness)、峰度(kurtosis)等指标来检查样本是否符合正态分布,帮助判断其与正态分布的异同。在Frequencies对话框中,点击Charts按钮,勾选Histograms和With normal curve,输出频率直方图及正态分布表,如图1所示。
图1 频率分布图
(二)难度分析
试题难度是指全体被测试对象对该题的失分率。建立一个包含均值Mean和各题满分W的数据文件,单击【Transform→Compute】,在Numeric expression中,输入公式:Mean/W,在Target Variable中,输入难度系数P,即可得到各题的难度系数,见表3。
表3 各题的难度系数表
试题难度值与试题实际难易程度正好相反,P值越大表示能够正确解答该题的学生越多,说明试题越容易,而难度值越小则试题越难。难度适中更能客观地反映出学生的学习情况。一般来讲,对于试题难度的测量,可以参照表4来评价。
表4 试题难度评价表
(三)区分度分析
区分度是指试题对学业水平不同的学生的区分程度或鉴别能力,是反映试题效用高低的参数。在进行区分度分析时,常以考试总分作为被测试对象的实际能力水平,而把被测试对象在某题上的得分与总分之间的相关关系作为该题的区分度。区分度的计算方法很多,一般对客观题采用皮尔曼(Spearman)等级相关分析,对主观题采用皮尔逊(Pearson)相关分析。单击【Analyze→Correlate→Bivariate】,在弹出的Bivariate Correlations对话框中选择各个客观题字段(T1~T12)和总分(sum)字段进入,点击Spearman,完成后便可得客观题区分度。主观题的区分度分析方法同上。选择主观题(T13~T18)和总分字段进入,选择Pearson。输出结果的最后一行或最后一列,每小题与总分之间的相关系数即为区分度。输出整理结果如表5。
表5 各题的区分度表
对试题区分度的评价如表6所示。
表6 区分度评价标准表
(四)信度分析
信度是衡量一次考试的可靠性、稳定性的统计指标。信度高低反映了考试受随机因素影响的大小,且与随机因素影响呈反比关系。试卷信度的检验一般采用的是同质性信度,其衡量一般采用克伦巴赫 (Cronbach)α系数,取值范围为0~1。单击【Analyze→Scale→Reliability Analysis】,在“Reliability Analysis”中选择要进入分析的项目T1~T18共18个变量,使之进入Items框中,在Model中选择Alpha模型,点击Statistics按钮,在弹出的对话框Descriptive for栏中勾选Item、Scale和Scale'if item deleted项,输出分析结果见表7和表8。
表7 信度统计值表
表8 删除变量后项目统计值表
表8反映的是删去某一题后考生的平均成绩,此题与总分的相关系数及信度系数α的改变情况。
对信度的解释如表9所示。
表9 信度系数解释表
(五)效度分析
效度是指测试的有效程度,即试卷准确地测量了欲测内容的多少,换言之,在多大程度上实现了测试目的。效度的取值范围在0~1之间,一般来说,效度系数在0.4~0.7之间,值越大效度越高。常用的效度检验方法有效标关联效度法和构想效度法。在此利用效标关联效度法进行分析,因为平时成绩对于评价学生来说具有一定的正确性和有效性,所以把学生的平时成绩作为效度分析的效标。由于平时成绩已在数据表格中,故单击 【Analyze→Correlate→Bivariate】,选择字段sum和ps进入Variable(s)中,点击Pearson,最后输出结果见表10。
表10 相关性分析
第一,由表1可见,本次测试的平均成绩为73.05分,最高分97分,最低分53分,偏度0.165和峰度-0.401都较小,趋近于0,成绩服从正态分布,说明试卷命题基本合理,考试总体情况良好。标准方差为10.568,数值较高,说明数据变化较大,学生个体之间存在较大差异,主要影响因素是上课听讲、完成作业、课后巩固、考前复习等。在教学中,教师应注意这个问题,通过因材施教、分类指导等措施努力缩小学生之间差距。从图1可知,处于80~100分数段的人数是12人,60分以下的3人,峰值出现在70~75分数段,说明大多数学生对知识掌握较好,但成绩多集中在平均分附近,建议适当加大一些试题的区分度,有利于激励学生的学习积极性。
第二,在难度分析中,了解到除了T12、T18题难度较大,T14、T17题难度适中外,其余各题均偏易,特别是T3、T8、T13题,可以认为过于简单,需适当增加难度,以便更好地反映学生掌握知识的情况。若需提高平均分,可以考虑将T12、T18题删除。由表3可见,本次考试大多数题难度系数在0.7以上,总体来看还是一次容易的考试,比较适合像期末考试这类属于目标参照性的考试。
第三,从表5可见,T18题的区分度非常高,为0.786,说明学生成绩在此题被显著拉开,而该题的标准方差值在所有题目中是最大的,达到3.202,而其分值又是全卷中最高的,所以,在日后教学工作中,教师应该针对该题和该题所含的知识点对学生多加训练和辅导。T2、T5、T6、T12题区分度较低,说明学生之间的差距没有拉开,学生所掌握的知识范畴及对知识的理解程度和运用能力难以得到充分体现,因此,有必要加以调整、改进。
第四,从表7可知,本次考试的信度为0.576。一般来说,学校教师自编考卷的信度应在0.6以上,所以,本试卷信度一般。为提高试卷信度,可从适当增加试题数量、保持所有试题的难度接近正态分布等方面改进。从表8可见,T2题的质量相对要差一些,与总分的相关程度较低,删去这一题后的信度系数上升为0.593,运用类似的方法可以观测其他题删去后信度的变化,这对改进试题有指导意义。
第五,从表10可见,效度值为0.952,显著相关,说明平时成绩好的学生此次考试成绩也较好,平时成绩差的学生此次考试成绩亦较差,可见此次考试反映了学生的实际真实水平,符合效度要求。
[1]张文彤,闫洁.SPSS统计分析基础教程[M].北京:高等教育出版社,2004.
[2]杨丽军.高校教学水平评估中试卷质量分析系统的研究与实现[J].微电子学与计算机,2006,23(8):198-201.
[3]于水华,郑任儿.浅谈SPSS在教育信息处理中的应用[J].电脑与电信,2006,(10):55-58.
(
:)
G712
A
1672-5727(2011)08-0169-02
纪宏伟(1977—),男,江苏南通人,理学硕士,江苏教育学院如皋分院讲师,研究方向为数学教育、泛函分析、信息技术等。本文责任编辑杨在良