邓佩佩
摘 要 通过试卷成绩分析和试卷质量分析,对试卷进行难度、区分度、信度、效度检验,能够让考试这一重要的总结性评价有效地测验出学生掌握知识的真实水平。以计算机应用基础考试试卷为例,结合SPSS对其进行试卷质量分析,能为教师或教学管理者在教学研究方面提供帮助,提高试题质量和教学水平,因此,试卷分析十分具有指导意义。
关键词 考试;试卷分析;SPSS;计算机应用基础;教学管理; 克朗巴哈系数
中图分类号:G652 文献标识码:B
文章编号:1671-489X(2018)14-0020-04
Paper Analysis and Application based on SPSS Software//DENG Peipei
Abstract Through the analysis of the test paper and the quality ana-
lysis of the test paper, this study tests the difficulty, distinction, relia-
bility and validity of the test paper so that the important summative evaluation of the test can effectively test the true level of the students
knowledge of the test. Take the basic computer application examina-
tion papers as an example, combined with SPSS to analyze the paper
quality. For teachers or teaching managers in teaching and research can be assisted to improve the quality of test items and teaching effec-
tiveness, so the paper analysis is very instructive.
Key words examination; papers analysis; SPSS; basics of computer applications; teaching management; Cronbachs Alpha
1 前言
考试是一个检验教学效果和评价学生学习效果的重要手段,在学校管理和教学质量评价中占有重要地位,因而考试用的试卷质量的好坏便是基础和前提[1]。然而大多数教师很少用正规的方法去对考试后的试卷做出合理分析,止步于考完得出成绩、评讲试卷即可。要想深入了解试卷题目安排的合理性和有效性,需要用科学可靠的方法去检验分析试卷,多方面、多角度进行剖析,才能更好地提升和改进教学,真正发挥技术帮助教育的作用。试卷分析包括试卷成绩分析和试卷质量分析,这两者也存在必然联系,试卷成绩分析的前提应该是试卷质量的保证。因此,试卷分析对教学来说是尤为重要的环节。
2 SPSS
SPSS是“统计产品与服务解决方案”軟件,是用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品[2]。在教育领域,教育研究定量数据的分析起着非常重要的作用。在逻辑推理方面,在数据分析的基础上初步得出一个结论,再对结论做一个比较合乎逻辑的推理和演绎。
3 研究内容
期末考试是属于总结性评价的一种类型,也是检验教学效果的方法之一[3]。本文主要以某学校计算机应用基础考试试卷为例,结合SPSS软件对其进行试卷质量的分析,主要包括信度、效度、难度和区分度。在操作步骤和分析结果的过程中可以给一些教师或教学管理人员在教育研究工作中提供方法上的参考价值,成为教育做出相关有效决策和判断的标准和依据。因此,教育方面的相关工作人员掌握SPSS软件或其他教育统计研究工具软件是有必要的。
试卷分析作为教学评估的手段,可以为教师或教学管理者在教学研究方面提供辅助,提高试题质量和教学效率,因此,试卷分析十分具有指导意义。
4 试卷成绩分析
试卷结构 本试卷选取某学校2016级学前教育专业的计算机应用基础课程期末考试试卷,试卷总共有五道大题,分别是填空题(20分)、单项选择题(20分)、问答题(30分)、计算题(15分)、操作题(15分),如表1所示。
样本个数30人,分别在每项题的得分明细情况如表2所示。
试卷基本信息统计 选择SPSS软件,单击“分析”菜单→“描述统计”→“描述”,打开“描述”对话框设置窗口,将五个变量依次选入右边的变量框中,在“描述统计”选项按钮中设计描述性统计需要输出的基本选项,勾选其中的“最大值、最小值、平均数、标准偏差”,单击“确定”,输出表3所示详情表。从表3中可以整体性地观察到第一列有填空题、单项选择题、简答题、计算题和操作题这五种类型的题型,清晰明了地得出本次考试成绩中的最小值、最大值、平均数、标准偏差的信息。
4 试卷质量分析
难度分析 难度分析是针对测量量表或测试试卷中单个项目进行的分析[4]。对试卷评判它的难易程度,该如何来判断呢?以便于规范试卷的合理性,增强试卷的信度。难度系数是定量,被视作答一个题目所遇到的困难程度的量数,用符号P表示。表4所示是试题难度的评价指标。
计算难度系数的方法有很多种,这里采用得分率作为难度系数的指标,其计算公式为:
式中P代表题目难度,X为被试者在某题目上的平均得分,XMAX为该题目的满分。
【具体步骤】打开SPSS数据文件,先将各题项的平均值统计出来,如表5所示;新建SPSS数据文件,命名为“课程期末考试题难度系数”,分别将统计出的平均值和满分值录入,均值变量命名为Mean,满分值变量命名为W;选择“转换”→“计算变量”,进入计算变量对话框;在“目标变量”中输入要计算的难度系数P,在“数学表达式”框中输入公式“Mean(平均值)/W(满分)”,单击“确认”,便得到难度系数P的值,如图1所示。
结合表4,可以看出:单项选择题P—0.75,操作题P—0.74,对应的P值大于0.7,表明这两项题属于较易题;而填空题P—0.64,简答题P—0.68,计算题P—0.64,难度系数在0.4~0.7这一区间,表明这三类题属于中等难度题。由此可知,试卷各题型总体的难度系数情况良好,合理性还不错。
区分度分析 区分度又称鉴别力,主要是针对测量量表或测试试卷中的单个题目的鉴别度进行的分析[4]。通过对试卷测试题的区分度分析,可以区别试卷题目成绩优劣,更好地清楚学生实际能力水平的区分情况。题目区分度评价标准如表6所示。
【具体步骤】打开数据文件,选择菜单“数据”→“排序个案”,将“总分”拖入“排序依据”框;再选择“降序”排列,单击“确定”,在数据视图窗口中,总分是按照从大到小的顺序排列的;将总人数30人乘以27%处的分数记下。在这里,30*27%,记下第八个的分数是75。
同上操作步骤,再将“总分”按照“升序”排列,记下第八个的分数是65。
选择菜单“转换”→“重新编码为不同变量”,将变量“总分”选入“输入变量—输出变量”框中,在右边的“输出变量”框中输入新的变量名“总成绩”,单击“更改”按钮。单击“旧值和新值”按钮,在最旁边的“旧值”框中的“范围,从值到最高”下面输入高分组限定分数75,在右边“新值”框中输入1,表示成绩总分在75分以上的为第一组,单击“添加”。同理,在左边的“旧值”框中的“范围,从最低到值”下面输入低分组限定分数65,在右边“新值”框中输入2,表示成绩总分在65分以下的为第二组,单击“添加”。在数据视图窗口中便能查看到总成绩按照高低分组的情况。
接着选择菜单“分析”→“比较均值”→“独立样本T检验”,将变量“填空题、单项选择题、简答题、计算题、操作题”选入“T检验变量”框中;将定义的新变量命名为“总成绩”,选入“分组变量”框中,对变量进行两独立样本T检验。单击“定义组”按钮,在“用特殊的值”框的Group1、Group2中分别输入1、2,单击“确定”按钮,输出T检验结果,如表7所示。
从表7的第二列和第三列中分别得出方差齐性检验和T检验的结果:首先,Levene的变异数相等测试为方差齐性检验,若方差齐性检验对应的概率P值大于显著性水平0.05,则表明方差无显著性差异,就应该看第一行的假设相等变量数的T检验结果;反之,若方差齐性检验对应的概率P值小于显著性水平0.05,这表明方差有显著差异,则看第二行假设不相等变量的T检验结果。
从表7观察得到方差齐性检验对应的概率P值都大于显著性概率水平0.05,表明方差无显著性差异,应该都看第一行的T检验结果;填空题、单项选择题、简答题、计算
题、操作题对应的概率P值分别为0.04、0.04、0.00、0.07、0.23,說明这些题都存在显著性差异,区分度较高,可以选择保留。
效度分析 效度,指测量结果的准确性和有效性的程度,即测量是否达到预期的目的[4]。在课堂教学过程中,通过评价量规对学生的平时表现进行过程性评价,并记为学生的“平时成绩”,现在想了解平时成绩是否对学生的期末考试成绩有影响,在此采用效标关联效度分析法进行分析。
打开数据文件,选择“分析”→“相关”→“双变量”,打开“双变量相关性”窗口,将左边的“平时成绩、期末成绩”拖入变量列表中,其中平时成绩作为效标,分析其与期末成绩的相关关系。接着,选择“相关系数”下的“Pearson”检验方法,计算效标平时成绩和期末成绩的相关系数,利用积差相关法求效度,具体结果如表8所示。
由表8可以得到,平时成绩和期末成绩的相关系数为0.686,说明本次考试与平时成绩的相关性强,反映了学生的真实水平,有效性和准确性较好,符合效度要求。
信度分析 信度,广义上是指教育测量与评价结果的可信程度;狭义上是指重复测量结果间的一致性程度,即依靠测量提供稳定的、非模棱两可的信息的程度[4]。本文主要是对试卷检验同质性信度,也就是内部一致性信度,是指测验内部所有题目间的一致性程度。采用克朗巴哈系数(Cronbachs Alpha),表9所示为克朗巴哈系数的取值范围。其计算公式为:
式中,k为评估项目数,r为k个项目相关系数的均值。
打开数据文件,打开“分析”→“度量”→“可靠性”,将“填空题、单项选择题、简单题、计算题、操作题”拖入“变量”框中,在“模型”下拉列表选择“Alpha”,点击“统计”按钮,勾选复选框“描述性”栏的“如果项目已删除则进行度量”,“项之间”栏的“相关性”,“摘要”栏的“平均值”“方差”“相关性”。单击对话框中的“继续”,返回信度分析主对话框中的“确定”,输出结果如表10、表11和表12所示。
由表10可知,本试卷中进行信度分析的指标有五个,信度系数为0.516,参照表9克朗巴哈系数的取值范围,信度系数小于0.7,说明该试卷的信度较低,可靠性和稳定性不佳。
表11中,项目平均数行表示五个评估指标平均分的基本描述,包括均值(13.813)、最小值(9.667)、最大值(20.467)、范围(10.800)、最大值最小值的比(2.117)、方差(17.828)。同理,项目方差行和各项目之间的相关性行分别表示对五个指标方差和相关系数的均值、最小值、最大值、范围、最大值最小值的比、方差的基本描述。
表12显示了剔除某评估指标后的情况。其中,从“如果项目已删除”最后一栏可知,当剔除“单项选择题”这一变量,本次测验的信度系数达到最大,为0.509。通过这种方法可以对测验已有的题目选项进行修改、删除等,进而提高整个测验的信度。
5 总结与展望
SPSS软件功能强大,操作简便,好学易懂,在教育研究中对定量数据的统计与分析上是一款很好的工具。就研究的分析评价来说,还有因子分析、主成分分析、回归分析、聚类分析等,都有较高的使用价值,对教育研究有很大的帮助,掌握此类工具的运用更能做到教学最优化。
本研究通过试卷成绩分析和试卷质量分析,既能反映试卷质量的好坏水平,也能了解学生的知识点掌握情况。对试卷进行难度、区分度、信度、效度的检验,对实验的步骤和结果进行详细的解释说明,用科学统计的方法证明试卷的单个题目安排是否合理。同时,体现出试卷分析的可操作性和重要性,能够让考试这一重要的总结性评价有效地测验出学生掌握知识的真实水平,对成绩做进一步分析。其中不足的是实验的样本量相对较少,若有更多的实验对象,得出的结论或许更加令人信服。
在进一步的研究中,可以采用问卷调查或访谈的形式向学生收集一些建议,再从学校教学管理者的角度来进行整体交流,更好地做到结合科学的方法来做试卷分析,让教师对症下药、及时调整,更好地提高教学质量。
参考文献
[1]任艳玲,朱明放.基于统计软件SPSS的学生试卷分析方法[J].重庆工学院学报:自然科学版,2007(4):95-98.
[2]吴骏.SPSS统计分析从零开始学[M].北京:清华大学出版社,2014.
[3]李文玲,张厚粲,舒华.教育与心理定量研究方法与统计分析: SPSS实用指导[M].北京:北京师范大学出版社,
2008.
[4]张屹,周平红.教育研究中定量数据的统计与分析[M].北京:北京大学出版社,2015.