何琳 张良军
摘要文章运用SPSS软件对高职学生学业成绩进行分析研究,探索了题型结构、效度、信度、难度、区分度方面的问题,分析了班级、文理科、民族、性别等成绩的差异性,提出了适当的评价反馈和改进教学的建议,以促进教学质量的提高。
关键词SPSS软件学业成绩高职学生
随着我国高等职业教育的发展,为了保证高等职业教育的质量,有必要对高等职业院校的教学工作进行全面评估。其中,学生学业成绩的评价是教学质量评价的一项主要内容。本文结合高职学生学业成绩的评估工作,应用SPSS软件进行分析,得出学生学业成绩总体情况,得到试题的难度、区分度、信度等,还有学业成绩的差异性与相关性,使教师、高职学生得到学生学业成绩的评价反馈,在某种程度上促进教学质量的提高。
1 研究对象与方法
随机选取某高职院校学生100名,其中,男生73名,女生27名。试卷来源GXGZY高职学生电工应用技术考试。数据管理与分析采用SPSS软件。通过软件测量得出学业成绩的一般信息,进一步对试题的效度、信度、难度、区分度等进行分析,对不同班级、性别、民族等的考生成绩进行差异性检验。
2 研究结果
2.1 考试题目的题型结构及分值分布
试题共四大题。第一大题为判断题,共10小题,共20分。第二大题为填空题,共6小题,共30分。第三大题是选择题,共四小题,共12分。第四大题是计算题,共3小题,共38分。
2.2 学业成绩描述统计
学业成绩的基本描述统计量包括极小值、极大值、均值、标准差、偏度和峰度等。均值代表数据的集中趋势。数据的离散程度可用标准差描述,标准差越大说明数据间的差异越大。偏度和峰度用来描述数据分布是否对称,偏斜程度如何,分布陡缓程度等。①
在SPSS中可以进行以下操作:分析→描述统计→描述→总体考试成绩→选择到变量框中→单击选项→选择描述统计量→确定。统计结果输出,统计量100,极小值19,极大值97,均值59.98,标准差18.419,偏度-0.005,峰度-0.880。同时可以输出频数分布图,看看成绩分布情况。操作步骤:分析→描述统计→频率→成绩→选择到变量框中→单击图表→选择直方图,带正态曲线→继续→确定。从偏度、峰度以及频数分布图可得,总体成绩基本符合正态分布,说明这份试卷达到了检测学生学习水平的目的。
2.3 考题的难度
难度是指全体被测对象对该题目的失分率。计算公式:难度系数P=1-(考生在该题目所得分数的平均值/该题目满分值)。样本总体平均值59.98,各大题难度系数分别为:0.24、0.42、0.37、0.48;标准差分别为:2.953、7.319、2.677、10.854。一般认为难度范围应在0.3-0.8之间比较恰当,仅有第一题难度小于0.3,为判断题,题目都比较简单,只要学生掌握基本知识,仔细判断就可以得高分。计算题最难,排在最后合适。选择题难度排第二,应该排第二,让试卷题目的难度成递增趋势较好。从试卷总体来看,总分难度系数为0.4,难度略偏容易。
2.4 考题的区分度
区分度是指考题对考生实际水平的鉴别能力,是把考生区别开来的统计量。在SPSS中可以进行以下操作:分析→相关→双变量→把学生某题成绩与总分选择入变量框中→选择相关系数→Pearson→确定。得到各大题的区分度分别为:0.468、0.811、0.543、0.889。一般来说,难度大的题目,区分度较高;难度低的题目,很多学生做对,区分度必然低。从以上可以看出。
每大题与总分的相关系数较高,在0.01的显著性水平上相关。从上述数据分析可见,试题的区分度比较理想,且主观题的区分度优于客观题,这与主观题灵活的评分方式有关。
3 研究讨论与发现
3.1 考试的效度
效度是指考试的有效程度。把学生的平时成绩作为效度分析的效标,利用积差相关法求效标效度(Pearson法)。在SPSS中可以进行以下操作:分析→相关→双变量→把学生平时成绩与考试总分选择入变量框中→选择相关系数→Pearson→确定。得到本次考试总分与平时成绩的相关系数为0.966。说明平时成绩好的学生这次考试也好,平时成绩差的学生这次考试成绩也差,因此本次考试反映了学生的真实能力,符合要求。这与考题的区分度较高的测量结果一致,表明试题的质量较好。
3.2 考试的信度
信度是衡量一次考试的可靠性、稳定性的统计指标。在SPSS中可以进行以下操作:分析→度量→可靠性分析→把分析量选入框中→统计量→选择→同类相关系数→确定。结果本次考试的信度为:0.765。一般来说,学校教师自编试卷的信度要求0.6以上,则本次考试卷子符合要求。这与考题的区分度较高的测量结果一致,表明试题的质量较高。但是信度没有达到0.8,影响信度的因素可能和评分、题量等有关。
从试卷的题型和分值比例可见,客观题分值不到主观题的一半,可能影响试卷的信度。从以上统计结果表明,主观题的区分度比客观题的高,证明高职电工应用技术考试中主观题的命题效果较好。另外,这次题目量较少,不少考生提前交卷,这也是影响信度的原因。再有,题目的知识覆盖面不够宽,这也是影响信度的原因。
3.3 班级差异性
在不很了解两个样本总体分布的情况下,一般用两个独立样本非参数检验,样本数大于30为大样本,用Kolmogorov-Smirnov 检验。用SPSS进行1班、2班学业成绩间均值的差异性检验。基本步骤:分析→非参数检验→两独立样本→总分→选择到检验变量列表中→班级→选择到分组变量框中→定义组→输入1与2→继续→选择检验类型→确定。分析结果,1班46人,2班54人;K-S Z值为2.022,相伴概率为0.001<%Z=0.05,可以认为应该拒绝零假设H0,认为1班与2班学生的学业成绩均值存在显著差异。另外,在描述统计表明,1班的均值明显比2班高,差异显著,有高度的统计价值。
3.4 文理科学生成绩差异性
用以上方法可得到,高考文科考生与理科考生的差异性。分析结果:理科63人,文科37人;K-S Z值为1.914,相伴概率为0.001<%Z=0.05,认为高考理科与文科学生的学业成绩均值存在显著差异。另外,在描述统计表明,理科的均值明显比文科的高,差异显著,有较高的统计价值。
3.5 汉族与少数民族学生成绩差异性
用Kolmogorov-Smirnov 检验,基本步骤同上。分析结果:汉族60人,少数民族40人;最大绝对值差为0.100,最大正差为0.100,最大负差为-0.092,得到的K-S Z值为0.490,相伴概率为0.970>%Z=0.05,则不能拒绝零假设H0,认为汉族与少数民族学生的学业成绩均值无显著差异。
3.6 男女差异性检验
样本数小于30为小样本,用Mann-Whitney 检验。②分析结果:男生73人,女生27人;Z值为-0.074,相伴概率为0.941>%Z=0.05,则不能拒绝零假设H0,认为男女学生的学业成绩总体分布无显著差异。
4 结束语
4.1 试题方面
试卷的区分度、效度、信度较高,成绩频数基本趋于正态分布。题型多样,客观题与主观题比例基本合理;题量还可以加大一些,特别是加大主观题的量;知识覆盖面还可以加宽一些;今后按照题目的难度逐渐递增排列,以增加试卷的科学性;大多数学生两个小时完成为合适,重点考核学生基础知识、分析问题和解决问题的能力。
4.2 差异性检验
由班级差异性检验,推论1班、2班成绩存在显著性差异。产生原因可能与学习风气、试题难易等有关,还有待进一步研究。由高考文理科学生成绩差异性检验,推论文科生与理科生成绩存在显著性差异,产生原因可能与学生的数理基础有关。由不同民族学生成绩差异性检验无差异性,说明考试成绩与民族无关。由男女学生差异性检验无差异性,说明学生考试成绩与性别无关。
4.3 相关性分析
通过效度分析发现,学生学业成绩与平时成绩正相关。说明平时成绩的好坏直接影响学生的学业成绩。可能学生的学业成绩还与其它因素有关,如学习策略、生源地、家庭情况等,还有待进一步研究。
学生的学业成绩评价与平时成绩、实验操作成绩,以及期末考试成绩相关联。而平时成绩与考勤、作业、实验报告相关。教师向学生提供学业成绩的评价反馈,能促进高职学生主动去学习。
今后的教学重点改进教学方法,注重提高学生能力。根据高职生的特点,教学团队制订课程标准和课程改革设计方案;任课教师要制定每次课的教学目标,含能力目标、知识目标和素质目标;逐步采用教学做一体化教学,让学生在做中学,学中做。采用项目式教学,利用了视屏、PPT、投影等多媒体,同时使用讲授、启发和小组讨论合作实验等教学方法;在教学活动中,确立学生的主体地位,教师作为引导,注重“教”与“学”的互动,使学生在项目活动中掌握相关的知识和技能,提高教学质量,培养高端技能型专门人才。