考试数据分布特征量在学风建设中的应用

2015-09-10 07:22刘长虹郝杰杨晨陈凯伦
考试周刊 2015年52期
关键词:统计分析学风建设

刘长虹 郝杰 杨晨 陈凯伦

摘 要: 根据教育统计学理论,考试数据的前四阶矩,即均值、标准差、偏度、峰度,用于分析学生的学习状态。通过对不同年级、专业的考试数据所做的前四阶矩计算分析,提出考试数据的前四阶矩可以分别反映出班级学生的学习情况。因此,可以根据各个班级考试成绩数据分布特征量,有针对性地提出改善班风、学风的建议。

关键词: 学风建设 考试数据分布 统计分析 前四阶矩

在高校教学过程中,各门课程的考试成绩是衡量教学质量、学生知识掌握程度、学习能力、保研出国深造及就业的重要评价指标之一。实际上,教育统计学对于学生考试成绩的分析研究早已成为一门专门的学科,在教育学领域中得到了广泛应用[1,2]。随着数据挖掘技术的发展和应用,将考试数据挖掘研究应用于对教学质量分析上,取得了很大的进展[3]。但是如何將考试成绩的统计分析,应用于指导学生学习和学风建设中,目前还少有论述。下面试着对上述问题进行讨论。

1.考试成绩数据分布的特征量

考试成绩数据分布的特征量,指数据统计中的前四阶矩[2,4,5]。由于考试成绩数据服从概率分布已是公认的事实,通常各个教学部门都会统计考试数据的前两阶概率矩,即考试成绩的均值、标准差。但是从事教学工作的教师都清楚,各门学科的考试成绩并不一定服从正态分布。因此,考试成绩的前两阶矩无法全面评价学生成绩的情况。根据概率统计理论,一般采用前四阶概率矩就可以近似逼近任意概率分布函数[6]。

描述考试数据前四阶矩,也就是均值、标准差、偏度和峰度的计算公式如下[6],

是偏倚度,如果概率密度函数对称时,其值为零。而α4g是峰度,在正态分布情况下,其值为3。

2.考试成绩的前四阶矩

考试成绩的前四阶矩分别是均值、标准差、偏度和峰度。其中,均值表示考试成绩的平均分数,标准差表示考试成绩的分散程度。偏度衡量实数随机变量概率分布的不对称性,当偏度为负(称为负偏态),意味着在概率密度函数左侧的尾部比右侧的长,绝大多数的考试分数值(包括中位数在内)位于平均分数的右侧;偏度为正(正偏态)就意味着在概率密度函数右侧的尾部比左侧的长,绝大多数的值(包括中位数在内)位于平均值的左侧;偏度为零,表示考分相对均匀地分布在平均分数的两侧,但不一定意味着是对称分布。峰度是描述考试分数概率密度函数分布形态陡缓程度的统计量,是和正态分布相比较的量,当峰度值是3,其考试数据服从正态分布。

下面分别对不同年级、专业班级的考试数据进行计算,根据上述公式,得到相应考试数据的前四阶距。为了举例说明,表1列出其中三个班级的三门基础理论课程考试成绩的前四阶矩。为方便起见,分别称三个班为A、B、C。

由表1可以看出,各个班级的考试成绩分布并不全是服从于正态分布和对称分布的,在9个项目的考试成绩峰度值中,只有A班大学物理、C班线性代数和电工技术三项成绩的峰度值接近3,近似于正态分布的峰态属于常峰态。B班偏度接近于0为0.0113,即考分分布近似对称分布于平均分数两侧。

其次,如果均值和标准差很接近,就不能保证考试成绩分布一致。以大学物理考试成绩为例,三个班级的均值在75分上下,方差在11到15分之间,尽管三个班考试成绩的均值和方差均相差不大。但是三个班的偏度和峰度却相差较大。三个班级中只有班级A的大学物理考试分布近似为正态分布,其余两个班的考试成绩则不服从正态分布。

在表1中,只有B班线性代数的偏度大于零,偏度大于零表示该班大于平均分数的人数多于小于平均数人数。如果假设线性代数考试难度一致无差异的前提下,与其他两个班级的成绩相比,说明B班大部分同学对这门课程掌握程度最好,A班次之,C班最差。

在电工技术考试成绩中,B班偏度最小为-2.09,标准差也是最小为7.74,而峰度为最大值8.39,结合上述三个指标,说明有较多同学低于平均分数,但是多数学生分数的差距不大。如同一个陡峭山峰一样,分数紧密靠在一起,说明尽管B班总体上不如其他两个班对这门课程掌握得好,但是在班级内对该门课知识掌握的差距不大。通过进一步的调查发现,B班通常采取集体复习方式,所以大部分同学复习充分得分较高,导致最大峰度值。

在表1中,A班是标准差最大的班级,该班分数分散性最大,结合峰度情况,表示该班级同学们学习成绩分散性较强。事实证明,该班级在学习方面,同学之间协作少、独立性最强。因此,在班风建设时,应鼓励同学们在学习中相互帮助,有意识地培养全班同学集体自习的习惯。

除了大学物理成绩外,B班考试的平均分数最高,标准差是三个班中最小的。标准差小即分数离散程度低,说明该班级同学对知识掌握差异性较小,或者在学习方面团结性最强。调查表明,B班是在各科学习时相互帮助、协作性最强的班级。

尽管C班各科平均成绩均处于中间水平,而且峰度值较大。但是标准差也较大,偏度为较大的负值,说明尽管大部分同学在平时学习上相互协助较好,特别是物理成绩峰度为6.2,体现该班大部分同学能够参加集体自习,但是由于有少数同学学习状态差距较大,为此拉低了全班成绩,使得考分标准差较大。因此,应该提倡班里采取成绩优秀的和成绩差的同学“结对子”,以提高全班平均成绩,降低成绩的标准差。

3.结语

通过上述对于各个年级、班级考试成绩的前四阶矩计算分析,得出以下结论:考试平均分代表整体学生学习的平均水平;成绩的标准差代表考试分数的离散程度,与学生对知识掌握程度的差异有关,班级中好和差成绩相距较大;偏度则表示考试分布是否高于或低于平均水平的程度。当峰度为负值时,表示有较多同学考试成绩高于班平均分,该班学风较好;峰度则表示考试分数是否像陡峭山峰聚集在一起的程度,体现出班级在学习中团结程度。因此,通过综合分析考试成绩的前四阶矩,可以了解学生的学风和班风情况,从而对症处理,在班风、学风建设中取得更好的效果。

参考文献:

[1]刘新平,刘存侠.教育统计与测评导论[M].北京:科学出版社,2003.

[2]王孝玲,赵必华.教育统计学[M].北京:北京师范大学出版集团,2008.

[3]刘小桃,林延庆.数据挖掘技术在高校学生学习成绩分析中的应用[J].考试周刊,2014,41:108-109.

[4]常振江.学生成绩分布与一种简便的评估试卷命题质量的方法[J].辽宁师范大学学报(自然科学版),2003,26(1):109-112.

[5]许年春,刘东燕,夏文静,黄林青.高校学生课程考试成绩的正态化换算方法研究[J].重庆科技学院学报(社会科学版),2014,7:143-146.

[6]李超,刘长虹.蠕变损伤概率的Edgeworth级数近似分布函数的研究[J].机械设计与制造,2013,9:124-129.

猜你喜欢
统计分析学风建设
如何发挥新时期统计工作的作用之我见
论大学生学风建设的途径
以统计分析为基础的房地产税收优化分析
浅议武夷学院“无手机课堂”学风建设活动
SPSS在高校图书馆服务体系中的应用研究