曲霄红
(山西大同大学教育科学与技术学院,山西大同 037009)
科学计算自由软件SCILAB在考试分析中的应用
曲霄红
(山西大同大学教育科学与技术学院,山西大同 037009)
大规模教育考试之后需要对大量的考试成绩进行分析和解释,对考生做出决策。科学计算自由软件SCILAB是著名的开源软件,以其数值计算和结果可视化受到人们喜爱,主要介绍了SCILAB软件中的结果可视化功能在考试成绩分析中的应用,利用常用的统计指标来绘制成绩的分布图表,使考试成绩分布特征直观明了,有助于教育管理者把握考试整体情况。
SCILAB;考试分析;结果可视化
考试是教育过程中重要的环节,考试实际上提供的不单是反映每个学生知识、能力水平的分数,其中还隐含着大量的可以用来研究关于学生学习、教师教学情况的宝贵资料。如果考试后只提供一个分数,而不进行考试分析和总结,这样必定会浪费大量宝贵的信息[1]。而目前国内大规模教育考试分析软件一般都采用价格不菲SPSS或MATLAB[2]。本文主要介绍了科学计算自由软件SCILAB的结果可视化功能在考试成绩分析中的应用,利用常用的教育统计指标来绘制成绩的分布图表,包括频数直方图、正态分布图等,使成绩分布直观明了。
SCILAB是法国国立信息与自动化研究院(INRIA)的科学家为主共同开发的“开放源码”式科学计算软件。它主要有两个功能:数值计算和计算结果可视化。SCILAB为用户提供如下计算和开放式编程环境:(1)多种容易操作的数据类型;(2)一个作为广泛计算基础的合理有效的基本函数集;(3)一个开放式编程环境,新的函数能很容易地被添加[3]。
作为著名的开源科学计算软件之一,SCILAB具有广泛的应用领域,并具有运行稳定,占用计算机资源少,运行速度快等诸多特点。SCILAB最大优势在于它是一款开放源码的软件,使用正版软件完全免费。目前SCILAB已经得到各国研究工作者,以及教育界和工业界人士的普遍关注,并被免费地引进到他们的研究、教学以及产品研发中,正以每10 000份的速度向全世界发布。
2.1 平均分
平均分通常被定义为所有观察数据的总和除以数据个数所得到的商,也称为算术平均数或均值.它的计算公式为:
平均分是应用最广泛的集中量数指标,因为它定义简明易懂,计算公式也很简单。但是使用平均数也会受到一些限制,对数据的准确性要求较高,容易受到极端数据的影响。所以使用平均分的前提条件是:一组数据中每个数据都比较准确可靠;无极端数值的影响。如果这两个条件不能满足,可以换用别的量数,或者对数据进行一些处理。
2.2 全距
全距指的是一组数据中的最大值与最小值之差,又称为极差,用R来表示它实际上揭示的是一组数据中任意两个数据之间的差异的最大值。全距的计算公式:
全距=最大值-最小值
全距简明易懂,计算简单,但它容易受到两极端数据值的影响,并且只能反映数据组的两极端值的差异程度,不能很好地反映中间数据的差异情况,反映不够灵敏。因此,它只能粗略地反应数据的差异程度,只有与其他统计量结合起来使用,才能比较全面地反映出数据分布的差异情况。
2.3 方差和标准偏差
方差和标准偏差是表示一组数据变异程度或分散程度大小的数字指标。标准偏差指的是所有观察值与平均值的平均距离。如果一组数据变化比较大,那么观察值与平均值的平均距离就比较大,标准偏差就比较大;反之,标准偏差就比较小。简而言之,数据变化与标准偏差的关系是:数据变化越大,标准偏差也越大。一般分别用符号σ和σ2来表示数据的标准偏差和方差。方差和标准偏差的定义公式分别为[4-5]:
式中,x为样本的观察值,μ为所有观察值的平均值,n为样本的容量.
方差和标准偏差具有反应灵敏、严密确定、计算简单等优点,是最常用的差异量数。但是,它们的意义不太容易理解、容易受到两端数值的影响以及有个别数据不清楚时,无法计算。但是与其他差异量数相比,方差和标准偏差应用最广泛。其中标准偏差的应用尤为广泛。标准偏差和平均数经常配对使用,来反映一组数据的差异和集中程度。标准偏差不仅可以直接用来反映一组数据的差异程度,还可以用来计算差异系数、标准分数、相关关系等。
数据分布是指反映观察值及其呈现规律的表、图或计算公式[6]。
图表是考试成绩分析和结果呈现的一个重要工具,也是考试研究报告的一个基本组成部分。考试数据图、表可以帮助我们组织、概括数据,有助于解释对数据的研究。好的数据图表可以帮助读者理解考试数据,迅速地发现数据中蕴含的某些用文字很难描述的规律。常用的反映成绩分布的有直方图、条形图、折线图等。
折线图的最大优势在于可以同时表示若干不同的考试数据。直方图与条形图的最主要区别:(1)直方图的测量量标表示的是顺序量标或等距量标;(2)直方图的横轴代表的是连续变量,每条之间没有间隙。
以贵州省贵阳市2009年中考考试成绩为数据来源,利用SCILAB软件的结果可视化功能根据需要对考试成绩进行分析,把数据分布以图表形式表示出来,起到一图胜千言的作用。
4.1 频数分布直方图
频数是指在某个取值范围内的统计数据的个数。为了了解考试成绩的分布,常常需要将原始数据按照一定顺序进行排序,并求出考试数据的全距,然后根据该取值范围以及范围内的数据个数绘制频数分布图。
图1是贵州省贵阳市某校中考语文考试考生成绩的频数分布直方图。通过图示可以帮助掌握该校语文科目考试成绩整体分布情况和特征。
图1 频数分布直方图
4.2 同一科目的不同学校的成绩差异比较
图2是根据贵州省贵阳市2009年中考各区语文成绩的考生人数和平均分,绘制的成绩分布折线图。
图2 成绩分布折线图
由图可见,通过折线图将同一学科、不同区的考试分连接起来,可以非常清楚地看到同一科目不同地区考试分数的差异程度。教育管理者可以根据考试成绩分布情况掌握各区语文成绩的差异,并采取相应的教育决策。
4.3 不同学校同一科目的成绩指标的比较
教育研究者经常需要对同一科目不同考试群体成绩进行深入比较,这就需要对考试成绩的计算考试成绩的各项指标。表1是贵州省贵阳市两所学校2009年中考语文成绩的两项统计指标量:
表1 统计指标量表
图3是根据上表中指标绘制的正态分布曲线,从表和图中数据和图示可以得出,学校1在各项指标上都高于学校2,说明学校1的考试成绩比较好。
图3 正态分布曲线图
4.4 某一试题得分选项分布图
图4是根据贵州省贵阳市中考2009年数学某选择题得分绘制的选项分布图。从图中可以看出,该试题比较简单,在得分能力较差的考生群体中有超70%可以做对该题。
图4 选项分布图
由于科学计算自由软件SCILAB可以免费下载,无论在研究还是学习中进行推广均无任何经费上的困难,而其有形和无形的收益却不可估量.科学计算自由软件是个巨大的宝库,以上只是简单介绍SCILAB软件结果可视化功能。SCILAB软件在考试中的更多功能将在未来的研究中继续扩充,发挥SCILAB的良好的数据可视化功能。
[1]张礼伟.考试成绩的科学分析以及意义[J].科教前沿,2009(6):8-9.
[2]刘翔,赵昆渝,李智东.用SPSS对理工科试卷进行分析与评价[J].长江大学学报,2008(3):182-184.
[3]胡包钢,赵星,康孟珍.科学计算自由软件:SCILAB教程[M].北京:清华大学出版社,2003.
[4]葛军.教育统计在教育决策中的应用[J].统计与决策,2009(19):167-168.
[5]鲁志芳.开源软件之教育应用初探[J].考试周刊,2009(32):158-159.
[6]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007:59-73.
〔编辑 高海〕
The Application of Scientific Computing Software SCILAB in Exam Analysis
QU Xiao-hong
(School of Education Science and Technology,Shanxi Datong University,Datong Shanxi,037009)
It needs to analyze and explain the extensive exam results after the large-scale examinations,thus people can judge the students scientifically.The free scientific computing software SCILAB is the distinguished open-source software,with its numerical calculation and results visualization,it is favorite by researchers and educators.This thesis mainly introduces the functions of results visualization in the software SCILAB how be applied in the exam analysis and uses the statistical index to draw the distribution of achievement,it makes the examination records distribution diagram clearly,and further helps the educators to grasp the whole situation of the exam.
SCILAB;exam analysis;results visualization
O175.14
A
1674-0874(2011)02-0014-03
2010-12-10
贵州省教育厅自然科学研究资助项目[黔教科2009(0034)]
曲霄红(1980-),女,山西应县人,硕士,讲师,研究方向:网络通信与信息安全。