丁海霞(灌云中等专业学校 江苏连云港 222200)
基于经典测量理论的试卷评价系统的设计
丁海霞
(灌云中等专业学校江苏连云港222200)
摘要:针对传统的试卷评价方式欠缺真实性和准确性的问题,在充分分析经典测量理论的基础上,将定量分析和定性分析有机结合起来,开发了一款专业的试卷评价系统。以灌云中等专业学校1 407班学生计算机应用基础期末成绩为例,进行了试卷分析和试题分析,反映了本班学生的整体水平,并通过分析学生的客观能力,对本次试卷的改进进行建议。
关键词:经典测量理论;试卷评价系统;定量分析;定性分析
随着我国经济迅猛发展,教育事业受到了前所未有的重视,教育测评作为教育过程的一个重要环节,能够调控教育过程,促进教育发展,日渐引起了国家和政府的高度重视,已经被教育部上升到了一个重要的政策层面。2010年7月发布的《国家中长期教育改革和发展规划纲要(2010—2020年)》和2012年6月颁布的《国家教育事业发展第十二个五年规划》都强调要重视教育评价,以提高教育质量。
试卷评价是反映和评估教学质量的重要手段,传统的人工评价方式操作繁琐,效率低下,很难准确地衡量学生的实际水平[1]。以经典测量理论为基础进行试卷评价,不仅理论依据充分,而且评价指标明确,数学模型简单易懂,只要误差在允许的范围内,就能得到比较客观、准确的结果。
经典测量理论是以真分数理论为核心理论假设的测量理论及其方法体系,真分数模型通过一系列的基本定义和推导对此进行了简单而有效的描述。①观测分数是真分数与误差分数之和;②真分数与观测分数的各自平均数相等;③误差分数的期望值是0;④真分数与误差分数的相关性为0;⑤不同的测验误差的相关性为0;⑥测验观测分数的方差为真分数方差和误差分数方差之和[2]。本次开发的试卷评价系统是以经典测量理论为指导,在定量分析的基础上,进行了定性分析,以能够正确反映学生的实际水平。
本项目在开发过程中前端使用C#作为开发语言,VS2008作为开发平台,后端使用SQL Server 2005数据库存储数据。
系统中,管理员拥有最大权限,教师在申请账号后,可以登陆进入主窗口,通过选用相应的菜单及子菜单,添加试卷、试题信息和学生的相关信息,并可以当场分析,同时也可以对数据库中已有的试卷进行分析。具体流程图如图1所示:
图1 试卷分析系统流程图
2.1功能模块设计
试卷评价系统包括各子系统,分别是:
①系统管理:系统中各级用户管理和权限分配,包括管理员和教师。
②信息管理:试卷基本信息的录入,包括班级号、课程名、试题总分、每道试题的分值、考试人数、任课教师、出卷教师。
③成绩录入:把学生的个人成绩添加进数据库。
④试卷分析:对试卷从平均分、全距、方差、及格率、优秀率、难度、区分度、信度、效度等几个方面进行分析。
⑤知识点分布与分值:通过对考察的试题知识点情况分析试卷,同时也分析了考生在每个知识点上的平均得分及每位考生在每个知识点的得分情况。
其中试卷分析模块是本系统的核心模块,也是进行试卷评价的重要依据,整个系统是以经典测量理论为基础,具体结构图如图2所示:
图2 试卷分析模块
2.2数据库设计
试卷评价系统需要存储大量的信息,本系统采用性能较好,使用较广泛的SQL Server 2005设计数据库,数据库名称为PaperAnalysis。
2.2.1主要数据表的设计
在试卷评价系统中,数据库表清单如表1所示:
表1 数据库表清单
①用户表:存储系统用户的权限和密码等信息。
②试卷信息表:存放试卷的基本信息,主要包括人数、任课老师、出卷老师等。
③学生信息表:存放考生的学号、姓名以及其所属的班级等信息。
④成绩录入表:试卷总分值及每题分值。
⑤个人成绩表:每个学生的成绩及每题得分。
2.2.2数据库连接
本系统选用Microsoft SQL Server 2005作为关系数据库,选用ADO.NET作为数据库访问技术。具体数据库连接语句如下:
2.3系统主要功能实现
根据分配的权限,用户输入正确的用户名和密码进入系统[3]。在试卷分析下拉菜单中点击试卷整体分析,系统则会对当前选择的1407班的学生成绩数据进行分析,点击试题分析,则会对当前选择的题目进行数据分析,具体结果如图3和图4所示:
图3 试卷分析
图4 试题分析
教师点击知识点分布与分值菜单后,则会以直观、清晰的界面把一张试卷中各知识点的分值及本班学生在每个知识点上的平均得分及每个考生在各知识点上的得分展示出来,具体如图5所示:
图5 知识点分布与分值
2.4主要公式算法实现
4)区分度:指试卷对不同水平考生加以区分的能力。计算公式:
2)方差:指每位考生的成绩与平均成绩的差的平方和。计算公式为:,其中ZH、ZL分别代表高分组(卷面成绩前27%)和低分组(后27%)考生成绩总和,H、L分别代表考生的最高分和最低分,N代表高(低)分组人数[5]。代码如下:
5)信度:指试卷的稳定性和可靠性程度。即将同一组测试者反复测试同一份试卷,所得结果一致,那么这份测验题就具有很高的信度。计算公式为:,其中k代表试卷的题目数,代表第t道题分数的方差代表考生总分的方差。代码如下:
6)效度:指测量试卷的有效性程度,即测量工具能够准确测出所要测量事物的程度。计算公式为:,其中Xi、Yi分别表示i考生在X考卷与Y考卷中的成绩,和分别是这两次考试的平均成绩,Sx和Sy分别是这两次考试成绩的标准差,n是考试人数。主要代码如下:
选用灌云中等专业学校1407班学生的计算机应用基础期末成绩作为本次实验的数据。在对各模块运行结束后,点击主界面上的“数据输出”菜单,实现对本试卷的整体分析,具体如表2所示:
表2 评价结果
从试卷分析结果可以得出:
1)该试卷的具体题目难度值偏小,这在一定程度上势必会影响整体试卷应发挥的作用。
2)试卷整体难度适中,平均分大致反映了本班学生的实际学习水平,优秀率、及格率符合标准的情况,方差能够将学生的离散程度表现出来,这几个指标也反映了本班学生的学习成绩符合正态分布,符合标准试卷的大致指标标准。但是该试卷的全距有点大,说明学生的水平差距大,同时也反映了试卷的题目设置上可能不能满足所有学生的需求,或者有部分题目偏离大纲要求,需要改进。
3)试卷的区分度、信度、效度都比较好,与测验的目的、性质相一致,说明该试卷整体上是一份符合教学大纲,题型结构合理、覆盖面广的好试卷,能够很好地区分出班级优秀生和差生,也能够保证其测试的准确度和稳定性。
4)试卷的知识点分布符合大纲考查要求,覆盖面也较广,符合中等院校计算机基础课程的公共课考察要求。从学生在每个知识点的分布情况也可以看出,该试卷是一份不错的试卷,在改进的基础上值得保留,可以纳入题库。
本文对系统的开发模型作了详细介绍,严格按照瀑布开发模型的方法,初步开发了一个基于经典测量理论的试卷评价系统,该系统综合应用了教育测量理论相关知识,使试卷评价模型的建立更加科学,评价结果更加准确。同时利用本校1407班学生的计算机应用基础期末成绩作为本次实验的数据,经过测试,客观、高效地对本试卷进行了综合评价。
参考文献:
[1]郑金婷.高校试卷分析系统的研究与开发[D].上海:华东师范大学,2007:1.
[2]于向英.教育测量与统计[M].郑州:郑州大学出版社,2004:26-27.
[3]孙莹.云南文化学院试卷质量网上综合评价系统的设计与实现[D].成都:电子科技大学,2008:43-44.
[4]董万归.试卷分析系统的设计与实现[J].大理学院学报,2009(8):12.
[5]李勇,宋晓霞.通用试卷分析系统的设计与实现[J].中国教育信息化,2008(4):55-56.
Design of Examination Paper Assessment System Based on Classical Test Theory
DING Haixia
(Guanyun Polytechnic School,Lianyungang 222200,China)
Abstract:The traditional way of examination paper evaluation is lack of authenticity and accuracy.Based on the classical measurement theory,this paper combines quantitative analysis with qualitative analysis to develop a professional paper evaluation system.It analyzes the paper and test question by viewing final examination result of computer basic knowledge of class 1407 in Guanyun Polytechnic School,which could reflect students'overall level,analyze students'ability and give suggestions for improving the paper.
Key words:Classical Test Theory;examination paper assessment system;quantitative analysis;qualitative analysis
作者简介:丁海霞(1987-),女,助教,硕士,主要研究方向:计算机辅助教学
收稿日期:2015-11-09
中图分类号:TP 311.52
文献标志码:A
文章编号:1672-2434(2016)01-0032-04