王剑梅,李明慧,崔洪雨
(锦州医科大学,辽宁 锦州 121000)
1977年全国参加高考的人数为570万,而2017年这一数字达到了940万,增长65%,随着高考人数的逐年增加,阅卷工作也是越来越繁重,在经历了20多年的人工阅卷后,1999年广西省率先对高等教育入学考试英语科目实施网上评卷,之后,全国多个省份陆续使用网上评卷系统对高考不同部分试题进行评分。截至2005年,我国高考所有试题形式(小语种科目试题除外)均采用网上评卷技术[1]。与高考中成熟的网上评卷技术形成鲜明对比的是高校中评卷模式的相对滞后,目前全国大多数高等院校采用的依旧是客观题机器评卷,主观题人工评卷的传统模式,能够开展所有题型全部网上评卷的仍是少数院校。
2017年7月份,锦州医科大学于全校39个专业期末考试工作中首次实行网上评卷,作为学校教材考试中心的一员,笔者有幸亲历了锦医大的这一历史时刻,并在学校教育教学研究与改革项目的资助下,针对此次期末考试的网上评卷环节,从前期准备到最终的数据统计做了一些相关性研究。
1.系统建立。网上评卷过程的顺利实施主要依靠评卷系统软件、计算机网络、硬件设备三方面的技术支持。(1)评卷系统软件:学校购进最新版网络评卷系统软件,由专业技术人员负责软件的安装及日常维护;(2)计算机网络:学校网络中心构建的计算机C/S结构局域网可以满足系统软件的运行需求;(3)学校考试中心的计算机及电子扫描设备可以满足网上评卷过程的硬件需求。
2.评卷教师培训。教材考试中心负责组织各二级学院下属教研室的教师进行网上评卷系统使用方法的培训,要求每位教师能够熟练掌握网上评卷系统的正确使用方法,并对参加培训的教师进行考核,考核通过者由考试中心下发教师个人的“网上评卷账号”。在培训过程中,评卷教师对评卷系统存在的不足之处提出了建议,由考试中心收集整理并反馈给软件公司,力争让评卷系统软件更加完善。
3.答题纸制作。由于我校考试科目众多,不同类别科目的题型和题量也有所差别。为了适应各考试科目的特点,考试中心根据命题计划制定出各科相对应的答题纸模板(主观题采用答题纸答题、客观题采用答题卡答题、试卷题干区域与答题区域分离),并将答题纸模板的数量控制在五种以内,以提高后期模板切割、评卷任务分配的效率。
1.试卷扫描。考试结束后,考试中心工作人员在保密室内用高速扫描仪快速扫描答题纸,并进行考号有效性检测。批量扫描结束后,系统会对考生答题中的主观题部分进行切割,每道题作为一个切割点,切割图像将由计算机乱码编号储存在服务器中,检测无效的考号和异常识别的试卷图像也会同样保存在计算机服务器中等待人工复检。
2.教师网上评卷。由考试中心组织相关评卷教师于学校机房集中进行主观题评阅,考试中心工作人员全程监督,网络中心工作人员提供技术支持。评卷教师登录个人评卷账号后,服务器会随机将部分考生的试卷图像分发给教师账号,评卷教师按照细化的评分标准进行网上评阅,评阅结束提交试卷后,系统会自动保存评阅结果并派发下一份试卷的答题纸图像。
3.试卷成绩整合。考试中心工作人员在计算机终端检测教师阅卷进度,对已完成全部主观题评阅的试卷利用系统自动生成学生主观题得分。之后通过OMR/OCR识别软件对该部分试卷的客观题答题卡进行OMR识别评分,得到考生客观题成绩后与数据库中考生的主观题分数整合,得到考生的最终成绩。待所有试卷评阅结束后,系统会对此次考试所有科目的得分情况进行汇总分析,统计出及格率、平均分、难易度、区分度等一系列数据指标,供任课教师试卷分析使用。
1.评卷效率分析。网上评卷时间为2017年7月5日到7月16日,整个评卷过程历时12天,2016年同期(非网上评卷)评卷时间为2016年7月5日到7月28日,整个评卷过程历时24天。与2016年相比,2017年网上评卷时间缩短了(50%),说明相比于传统阅卷方式“网上评卷”可以有效的缩短阅卷周期。(1)网上评卷过程省却了传统阅卷方式中的试卷领取、手工翻阅、人工合分、成绩录入、试卷回收等环节,尤其是网上评卷过程中的分数整合完全由电脑自动完成,这大大降低了人工合分、人工复分所花费的时间,同时又保证了分数计算的准确性。(2)评卷系统会自动储存考生的答题情况和阅卷信息并对考试成绩进行数据统计,任课教师可以根据系统提供的数据做进一步的试卷分析,与传统的人工数据统计相比,系统自动进行的数据统计显然更快更准确,这对教学成果的检验及教学质量的提高具有重要意义。
2.学生成绩分析。学生期末成绩的及格率是检验一所高校教学质量的核心所在,也是高校为国家培养人才过程中的重要环节,如何能够客观公正地反映出学生对于知识的掌握情况是目前国内各层次院校亟待解决的问题。以锦州医科大学为例,临床医学与护理学专业是锦医大学生数量最多的两个专业,也是学校为社会输送医疗人才的两个核心专业。笔者统计了2017年(网上评卷)与2016年(手工评卷)同期临床医学与护理学两个专业期末考试及格率,仅将医学课程中最重要的三门基础课(生物化学、人体解剖学、生理学)纳入统计范围,统计结果如下(见表1、表2)。
表1 2016年7月份期末考试及格率统计情况
表2 2017年7月份期末考试及格率统计情况
在学校招生政策及教师职称结构无明显改变,各课程试卷难度系数与往年保持一致的前提下,与2016年同期相比,2017年各专业的三门主干课程的及格率都有所下降。笔者认为,在以往的手工评卷过程中,对于58分、59分的试卷,评卷老师往往会给予1至2分的感情分以让学生成绩达到60分的及格线,这在非选拔性的阶段考试中是普遍存在的。网上评卷实行以后,评卷教师只会看到某份试卷的某个题型(甚至某个题型下的某道题目),对于该试卷的其他题目的得分情况一无所知,这就有效杜绝了手工评卷过程中“合情不合理”的提分现象,让一份试卷的真实成绩“通过最客观的过程”呈现出来。
在具体执行过程中,网上评卷过程也出现了一些传统阅卷方式中不存在的新问题,如:试卷扫描过程中纸张的卡顿、评卷系统的异常关闭、学生主观题答题纸填涂错误等,这就要求我们认真总结经验教训并在工作中努力避免。
考试制度起源于中国,最早可以追溯到夏、商、周时期,距今已有4000余年历史。世界上现存最早的皇室文献《尚书》中曾对考试有过“三载考绩,三考黜陟幽明”“敷奏以言,明试以功”等记载。在历史的长河中,我国的考试制度也历经了封建社会的策试、察举、评议、征辟以及后来较为完善的科举制度的变迁和发展。在新中国成立以后,国家建立了全国统一高等学校招生制度以彰显教育的公平性,这也适应了当时社会快速选拔人才的需要[2]。自1977年恢复高考至今,累计已有超过一亿的学生进入到大学校园接受深造,现行大学中的阶段性考试以及学分制对于学生的学习情况起到了良好的督促作用,而如何真实地反映出学生的学习效果以及学校的教学质量这就依赖于考试的“阅卷环节”。在科技日新月异的今天,大学课堂也在发生着翻天覆地的变化,“微课、慕课、雨课堂”,这些新兴的授课方式正在挑战着传统的课堂[3],而大学里“评卷方式”的发展速度却显得与时代格格不入,早在2007年,苏州大学的胡慧老师就曾发表过文章倡导在高校中实行“网上评卷”[4]。然而10年过去了,真正能够开展网上评卷的高校仍然凤毛麟角,仅以锦州医科大学的一次期末考试的评卷过程分析来断言高校评卷方式改革的方向是远远不够的,这需要越来越多的高校参与进来,共同在实践中探索“网上评卷”到底符不符合我国高校的实际情况,为今后高校的教学评卷改革指明方向。