任 涛 扈 岩 张青华 丁秀涛
自主课程建设实验学校学业水平考试试卷评价标准研究
任 涛 扈 岩 张青华 丁秀涛
考试评价研究的科学、全面发展,对促进基础教育的均衡发展、减轻学生负担、彰显学校办学特色,提高教育教学质量都将产生重要影响。试卷评价体系是衡量和评估试卷是否公平科学、准确规范,学生学业质量是否达标的标尺。本文以自主课程建设实验学校学业水平考试试卷评价标准的探究为切入点,通过建立命题蓝图评价量表,使试卷蓝图科学化;通过建立试卷质量评价量表,使评价过程标准化,评价结果可量化,评价报告可读性强。
课程标准;学业水平考试;命题蓝图;考试评价标准
《国家中长期教育改革和发展规划纲要(2010—2020)》和《国务院深化考试招生制度改革的实施意见》提出“建立科学的教育质量评价体系,全面实施高中学业水平考试”。普通高中学业水平考试制度作为我国教育制度的重要组成部分,是基础教育考试评价体系的核心内容。开展普通高中课程改革实验,是贯彻国家及北京市中长期教育改革和发展规划纲要,推进素质教育的根本要求,也是落实国家及北京市普通高中课程方案,推进具有首都特色和充满活力的普通高中课程体系,促进学生全面而有个性发展,促进教师素质整体优化和普通高中教育质量不断提高的重要手段。
北京市自2007年开展普通高中自主排课实验(以下简称“自主实验”),自主实验学校可根据课程进度安排和学校实际能力选择科目进行学业水平考试组考(以下简称“自主会考”)。允许部分普通高中开展自主实验,赋予学校合理而充分的课程自主权是为了更好地落实课改实验总目标,为学校创造性地实施国家课程、因地制宜地开发校本课程,为学生自主选择个性课程提供保障,切实探索一套完整的“以校为本”的新课程实验体系,为推进北京市高中课改起到示范和引领作用。先期进入自主课程实验的学校共有10所,如北京二中、北京四中、中国人民大学附属中学和北京十一学校等全国知名的示范性高中。
为推进高中课改健康发展,保证课改质量,完善自主实验学校学业水平考试管理机制,依据北京市教委《关于进一步推进学校自主课程建设实验有关事项的通知》(京教基二[2012]20号)精神,以及《北京市自主课程建设实验学校学业水平考试(会考)管理方案》,从2013年夏季开始北京市参加自主会考的学校增加14所,加上先期进入的10所,共有24所示范性高中进行自主排课实验,自行组织学业水平考试,即这24所中学均要进行高中会考语文、数学、英语、物理、化学、生物、思想政治、历史和地理9个学科的自主命题工作。
自主会考是开展自主课程实验的重要组成部分,是落实课程计划、检验和评价课程实验、达成实验目标的重要环节,允许自主考试是北京市教委为实现自主实验目标、课程计划、教学内容、保障教学时间的基本手段。尤其需要指出的是,自主会考是北京市为推进普通高中课程改革实验,推进具有首都特色和充满活力的普通高中课程体系,而进行的新改革举措。对自主会考进行科学的、体系化的评价研究,对于北京市建立和完善普通高中教育质量监测体系具有积极的意义。因此,从省市级层面加强对自主考试的监控与评价极其重要和必要。
试卷评价体系是衡量和评估试卷是否科学公平、准确规范,学生学业质量是否达标的标尺。开展自主会考试卷评价体系研究工作,主要目的是加强对自主会考的监控与评价,保证自主考试与自主课程建设实验的一致性,确保统一考试的公平性。对24所学校会考9个学科进行自主命题的评价,意味着北京市每年将有约200份的试卷评价报告需要撰写,工作量很大。因此编制评价量表,对试卷评价进行系统化处理,将使北京市的自主会考评价研究工作科学、高效、便捷。
北京市针对全市会考已开展多年试题质量、学生学业水平及教学质量分析研究,在对试题评价分析中,已构建并逐步完善了考试评价的统计指标和教育测量指标体系。
自主会考试卷评价的依据是:“高中课程标准”、“北京市普通高中会考考试说明”、学科试卷命题蓝图,并适当参照北京市统一会考试卷的难度水平。因此,自主会考试卷评价量表研究就是结合教育测量学中质性评价的定量、定性分析方法,在每次考试后对考试试卷进行全卷以及题目的分析,并对命题提出有针对性的建议。
3.1 对试卷命题蓝图的评价
命题蓝图是试卷命制的计划或规划,一份“好”的命题蓝图是命制一份高质量试卷的前提,因此对于各校各学科试卷的命题蓝图的评价非常重要。根据学科课程标准、学校自主课程实验方案,参照北京市会考考试说明,从以下几方面对各学校提供的自主会考学科命题蓝图进行评价,见表1。
表1 命题蓝图评价量表
对于1~5题,请学科专家进行等级评分,最高为10分,最低为0分。8~10分为满足要求,6~7分为基本满足要求,3~5分为基本不符合要求,0~2分为完全不符合要求,并用定性化的语言进行说明或描述。对第6项给予明确评价意见,简要概述此命题蓝图涉及的学科模块内容和该学科命题的主要特点,并简述改进意见和措施。不同专家“背靠背”的对试卷命题蓝图进行“盲审”,蓝图是否有问题,有什么样的问题,该如何改进,建议和措施等就会显现在评价量表上,提供给自主会考学校进行改进和完善。
3.2试卷质量评价标准
不论是常模参照性考试或标准参照性考试,对试卷评价的角度主要有四个方面,即科学性、准确性、规范性和公平性。根据自主会考的水平性考试性质和特点,首先聘请一线学科教师和命题专家等30余人对试卷质量标准进行访谈,并对访谈记录进行编码,之后整合为编码结果。整理后的结果共分成两大类,一类为考查内容及要求,主要是对考试试卷所涉及的内容范围进行评分;第二类为命题技术规范。将这两类问题进行合并整理,选取频率最高的编制问卷,采用因素分析,从考查内容要求、命题技术规范、难度设置和总体质性评价四个维度进行试卷质量评价。
表2 试卷质量评价量表
试卷评价专家参考表2中的20个方面来对试卷进行评价,并给予分项说明。首先,对表2“试卷质量评价量表”进行量化打分,共20项,每项5分;采用五级评分制,把5分细化为五档,即完全满足要求5分、能够满足要求4分、基本满足要求3分、基本不符合要求2分、完全不符合要求0~1分。同时,对试卷质性评价的等级性进行描述:优秀等级试卷为完全符合表2中列出的所有方面,试卷中大部分试题属于原创性试题或改编试题,命题有学校自主方案特色;良好等级为基本符合表2中列出的所有方面,试卷有部分原创试题,具有一定的学校自主方案特色;合格等级为能够符合表2中列出的大部分内容,试卷具有一定的特点;不合格等级为不符合表2中列出的大部分内容,或包含以下问题如:试卷未按照命题蓝图命题,试卷有科学性“硬伤”,试题无原创性或改编试题,试卷没有反映学校自主方案的特点,等等。
不同专家“背靠背”对试卷进行“盲审”,尤其对低于3分等级的要给出确切原因说明,最后根据试卷20项总得分,给出试卷质量总体评价,见表3。通过这样定量与定性的评价过程,一份自主会考试卷的特色和不足就完全展现在评价量表上。
3.3 评价报告内容框架设计
结合试卷质量评价量表,设计试卷质性评价报告,共分为三部分:
第一部分为对试卷的整体评价,内容包含三方面:一是对学科命题质量的总体评价,内容可结合表3描述;二是评价试卷与命题蓝图的一致性,内容可结合表1进行说明;三是总体评价结果(优秀、良好、合格和不合格),属于定性和定量评价相结合,用表3的结论。
第二部分为试卷分析,依据课程标准、会考考试说明和命题蓝图,并参照北京市会考试卷难度进行分析。内容包含:试卷特点、试卷结构、难度控制和题目科学性等方面。主要参考表2中所列出的20个方面的内容,突出重点进行评价分析。定性评价语言要求体现特色、言简意赅。
第三部分为建议与改进,主要根据表2(评定为3分等级以下的内容原因和说明)和表3中的改进建议,针对试卷的优点及不足,给出改进试卷命题的合理化建议。
表3 试卷质量总体评价量表(质性评价)
经过近三年的实践,本研究有效控制了自主会考试卷命题质量,使不合格试卷的数量逐步减少,自主排课学校更加重视试卷的命题工作,到2015年,优秀和良好试卷的比例远远高于标准制定时第一年的数量,在一定程度上保证了北京市高中毕业会考的公平公正,同时也使北京市的此项教育改革得到了质量监控。表4给出了2013年和2014年度试卷不同等级的评价结果。
通过对自主会考试卷建立评价指标标准体系,主要达成了如下结论。
4.1 使试卷蓝图科学化,命题设计规范化
通过建立命题蓝图评价量表(表1),使试卷从设计和规划之初的阶段,就有监督、有标准和有方向,并且对命题有反馈和改进。解决了部分自主命题学校不能保持优质的命题水平、部分试卷未按照蓝图命题的突出问题,降低了命题的随意性和盲从性。
4.2 使评价过程标准化,评价结果可量化
通过建立试卷质量评价量表(表2)和质性总体评价量表(表3),初步建构了学业水平性考试的评价标准。通过打分量化评价等级和给出定性的评价结果,不仅监控了教师评价的过程,使评价过程标准量化、有据可依,同时也将试卷的特点和不足完全展现在评价量表上,使教育管理者或命题教师能够一目了然地知悉试卷诊断反映出的问题,以便下次命题时改进。从实践效果来看,试卷评价量表指出了试题表述不严谨、存在的科学性错误;试卷存在题目与其答案不匹配、答案不规范、评分标准不清晰的瑕疵;有的试卷使用历年会考原题数量过高,原创或改编试题数量太少,致使试卷效度差;有的试卷存在排版不规范,格式不统一;有的试卷没有反映学校自主方案的特点等现象或突出问题。
4.3 使评价报告高效化,可读性强
每年对24所学校会考9个学科进行自主命题的评价,有约200份的试卷评价报告需要撰写,工作量很大,通过编制试卷评价量表,评价教师撰写评价报告就有据可依,极大地提高了评价工作效率。同时,也减少了评价报告不客观、不规范、不严谨,评价语言随意性的问题,增加了评价报告的可读性,使北京市的自主会考评价研究工作科学、客观、高效、便捷。
表4 试卷等级评价结果
面对未来即将进行的普通高中学业水平考试,进行自主课程实验的学校要加强对学业水平考试命题及命题蓝图设计等的思考和设计研究,使教师切实掌握命题的基本操作程序和规范要求,同时鼓励积极命制原创题,通过原创试题体现新一轮考试改革和“走班制”教学特点以及学校教学水平与特色。采取有效措施,提高校本审命题技术的培训,探索考试与教学良性互动的新型关系,使自主会考对优质高中有创意的学科教学的诊断评价功能得到更充分的发挥。
[1]戴家干.教育考试与评价制度创新 理论研究与实践探索[M].北京:高等教育出版社,2010,4.
[2]杨向东.关于高中学业水平考试的比较研究[J].全球教育展望,2010(4):7-13.
[3]朱宇.高中学业水平考试:功能、命题与成绩使用[J].考试研究,2008(4).
[4]雷新勇,周群.从基于标准的基础教育改革的视角审视课程标准和学业水平考试[J].考试研究,2009(5).
[5]刘庆思.建立稳定量表 服务中学教学——谈高考评价功能的开发[J].中国考试,2009(5).
Research on Academic Level Test Paper Evaluation Standard in the Independent Course Construction Experimental Schools
REN Tao,HU Yan,ZHANG Qinghua&DING Xiutao
The scientific and all-round development of research in measurement and assessment will be very helpful in promoting the balanced development of basic education,reducing the workload of students, demonstrating the uniqueness of school governance and improving the quality of both education in general and instructions in the classroom in particular.The test paper evaluation system is a promising tool used for assessing not only whether the test paper is scientific,fair,accurate and standard but also whether students have attained the required proficiency level.Using as a starting point discussions of the academic level test paper evaluation standard in the independent course construction experimental schools,the article is intended not only to help to make the test paper design scientific by establishing a scale for assessing the blueprint for test writing,but also to help to make the evaluation process standardized,the evaluation outcomes measurable and the evaluation reports readable.
Curriculum Standard;Academic Level Test;Test Development Blueprint;Test Paper Evaluation Standard
G405
A
1005-8427(2016)05-0031-5
本文系北京教育规划重点课题“北京市学业水平考试(会考)评价体系研究”(立项编号:AHA14168)的阶段性研究成果。
任 涛,男,北京教育考试院,科研办副主任,副研究员(北京 100083)
扈 岩,男,北京教育考试院,助理研究员(北京 100083)
张青华,女,北京教育考试院,副研究员(北京 100083)
丁秀涛,女,北京教育考试院,科研办主任,研究员(北京 100083)