高考新政下等级性考试若干理论问题初探

2016-06-05 14:14:54郭长江
中国考试 2016年9期
关键词:电阻箱测验普通高中

郭长江

高考新政下等级性考试若干理论问题初探

郭长江

本文对高考新政下的等级性考试的属性问题、等级描述的水平标准问题、等级性考试试卷结构和题型设计问题、等级性考试试题难度设计问题,以及等级性考试分层评分问题进行讨论,希冀对合理编制等级性考试试题、实现其功能价值有所启示。

考试招生制度改革;高考改革;高中学业水平考试

根据《上海市深化高等学校考试招生综合改革实施方案》和《上海市普通高中学业水平考试实施办法》,高中地理、生命科学、历史、思想政治、物理和化学6门学科设置等级性考试,高中学生可在其中选择3门参加考试,考试成绩划分为五等11级,再折算计入高考总分。等级性考试成绩以等级呈现,按获得该次考试有效成绩的考生总数(即缺考或未得分的考生除外)的相应比例划分等级,位次由高到底分为A+、A、B+、B、B-、C+、C、C-、D+、D、E共五等11级。其中A+约占5%,A、B+、B、B-、C+、C、C-、D+各约占10%,D、E共约15%,E为卷面有效成绩低于标准分值或约占5%[1-2]。为了适度控制学生的考试负担,上海市教委对等级性考试的难度、内容和考试时间都作出明确要求。等级性考试试卷难度控制在0.75左右,介于高考和合格性考试难度之间,考试时间为60分钟。如何编制等级性考试的试题,以体现等级性考试的功能,是考试评价研究者当前迫切需要回答的一个实际问题。

1 等级性考试的属性问题

传统的高考,属于常模参照测验。常模参照测验是以被测团体的常模(平均分)为参照标准来衡量个体成绩的测验[3]。测验编制所基于的假设是:团体测验成绩呈正态分布。因此,要求组成测验的试题,以中等难度题居多,少数为较难或较易试题,即测试题难度呈正态分布。这种测验对学生的学习起到考核、监督作用,主要功能是区分学生的个别差异和相对水平,但却不能确定学生的实际水平和达到目标的程度,缺少对困难和错误的诊断,有时还会降低或者提高衡量标准。

等级性考试属于标准参照测验。标准参照测验是以预订的目标(大纲)为参照标准来衡量测验成绩的测验[3]。确定其评分基准是在测验之前,建立在被测团体之外。个体的成绩只需要与既定的目标相比较,不必与团体中的他人相比较就可以确定其优劣。

因此,等级性考试之前,必须要建立某学科一套明确而固定的标准,即一套等级描述,以说明该学科达到某等级的考生的典型能力水平。拟定这些等级描述的原则是正面描述考生能展示的水平,而避免描述考生不能掌握的能力。同时,开发标准的时候,必须考虑以下流程:①明确地定义所测量的学科能力及其行为目标;②根据定义的能力及其行为目标,命制试卷,选取一部分学生进行试测,选取有代表性的行为样本;③按照评分标准,对学生在考试中的表现进行绝对评分;④根据标准,给出不同等级水平的分数界线;⑤根据分数界线的情况,对等级描述进行一定的修正,形成最终版本。

这套等级描述,应该由一个工作小组拟定,小组成员应该包括考试评价部门、大学、中学等部门人员组成。

等级描述是学科专家在评级、设定水平和维持水平等工作的重要参考资料。同时,等级描述也可以促进教与学。学生可参考有关描述,用以制定个人的学习目标和评估学习进度。教师可以明确了解如何协助学生迈向更高水平。此外,作为高校,等级描述让他们更清楚地了解不同水平考生的实际能力,从而作出更合适的选择决定。

2 等级描述的水平标准问题

显然,在开展学业水平考试之前,首要任务是拟定各学科的等级描述。此前,上海市的普通高中学业水平考试各学科已经建立了一个初步的等级标准。以物理学科为例,主要从基础知识和基本技能、基本原理和科学方法、基本科学素养、基本实验技能四个方面,分别对A、B、C、D、E等第的能力进行了描述[4]。不过,因为考试背景、内容和功能不同,需要在这套等第能力描述的基础上,进一步拓展和完善。

如果暂时撇开具体学科,仅从共通的角度分析,可以从知识和技能的理解情况、应用知识和技能解决问题的能力、评价与表达三个维度进行等级描述。这样做的好处是,水平标准的框架比较明确,水平的区分也比较明确,具有可操作性。各等级描述特征见表1。

表1 学业水平考试共通等级描述特征

从科学性的角度,建议在最后设置“不予评级”项。因为等级描述的原则是正面描述考生能展示的水平,而避免描述考生不能掌握的能力。因此,如果考生没有达到最低等级描述,应该不予评级。

3 等级性考试试卷结构和题型设计问题

目前上海高考分科卷的时长是2小时,分值为150分;等级性考试的时长是1小时,分值为100分。由于等级性考试时长短、分值少,试卷结构应该比高考简单,建议客观题只设单选题,主观题以综合性试题为主。以物理学科为例,高考和等级性考试试卷结构的对比见表2。

表2 物理科高考和等级性考试试卷结构的对比

等级性考试不设多选题的理由是,多选题难度较大但区分度一般。设置简答题的目的在于考查学生分析、综合和评价所给的资料并表达自己的见解的能力,简答题有利于考查“评价与表达”维度,有利于开展分级评分,从而进一步提高等级性考试的区分度。

保留的题型,因为考试功能的改变,也要做相应的调整。其中,选择题、实验题主要考查学生对课程内容的认识和理解,体现一定的广度。计算题主要考查学生把概念和技能应用到不同的情境中解决问题的能力,可以考虑其中一道题的情境简单、另一道题的情境复杂些。

4 等级性考试试题难度设计问题

从教育测量学的角度看,大规模常模参照考试(即统一高考)与标准参照考试(即高考新政下的等级性考试)是两类不同性质的考试。常模参照考试命题设计的主要原则是使试卷的区分能力最大化,使对考生进行的教育决策误差尽可能小。常模参照考试的试题难度范围应该与考生的能力范围大致相当,这样才能真正考查出考生的实际水平。标准参照考试的命题设计主要取决于测量目标的要求,只要是课程标准规定的、考生应该达到的、应该掌握的内容,且考试能够测量的目标,都应该考,无论其难度如何。这种情况下,考试的难度水平主要取决于课程标准规定的行为表现水平标准的高低和学习内容的难易。因此,命题者不必人为设置整个试卷的难度系数。当然,考试的最后结果会表现出一个难度系数,比如说目前上海等级性考试的预估难度系数设定为0.75。

对于等级性考试而言,最重要的是如何将课程标准规定的定性的行为表现水平转变为定量的量表——试卷[5]。标准参照考试命题的基本原则是:试题的难度是平行的,它包括两层含义,一是测量同一行为表现水平的试题难度是平行的,二是测量不同行为表现水平的试题难度也是平行的,而且测量每一行为目标的试题都应该达到一定的数量。这一原则是由标准参照考试的目的决定的。

传统高考的难度系数,从理论上讲,应设置在0.5左右,考生的成绩应呈正态分布,考试合成总分的标准差也达到最大,这样考生的成绩分布最分散,有利于减少招生分数线划分造成的决策误差。近些年,因为高校招生数量的增加,适当调高难度系数也是可行的,比如上海目前高考的难度系数定为0.65。难度系数再高,会使平均分提高,标准差降低,成绩分布的负偏度和峰度都加大,即更多的考生分数会集中于高分一侧。

传统高考的这种特性,决定了试题以中等难度题居多,少数为较难或较易试题。但是,标准参照考试的情况却大不相同,可以通过以下计算看出。

2016年上海高考人数约5万人,估计2017年的人数也在5万左右。若其中30%的考生选择物理等级性考试,也就是1.5万人。等级性考试设定难度系数为0.75,参照表3上海市近5年普通高中学业水平考试物理试卷基本统计数据,取最接近难度系数0.75的2013年的标准差18.11分进行估算。

表3 2011—2015年上海市普通高中学业水平考试物理试卷统计数据

取以上数据,利用正态分布确定各等级人数分数的情况见表4。

表4 利用正态分布确定各等级分数

图1 2012—2015年上海市普通高中学业水平考试物理试卷试题难度分布

以上数据可以明显地看出两个问题:第一,两段的划界分数不理想。A+等级和E等级的划界分数偏高,这会造成A+等级的竞争激烈;E的划界分数偏高,将使得整卷的区分度降低,压缩了有效试题的空间,绝对分数之间的差值与等级分数的差值差异不大。这不仅给命题带来一定的困难,而且也削弱了等级性考试原本的功能。

再具体来看近4年上海市普通高中学业水平考试物理试卷试题难度分布,见图1。图中横坐标为试题难度系数,以0.1为一个单位递增;纵坐标为与难度系数对应的试题分值之和。

从图1可知,近4年上海市普通高中学业水平考试物理试题在难度分布上基本为双峰值结构,即在难度0.8~0.9、0.3~0.4附近形成两个峰值。试题在难度0.8~0.9处形成一个峰值,主要可以体现水平考试的“达标”功能,并有效地控制试卷的难度。试题在难度0.3~0.4处形成一个峰值,主要是为了A档的划界分数更为合理。但是,等级性考试与传统的学业水平考试不同,需要在各个层次上区分考生。因此,总体上讲,应该平行设置试题难度,而不是正态设置试题难度,即参照2015年的数据,不是出现双峰结构,而是应该出现数量相当的多峰结构,让典型难度的试题“平行”,这样才有利于提高区分精度,减少划界分数的误差。当然,为了体现整体难度系数在0.75这一预想结果,也可以考虑难度在0.7~0.8附近的试题略多,0.4以下的试题略少。但是,通过以上计算可知,为了避免A+的划界竞争过于激烈,必须设置一定数量的难度在0.2~0.3的试题。

5 等级性考试分层评分问题

“分层评分法”来源于香港大学教育心理学教授比格斯提出的SOLO分类评价理论,这是一种以等级描述为特征的质性评价方法。比格斯研究发现:人在学习新知识的过程中表现出来的思维阶段是可以观察的,称为“可观察的学习成果结构”(Struc⁃ture of the Observed Learning Outcome,SOLO)[6]。“分层评分法”是提高等级性考试区分性的一种有效尝试,是合理区分“等级”的一种具有较强操作性的方法。2014年上海市普通高中学业水平考试物理试卷首次尝试了“分层评分法”,举例说明如下:

例:如图1所示电路中,电源电压U恒定,Ⅰ和Ⅱ是电阻箱,Ⅲ是定值电阻。调节两电阻箱Ⅰ、Ⅱ的阻值R1、R2,但保持R1与R2之和不变。当R1=R2时,安培表A的示数为0.4 A,伏特表V1和V2的示数分别为4 V和9 V。求:

图1

(1)R1与R2之和;

(2)定值电阻Ⅲ的阻值R3;

(3)调节电阻箱的过程中,安培表A的示数会发生变化。分别求出安培表A的示数最大和最小时,电阻箱Ⅰ的阻值。

对于第(3)问,命题者制定了分层评分标准,见表5。

表5 评分标准

评分标准分为4个等级,分别为0分、1分、2分和满分3分,即在全对和全错之间再区分两个等级。得1分的学生,在思维上已经能够运用简单的串联、并联组合电路知识给出电流表示数与电阻箱阻值间的关系,但无法运用数学方法继续求解极值问题;或者通过简单改变电阻箱各种极端取值(如短路或断路)进行估算,得到至少1个正确结果,但分析不全面、结果不完整。得2分的学生,在思维上已经能够运用简单的串联、并联组合电路知识给出电流表示数与电阻箱阻值间的关系,而且能运用数学方法求解物理问题中的极值,但是分析不全面,在3个正确答案中只答出2个;或会通过简单改变电阻箱各种极端取值进行估算,得到全部3个正确答案。通过这样的方法,就能根据学生在回答问题时的表现,来判断其所处的思维发展阶段,进而给予合理的评分。

在主观题的评判,尤其是简答题的评判中,“分层评分法”能够有效地提高区分度,并合理地评定学生所达到的思维水平。

以上只是在理论层面对等级性考试的命题模型进行了讨论。实际上,还有许多操作层面的准备需要落实,比如需要建立一套相对合理的等级描述水平标准,并进行样题的编制、试测、典型样本的分析等,这是正式考试成功与否的重要铺垫。希望以上的讨论对于命题工作有所帮助。

[1]上海市政府.关于印发《上海市深化高等学校考试招生综合改革实施方案》的通知[EB/OL].(2014-09-19)[2016-06-26].http:// www.shmec.gov.cn/html/xxgk/201409/420032014012.php.

[2]上海市教育委员会.关于印发《上海市普通高中学业水平考试实施办法(试行)》的通知[EB/OL].(2015-04-24)[2016-06-26]. http://www.shmec.gov.cn/html/xxgk/201504/402162015003.php.

[3]王孝玲.教育测量[M].上海:华东师范大学出版社,2005:17.

[4]上海市教育考试院.2014年上海市普通高中学业水平考试考试手册[M].上海:上海科学技术出版社,2014:4-8.

[5]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006:164.

[6]BIGGS J B,COLLIS K F.Evaluating the Quality of Learning:The SOLO Taxonomy[M].New York:Academic Press,1982.

A Study of Some Theoretical Issues of Hierarchical Examinations in the College Entrance Examination Reform Context

GUO Changjiang

This article discusses the nature,level descriptions,paper structures,task types,item difficulty and tiered rating strategies of hierarchical examinations in the College Entrance Examination reform context.It is hoped that lessons can be learned from the discussions about how to write ideal test items for hierarchical examinations to realize their intended functions.

Examination and Admission System Reform;College Entrance Examination;High School Academic Proficiency Test

G405

A

1005-8427(2016)09-0003-6

(责任编辑:陈睿)

郭长江,男,上海师范大学数理学院,副教授(上海 200234)

猜你喜欢
电阻箱测验普通高中
普通高中生涯规划教育的尝试、困境与思考
甘肃教育(2020年24期)2020-04-13 08:24:16
普通高中文化育人的思考与实践
《新年大测验》大揭榜
趣味(语文)(2018年7期)2018-06-26 08:13:48
两个处理t测验与F测验的数学关系
考试周刊(2016年88期)2016-11-24 13:30:50
半偏法测电表内阻及误差分析
河南普通高中今年停招择校生
中小学电教(2016年3期)2016-03-01 03:40:46
分析直流电阻箱误差对检定二次仪表的影响
你知道吗?
少年科学(2014年10期)2014-11-14 07:38:17
直流电阻箱误差对检定二次仪表的影响
计测技术(2014年3期)2014-04-26 09:33:40
数控直流电阻箱的研究
技术与教育(2014年1期)2014-04-18 12:39:17