杨君 陈志国
摘 要
与现行高考相比,学业水平等级性考试的命题目标要求更高、测量功能更加丰富、操作过程更加复杂,在考试性质、考试形式、成绩呈现和使用方式、考生群体以及命题依据等方面均有较大的差异。对于等级性考试命题的研究,应深入分析等级性考试的等级赋分方案以及相应的区分要求、等级成绩的呈现和使用以及相应的考生成绩分布和难度结构要求,在此基础上,依据课标要求和考生群体实际情况,设计等级考试卷的题型、题量和难度结构。
关键词
学业水平等级性考试 试题命制 等级方案 等级赋分
2020年,北京开始实施等级性考试。与现行高考相比,学业水平等级性考试是一项目标要求更高、测量功能更加丰富、操作过程更加复杂的全新的考试。本文将对等级性考试的特点和考试对命题的要求进行分析,梳理等级性考试的研究逻辑,研究学业水平等级性考试的命题策略。
一、学业水平等级性考试的特点
学业水平考试是本轮考试招生制度改革的重要措施之一,其中的等级性考试,因其成绩计入总成绩并在高校招生录取中使用,倍受社会各界关注。相比现行高考,等级性考试有如下变化。
1.考试性质的变化
国务院和教育部的改革实施意见[1,2]中均指出,学业水平考试是学生毕业和升学的重要依据。《普通高中课程标准(2017年版)》(下文简称《新课标》)的颁布以及学业水平标准的研制,为学业水平考试和升学考试命题提供了重要依据[3]。等级性考试对应升学功能,一般而言,在成绩解释上,升学功能对应常模参照测验,主要考查学生的个体差异,用于衡量学生的相对水平,即学生在群体中的相对位置,是以选拔为主要目的的考试。不同的测验性质,试卷设计会有所不同[4]。综上,等级性考试是具有常模参照特征的标准参照考试[5]。
2.考试形式的变化
《教育部关于普通高中学业水平考试的实施意见》中指出,高考综合改革的省(区、市),计入高校招生录取总成绩的学业水平考试3个科目,由学生根据报考高校要求和自身特长,在思想政治、历史、地理、物理、化学、生物等科目中自主选择。由综合卷向单科卷的改变,带来的不仅是考试形式和考试时长的变化,由此也带来各科试卷结构及题型题量的变化,同时也给各科探索新的能力考查方式和试题呈现形式提供了空间。
3.成绩呈现和使用方式的变化
教育部《实施意见》中关于考试成绩呈现的陈述如下:计入高校招生录取总成绩的学业水平考试3个科目成绩以等级呈现,其他科目一般以“合格、不合格”呈現。以等级呈现成绩的一般分为五个等级,位次由高到低为A、B、C、D、E。原则上各省(区、市)各等级人数所占比例依次为:A等级15%,B等级30%,C等级30%,D、E等级共25%。E等级为不合格,具体比例由各省(区、市)根据基本教学质量要求和命题情况等确定。与传统考试使用原始分呈现和使用成绩不同,等级性呈现和使用考试成绩是等级考区别于现行高考的最主要特征。
4.考生群体的变化
根据政策要求,考生依据高校要求和自身特长选择选考科目,但在实际操作中,影响考生选择选考科目的因素多样且复杂,既有考生的主观因素如个人兴趣、学科特长等,也有个人职业规划和高校专业要求等的因素,同时也有各学科的难度、学时以及教师及家长的引导等诸多因素的影响。因考生选考的复杂性,必然导致各选考科目考生群体的数量和层次结构的不确定性增加,这显然会让学科难度的把控增加不确定性,同时也会增加选考科目间的平衡难度。
5.命题依据的变化
国务院《关于新时代推进普通高中育人方式改革的指导意见》明确提出:学业水平选择性考试与高等学校招生全国统一考试命题要以普通高中课程标准[6]和高校人才选拔要求为依据,实施普通高中新课程的省份不再制定考试大纲。可见等级性考试要依据新版课程标准进行命题。
二、学业水平等级性考试的命题要求
1.等级方案的实施要求
等级性考试以等级呈现考试成绩,符合学业水平考试的基本特征,同时,考生的等级成绩以其原始成绩在全体考生中的累计比例位置确定,因此等级能客观反应考生在群体中的相对位置,符合等级性考试成绩用于高校招生录取的特征。
在教育部《实施意见》的总体要求下,各地结合当地实际,分别制定了各省的等级方案。需要说明的是,上述所有等级方案均没有改变各科成绩的排列顺序,即原始分高的等级成绩也高,原始分低的等级成绩也低,原始分相同的转换后等级成绩也相同。虽然单科成绩的相对位置没有改变,但各科等级成绩加和后的总成绩与原始分总成绩可能出现错位,即原始分总成绩较高,但各科使用等级成绩加和后的总成绩偏低,导致两个成绩在总体中的相对位置也不相同,这也是各地等级方案所面临的最大挑战。因此,在设置等级方案时,应结合各省市实际情况,制定与考生成绩分布相匹配的等级方案,减少原始分总成绩与等级分总成绩错位的风险。
2.等级方案对考生成绩分布的要求
由等级划分的过程可知,考生的成绩分布直接影响到等级比例划分的效果。若某一分数段的考生占比过大,容易导致等级对应的原始分区间过小,甚至某个等级无法切分;若某分数段考生人数过少,则易造成等级对应的原始分区间过大,削弱区分功能。以浙江方案为例,若试卷总体过于简单,导致满分率过高(如达到2%左右),由于等级1对应的考生比例为1%,导致等级1无法划分;若试题过难,导致高分段考生人数偏少,则累计1%的考生对应的原始分区间过大。若等级1对应的原始分区间为10分,则导致分值小于10分的最难试题的区分功能削弱,甚至造成难题的区分功能无法发挥。实现学业水平等级性考试成绩的等级有效和合理划分,关键在于通过科学严谨的命题技术实现与等级方案相匹配的考生成绩分布。
3.考生成绩分布与难度结构的关系
考生成绩分布与试卷的总体难度及难度结构密切相关。为说明二者关系,本文选取了六份不同难度的高考物理学科实测数据(满分120分),并对每份数据对应的考生成绩分布图进行高斯分布模拟,结果如图1所示。各数据对应的统计数据如表1所示。
接下来从三个方面对考生成绩分布进行分析。
(1)试卷难度
考生成绩分布通常会根据测验难度呈偏态分布。测验难度较大(考生平均得分率低),成绩呈正偏态分布;难度较小(考生平均得分率高),则呈负偏态分布。
从表1可以看出,表中大多数考生成绩分布均呈负偏态分布(平均数<中数<众数),试卷难度系数高(试题得分率高,试题偏容易),偏度越大,即偏离正态分布越多。试卷难度接近0.5左右,偏度越小,考生成绩分布接近正态分布。此外,也容易看出,试卷难度系数越高,平均分越高,同时众数和众数也越高。反应在图像上即图线的“峰”向高分段移动。
把六条考生成绩分布曲线分为两组,0.64、0.66、0.68为第一组,0.51、0.56、0.60为第二组。从表1可以看出,第二组数据对应的标准差明显高于第一组。标准差反应的是一组数据的离散程度,标准差越小,表明数据越聚集,对考生的区分越差,考生成绩分布图像的“峰”越“窄、高”;标准差越大,表明数据越离散,对考生的区分越好,考生成绩分布图像的“峰”越“宽、低”。
(2)试卷难度结构
为研究试卷难度结构对考生成绩分布形态的影响,表2统计了各难度试卷对应的试卷难度结构数据。将试卷试题分为难、中、易三个层次,对应的难度系数分别为0~0.3、0.3~0.7和0.7~1。
从表2可以看出,两组数据的难题分值相差并不明显,主要差异体现在中档题和容易题上。第一组数据中档题少、容易题多,第二组数据中档题多、容易题少。可见中档题对考生的区分强于容易题和难题,这是因为难题的区分群体主要集中在高分段考生,而容易题的区分则集中在低分段考生,中档题的区分空间最大,甚至能实现对全体考生的区分。
(3)难度结构的进一步分析
对比表2中第一组数据中0.66和0.64两组数据,两组数据不仅难度接近,且难度结构也很接近,中档题分值相同,难题和容易题也仅两分的差异。但图1显示两组数据对应的考生成绩分布形态却显示出较大差异,虽然低分段分布基本相近,但高分段分布差异较大。笔者认为,这应和更加精细的难度结构有关。表3所示为两份数据中各层次试题的平均得分及平均难度数据。对比两份数据,可以看出,难度为0.64的试卷难题不仅总分高2分,且平均得分更低,即難题多,且偏难,导致高分段考生较少;此外,两组数据中档题分值相同,但难度为0.66的试卷的中档题得分率高,偏易。上述两方面原因导致两份试卷的考生成绩分布差异(如图1所示)。
在图1中,进一步对比难度为0.66和0.68的两份数据,虽然难度结构差异较大(如表2),但考生成绩分布形态相近。为分析原因,表4为两份数据的难度结构进行了更细致的分档,与表3中把试题分为难、中、易三档不同,表4将试题按每档0.2为间隔分成5档。从表4可以看出,尽管两份试卷难、中、易试题的比例相差较大,但对难度结构按照0.2为难度间隔进行更加细致的分析后,可知两份试卷的难度结构非常相近是两份数据对应的考生成绩分布形态相近的原因。
可见,为实现理想的考生成绩分布,不仅要做到对试卷总体难度的准确把控,也要对试题难度梯度分布进行精细的设计。需要说明的是,上述分析所采用的数据非常有限,所做的分析也仅是粗浅的定性分析,仅粗略分析难度结构对考生成绩分布的影响,并无定量结论,且由于不同学科之间的差异较大,上述分析结论仅限于物理学科。
4.科目选考对考生群体的影响
(1)科目组合的变化
现行高考按“语数外+文(理)科综合”将考生按科目组合分为2类,两类考生中,理科考生占绝大多数,以北京为例,历年高考理科考生占考生总体65%~70%左右。尽管历年考生总人数有较大变化,但文理科考生的比例基本稳定。
新高考采用“高考+等级考”模式,其中等级考采用“六选三”选考方案。与现行高考不同,理论上“六选三”的选考方案将有20种科目组合,对考生按科目组合进行分类,将有20组考生,且各组合考生的人数比例及水平均有差异。
科目组合发生变化的同时,各选考科目的考生群体也发生了相应的变化。现行高考实行多年,文理科考生基本稳定。但在等级考中,不仅各科目的考生人数不同,各科的考生群体整体水平及层次结构也有差异,且受试卷难度及高校招生政策的影响,各科的考生群体还可能逐年变化。
(2)教学的变化
随着新课标(2017版)和相应的教学指导意见的实施,中学课堂教学的形态发生了较大变化,如走班教学和分层教学的推行、课时数和课程内容的变化、教学顺序的调整、教学进度的安排等都对等级考的命题产生了新的不确定性影响。为此,在等级考的命题研究中,应重视中学学情调研,调研样本应涵盖不同层次、不同特色的典型中学。
(3)难度把控的复杂性和试测的必要性
目前,试题的难度系数一般用全体考生在某一试题(试卷)上的通过率(得分率)来表示。难度系数数值越大,可以认为试题总体越容易,反之,难度系数数值越小,则表示试题难度越大。可见,难度系数与考生的整体能力水平和层次结构以及课堂教学的实际紧密相连。由于等级考的考生群体以及中学课程教学上的变化,使得等级考的难度把控更加复杂和困难。
基于等级考命题的复杂性,为实现等级考命题的科学性,试测工作[7]就显得尤为关键和必要。可以在充分的学情调研和细致的各科考生群体分析的基础上,选择有代表性的样本进行试测,了解不同层次考生在不同难度、不同类型试题中的通过率,建立难度常模[8],为等级考的难度把控提供依据。
三、学业水平等级性考试的命题策略
在等级性考试中,对各科采用同一等级方案进行成绩转化和等级呈现,因此,命题过程中不仅要实现六科总体的难度目标,同时还应实现六科间难度的均衡,即六科难度大致相当。这一方面有利于考生选择选考科目的稳定,同时也有利于各科進行等级转换时的公平和合理,有利于降低原始分总成绩和等级转化分总成绩排名错位的风险。
题型设计上,如上文所述,等级成绩要反应考生的学业质量水平,而学业质量水平是依据各学科核心素养的水平,结合课程内容的要求,依据不同水平学业成就表现的关键特征制定的。因此等级考命题中,应通过创新试题呈现方式和问题设置方式,实现对考生学科核心素养及其各要素的不同水平考查。通过拓宽命题素材的选取范围,加强联系实际类问题的研究,考查考生分析问题解决问题的能力。加强开放性试题的研究,培养考生的创新精神、实践能力和思维品质。
题量设计上,应结合考试时间和难度目标,设置不同题型的合理数量和配比。若题量过少,则可能导致考查内容的覆盖面不够和考生学业质量水平区分的层次性不够;若题量过多,虽然考查内容的覆盖面更大,但由于作答时间有限造成考生无法完成全卷作答,尤其是难题的作答,易导致对高分段考生的区分不够。
难度设计上,在完成既定难度目标的前提下,还应实现与区分功能相匹配的试题难度结构,即试卷有合理的难度梯度,难中易试题的分值比例合理。这需要依据各省市的等级方案和考生的实际水平,进行细致的数据分析,得到难度的精细结构。
实施学业水平考试是本轮考试招生制度改革的重要举措,等级性考试的命题工作是关系学业水平考试实施效果的关键环节,关系全局,至关重要。本文系统分析了等级性考试命题的研究逻辑,提出了等级性考试命题的研究逻辑和命题策略,希望能为各地等级性考试的命题提供参考。
参考文献
[1] 国务院.国务院关于深化考试招生制度改革的实施意见[EB/OL].http://www.moe.edu.cn/publicfiles/busi-ness/htmlfiles/moe/moe_177
8/201409/174543.html.
[2] 教育部.教育部关于普通高中学业水平考试的实施意见[EB/OL].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s4559/2014
12/181664.html.
[3] 雷新勇.我国学业水平考试的基本问题及反思[J].教育测量与评价,2010(01):4-9.
[4] 王松岭.高中学业水平考试改革的思考与展望[J].天津师范大学学报:基础教育版,2015(01):15-19.
[5] 陶百强.对我国新高考方案高中学业水平考试的思考和政策建议[J].中国考试,2015(08):26-38.
[6] 中华人民共和国教育部.普通高中物理课程标准(2017年版2020年修订)[S].北京:人民教育出版社,2020:60-67.
[7] 杨君.高中学业水平考试试测项目的设计及实施——以北京卷物理试题为例[J].教学与管理,2018(13):73-76.
[8] 赵海燕,臧铁军.高考命题中的分数分布模拟与预测——难度常模的具体应用[J].评价与测量,2011(01):9-15.
【责任编辑 郑雪凌】