孙建明 王祖浩 王后雄 曾国平
摘要: 教育公平是最大的公平,高考公平是教育公平的一个重要环节,而命题公平又是高考公平的核心所在。影响高考化学命题公平性的因素众多,主要有命题组织方式、试题内容、试题背景、试卷难度、题型与组卷等。分析了这些因素影响高考化学命题公平性的作用机理,为后续研究构建保障高考化学命题公平体系提供重要的学理支撑。
关键词: 高考; 化学命题; 公平性; 影响因素
文章编号: 1005-6629(2021)12-0012-05
中图分类号: G633.8
文献标识码: B
我国古代教育家孔子两千多年前就提出“有教无类”的朴素教育公平思想;从世界范围看,古希腊哲学家柏拉图最早提出教育公平观念,他的弟子亚里士多德则试图通过法律来保障公民享受公平教育的权利。我国政府始终把推动教育公平发展和质量提升作为一项重要的惠民工程,常抓不懈,取得了举世瞩目的辉煌成就。高考公平是教育公平的一个重要环节,而命题公平又是高考公平的核心所在,它是系统的公平,受外部系统因素与内部系统因素的共同影响(见表1)。
总的说来,所谓命题公平是指不同考生群体,不会因为命题的各种因素而产生测试结果偏差的命题。我们研究影响高考化学命题公平性的主要因素,目的是找到构建科学合理的高考化学命题监测体系的方法与策略,更好地保障高考公平,进而使教育普惠大众。以下是影响高考化学命题公平性主要因素的具体分析。
1 组织方式
刘海峰认为,从高考命题的组织方式看,一部中国高考史就是一部“统分演变史”,统分之间来回徘徊,分
表1 高考化学命题公平性影响因素的种类划分
高考命题公平性影响因素包含内容
外部系统因素高考外部影响因素包括经济、政治、文化、地域、制度等因素,它与内部因素息息相关,从不同层次决定着高考公平性与科学性水平。
内部系统因素高考内部系统因素主要包括政策文件制定、命题、组卷、保密、施考、防弊、阅卷、统分、登分、指标分配、录取等程序,这些程序相互关联,任何环节的失误都会影响高考的公平。
分合合,不断探索理想与现实的最佳结合点。2004年实行分省命题以来,统分命題就成为各界关注的焦点,褒贬不一[1]。全国高考统一化学命题方式是指由教育部考试中心组织高考命题的方式,当前有全国一卷、全国二卷与三卷等3种,各有其适用的范围;自主命题是指有自主命题权的省份自行组织高考命题的方式。全国统一命题与分省自主命题,都是由政府主导的大规模选拔性考试命题方式,都致力于公平而科学地为国选才[2]。中国青年报社会调查中心曾经通过问卷网对1948人进行的调查显示,83.9%的受访者回答支持高考全国统一命题[3]。教育部考试中心可以在国家层面调动全国的人力、财力、物力等为高考化学命题出力,以确保高考化学试题的信度、效度与区分度,有力保障高考化学命题的科学性、公平性、权威性。
分省命题也有好处,能在一定程度上照顾到地域教育情况的差异,从这个意义上讲,分省命题维护了高考的公平性;但其命题水平很难达到全国统一命题水平,一定程度上又影响到选拔人才的科学性、公平性。
我们认为,高考组织方式应从全局出发,维护国家利益最大化,有利于高校选才,有利于引导基础教育发展,有利于提升高考命题的科学性、权威性、公平性、安全性、高效性、社会声誉与公信力,并降低命题经济成本。当然,全国统一高考命题,特别需要强化命题、试卷保管等环节的保密管理,加强互联网全方位监控,防范出现大面积的安全风险[4]。也有学者认为,分省自主高考命题以一种隐蔽的、不易被察觉的方式,掩盖了各省区直辖市高校入学机会不均等的问题,原因是分省高考命题使得各省区直辖市间的高校录取分数线不再具有可比性[5]。因为这与命题本身无关,故而我们在这里就不做深入讨论了。
2 试题内容
高考化学试题抽样内容影响高考命题公平性。抽样内容的选取受考试的时长、形式,命题人的学识、喜好等因素的制约。高考化学试题不可能考查所有《普通高中化学课程标准》规定的内容,其选取的命题内容一定少于课程标准所规定的内容。通常情况下,多样本选择的公平性优于其少样本选择。高考试题内容选择本身可能引起的误差是产生高考系统误差的原因之一,增大高考试题容量与高考试题内容所涉及知识技能领域的覆盖面,可以减少由于偶然性因素产生的系统误差,高考试题的信效度会增大,然而试题内容的选取又受到以上所述的诸多因素与学生年龄和心理特征的制约,为了减小系统误差,无限制地增加试题量,现实情况是不可能做到的。大多数高考命题专家认为,试题量与试题难度、高考用时之间应有一个最佳平衡点,以此满足试题内容的公平性要求。高考化学命题的实践过程中,命题人员通过设计多个“选做题”,为考生提供更大选择样本,让每位考生有机会选择自己所擅长领域答题,从而有效减少因样本选取偏小所造成的不公平现象。
高考化学选做题的等值性是高考公平性的一项重要保障。然而,我们深入研究近几年的高考化学试题发现,选做题在难度、得分率、认知层次等方面存在不等值的现象。实证研究显示,化学选做题的难度系数与平均得分存在巨大差异的原因是复杂而多面的,如选修模块的选修情况与教学情况、学生答题选择的决策与临场发挥情况等等。但不可否认的是,选做题的问题设置与所考查的课程标准规定的认知层次不同,是造成上述差异的主要原因之一。这些问题的存在极大地阻碍了考试公平性目标与诊断性目标实现,不可等闲视之。
等值性这一技术难题是新课程高考多样性和选择性形成的难题,必须运用“等值”技术解决考试结果的公平性问题。从试题长度、知识点数、能力层次、难度系数、解题时间、答题字数等可比性技术要素相近,用测验等值的技术保证编制选做题是平行题[6]。美国教育考试服务中心(简称ETS)有将近四百人的研究队伍攻关命题的等值性问题。我国目前尚没有类似的机构研究解决命题的等值性问题[7]。我们暂时只能使用折中的办法凭经验进行等值操作,以期实现高考选做试题的相对公平。具体办法可以参见《高中化学试题命制的常见问题诊断分析》,这里不做赘述[8]。
新高考改革以后,不同选考科目之间命题的等值性问题也影响高考命题的公平性。新高考选考科目设置的假设是选考科目在高考录取的权重比例是同等重要,但是不同选考科目间高考试题的内容、难度、信度、效度、计分方式等差异较大,这样将选考科目置于同等重要的位置,而其高考成绩不等值有违公平。如何解决需要进一步深入研究[9]。
3 试题背景
每一道高考化学试题考查学生的思维活动都是在一定的背景(情景或情境)材料之中完成的,高考试题背景材料和应答形式都有相关规定,考生按照试题背景材料和应答形式的规定,给出试题的应答过程与结果,获得相应数值的赋分评价,这种相应数值的赋分评价可以看作是考生学习结果的迁移,考生学习结果能否顺利迁移并转化为考生现实的考分,主要有两个条件决定,一是考生知识技能或核心素养的思维能力水平或操作技能水平;二是考生对迁移的试题背景材料的理解水平。考生知识技能或核心素养水平相同或相当的情况下,对试题背景材料理解水平的深度广度就成为考生能否顺利答题的关键。若考生对试题背景材料十分陌生,就很难顺利作答试题。试题背景材料的设计水平是考查考生知识技能或核心素养的思维能力水平或操作技能水平的主要技术环节,不夸张地说没有新试题背景材料的设计,高考的考查意图与选才功能就无法实现。
我国东部沿海发达地区较中西部地区拥有更丰富的教育资源与文化资源,高考化学命题的城市化价值趋向是新高考改革的一个隐形的公平性难题。城乡二元结构的社会现实逐渐形成了高考命题的“城市中心”价值趋向[10],即高考命题人以长期居住在城市的知名高校教师或省级示范中学的教师为主,命题时会下意识地选择以城市事物或现象作为试题背景材料,极易造成高考试题中出现明显偏向城市考生的题目,进而对农村考生造成不公平现象,即使两类考生具有相同或相似的思维能力水平或核心素养水平,但由于各自对试题背景材料的理解程度的不同,导致其高考化学成绩出现差异。
高考化学命题“城市价值”取向,主要是指高考化学试题背景材料设计与城市生产生活结合得紧密,而与农村生产生活的实际相去甚远。像“学区房”“股票”“债券”“密室逃脱”“地铁”“快速公交”等,这些高考試题背景材料对城市考生来讲比较亲切、熟悉、容易理解,而农村考生对此则相对陌生、不易理解,由于试题背景材料而产生新的干扰因素,加大了高考化学命题的系统误差,降低高考化学试题的信度、效度[11]。高考化学命题区域偏向是指高考化学试题背景材料对某一区域的风俗、文化、地理特征等的偏好,尤其是没有以经典的、代表性强的区域事物作为高考试题背景材料,如果考生因为对其熟悉程度的不同而出现不同的答题结果,此过程就有不公平的现象出现。我国幅员辽阔,不同地域的人文自然存在巨大差异,这为高考命题提供了丰富多样的试题背景材料,但是,同时容易出现另一个问题,即不同区域的考生因对不同区域人文自然熟悉程度不同,而出现的答题结果的差异[12]。例如“打铁花”等这类具有强烈地域性倾向的试题,命题人员应有充分考虑[13],尽量避免需要特殊试题背景材料和特殊解答方式的试题。另有研究者认为,还没有任何一个社会或制度能够做到每个人都有同等进入高校的机会,因为每位考生的天资、非智力因素以及他们占有的文化资本、经济资本等差异是无法完全抹平的[14]。
高考化学试题背景材料考虑考生群体的多样化与差异性对高考命题的公平性至关重要。命题尽可能降低试题背景材料对考生表现的影响,即试题背景材料的选择应避免出现地域、民族、性别、经济、文化背景的歧视内容[15]。对于高考这种重要的高利害关系的命题,应成立专门的“歧视监测小组”,严格监控,保证命题在试题背景材料选择方面的公平性[16]。同时,新高考改革给高考命题的理念、技术水平、命题能力等提出了更高的要求与挑战,如学生核心素养如何准确考查等等[17]。
4 试卷难度
试题难度与难度匹配显著影响高考化学命题的公平性。相关理论研究表明,高考试题整体难度系数在6.5左右时,高考成绩呈正态分布,高考试题的整体标准差达最大数值,区分度最高。难度与区分度一般随高考录取率高低而做相应变化,录取率高时,试题整体较易,难度应小些;反之,则应大些,即试题整体较难[18]。近些年,我国高考录取率不断攀升,高等教育进入大众化普及阶段,高考试题整体难度系数也应适当减小[19]。依据统计学理论,高考录取率超50%时,试题整体难度系数应控制在0.55~0.65区间较为合适[20]。适度降低高考试题的难度,拉开分数层次,划定更合理的录取分数线,科学录取、公平录取[21]。
高考化学命题难度设计首先要平衡不同学科间的难度关系,其次需要平衡好理综试题与文综试题中各学科间的难度关系。理综试卷和文科综合试卷里不同学科的内容权重、赋分比例、难度系数、信效度等问题,同样会影响到高考命题的公平性。杨志明等应用多元概化理论对某年广东省的高考试题的深入研究表明,其对理科较强的考生更为有利,会使其获得更大竞争优势,这表明学科对全域总分方差的实际贡献和命题的初始赋分意图有着较大差异[22]。命制理综化学试题与文综试题时需要平衡好不同学科试题间难度的权重比例[23]。相关研究表明,难度太大或太小都会影响试题的区分度,不利于拔尖学生的脱颖而出,从而影响高考的公平性。只有当高考试题难度在科学合理的区间内,高考才有利于考生发挥出真实水平[24]。大多学者认为,高考化学命题应该有测量评价专家、教育专家与高考命题人员的共同参与,有利于充分发挥高考的各种功能[25]。
5 题型与组卷
题型与高考化学试题的效度、信度、测量行为目标、测量结果的可靠性、计分误差、教学方式、学习方式、训练方式、课程教材改革等等关系密切,影响高考化学命题的公平性。高考题型分类方法较多: 按照评分方式,可把高考题型分为客观题与主观题;客观题主要有选择题、是非题、匹配题等;主观题主要有填空、简答、材料分析、问答等题型。
国际上通常把题型划分为选择型试题与建构型试题。高考题型各有其優势与不足,它们科学合理搭配完成高考命题的教育测量目标[26]。建构型题型的测量结果类似性较低,认知过程、内容等方面与测量目标的一致性程度高,能有效减少猜测答案的概率,有效考查学生的创新能力,信度较高,但试题样本较小,评分误差大;选择题结果唯一,抽样量大,易评分,系统误差小,从这些方面讲有利于增强高考命题的公平性,但其增大了考生猜蒙得分的几率,不利于考查考生思维的开放性与创新能力。实践证明,绝对完美的公平的题型不存在,高考题型的选择应在利弊兼具的特性中考虑不同题型对高考结果的影响[27]。
高考化学试卷组配对命题的公平性也有直接的影响。高考试卷组配不合理,可能产生严重的不公平后果。某年全国高考化学试卷,因为试卷第12题难度较大,致使很多考生不仅该题得了零分,而且后面几题的得分率都较低。很多学者认为,若把此最难试题安排到试卷的最后,很多考生后面的几题不至于都得零分。所以,高考命题组配应从公平的视角,尊重学生的心理认知特点,科学设计各试题的难度坡度,由易到难排列,目的是使考生产生良好的心理效应,适应考试环境,树立自信,发挥出实际水平[28]。
近年来,高考化学命题的性别偏向逐渐受到研究者的关注,高考命题的性别偏向主要是指高考科目设置与各科高考试题设计对男、女考生的影响情况。因为两性在知识结构、心理特征与思维特点等方面有着较大差异,所以两性考生对不同考试科目与不同题型的解答能力存在着客观差异[29]。男性考生擅长抽象逻辑思维,女性考生更擅长形象化思维,而在语言敏感度方面女性考生也优于男性考生,故高考化学试题类型及考查意图会使男、女考生的竞争表现出明显的性别差异[30]。当前的高考科目中,语文、数学、英语三门主科在高考录取总分中的权重比例较大,客观上对女性考生较为有利[31]。近十几年间中国各地区省级高考状元统计中,男状元有较大幅度下跌,女状元的年均比例则攀升,比例上涨甚至达至60%以上,反映女性考生在高考中的优势地位更加凸显[32]。当然,女状元增多的现象也可能是女性考生学习态度较为认真的原因。此外,题型与题材的不同也能够对男、女考生的答题效果产生差异性影响[33]。有学者研究发现高考化学命题中确实存在着一些有利男性考生的题目,如理科类科普文章的素材题,也存在一些有利于女性考生的题目,如涉及情感类的文学作品化学素材题等[34]。
综上所述,高考化学命题组织方式、试题内容、试题背景、试卷难度、题型与组卷等是影响高考化学命题公平性的主要因素。我们研究这些因素的作用机理,是为后续研究构建保障高考化学命题公平体系提供重要的学理支撑。篇幅所限,我们这里就不再展开。
参考文献:
[1][4]刘海峰. 全国统考有利于高考公平[N]. 中国教育报,2016-3-8(2).
[2][29][33]刘亮. 高考命题公平性探研[J]. 河北师范大学学报(教育科学版), 2016, (11): 105~110.
[3][10][11][13][15][19][21][23][25][27][28]王后雄. 高考命题公正的现实困境与两难选择[J]. 教育研究, 2008, (8): 24~31.
[5]郑若玲. 苦旅何以得纾解——高考改革困境与突破[M]. 南京: 江苏教育出版社, 2011: 125~136.
[6]王后雄. 新课程下高考理科综合考试评价标准及试卷结构技术指标构想[J]. 教育与考试, 2008, (4): 21~23.
[7]Educational Testing Service. ETS Standards for Quality and Fairness [EB/OL].[2017-06-30].http://www.ets.org/about/fairness.
[8]王后雄, 孙建明, 陈成华. 高中化学试题命制的常见问题诊断分析[J]. 中国考试, 2013, (4): 3~12.
[9]王新凤. 新高考考试科目设置的公平性问题研究[J]. 重庆高教研究, 2020, (1): 15~18.
[12]蔡伟. 地域差异对高考命题公平性的影响及对策研究——以高考语文命题为例[J]. 湖北招生考试, 2009, (2): 53~56.
[14]刘海峰. 高考改革中的公平与效率问题[J]. 教育研究, 2002, (12): 21~26.
[16]王后雄. 新课程标准下高考命题若干技术难题刍论[J]. 考试研究, 2007, (2): 11~16.
[17]王新凤, 钟秉林. 新高考公平性问题及应对策略研究: 基于浙沪经验[J]. 国家教育行政学院学报, 2019, (4): 38~46.
[18]教育部考试中心. 高考数学测量理论与实践[M]. 北京: 高等教育出版社, 2006: 270.
[20][24][26]雷新勇. 大规模教育考试: 命题与评价[M]. 上海: 华东师范大学出版社, 2006: 159, 89, 160.
[22]刘秀苑, 钱扬义. 对“3+X”综合能力测试热点问题的思考[J]. 中国考试, 2006, (5): 12~15.
[30]Ruth Axman Childs. Gender Bias and Firirness [J]. Practical Assessment, Research & Evaluation, 1990, 2(3): 1~3.
[31]刘海峰. 高考改革论[M]. 杭州: 浙江教育出版社, 2013: 16~19.
[32]中国高考状元性别调查女状元称霸全国18省[EB/OL]. http://ah.sina.com.cn/news/s/2015-06-24/detail-ifxefurr1843431.shtml, 2020-07-06.
[34]刘海峰. 高校招生考试制度改革研究[M]. 北京: 经济科学出版, 2008: 65~69.