关于高考分省命题存废的探讨——教育与心理测量学的专业视角

2013-11-08 08:06:22张敏强王小婷
中国考试 2013年8期
关键词:教育部考试中心命题试题

张敏强 王小婷 徐 桃

1 前言

近10年来,参加高考的人数年均超900万人,其中2008年更高达1 050万人次,虽然从2009年后高考人数有所下降,仍维持在参与人数超多的水平上。而每年高考的关系人则达5000万人以上(包括考生本人、考生父母、考生祖父母、外祖父母;为高考服务的机构、学校考场考点的保卫安全卫生人员、监考改卷评分老师;考试管理人员,直至交通警察、城管等),所以,高考绝对是我国的第一大考,也是世界的第一大考。而在极大多数考生和家长看来,高考更是关系到人生发展的头等重要大事。

表1 2006—2012年参加高考人数及录取人数、比例① 根据教育部网站发布的中华人民共和国教育部历年的《全国教育事业发展统计公报》和《中国考试》2007年第8期普通高考大事记整理而成。

恢复高考30多年来,高考为国家公平、准确、规范选拔人才做出了巨大的贡献。尤其是在高等教育资源有限的条件下,高考在高等教育发展中不断改革和完善,最大限度地实现了人才科学选拔的功能。而高考命题是涉及高考准确性、公平性的关键因素之一。所以,参与高考的考生、毕业班任课教师、各中学,对高考内容形式、考试方式予以了极高度的重视。因此,统一命题还是分省命题在高考改革过程有争议是正常的。

从高考发展历史来看,1977年因招生时间关系曾经组织过分省命题。1978年后,除个别高考改革试验区的省市外,一直实行全国统一命题,其中1985年,上海率先实行自主命题试验。至2000年,教育部考虑到地区的差异及其他因素,决定在全国实施高考分省自主命题。到目前为止,全国已有16个省市(上海、北京、天津、辽宁、江苏、浙江、福建、湖北、湖南、广东、重庆、山东、安徽、江西、四川和陕西)实施自主命题。

2 高考分省命题的利与弊

2.1 命题的安全性

安全是高考的生命线,由于高考本身的高风险、高利害特点,要求必须公平、公正,而且要高度保密。分省自主命题由原来教育部考试中心一个命题组扩大为17个命题组(即教育部考试中心命题组+16个分省命题组),这在客观上使得高考命题队伍扩大了十几倍。与此同时,涉密人员的范围也相应扩大,从而大大增加了命题组织管理的泄密风险。

“由于自主命题一般从本省中挑选命题人员,命题人员和教师互动的概率,较之从全国范围挑选命题人员的全国统一命题肯定更大。因此,自主命题一方面减少了因一省泄题波及全国的风险,但另一方面,在抵御高押题率、人情请托和特权干涉等方面,却可能低于全国统一命题。由此也会带来新的公平问题。”

由此可见,分省命题并不能减少泄题的风险,反而使得影响高考安全性的因素更多更复杂。要做好高考的安全性工作,除了要规范命题组织管理,提高保密意识,加强安全保密各个程序和环节的管理,完善考试应急的处理机制外,减少接触关键机密的人或建立良好的防泄密机制也是需要考虑的因素。

2.2 命题队伍的质量

除了安全性外,命题的科学性又是另一个重要的问题,因为题目质量的高低直接关系到考生的前途和命运。高质量的试题取决于两个方面,一是既有学科专业知识,又具有教育与心理测量学知识的高水平命题队伍,二是高水平的考试命题组织管理。前者要求参与高考命题的专家既要了解高校的招生需要,也要了解当前高中教育的现状,对所命题的学科有较高的造诣和宽广的专业知识,此外还应具备足够的教育与心理测量学知识,这样才能命制出科学有效的试题。后者对教育考试管理机构有着严格的要求。在分省命题前的20世纪80年代末至今,教育部考试中心组织的全国高考的命题质量较高,得到基础教育、高等教育部门及考生、教师的充分好评。作为我国专门的考试机构,教育部考试中心对考试命题的组织管理积累了丰富的经验,可以在全国范围内遴选命题专家,同时注重命题专家队伍的稳定性。落实待遇及与输送学校互动,以及命题专家教育与心理测量、统计专业知识的培训,每年考试后的总结提升交流会,都对命题专家的命题水平有很大的帮助,从而又用于下一年度的命题。由此循环,试题质量的提升和命题的水平提升则是水到渠成。而分省命题只能在本省范围内物色命题专家。更困难的是,一个省内的专家难以连续多年甚至10年参与命题,特别是各省命题都采用入闱1个多月的方式,则使得一些高水平的专家望而生畏,命题专家队伍缺乏延续性。此外,各个省份的发展不平衡,如东西部差异等,有些省份高校较少,缺少综合类重点高校,较难组织一支高质量的理想的命题专家队伍。

从近几年的实践来看,有些自主命题的省份,缺乏稳定的命题队伍,有的甚至以中学教师为主,或命题人员一年一换,延续性差。经验与教训的总结都不能得到有效的延续,导致分省命题的高考试题“一年难、一年易”或者内容与知识和能力考查的匹配性不足这些常见现象。

2.3 命题的科学性

现代教育与心理测量学认为,命题是测验内容和形式的重要环节,为了更加公平地选拔,在命题方面必须考虑到效度、信度、难度、区分度等测量学指标。研究表明,学生的考试测验成绩除了主要受到考生的能力水平层次影响以外,试题对考生作答表现的影响也是非常重要的。

在某些时候考生的测试成绩不理想,并非一定是考生的能力水平所致,可能是因为命题的内容及考查的能力要求并不适合考生作答。首先就区分度而言,区分度指标能够指导命题教师更科学地命题,以达到测验区别不同水平考生的目的。高区分度的试题能将不同能力水平的考生区别开来,低区分度的试题应该进行修改或淘汰。其次试题的信度高,表示测量较为准确,测量误差较小;信度低,表明测量误差较大。信度低的考试无法正确评价考生的知识水平与智能素质。从历年高考后教师和考生的反应来看,有些分省自主命题的试卷没有严格按照教育部统一制订的《考试大纲》命题,出现“超纲”现象。再次,难度是反映试题或考试难易程度的重要指标,它反映了考生对试题或考试是否适应。试题太难或太易都无法反映学生的实际水平。试题太难了,高分学生与低分学生都做不出来;试题太容易了,高分学生与低分学生得分都差不多。最后就效度来说,它是指测量工具或手段能够准确测出所需测量的事物的程度。测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。华中师范大学考试研究院鲁子问教授曾经将2005年全国统一命制高考英语试卷的作文试题与分省命题省份命制的高考英语15道作文试题质量进行定性和定量的对比分析,结果表明:分省命题作文试题与全国卷作文试题相比,试题效度存在较大差距,分省命制的作文试题73.3%不是以外国人为写作交际对象,语用目的不合理。

可见,高考作为全国范围内的选拔性的考试,要把人才选拔出来,把学习能力和知识掌握好的学生逐渐选拔出来,必须运用专业的教育与心理测量学理论与方法,既要在难度方面,把握简单题和难题的百分比,同时要提高试卷信度,还要在效度和区分度方面,要根据招生的人数和录取的人数,做出适当的调整。要避免报考人数少、录取名额多的情况出现。也就是说命题者应在命题前接受教育与心理测量学、统计学的专项培训。只有学科知识与教育与心理测量知识有效地结合,才能保证高考命题的质量。

2.4 命题的经济性

据了解,“国家教育部考试中心统一命制高考试题的总成本每年是150万元左右,而参加分省单独命题每省要花费400万元,有的省花费高达600元万。”2012年各省市参加高考人数,河南省约为82.5万人,居全国之首;最少的为青海省3.8万人,上海市5.5万人。16个分省命题的省市2012年考生总数约为548万人,其他省市总数为367万人。若按16个分省命题省市每年每省市花费400万元,则分省自主命题共要花费400×16=6 400万元,考生人均11.68元。以教育部考试中心每年高考统一命题成本150万元来算得话,参加教育部考试中心的考生人均命题费约为0.41元。分省命题的人均成本是统一命题的28倍多,可见分省命题的经济成本远远高于统一命题,这直接加重了考生的经济负担。有的省市,命题教师与负责守卫的武警几乎达到1∶1的配置比例。这不仅给命题专家带来极大的精神压力,也造成社会资源的极大浪费,使得有限的教育经费没有发挥应有的作用。

也许有人会认为高考分省命题,各个省份就可以按照本省的实际情况和地方特色来出一些有针对性的试题。但是这种地方适应性在事实上,只能在语文的部分题目中,如作文题中得到体现。其他科目如数学和英语是不需要具有地方适应性的特点,对这些科目的分省命题往往是增大了命题成本,造成资源的浪费。更重要的是,高考命题主要是为了针对各高校各专业的招生需要,为高校的招生选拔提供支持,若把重点放在满足地方适应性上,未免喧宾夺主了。因此,高考的命题应当以满足高校的需求为首,考虑地方特色则是次要问题。

2.5 命题的公平性

高考实行分省命题,在很大程度上使全国失去了一个统一的衡量标准,这对比较各省教育水平、衡量新生的教育质量都带来了消极的影响。可以说,分省命题以一种更为隐蔽的方式,掩盖了各省区入学机会不均等的问题。近20年来,高考分数向落后地区倾斜的同时,也更多地向教育资源丰富的大城市倾斜,这显然有悖于考试公平的原则。

在高考分省命题的制度下,被同一所高校所录取的不同生源地学生的能力水平不一,有些省份间的差异可能达到十分显著。国内普遍存在着高校对其所在省份的招生指标远大于其他省份的现象。教育地方保护主义十分明显,招生名额的划分缺乏充分科学的依据,教育资源的分配更加不平等。

2.6 高考的评价功能

教育部明确指出,高考命题要坚持以“两个有利于”为指导思想,即有利于高校选拔新生,有利于基础教育质量提升。第一个有利于是指高考的选拔功能,要为各个大学选拔出优秀的人才。而第二个有利于是指高考的评价功能,高考要为基础教育,特别是中学教育教学提供有关考试的信息及教学反馈信息,以有利于中学改革教学及提高教育质量。近年来,高考分数的作用不但没有被削弱,在一些省份实施“平行志愿”后,高考分数的绝对作用还被强化。而高考的评价作用,不但没有得到保持还有所减弱。特别是由于分省命题的不断扩大,由于教育部考试中心整体调控或指导作用被弱化,使用其试题的省份成为少数,所以,教育部考试中心自身职能中的考试指导作用被弱化;另一方面,由于各分省命题省份的考试部门原来都只是考试的组织管理部门,并不是专门的命题机构或考试研究部门,在题库未建立、缺乏经验、缺乏专业人才、缺乏持续性和稳定性的命题队伍的情况下,能完成高考命题任务已经很难得了,开展评价工作则成为一种奢谈。

3 保证高考命题科学性的建议

3.1 建立稳定的命题队伍,保障命题的质量和科学性

高考是大型的国家考试,高考试题的科学性和规范性直接关系到高考的选拔性和评价性功能。

首先需要一支优秀的稳定的命题队伍。科学的命题需要优秀的命题教师,分省命题教师队伍由于只能在省内范围选择,命题教师的水平低于国家教育部考试中心。这样,由于各省命题水平、组织水平的不一致,分省命题的试题质量并没有得到保证。此外,分省命题教师队伍不稳定,变动大,这也在客观上导致了每年的高考试题难度不一,有时甚至变化很大。这对于考生来说,存在不公平。此外,因为参与命题教师的流动性,前一年的教训或经验未能在新的命题人员中得到启示,而新参与的命题人员也难以在短时间学习掌握教育与心理测量学的专业知识。

其次应对命题的质量进行统一严格的控制。命题质量是命题科学性的主要体现,是保证高考选拔和评价机制公平性、准确性的重要保证。但是在分省命题题目的编制中,因为题目资源的缺乏及保密的困难,很难预测,大多是根据经验作判断。结果是导致题目质量不高,试卷信效度不高,不同学科之间难度控制无法协调。同学科不同年度的难度程度摇摆不定,对学生备考,教师教学开展都不利。更为可悲的是,一些省市考试部门为了掩盖命题质量不高的事实,不愿、也不敢公开高考的真实数据,以“保密”为言辞掩饰。这种现象周而复始,导致恶性循环,更使得命题质量得不到提高,对高考的批评也就越来越多。所以,考试部门不要把命题完全当作是一项政治任务,而应将其当作一项技术活,它有其自身的科学性、专业性,需要得到充分的尊重,而命题队伍的专业知识提升应有长远的规划和实际实施。

3.2 重视教育与心理测量学技术,通过等值实现各省高考分数的可比性和质量监测

高考的一个目的是为高校选拔人才,另一个目的是为提升基础教育质量服务。作为全国第一大考,所获取的数据信息是具有很高的价值,但是,分省命题因为题目质量及各地考试机构没有能力或者不愿意对自己的命题情况作出评价。一方面,分省命题导致不同省份之间学生的成绩很难比较,这已经成为分省命题造成的广为诟病的问题。运用现代教育与心理测量理论方法,事先进行合理等值设计的高考试题,是可以实现不同试卷甚至试题之间的等值,这样就可以比较不同省份的学生的能力水平,从而有针对性地制定措施。另一方面,高考是我国最大规模的考试,可以获得全世界最大、最丰富的关于考试的数据资料,运用现代教育与心理测量理论方法可以对试题数据进行全面且准确的分析,从而了解学生在每道题的表现,清楚地了解学生的认知水平,实现高考的评价功能。

这些就亟须建立一支既有学科专业背景又掌握现代教育与心理测量理论方法的专业命题队伍。首先,通过现代教育与心理测量方法,建立相关模型,事先对试题进行等值设计,如非等组锚题设计等。通过等值的技术可以实现使用不同试卷或试题的考生之间进行能力的比较。其次,通过现代教育与心理测量理论方法,对考生内部知识结构的评价,实现对教育质量的有效监测,有利于国家提升教育水平和质量。

但是国内少有人懂得和应用常规的、最新发展的测量和统计理论和方法,导致高考数据资源的巨大浪费,而各省市的力量很难保证都能拥有这样的专家学者对试题进行事先专门的等值测量设计,以及对考生的考试数据进行反馈和监测,所以,应由教育部来统筹完成。

3.3 改革命题机构的组织与管理体制,促进高考的科学性、公平性、准确性

拥有稳定的优秀的命题队伍,统一把控试卷的质量,组织教育与心理测量理论的专家事先对试题进行等值设计,这不是各个省市单独地凭借自己的力量就能够实现的,这需要在全国范围内建立一个统一的组织来承担这些任务。在此基础上,我们可以考虑在全国建立多个专门的非盈利的考试机构,类似美国的SAT测验,它是美国大学录取中的一个标准化测试,也是美国各大学申请入学的重要参考条件之一,相当于中国的高考。该测验就是由美国大学委员会(大约4 300所美国大学共同组成的文教组织)委托美国教育测验服务社(Educational Testing Service,ETS)进行命题、印刷和评分,定期举办的世界性测验,而SAT考试正是隶属于由非营利性机构大学理事会(College Board)。设置专门的考试机构既可以在经济上有效地避免由分省命题带来的资源浪费,又可以保证命题的科学性,实现不同试卷甚至试题的可比性,避免地域差异和发展水平造成的不公平性,同时还能拥有强大的高考数据分析能力,提供考生的学业诊断报告,而不只是单纯的测验分数。

而在近年来兴起的自主招生政策,也可委托专门的考试机构为各校不同的招生要求设计出不同的考试试卷,以此作为申请入学的门槛或者其中的参考指标,如申请国外学校需要提供的TOFEL或雅思成绩,再结合高校各自组织的面试,实现对考生的全面真实的考察。这有利于缓和目前国内高考自主招生“北约”、“华约”、“卓越”三大联盟抢夺优质生源的大战,或考生为自主招生疲于奔波于各地方考场的现象。

4 总结

当然,任何事物的发展都有一个循序渐进的过程,尤其是对于关系到上百万人上千万家庭的高考制度,任何的改革都要经过深思熟虑,且要有相对完善的计划。在此,我们提出了建立专业的考试机构的构想。通过逐步消化,将分省命题的工作变成由国家权威教育部专门统筹下,成立3~5个考试命题机构,每年可以完成30~50套高考试卷,由各省按各自特点选用。也可以各省提出自己的特殊要求专门命制等。这些试题,可以通过等值模型进行等值,命题由专业机构完成,从而使得题目质量高,成本低廉且更有效率。要完成这个艰巨的任务,就要解放思想,在全国范围内组建4~5命题及考试研究机构,非企业组织的机构,不以营利为目的,由国家适当补贴。这样,既可以保证最高水平的专家参与工作,又能兼配各省的特点,也确保资源不浪费,减轻纳税人的负担。当国内建立4~5个考试命题及评价的非营利性机构时,各省甚至各院校都可以自主选择他们提供的产品(考试卷),通过良性竞争,使考试及评价都提升到一个新的水平。此外,各个考试机构之间也可以有密切的联系,在不同的试卷中设置“锚题”,这些就能通过教育与心理测量学中的等值技术实现试卷甚至试题参数的等值,对参加不同试卷考试的考生的成绩等值,实现考试的公平性。

综上所述,建议国家主管部门采取措施,边建设考试机构,边回收各省的命题权,逐步走向招考分离,走向更加公平公正的高考招生考试方式。

[1]郑若玲.高考改革必须凸显公平[J].教育研究,2005(3):36-37.

[2]鲁子问.保证分省命题的科学性[N].中国教育报,2006-9-27(第7版).

[3]教育部阳光高考指定平台:阳光高考:http://gaokao.chsi.com.cn/z/2013gkbmfslq/bmrs.jsp.

[4]李立峰.高考分省命题不是改革的必然方向[J].粤海风,2011(1):21-24.

[5]张敏强,高艳红.高考的评价功能不可缺失[J].中国考试,2011(2):11-15.

[6]张敏强,黎光明,刘晓瑜,焦璨.教学管理与评价的测量技术:测验等值的理论、方法及应用 [J].教育研究与实验,2009(2):54-57.

猜你喜欢
教育部考试中心命题试题
2021年高考数学模拟试题(四)
情报站
环球时报(2020-04-27)2020-04-27 04:17:50
雅思考试费2020年调整为2170元考试日期已发布
留学(2019年21期)2019-11-23 05:57:06
2019年高考数学模拟试题(五)
《陈涉世家》初三复习试题
2019届高考数学模拟试题(二)
教育部考试中心网上测试卡
下一站命题
赏高考真题,品命题思路
2012年“春季擂台”命题
对联(2011年24期)2011-11-20 02:42:38