高考改革,评价与考试技术需要有哪些突破

2015-01-08 07:17姚春艳张勇
湖北教育·综合资讯 2014年11期
关键词:技术难题学业考试

姚春艳+张勇

2014年9月4日,《国务院关于深化考试招生制度改革的实施意见》(以下简称《意见》)正式发布后,引来各方热议。对这次具有里程碑意义的考试招生制度改革,支持者众多,也不乏质疑者。

评价与考试领域内的研究者们,更关注的是《意见》中关于考试招生制度改革方案所必须要解决的技术难题,以及怎么解决这些技术难题。前者关系到高考改革能否取得预期的效果,后者则关系到这些技术难题能否得到真正解决。

就评价与考试实施及其能否达到预期目标而言,需要解决的技术难题则主要包括以下三个方面:

高中学业水平考试作为高考成绩的依据之一,定位于标准参照性考试还是常模参照性考试,做学科成就评价还是学科能力评价?

《意见》指出,“学业水平考试主要检验学生学习程度,是学生毕业和升学的重要依据”。这意味着高考成绩中,高中期间的学业水平考试成绩将成为重要的组成部分,将学业水平考试成绩纳入高考成绩范畴,主要目的是为了“引导学生认真学习每门课程,避免严重偏科”,这种促进学生全面发展的政策导向,显然毋庸置疑。

毕业与升学的目的、性质不同,技术实现的要求也不相同。在理论上,毕业考试属于成就性检测,采取标准参考性考试;升学考试则更侧重能力性或倾向性检测,采取常模参照性考试。我国现在的中考,承担着学生毕业和升学两种考试要求,两种目的和性质不同的任务,给中考的技术实现造成难以解决的困扰。如此,就给考试招生制度改革提出了第一个技术难题:高中期间的学业水平考试的定位,是标准参照性考试还是常模参照性考试、是学科成就评价还是学科能力评价?

这两类考试的目的、性质和适用的情形是不同的。标准参照性考试的结果解释,在以下两种情形中更有意义:其一,一门学科的难度水平呈递增趋势,学生需要达到一定熟练水平才能进行下一阶段的学习,如数学科目中,学生如果不掌握长方形面积的计算方法,就无法计算长方体的体积;标准参照考试结果可以用来反馈学生已经达到的水平。其二,用于诊断学生在某门学科中知识、技能掌握的情况,为教师制定教学、辅导改进方案提供参考信息。而常模参照的结果解释在下列情形中更有意义:学科内容不是按照从易到难排列的,达到特定知识、技能水平并不是影响学生下一阶段学习的关键因素;选拔和预测成功可能性时,常模参照的结果更为适用。

标准参照考试结果用于了解学生在一门学科中究竟掌握了什么,达到了什么程度,而常模参照考试结果则用于区分学生之间的能力差异。除了结果应用上的差异,两种考试在试题编制上也存在较大差异。标准参照考试,测量的是学生对于一门学科所学内容掌握的情况,是对过去所取得的学业成就的测量,因此试题的编制要指向学过的内容,不强调试卷的区分度;而常模参照考试关注的是学生之间能力的差异,试题的编制要指向学生形成的学科能力和未来发展的潜力,对试卷的区分要求以及对未来预测的要求是必不可少的。

高中学业水平考试结果将成为高考招生的重要依据,教育部解读《意见》时也说明,学生可以依据自己特长以及高校要求,选取任意三科计入录取成绩。根据《意见》及解读,学业水平考试的成绩已经被赋予了人才选拔和预测成功可能性的功能,而且需要反映高校对特定人才的要求。这就意味着,学业水平考试应该是一种常模参照考试,而不应该是标准参照考试。而常模参照考试的试题编制以及成绩呈现方式都有特定的要求,与群体比的结果是常模参照考试中必不可少的报告方式。如果将高中学业水平考试定位于标准参照考试,不仅测量的内容不足以反映学生的能力和未来发展潜力,等级评定的结果呈现方式也会淹没大量的有效信息,使招生单位无法做出有效判断,导致的结果只能有两个:一种情况是,录取最终还是会以统一考试的成绩为主要参考依据,学业水平考试的结果最终会沦落为一

个“中看不中用”的花瓶;另一种情况是录取参考了学业水平考试成绩,但录取的学生在进一步学习中的胜任度较差,高考作为人才选拔的一种重要方式,其功能不能得到有效的保证。

因此,高中学业水平考试,究竟定位在标准参照性考试还是常模参照性考试、是学科成就评价还是学科能力评价,是考试改革必须要解决的首要难题。

允许两次考试的科目,如何解决不同次考试之间的等值问题,从而确保学生所选择的高分是能力的体现而非考试差异所导致

根据教育部对《意见》的解读,学业考试每门课程学完即考,同时鼓励为学生提供每一个科目两次参加考试的机会。对于统一考试中的英语,也将采取两次考试,择优计入成绩的方式。允许学生多次考试,成绩择优计入是为了解决“一考定终身”的弊端,这是高考改革的一大进步。然而,由此而带来的技术难题是不同次考试试卷之间的等值问题。

等值问题如果不能妥善解决,学生的分数高低就不是学生学习成绩或能力的真实体现,而是试卷编制差异的一种结果。如果两次考试之间存在差异,意味着相同的分数或等级并不代表相同的成就或能力水平,两次考试成绩之间是无法直接比较的。举例来说,同样是80分,在全体考生的平均水平是75分和81分两种时,意义完全不同。不仅如此,80分的构成不同,代表学生掌握的知识、技能和能力结构也会存在较大差异,在以记忆为主的考试中获得的80分和在以问题解决为主的考试中获得的80分,所代表的学生能力完全不同。

相同科目的不同次考试之间的成绩,如果不能实现科学可靠的等值转换,所导致的结果也有两个:原本是为了减轻学生负担的制度设计,会变成逼迫考生必须考两次的政策;招生单位按照来自不同考试中的相同分数录取学生,学生会表现出较大的能力差异,高考对人才甄别和选拔的功能受到严重影响。无论哪一种结果,都将导致高考改革的良好意愿落空。因此,不同次考试之间的等值问题是考试改革要解决的第二个难题。

“两个依据,一个参考”的高考成绩报告,如何呈现才能为招生学校提供更丰富,更有效的信息,从而实现高校特色、专业特点与考生特质之间最大程度的匹配?

迄今为止,我国高考成绩的报告方式,依旧采取的是各科原始分及其简单加总的报告方式。这种成绩报告方式的弊端早已有学者论述过。这次《意见》中也明确提出要完善成绩报告方式。这就提出了本次考试改革的第三大技术难题,即以“统一考试和学业水平考试为两个依据,综合素质为一个参考”的高考成绩报告,应该包含哪些指标和数据才能为招生单位提供更丰富、更有效的信息,从而实现高校特色、专业特点与考生特质之间最大程度的匹配,使高考选拔人才的功能得以充分实现,也为学生选择最适合的成才之路提供重要参考。

教育评价与考试共存在四种比较方式:与标准比,与群体比,与他人比,与自己比。每一种比较方式都有其特定的意义。与标准比能判断学生达到标准的程度,与群体比能判断学生所处的层次与水平,与他人比可以判断学生的竞争力,与自己比则可以发现学生的发展态势。对于招生学校而言,成绩报告中提供的比较方式越多,对学生整体的判断也就越清晰越准确。多元智能理论对于人才的新定义则是八类不同的智能代表了八类N种不同的人才,每一门学科都至少包括3种以上的智能组合。单一的学科成绩并不能可靠有效的确定学生的智能发展类型,多科综合才能确保学生的智能结构更接近学生的真实情况。这意味着,新的高考成绩报告单要把统一考试、学业水平考试所考察的能力要素整合起来,形成学生特有的能力结构报告,才能为招生学校提供更有效的参考信息。这样的能力报告与高校特色以及专业特点匹配度越高,学生的成才机率也就会越高。然而,这样的报告要怎样采集数据,怎样合成,通过什么技术手段处理才能保证每年如此多的考生及时拿到自己的成绩报告,却并非是一个容易解决的问题,所面临的挑战之大也是前所未有的。

历史上所有重大变革,都离不开技术突破。这次高考改革方案想要落地并取得成功,评价与考试技术也必须要有重大突破。

作者

姚春艳

公众教育研究院、公众考试研究院副院长;

张  勇

中国教育学会中小学教育质量综合评价改革实验办公室副主任、公众教育研究院、公众考试研究院院长。

猜你喜欢
技术难题学业考试
艰苦的学业
张建东钻探技能大师工作室:致力技术难题攻关 提高钻探施工能力
中国船级社“深远海技术难题”入选中国科协2021年度10大工程技术难题
十大林草科学问题和工程技术难题遴选结果发布
音乐提升学生学业表现
树起学业担当之心
35
公 告