我国高考测评方式研究

2012-04-29 00:44曹姗万文涛
考试周刊 2012年5期
关键词:纸笔测验校本

曹姗 万文涛

摘要: 目前世界各国主要采取五种考试测评方式,分别是纸笔测试、面试、推荐、校本评核及自适应测验。作者采用专家咨询法建立了高考测评方式评价指标体系,并用层次分析法对这五种测评方式进行数据分析,认为我国应建立以纸笔测试为主,多种测评方式为辅的考试测评体系。

关键词: 高考测评方式评价指标体系层次分析法

高考一直是我国为高等学府选拔优秀人才的重要制度,也是现阶段最公平、公正的选拔方式。自高考诞生以来,最主要的测试方式就是纸笔测试。纸笔测试的优点在于易于操作,也相对公平公正,但也存在明显的缺陷:一则难以全面考察考生的综合素质和能力,二则存在“一考定终身”的弊端。因此,单一的纸笔测试已不能适应社会多元化的选才需求,高考需要更加多元化的测评方式。目前,世界各国的考试测评方式主要有五种:一是纸笔测试,是目前各国主要采取的测评方式。二是面试,国内多数自主招生的高校会增加这种测评方式,上海交通大学和复旦大学等还尝试了以面试取代传统高考的改革。三是推荐。在国外,推荐信是多数大学必备的申请条件之一。我国北京大学从2010年开始也采取了由中学校长实名推荐上大学的方式。四是校本评核,即由学校任课老师评核本校学生的表现,将学生的平时表现和教师的主观评价综合打分,计入学生的公开考试成绩。目前很多国家的高考方案中包含校本评核成绩,如加拿大、英国、澳大利亚、荷兰、美国。我国香港在中学会考和高级程度会考中都推行了校本评核。五是自适应测试(简称CAT)。利用项目反应理论建立考试题库,以人机对话的方式的答题,计算机根据答题者的答题水平自动抽取下一个与考生水平相近的题目,以测出考生的真实水平。CAT在世界范围内的很多大型考试中得到应用,如TOEFL、GRE、美国的医生护士资格考试及军事服役职业能力测验等。而在我国CAT还处于技术开发阶段,许多学者预测随着我国高考题库的建成,未来高考有望实行自适应测验。究竟哪种测评方式最适合中国的国情,能最大效度地选拔高等人才?我们通过建立高考测评方式评价指标体系、运用德尔菲法、层次分析法对这五种测评方式进行分析。

一、建立高考测评方式评价指标体系

本着建立评价指标体系的一般原则,结合国内学者在考试评价方面的学术成果,我们拟定了五个一级指标,即公平公正、科学组织、利于选拔、正确导向和成本代价。五个指标的具体内涵为:(1)公平公正:考试的内容、形式公平。政策平等,统筹城乡差异;考试的过程及结果公正公开;无徇私舞弊,考试成绩可比较、调剂。(2)利于选拔:测评方式既注重基础性又突出选拔性,能有效测出考生的素质、特长;利于高校选择不同的人才。(3)科学组织:测试的形式科学,易于组织;测试的内容科学,紧扣教学大纲;测试的方法科学,便于识别人才。(4)正确导向:引导中学实行素质教育;引导学生树立自我教育观、善于自我评价;引导高校、用人单位乃至全社会正确、全面评价人才。(5)成本代价:考试组织方和考生个人付出的考试成本,包括经费、时间、精力投入以及为准备考试而牺牲的机会成本。

二、用德尔菲法确定指标权重

徳尔菲法又称专家咨询法,是一种使用广泛的、具有权威性的方法。它采用通讯方式分别将所需解决的问题单独发送到各个专家手中,以打分的形式征询意见,然后回收数据进行统计,整理出综合意见。随后将该综合意见和预测问题再分别反馈给各专家,进行第二轮咨询。这样多次反复,逐步取得比较一致的预测结果。本研究选择了省内外的24位专家、学者,包括江西师大的教授、南京师大的相关学者、在教育第一线的校长和高中教师等。进行三轮咨询后,指标权重分布见表1。

三、层次分析法优选高考测评方式

层次分析法,简称AHP,由20世纪70年代中期的美国运筹学家托马斯·塞蒂提出,是将与决策有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。

在确立了高考测评方式评价指标权重的基础上,我们运用层次分析法进行优选。

(一)建立层次结构模型

根据研究,我们建立了如下三级层次模型:

(二)构造判断矩阵

根据各层次各因素的相对重要性做出判断,用数值表示出来构成判断矩阵,便可得出判断矩阵对于总目标决策而言本层次与之有联系的因素的重要性次序的权值。根据德尔菲专家咨询法的统计结果,对于高考测评方式总目标的决策而言,各一级指标的重要性的判断矩阵见表2:

对该表进行一致性检验:λmax=5.1854;CI=0.0414;RI=1.12;CR=CI/RI=0.037<0.10。(注:λmax为判断矩阵的最大特征根,CI为一致性指标,RI为同阶平均随机一致性的指标,当CR=CI/RI<0.10时,判断矩阵具有满意的一致性。以下相同。)

下面从这五个指标依次比较各种考试测评方式。

1.公平公正

我国人口众多,每年有上百万的学生参加高考,公平公正是人才选拔的首要要求。最早诞生的纸笔测试因为采用统一的试卷,统一的考试的时间和地点,集中的阅卷方式,考试结果向全社会公开并接受社会监督,具备公平和考核的双重作用,沿用至今。面试是伴随着高校自主招生而诞生的,多数由招生的高校自己组织进行。在中国这个历来重视人情关系的社会中,很难做到避开人情、背景、权利等因素完全依据考生面试表现做出公正的评价。推荐方式自2010年北京大学首次推行后,得到了一定的舆论支持,但也遭了不少的非议。从公平公正方面考量,一是具有推荐资格的都是教育强省的重点学校,边远地区的普通学校没有推荐资格,造成了招生不公平;二是中学校长的权利过大,给权力寻租提供了空间,容易导致招生腐败,给候选学生带来不公正的入选结果。校本评核主要在英国、澳大利亚等教育发达国家实行。普遍认为由学校任课教师来评核学生的平时成绩的公正性需要建立在完善的诚信制度和法制制度之上。计算机自适应测验在人机测验的过程中是每个人对应不同水平的试题,题库具有全面性、保密性,考试过程相对公平公正。但是由于城乡学生对计算机操作的熟练程度不同会影响答题速度,也造成了一定的不公。

相对于公平公正而言,各测评方式的相对重要性的判断矩阵见表3:

对该表进行一致性检验:λmax=5.1898;CI=0.0424;RI=1.12;CR=CI/RI=0.0378<0.10。

2.利于选拔

纸笔测试采用或全国统一或分省命题的试卷,注重考查基础知识和基本技能,难以测量考生的素质、个性和特长。且考试方法单一,不能满足不同学校不同专业的选拔需要,不利于考生和高校的供需匹配。面试的选拔标准和形式灵活多样,最能反映出考生的真实信息,既有利于学校根据需要选拔合适的目标人才,又有利于考生展示自己的个性特长,选择适合自己的高校,是一个双向选择的过程。推荐产生的宗旨即是“不拘一格选人才”,目的就是推荐“怪才”、“偏才”上大学,在一定程度上提高了特殊人才的选拔效率。但由于多种原因,最终选拔的结果并不全是真正的有特长的人,且选拔的范围和名额也有限,难以兼顾所有符合条件的考生。校本评核体现了“多样化的评价方式”,实施的是全方位、个性化的过程性评价,提高了测评的效度。由于详细记载了考生的平时成绩和社会活动等,有利于高校选拔到全面发展的学生。自适应测验相当于为每个考生“量身定制”一个测验,从而对考生的能力水平进行更为精确的测量,有较大的区分度,但该技术还处于发展阶段,除了能力水平以外的其他技能还不能全面测量。

相对于利于选拔方面而言,各测评方式的相对重要性的判断矩阵见表4:

对该表进行一致性检验:λmax=5.1830;CI=0.0408;RI=1.12;CR=CI/RI=0.0364<0.10。

3.科学组织

纸笔测试在我国高考中的组织形式为统一高考,即统一命题、统一考试、统一阅卷。这种高度集中的组织形式能确保考试的信度、效度及权威性,但囿于测试内容的局限性、测试方法的单一性,难以全面测量考生质量。面试的时间、地点、人员都不统一,给学校、考生双方灵活性的同时,也可能存在组织管理上的漏洞,不够公开透明。考官和考生的面对面交流更有利于发现考生的素质特长,从而提高选拔的效度。推荐的程序相对而言比较简便易行,但各推荐学校实际的操作方式并不一致,有的甚至缺乏科学性。而由最了解考生的中学直接推荐其上大学,再由大学来审核,是一种便捷有效的选拔方式。校本评核实施的过程较为复杂,涉及考生高中三年全部的学习成绩、课程作业、社会实践、考试成绩、个人表现等多方面信息,而由任课教师对每个学生的个人情况进行汇总评价也是一个相当大的工作量。也正是因为此种方式注重过程性评价,对考生的考察比较全面细致,因而具有相当大的参考价值,便于高校根据不同标准选拔人才。自适应测验简单来说是将纸笔测试的卷子经过加工搬到了计算机上,考试的组织形式和纸笔测试相似。但不能排除计算机程序出故障或人为操作不当而造成的损失。

相对于科学组织方面而言,各测评方式的相对重要性的判断矩阵见表5:

对该表进行一致性检验:λmax=5.2419;CI=0.0540;RI=1.12;CR=CI/RI=0.0482<0.10。

4.正确导向

在倡导素质教育的教育理念下,高考采取单一的纸笔测试越来越遭到质疑和反对。“一考定终身”必然导致中学迫于压力试行应试教育,学生负担沉重,身体和精神都备受压力,不利于学生全面发展和身心健康。面试在人才交流频繁的当代社会是用人单位和多数高校普遍采用的选拔方式,也是一种直观、有效的测评方式。它侧重衡量除知识水平以外的个人素养、技术专长,利于引导学校和考生自己进行情商的培养。推荐这种特殊的选拔方式是对传统高考的改革。它给学科平均水平偏低但是有专业特长的人提供了一条成才之道,有利于学校和社会培养、接纳多样化的人才。校本评核对考生进行多方面的综合评价,既可以反馈高中教学质量,又能为大学提供资料参考。对平时表现的注重必然有利于中学实施素质教育,也缓解了考生一次高考的心理负担,也有利于诚信制度的完善。自适应测验的试题内容因人而异,具有很大的灵活性,在一定程度上减轻了考生的压力,也让中学没有了应试的方向,只能同等注重考试大纲的所有内容。

相对于正确导向方面而言,各测评方式的相对重要性的判断矩阵见表6:

对该表进行一致性检验:λmax=5.0680;CI=0.0152;RI=1.12;CR=CI/RI=0.0136<0.10。

5.成本代价

在我国现行的统一高考制度下,纸笔测试需要花费一定的组织费用。对考生来说比较方便节约,只需要在户口所在地参加一次考试且成绩可调剂,避免了跨省去参加考试的经济负担。高考面试除了要求考生的纸笔测试成绩外,还要由招生的高校单独组织面试招生,无疑是添加了一道考试程序,且标准不一,考生成绩无法调剂,增加了经济和心理压力。推荐在成本花费上是相对较少的,考生不需要参加专门的升学考试,招生部门也无需花费大量的人力物力来组织考试,而是由学校直接依据有关标准提供推荐学生名单给高校审核,省去了中间大量的备考、考试、阅卷的过程。校本评核因为需要统计的考生资料较多因而成本也较高。考生学校需要花费大量的时间和精力来记录和整理每个考生的平时成绩及社会活动记录材料;招生学校也要投入大量人员、经费来审核考生的材料,工作极其繁琐复杂。自适应测验是无纸化、自动化操作,比较节省人力成本,但大规模的计算机的配置及维护需要花费大量的资源。且不断进行题库更新、技术开发的成本也难以估量。

相对于成本代价方面而言,各测评方式的相对重要性的判断矩阵见表7:

对该表进行一致性检验:λmax=5.1719;CI=0.0384;RI=1.12;CR=CI/RI=0.0343<0.10。

五种测评方式层次总排序的计算结果见表8:

从计算结果可以看出,纸笔测试仍是最佳的选择,这是由中国特殊的社会历史背景决定的。中国是世界考试的发源地,悠久的考试历史形成了中国人倚重考试的传统,留传了千年的科举制对中国乃至世界的政治、经济、文化都有深刻的影响。但中国同时是一个人情社会,中国人做事讲究“天理、国法、人情”三个方面,因此在选拔人才方面,受人情关系的制约,古代的察举推荐逐渐演变成植党营私的手段,“文革”时期的“推荐”几乎成为“走后门”的同义词,后来的面试、推荐、评核方式也因受人为因素干扰太大,无法客观真实地反映出被推荐者的水平和表现。古往今来的无数事实一再证明,要维护社会的秩序,使人才能够通过公平的竞争脱颖而出,纸笔测试仍是一个有效的手段。

三、结语

根据前文的分析和数据统计的结果,我们认为现代高考应建立以纸笔测试为主、多种测评方式为辅的考试测评体系。在五个一级指标中,公平公正排在首位。因为在我国,高考与政治、经济、社会的各个领域密切相关,甚至影响着人一生的发展。统一的纸笔测试能保障所有考生拥有平等的接受高等教育的机会,有利于维护社会的公平和稳定,有利于教育均衡化发展,有利于提高国民素质和综合国力。但单一的测评方式有着不能全面测评人才质量的弊端,也不能满足高校和社会对各类人才的需求,也不利于中学实施素质教育。因此,我们建议维护高考采用纸笔测试的主体地位,同时采取多种辅助方式。一是分学科测试,探索个别科目实行自适应测验等社会化考试。据预计,大学英语四、六级将实行自适应测验。在中学的学业水平测试中,部分科目也可以尝试自适应测验。例如英语测试这样实际水平稳定性比较强的科目,可以考虑变为一年多次的自适应考试,选择成绩最好的一次作为报考的依据。二是健全社会诚信体系,试点采用推荐、校本评核。借鉴法国会考和澳大利亚的“全澳等级考试”,为避免一次考试的偶然性,应加强对平时表现的重视。美国等西方国家以及我国香港地区之所以能采用推荐信、档案袋、校本评核成绩等作为高考录取的依据,是与社会的诚信程度分不开的。受观念、体制的制约,以及社会升学压力、就业压力的影响,中国社会目前的诚信体系建设仍不健全。因此,推荐和校本评核方式还不宜广泛推行,只能在法制健全和有条件的地区试点采用。三是规范面试程序,增强面试技术的可操作性。目前面试最大的争议在于技术层面可能存在不规范、不公正的地方。为发挥该方式的优点,应在出题方式和考务方面都要严格按要求进行。

在全球经济一体化,提倡多元化、多素质人才的新时代,社会的发展也给教育提出了新要求。我们呼吁高考能适应新时代的发展要求,为高校选拔出多样化的人才。

参考文献:

[1]廖乃美,蔡烛昌.中外考试制度比较研究[M].武汉:华中师范大学出版社,2002,7.

[2]刘海峰.中国高考向何处去[J].北京大学教育评论,2010.2.

[3]万文涛,李坦英.我国高考模式探究[J].考试研究,2007.1.

[4]罗贵明.高考新模式的构建与思考[J].沈阳教育学院学报,2009.2.

[5]郑莹,宣力亢.“中学校长实名推荐制”的合理性与可行性分析[J].教育与考试,2011.1.

[6]蔡筱坤.香港公开考试的校本评核设计与推行[J].考试研究,2010.4.

[7]喻晓锋,秦春影.高校考试形式改革:从纸笔测验到计算机自适应测验[J].考试周刊,2009.9.

[8]温忠麟,罗冠中.高考方案:考试方式与计分方式[J].中国考试,2008.3.

本论文为校级课题《高考测评方式优选、优化研究》成果。

(作者曹姗系江西师范大学教育学院2009级硕士研究生;万文涛系江西师范大学教育学院教授、硕士研究生导师)

猜你喜欢
纸笔测验校本
“无纸笔”闯关,乐翻天
高中地理校本课程的开发与实施——以闽江环境保护校本开发为例
《红楼梦》(新校本)
《红楼梦》(新校本)
点校本《史记》中的“曆”字
《新年大测验》大揭榜
单宝塔诗
诗书画印纸笔——中国画的独特形式
两个处理t测验与F测验的数学关系
你知道吗?