温海英 黎光明
摘要:中小学新课程改革遇到了一些新问题,这些问题对中小学教学管理产生了一定的影响。教育测量理论中的测验等值技术,是解决中小学新课程改革中出现问题的途径。测验等值为实施新课程改革提供了保障。也方便了管理者。掌握测验等值技术相对困难,造成了测验等值技术在教学管理中的应用相对滞后。
关键词:中小学新课程;教学管理;测验等值;课程改革
中图分类号:G40-058.1文献标识码:A文章编号:1005-5843(2009)01-0006-03
自新课程改革提出以来,全国部分地区中小学开始实施新课程,但仍有一部分地区中小学未实施新课程,这就给地区之间造成了不平衡。由此引发了新课程教学管理中的一些问题。这些问题既有其特殊性,也有其普遍性。需要用一些新的方法及理念来解决,本文提出用测验等值方法来解决中小学新课程改革给教学管理带来的一些问题。测验等值是心理与教育测量学的重要技术,在心理与教育测量实践中,为了保证测验的公平性和可比性,需要把不同测验形式的分数都转换到同一个分数系统上,测量学上把为达到这一目的而发展起来的一套专门技术,称为测验等值。测验等值在考试、题库建设得到较为广泛的应用。但是,这种技术不仅可用于各类考试中,也可用于中小学新课程的教学管理中。
一、中小学新课程改革给教学管理带来的一些问题
(一)不同地区因使用不同教材给中考招生带来新问题
中考招生是升中考试中重要的一个环节,但是由于各地区实施教材有差别,导致不同地区的考试试卷也有差别,而中考只能划定一个分数线。如何将不同地区的分数进行比较,是一个重要问题。例如,广东省佛山市在2004~2006年间共有语文、数学和物理三科实施了新课程,但是并非所有佛山市的各地区都实施了新课程,其中仅有阐城、顺德和南海三区实施了新课程,而高明区和三水区则没有实施新课程,由于各地区实施的步骤不一致,带来了中考招生的新问题,即课改实验区与非实验区考生考试试卷不同。给招生统一录取工作造成了障碍。
新课程的实施给基础教育带来了新的观念和思路,特别是随着新课程的改革,教学管理机制开始转型。但是,如何在教学管理中统筹地区间的不平衡,以及如何在教学管理中运用更实际的办法改进旧体制,这是我们在新课程改革背景下不得不思考的问题。
(二)不同年份的新课程改革使分数可比性难于统一
新课程改革需要逐步稳定地实施,但当教育管理者需要比较不同年份学生的差异性时遇到了难题。这主要表现在以下几点:
1.各科教材不同。因为使用教材的差异性造成了分数难于统一在一个量纲之下,比如要比较不同年份不同科目分数的差异时,由于性质不同,无法将两者分数相提比论。
2.不同年份科目量纲不同。实际上,由于新课程的改革,当教育管理者需要比较不同年份相同科目时。由于所采用的教材有别,所参考的体系有异,也不能直接通过观察学生分数来进行比较。
(三)不同年级不同教育者对新课程教学评价难于统
新课程的教学评价规范统一,要求在各个水平对教师教学水平进行有效评价。但是,在不同年级之间,由于实施的教材有别,班级差异明显,如何体现一个教育者的教学水平,是一个值得研究的问题。如果需要比较不同年级教师之间教学水平差异,那么又该如何进行呢?即使在相同年级相同班级,教师之间也存在着教学水平之间的差异,所有这些问题,在中小学新课程教学管理中都将遇到,对实施新课程教学管理评价有重要的意义,也是实施新课程重要的组成部分。
解决班级、年份、地区、教师、学科和年级等因素对分数之间差异的比较是实施新课程改革重要的一步,它有助于检验中小学新课程改革实施的质量,也有助于新课程在新环境中的应用与推广。因此,上面所提及的这些问题,需要用新的方法来解决。
二、用测验等值解决中小学新课程出现的一些新问题
(一)测验等值可解决不同试卷考试的可比性
人们有种种理由要求比较、解释不同时间、不同地点、不同考生的测验分数,以便对试卷或试题的质量,对不同学年的考生水平作出公正的评价、合理的解释。特别是高考、自考、中考这种规模大、影响广的全国统一考试,它决定数百万考生的命运因而备受社会各界关注。一年一度的中考招生考试是牵动全社会应届中考考生和考生家庭的大事,中考招生工作是一项社会关注度很高的工作。近年来,基础教育课程改革在各地逐步实施,由于各地实施的步骤不一致,带来了新问题,即课改实验区与非实验区考生考试试卷不同,但参加统一录取带来的新问题。例如,2004-2006年,参加佛山市中考的考生如何在中考的语文、数学、物理三个科目上划定录取分数线,是心理与教育测量的研究重要内容,即测验等值研究。
测验等值是将不同形式的测验分数转换到同一个量纲上,如有两个测验X和Y,它们的题量、题型、试题难度和分数分布等方面相近。进行不同测验间的等值,首先要确定欲等值的测验,然后对两测验进行等值前的分析,看两测验是否符合等值的条件。还需要对等值设计和方法进行选择,得出等值关系,再将一个测验固定,将另外一个测验的分数转换到所固定的测验量纲上来。这样,就可以把不同形式测验分数进行高低比较。例如,根据2005年佛山市数学中考试卷,基于锚测验非等组设计,其形式如图1所示。
在锚测验非等组等值设计之下,还可以比较等值方法的优劣,如Tucker线性等值方法、Levine线性等值方法和等百位分数等值(频数估计)方法。在我们进行的研究中,得出Tucker线性等值方法最优,所引入的等值误差最小。其等值的关系是Y=0.86X+13.72。其中x表示课改实验区的考生的得分,而Y表示课改非实验区的考生的得分。如果已知实验区或非实验区的得分,就可以转换到相应的非实验区或实验区分数之上。通过测验等值,中考不同地区相同年份的考生得分就可以进行比较,也可以统一划出一个分数线,从而有利于中小学新课程的实施。
(二)测验等值可解决不同年度考试的可比性
人们当然想知道。各年度试卷的难度水平是否有变化?各年度考生的实际水平是否有提高?不同年度考试之间的考试分数究竟有何关系?如果我们能够把不同年度、不同考生的考试成绩转化到同一个单位系统上去,则上述问题就能得到解决。
可以设置“锚题”用于不同年度的比较,比较结果可以说明不同学生是否存在差异,学生能力在不同年度上是否有明显的变化。特别是,可以预见新课程改革以后,这种效果是否明显,这样就能够为深化教学管理提供理论依据。
锚题的建立是解决不同年度考试的可比性的关键,采用一定的测验技术可将不同测验上的分数作出等值转换。含有锚测验的等值设计包括锚测验随机组设计及锚测验非随机组设计,锚测验等值设计主要是通过“锚题”相连,
锚题的作用在于找到两测验的联系纽带。这种等值转换的链条可能会跨越多个测验与多个被试样组,还可以跨越不同年份。这种做法,在美国的测验等值中均有所体现,如,美国大学人学委员会的学术能力倾向测验(SAT)每年的分数都通过一系列的等值转换。转化到1941年由11000名被试构成的样组的SAT分数分布上去解释。这种固定参照团体在不同年份上进行等值的做法对比较被试分数与作有关决策提供了统一参照系,可以借用到中小学新课程教学与管理中。
(三)测验等值用于不同年级不同科目的新课程教学评价
根据测验等值的含义,可以在不同年级相同科目设置锚题进行比较,不同教师所教班级可以通过锚题这个桥梁相互联结起来。实际上,如果科目不一样,要进行教师教学能力的比较,就显得困难得多。因为很难找到共同联系纽带。一般的做法是比较不同科目的差异系数或者标准分。但是这样做仍然显得不够明显,对教育管理者而言,理解是有困难的。测验等值可以解决此类问题,但是在此种情况下,需要供用现代测量理论——IRT来进行项目之间的等值。借用IRT对全卷不同科目进行项目参数等值,使不同科目的题目都进行量表化,得出刻画它们的项目参数,如难度、区分度和猜测度等。对这种科目差异较大的等值,一般称为“垂直等值”。
将不同年级不同科目通过测验等值方法进行分数转换,有利于新课程教学评价,这种评价标准是建立在科学实践之上。克服了长期在教学中主观评定的方法,这是因为通过测验等值方法可以把所有科目所有年级分数表示在同一个量纲之上,熟优熟劣自然不言而喻了。因此,测验等值为新课程教学评价提供了理论依据。
三、测验等值对中小学新课程教学管理的启示
(一)测验等值为实施新课程改革提供了保障
推进和实施新课程是中小学教学管理的重要步骤,是改变我国基础教育存在一些不良现状的重要措施。测验等值为新课程提供了保障,具体表现在以下几方面:
1.为从实施旧教材到新教材提供了“过渡”保障。新课程改革是一个逐步实施的一个过程,不同地区存在新老更替的过程,在这样一个过程中分数等值尤为重要。如果不解决好此类的问题,人们当然会质疑分数的可比性,因为不同地区的考生使用的是不同试卷,而考试招生却只一个分数线。即便出现+分数线,人们同样也会质疑二个分数的等价性,因此必须解决好不同形式测验量纲统一的问题,而测验等值能够很好地处理此类问题。
2.测验等值为新课程教学评价提供了保障。根据测验等值的基本思想和做法,教师教学水平高低的评价,不是独立进行,而是需要通过一定的纽带联系起来,这个联系纽带便是锚测验。锚测验将不同学科不同年级教师联系起来,以使学生考试分数能在同一个量纲之上。基于同一个量纲这定,我们就可以将不同教师相应学生的分数及名次排列出来。
3.测验等值为新课程的实施效果的评价提供了保障。新课程的实施效果可以通过不同年度学生的学生成绩来反映。一种比较简单的办法是比较未实施新课程和实施新课程后的不同年度学生的考试成绩。对于这两种分数,我们不能作简单的比较,而是需要将不同年度的学生成绩转换后进行比较。如果学生成绩较以前有提高,则可能意味着实施新课程有效果。反之,则效果不明显。
(二)测验等值可以提升教育管理水平,方便管理者
通过测验等值对不同年度不同学科不同地区等分数的比较,可以深挖新课程背景下一些基本信息,对评价新课程实施提供了量化支持,可以提升教育管理水平,同时也可以方便管理者。特别是测验等值可用于不同年级不同教师教学水平的比较,这对实施新课程大有帮助,因为这就表明测验等值可以应用于具体实践的教学中。例如,学校管理者可以要求不同年级教务长规定一些锚题(或者可以建立锚题题库),利用这些锚题来建立不同班级不同教师不同科目下学生得分的联结点,以便作为比较不同年级不同教师教学水平的基础。这种做法可以大大提高评价的方便性和操作性,有利于促进教育管理水平和方便管理者。
(三)掌握测验等值技术相对困难,造成在教学管理中的应用相对滞后
测验等值的主要目的是转换不同测验的分数,这种做法类似于华氏温度与摄氏温度的转换。但是在具体操作中,还需要理解许多技术上的问题,如不同等值设计的选择、不同等值方法的选择、不同等值标准误的比较等,其中所涉及到的技术较具体,等值公式也较多,这给许多教学管理者造成了许多麻烦。因此,在我国,测验等值仍然有待大力支持和研究。测验等值在概念和操作上,理解较为困难,造成了测验等值在教学管理中的应用相对滞后。
但是,测验等值并非应该受到局限。在国外测验等值在各类考试各类教育管理中已经得到较大范围的应用。即便测验等值在我国中小学新课程教学管理中的应用有较多困难,也不能否认测验等值的作用。
责任编辑曙光