中考审题的关注点

2013-08-15 00:47
大连教育学院学报 2013年3期
关键词:公平性效度审题

赵 娟

(大连教育学院 学习质量监测中心,辽宁 大连 116021)

中考是大规模的标准化考试,中考试题的质量直接影响中考录取的公平性,甚至影响到社会的安定。要保证中考试题的质量,审题是不可缺少的环节。虽然不同省市的中考命审题管理各有不同,但审题过程中的关注点是共同的。

一、试题和试卷的效度

效度是指测量工具能够准确测出所需测量事物的程度。也就是说,效度与是否测出所要测量的特性有关。效度是测验评价最核心的指标,体现在试题和试卷两个方面。

1.试题效度

试题效度的审查除了要关注试题语言叙述的科学性、准确性,图文的对应性,还要关注以下几个方面。

(1)考查要点与课程标准要求的对应性

课程标准明确规定了学科的内容标准,中考试题应严格按照课标的内容标准。中考试题脱离课程标准常常表现在几个方面:一是考查课程标准规定的选学内容[1],二是把高中知识当作考查能力的载体[2],三是用高中的方法解答问题更便利。

(2)问题情境与考查要点的对应性

根据Osterlinter,试题的定义为:在教育和心理特质测试中,试题是一个测量单元,它具有刺激情境和对应答形式的规定,它的目的是要获得被试的应答,并根据应答对考生的某些心理特质方面的表现(如知识、能力等)进行推测。[3]

设计刺激情境,目的是引起学生的某种应答活动,推测其内在的心理状况。审查命题者设计的问题情境和对应答方式的规定能否引起预期的学生的心理反应,借助这一反应能否推断学生学科能力的高低。如果学生的反应有非预期的,且非预期的反应不能用以推断学生的学科能力,则说明试题的效度欠佳。

(3)问题呈现的方式与学生心理发展水平的对应性

命题者所设计的问题情境是否能引起学生预期的心理反应,在一定程度上与学生对问题情境的理解有关,而这种理解又与学生的心理发展水平有关。所以,审题者要审查试题的呈现方式是否符合初三学生的心理发展水平,保证绝大多数学生都明确问题的指向,能够锁定搜寻知识的范围。如果学生因为不明白问题本身的含义和指向而无法得出正确的答案,那么命题借助反应方式推断学生能力水平就是不准确的,试题本身的效度就无法体现。

(4)参考答案及赋分与学生能力水平的对应性

同一试题,不同的学生解答的方式不同,解答的水平也不同。审题者要审查试题参考答案及赋分是否与学生的能力水平相对应。具体包括:不同的解答方式是否反映不同的思维水平,思维含量大的步骤是否赋予更多的分数,体现思维水平的关键步骤是否赋予足够的分数。

2.试卷效度

试卷效度包括内容效度和结构效度。

内容效度是指测验内容对所要测量的内容的代表性程度。审查试卷的内容效度可以从以下几个方面入手。

覆盖度。中考作为一种标准化测验,各学科抽取的考查样本具有一定要求,一级主题和二级主题要有100%的覆盖度,三级主题覆盖度的要求各科各有不同。因此,覆盖度是重要的内容效度指标。审查覆盖度时,还要审查是否有超过课程标准要求的试题。

核心知识、核心能力和核心思想方法的考查力度。在各个学科的知识体系中,不同的知识和能力要求对于学生发展的作用各不相同,所以每个学科都会有其特有的核心知识、核心能力要素和核心思想方法。审题要关注试卷中学科核心要素是否得到充分的考查。

试卷的结构效度表现为中考试卷内容、能力和题型结构的合理性。审查试卷结构效度可以从以下几个方面入手。

审查双向细目表,评价所考查各项内容的比例合理性、所考查能力要求比例的合理性。评价的依据包括各部分内容所占的学时数,各项内容和能力要求在学科体系中的重要性,往年命题的经验和专家的建议。

审查试题与双向细目表的对应性。要把全卷试题进行分类汇总,确定内容比例和能力要求比例是否与双向细目表一致。

各种题型是否能够考查同一学科能力的不同侧面,又相互关联。如果各题型考查学科能力的同一侧面,那么,就无从发挥不同题型的特有的考查功能,同时也是一种浪费。如果各类题型考查了学科能力的不同方面,但相关甚低,有可能是某一题型考查的能力侧面偏离了本学科能力。

二、试题的导向性

中考具有明显的导向性,一次中考在一定程度上决定至少一年的教学导向。所以,审题者要审查每一试题对教学的引导作用。

1.试题的内容范围是否紧紧围绕课程标准,是否引导教师依据课程标准进行教学。

2.试题的能力要求是否与课程标准规定的学习要求相对应,避免教师加重学生的课业负担。

3.考查能力的载体是否与教材密切相关,引导教师回归教材,避免题海战术。

4.问题情境的设计和应答要求是否引导教师和学生关注学习过程,而不仅仅是学习结果。

5.问题情境的设计是否贴近学生的社会生活和实践,引导学生关注社会生活中的问题,提高学生解决真实问题的能力。

6.试题的选材是否渗透情感、态度、价值观的教育,引导教师在教学中关注多维教学目标。

三、试卷的信度

信度指测验的稳定性,中考审题主要审查内部一致性信度和复本信度。

内部一致性信度是指测验内部所有题目间的一致性程度。题目间的一致性含有两层意思:一是指所有题目测的是同一种心理特质;二是指所有题目得分之间都有较高的正相关。也就是说,内部一致性信度就是一个测验所测内容或特质的相同程度。

内部一致性信度的审查要点包括:各试题的考查内容是否均从属于本学科的知识体系,且是课程标准所规定;借助不同材料载体所考查的能力要点是否从属于本学科的能力要求,而且这些能力要点是相对稳定的;不同题型所考查的能力要点是否可以相互补充和印证学生学科能力状况。

复本信度指的是两个平行测验(或等值试卷)测量同一批被试所得结果的一致性程度。

中考命题中的等值与心理测验上的等值相比有其特殊性。通常情况下,启用副卷时正卷已经曝光,所以副卷与正卷的试题结构虽然相同,但并不是一一对应。审查要点包括:两卷的内容取样是否是同一知识范围内的不同抽样,且达到同样的覆盖度;两卷中所考查的能力要点是否借用了不同的知识载体,但考查功能基本一致;两卷中的同一知识和能力考查点是否采用不同的试题呈现方式,且考查功能基本一致。

同时副卷的绝对难度要高于正卷,这样测试后的相对难度才能对等。审题要关注两点:一是正卷的某一试题对解答副卷的某道试题有多大的迁移度,借助提高副卷中试题的难易程度能否使同一学生在相继的两次考试中得到基本一致的分数。二是正卷的某一试题对解答副卷的某道试题有多大的迁移度,借助改变知识载体和试题的呈现形式,能否使同一学生在相继的两次考试中得到基本一致的分数。

四、试题的公平性

试题的公平性是指试题的内容和呈现方式能够避免无关因素的干扰,能够考查出学生的实际学科能力水平。审查试题的公平性除了关注测验中的重点题目是否与其他省市、地区或本地区曾使用过的题目重复,还要关注以下几个方面。

1.试题背景的公平性

中考命题常常借助一定的背景材料考查学生的学科能力,但这些背景很难保证所有学生都见过。所以,只要通过言语描述或图表能够让学生在头脑中进行清晰表征的试题背景就可认定为具有公平性。如利用“盲道”的背景考查与摩擦力相关的知识,农村的多数学生没有见过盲道,如果题目借助图像来呈现问题,试题背景就具有公平性。

2.生活环境的公平性

不同学生的家庭环境、学校环境和地域环境各不相同,如果试题内容的设计不关注学生的生活环境,就会不公平。如中考作文题目“美丽的大海”,对于生活在山区和平原的学生来说就是不公平的。

3.认知风格的公平性

不同认知风格的学生擅长解答不同种类的试题。如独立型的学生更擅长解答抽象性试题,而场依存型的学生更擅长解答形象性试题。审题者一要审查整张试卷中不同种类试题的比例是否合理,二要审查是不是每道试题都能够让不同认知风格的学生找到解决问题的途径。

4.性别和民族的公平性

不同性别学生对不同题材的试题的兴趣和解答的水平是不同的,例如,在英语阅读理解的选文中,体育比赛的题材更容易被男生理解。所以,为了保证试题的公平性,审题者还要审查试题题材的倾向性。民族的公平性类似于性别的公平性,不再赘述。

五、试题的难度和区分度

试题的难度和难度结构设计服务于考试目的。多数城市的中考是两考合一,同时承担水平考查和选拔的功能,低、中、高档试题分值的比例7∶2∶1,这也是中考常用的难度结构比例。不同难度试题的区分度有所不同,一般情况下,0.5难度系数的试题区分度最大。但中考不是只把学生分为两类,而是要区分各个层面的学生,为不同类学校输送不同能力水平的学生。因此,审题者的审题要点包括两个方面。

1.7∶2∶1的设定范围是否符合录取要求。例如,某一年大连市中考示范性高中的录取率为30%,一般公办高中的录取率为55%,0.30和0.55就成为难度系数的节点。那么,“1”部分的试题难度系数可以控制在(0.20,0.40],在这个范围内,0.3难度系数的试题占的比例最大。“2”部分试题的难度系数可以控制在(0.40,0.70],在这个范围内,0.5难度系数试题的比例最大。“7”部分试题的难度系数可以控制在(0.70,1.00]之间。

2.“7”部分试题的呈现方式和应答要求是否能保证绝大多数学生能够得分,进而保证中考的水平测试功能的达成。

总之,对试题和试卷的审查的缜密程度影响中考质量,进而影响中考功能的发挥。因此,中考审题应科学、规范、重点突出。

[1]物理试卷评价组.2011年中考物理试题“红黑榜”[J].基础教育课程.2012(3):24-28.

[2]数学试题评阅组.2011年中考数学试题“红黑榜”[J].基础教育课程.2012(3):19-23.

[3]雷新勇,周群.试题命制的理论和技术(一)[J].考试研究,2008(1):84-97.

猜你喜欢
公平性效度审题
精审题,明立意,读懂童话
高管薪酬外部公平性、机构投资者与并购溢价
“三招”学会审题
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
七分审题三分做
认真审题 避免出错
被看重感指数在中国大学生中的构念效度
关于公平性的思考
外语形成性评估的效度验证框架
基于普查数据的我国18个少数民族受教育程度及公平性统计分析