数学试卷常用的测量分析法

2013-04-29 21:41吴小平
博览群书·教育 2013年7期
关键词:应试者区分度效度

吴小平

一份较为重要的数学试卷(如:学期考试或学年考试,最后上升至中考或高考)一定会有相应的评定参考指标来进行评价;既有定量分析方法,也会有定性分析方法,用来衡量或矫正试卷命制的达成程度,既符合国家课程改革的理念与数学学科的思想方法,又适合本次考试的任务目标(学业的水平性考试或学业的选拔性考试)。

常用的教育测量学将对试卷进行定量的四个维度的统计、分析;试卷分析的四个度:难度、区分度、信度、效度。

一、难度

难度是指试卷中试题的难易程度,它是衡量试卷質量的一个重要指标参数,一般的把它和区分度的共同影响度,确定着试卷的鉴别功能。一般认为,此类升学性考试的每一个试题的难度指数在0.3-0.85之间比较合适,高于0.85和低于0.3的试题不能太多。整份试卷的平均难度最好在0.50~0.65之间,本省中考数学试卷难度系数约为0.60,高考数学试卷难度指数约为0.50。

1.难度的通常定义

在样本容量n有一定大的前提下,难度系数 ,x为某题得分的平均分数,w为该题的满分;这种定义法,难度值小时表明试题难,难度值大时表明试题容易;最小值为0,最大值为1,0≤P ≤1。

2.难度系数的计算

为了简约的统计,通常无论是主观性试题、还是客观性试题的难度,其难度系数均以公式 为准,x为某题得分的平均分数,w为该题的满分;因而整张试卷的难度系数也以公式 为准,x为统计容量n(位)考生得分的平均分数,w为该试卷的满分值。

3.一般升学性考试试题难度系数与难度评价

二、区分度

区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。

试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较高,容易题或过难试题的区分度就要低一些。另外,试题的区分度也与应试者的水平分化密切相关,一般的试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。

1.区分度的计算方法:

通常的基本公式: (D代表区分度系数, 代表高分组(设统计对象得分较高的前27%名次考生为高分组)得分的均分值, 代表低分组(设统计对象得分较低的后27%名次考生为低分组)得分的均分值, 代表该题的满分值。一般认为:某一道试题的区分度系数高于0.4,试题的区分度较好;若试题的区分度系数低于0.2,则试题难以被接受。

2.区分度系数与试题的区分度评价

三、信度

信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对于同一应试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。

信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠。一般来说,要求信度在0.7以上。

1.评价信度的方法:

(1)重测法,(2)复本法—副题,(3)折半法,或者说:用再测信度、复本信度和内部一致信度三种方法来进行评估。

再测信度是指将同一试卷在相同的条件下对同一组考生先后实施两次,两次测评结果的相关系数。

复本信度是指用两份或几份在构想、内容、难度、题型和题量等方面都平行的试卷进行测试,测评结果之间的相关系数。

内部一致信度是指试卷内部各题之间的一致性,通常是将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数。

2.对试卷的信度评价

参照《全国中考数学考试评价指标量表(2007年修订版)》,对试卷的信度评价可归结以下四方面:①、试卷所规定的系统误差小,公平性能够实现;②、试卷所赋予的评分标准,准确无理解歧义;③、试卷的陈述准确无歧义;④、试卷呈现规范不会导致考生产生理解歧义。其操作性能好,较好处理。

四、效度

效度是一个测试能够测试出它所要测试的东西的程度,即测试结果与测试目标的符合程度。

任何测试工具,无论其它方面有多好,若效度太低,测试的结果不是它要测试的东西(如用英语试卷测试学生的数学思维能力,或者数学试卷测试诸如英语翻译、理解能力等偏颇内容),那么,对目前所要测试的东西,这个测试将是无价值的。

由于心理现象本身的特点,测评的效度尤为重要。心理属于精神方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模式或者对测试题目的反应,来推论其心理特质。如智力水于主要是借助于个体对一些问题的反应及正误等结果来推断的。

1.效度是一个相对概念。效度是一个相对概念,即效度只有高低之分,没有全部有效和全部无效之分。效度从种类上可分为卷面效度、内容效度、构想效度、预测效度和共时效度。

2.对试卷的效度评价。参照《全国中考数学考试评价指标量表(2007年修订版)》,对试卷的效度评价可归结以下六方面:①、体现数学课程标准所规定的学习要求(包含内容、结构覆盖率以及难度不超标);②、有利于考生展示在数学课程学习中取得的成就(整卷试题设计有利于学生展示、整卷的字图式表述有利于考生的发挥、试题的背景公平、试题的阅读量适合);③、试题的科学性;④、试卷评分标准的合理性;⑤、题型运用的合理性;⑥、分数与能力一致性的程度。

试卷的信度与效度的评价可操作性较难,不易被中学所量化测评。另外一份试卷质量的分析常常通过两个层面来进行,试卷分析与试题分析。

对于已经考过的试卷进行科学评价,对以后的命题将会起到非常重要的参考作用。一般的评价分析往往基于考试后对考试结果进行分析。但是,如果能在考试后结合答卷情况来对试卷进行科学地分析,发现和进一步体会预设的亮点,反思试卷中的瑕疵或不足,对于试卷命制今后的完善、完美更是有非常意义的价值。因此,如何建立对试卷的定量分析模型、质性评价分析方法,包括预测考试的成绩分布情况、考试的有效性和稳定性等,就是一项很有意义的工作。

猜你喜欢
应试者区分度效度
How AI experts influence our decisions
指纹识别在大学生应试者身份核验中的运用
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
浅谈试卷分析常用的几个参数及其应用
面试中常见的12种错误
图形推理测量指标相关性考察*
浅观一道题的“区分度”
单维参数型与非参数型项目反应理论项目参数的比较研究*
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架