邓昌滨 陈锋
摘 要:信度是指测试结果的一致性、稳定性与可靠性,反映学生考试后的得分与实际水平之间的差距. 文章从素材的公平性、试题的科学性、解答的猜测度、试题的难易度及赋分的合理性等因素,对初中数学常规性考试命题的信度进行定性分析,并提出改进措施,从而不断提升命题质量.
关键词:常规考试;命题信度;定性评价
根据常规考试的数据分析可以发现,常有个别学生甚至整个班级的考试成绩很不稳定,波动性较大. 结合具体试卷发现:有些试题优等生做错了,中等生反而做对了;有些试题同一位学生在多次考试中忽对忽错,前后不一致. 这样的考试数据不能真实地反映学生的知识水平与能力状态,缺乏应有的信度. 所谓信度,是指测试结果的一致性、稳定性与可靠性,反映学生考试后的成绩与实际水平之间的差距. 误差越小,越不容易受到偶然因素的影响,考试成绩就越稳定,信度就越高. 本文以初中数学为例,从素材的公平性、试题的科学性、解答的猜测度、试题的难易度及赋分的合理性等因素对常規性考试命题的信度进行定性分析,并提出改进措施. 不当之处,敬请指正.
一、素材的公平性
试题的公平性是指试题的内容、背景、素材不能倾向于某些学生,而不利于另外一部分学生. 试卷中更不能出现个别试题部分学生事先做过而导致命题素材选取的不公平的现象.
例1 (九年级期末试题)如图1,在⊙O中,弦AD,PC互相垂直,垂足为点M,点P为[AB]的中点,BC分别与AD,PD相交于点E,N,连接MN. 若⊙O的半径为8,[AB]的度数为90°,则线段MN的长为 .
分析及改进建议:此题主要考查圆中的性质及其应用. 命题者提供的答案为:如图2,连接OA,OB,AB,AC,BD,由[AP=BP],得∠BCP = ∠ACP. 又由AD⊥CP,得∠CAM = ∠CEM. 可得点M平分AE. 同理,可得点N平分BE. 故MN是△ABE的中位线. 在Rt△OAB中,易得斜边AB的长为[82]. 所以MN =[12]AB =[42]. 从考后数据来看,此题区分明显,难度适宜,但是出现了很多优等生做错了而中等生反而做对的现象. 通过试题分析发现,此题是2020年江苏泰州卷第24题的改编题,只进行了简单的题型转换,甚至数据都没有改变,在考前很多学生做过这道中考试题,因而对没有做过此题的学生就不利,导致考试不公平,从而降低试题信度. 此题难点是作辅助线,并从中发现MN是△ABE的中位线,因此,可将此题适当改变部分条件或结论降低难度. 例如,在⊙O中,弦AD,PC互相垂直,垂足为点M,点P为[AB]的中点,BC分别与AD,PD相交于点E,N,连接MN,求∠DNE的度数. 当然全新的改编题难度较大,最好的办法是更换试题背景,但对知识内容与能力要求的考查不变.
例2 (七年级期末试题)直线MN∥PQ,△ABC如图3所示放置,∠ACB = 90°,AC,BC分别与MN,PQ相交于点D,E,若∠CDM = 40°. 求∠CEP的度数.
分析及改进建议:此题主要考查平行线的判定与性质,是对经典问题进行了较大幅度的改编,对于七年级学生来说,该题还是有难度的. 命题者提供的答案为:如图4,延长AC交PQ于点H,过点C作CF∥MN,得∠DCF = ∠CDM = 40°. 因为∠ACB = 90°,所以∠FCE = 50°. 由MN∥PQ,得∠QHC = ∠CDM = 40°. 所以∠DCF = ∠QHC. 得CF∥PQ. 所以∠CEP = ∠FCE = 50°. 在阅卷时此题却出现了争议:① 在△CEH中,能否运用三角形内角和定理或外角性质直接求∠CEP的度数?② 能否运用平行线的传递性直接得到CF∥PQ?经了解,原来本次考试只考查到“7.2 平行线的条件与性质”,三角形内角和定理或外角性质不在本次考查范围内,平行线的传递性在后面学期“12.3 互逆命题”中才学习,虽然这两个知识点不在本次考查范围内,但是都属于中考范畴,而在平时教学中,有些班级则对这两个知识点进行了适当地拓展,这样思维就快了几步,难度也大为降低,因而对未补充讲解的班级就不利. 因此,此题可在学生学习了三角形内外角和的性质或平行线的传递性以后,再作为试题使用. 建议今后命题前充分了解教学进度与学生已学内容,以确保考查范围的公平性.
命题时要考虑到对不同学生群体的公平性. 要注意城乡、不同民族、不同家庭、不同性别之间的学生作答的倾向,对同一问题的理解差异,特别是难度较大的试题一定要坚持原创,能力立意,指向素养,避免猜题、押题,确保考试的公平与试题的信度.
二、试题的科学性
试题的科学性主要指内容准确,无知识性和逻辑性错误,题干语言表述规范、准确、无歧义,图形符合题意,大小比例精准合理.
例3 (八年级期中试题)如图5,在△ABC与△DCB中,∠A = ∠D,要使△ABC ≌ △DCB,下列添加的一个条件中,不可能是( ).
(A)∠ABC = ∠BCD (B)∠ACB = ∠DBC
(C)AB = DC (D)BO = CO
分析及改进建议:此题主要考查全等三角形的条件. 选项A、选项B判定三角形全等的依据为AAS,由选项D,可得∠OCB = ∠OBC,判定三角形全等的依据仍为AAS. 初看,选项C的依据似乎为SSA,故选选项C的较多. 但是,考后不少学生质疑,选项C也正确,可以先根据AAS,证得△ABO ≌ △DCO. 得BO = CO. 下面的解法与选项D相同. 因此,此题没有正确选项,出现了科学性错误,导致考试信度降低. 建议将此题改编为开放性填空题:在△ABC与△DCB中,∠A = ∠D,要使△ABC ≌ △DCB,则添加的一个条件是 .3B40D382-7DD3-4C5B-ACB7-E2AF1D929357
例4 (九年级期中试题)某商场销售一款羽绒服,平均每天可售出20件,每件售价320元. 为了减少库存,商场采取了降价措施. 已知每件羽绒服的出厂价为280元.假设在一定范围内,羽绒服的单价每降5元,平均每天可多售出10件. 如果降价后商场销售该款羽绒服平均每天盈利1 200元,则每件羽绒服的单价应降低多少?
分析及改进建议:此题是有关一元二次方程的销售问题,命题者提供的答案为:设每件羽绒服的单价降低[x]元,则有[20+2x320-280-x=1 200]. 解得[x1]= 10,[x2]= 20.因减少库存,所以[x1]= 10(舍去). 可是,阅卷时引起广大数学教师的质疑,争议的焦点是究竟要不要舍去一个解,不舍解的理由是,当x = 10时,也减少了库存,只不过减少的幅度稍小一点. 最后,通过网络教研达成共识,认为此题中的“减少库存”语言表达不够准确,建议更改为“为最大幅度地减少库存”,这样避免争议.
一般地,试题的材料选择要具有普遍性、代表性、真实性. 材料要来自教材、正规出版物、权威网站和历年各类试卷,还没有定论的观点、缺少佐证的热点等一般不作为命题素材. 材料的取舍要得当,不能断章取义,要根据考试目标进行增添或删减,材料的改编要准确、符合思维逻辑,语言表达规范、精准,不引发歧义,图文匹配. 材料背景必须与生活情境相适应,与试题解答无关的部分要及时删除,避免不必要的干扰.
三、解答的猜测度
解答的猜测度是指学生的答卷过程违背命题意图,缺少应有的思维逻辑或运算推理步骤,投机取巧、凭运气、采用“猜”“蒙”的方法获取答案的程度.
例5 (九年级期中试题)如图6,在△ABC中,AC = 3,CD⊥AB于点D,且AD = 3BD,在CD上取点E,使CE = 2DE,连接BE,则BE = .
分析及改进建议:此题主要考查相似三角形的判定. 由题意,得△ACD ∽ △BED. 从而得到[BEAC=BDAD=13]. 得BE = 1. 由于学生刚学相似三角形,对其判定方法还不能够灵活运用,因而对学生来说应该是有一定难度的. 但考后发现,由于此题是填空题,不需要呈现具体的解题过程,尽管不少学生不理解,但是只要用刻度尺量一下,就可以发现AC = 3BE,由此得到BE = 1,结果“猜”对了,但有悖命题意图. 建议将此题中的数据适当改编,如将题中条件“AD = 3BD,CE = 2DE”改为“AD∶BD = 7∶2,CE∶DE = 5∶2”,则△ACD与△BED的相似比为7∶2,其结果不凑整了,也就难以“猜”“蒙”了.
常规性考试主要是对最近阶段学习的主干知识、数学思想、逻辑思维、运算能力的考查,着重考查知识的发生、发展过程,注重通性、通法,淡化特殊技巧,特別是不需要呈现过程的选择题和填空题,在命题时要尽量避免靠“蒙”“猜”等手段而直接求解的试题,不让投机取巧者有机可乘,确保试题的信度.
四、试题的难易度
难度是指试题的难易程度,命题时通常从问题本质的内隐程度、知识内容的综合程度、问题条件的确定程度、数学运算的繁简程度等指标把控每道试题的难度. 同时,还要从学生已有的知识水平、复习巩固程度等视角整体上把控试卷的难度.
例6 (九年级期中试题)如图7,将抛物线[y=x2+1]绕原点O顺时针旋转45°得到新曲线,新曲线与直线[y=3x-42]交于点M,N,点M在点N的上方,求点M的坐标.
分析及改进建议:此题立意新颖,难度较大,主要考查一次函数、二次函数与图形变换的性质. 解题初始,学生容易陷入求新曲线函数表达式的死胡同中,导致思路受阻. 正难则反,此题可以将直线[y=][3x-42]绕原点O逆时针旋转45°,得到直线y = -2x + 4,再求该直线与抛物线的两个交点,然后将这两个交点绕原点O顺时针旋转45°后,就是所求的M,N两点. 建议此题增设一问作为铺垫,先“求MN的长”,再“求点M的坐标”,这样就降低了试题的难度. 也可以在组卷时将此题尽量后置,避免学生一旦思维受阻,又对此题“盯”住不放,做不到“遇难则弃,遇繁则跳”,从而影响整套试卷的作答时间、考试心理及后续发挥,降低考试的信度.
试题难度通常采用题目的平均得分率来定量评价,即平均得分值除以满分值. 一份试卷中的试题通常分为易、中、难3个层次,同题型中试题的难度设置应保持一定的梯度,难度较大的试题通常分布在各题型的最后一两道题,解答题的各小问也要梯度分布. 杜绝过难试题,控制全卷难度,让绝大多数学生做到最后,以确保考试的信度.
五、赋分的合理性
参考答案要简明扼要、科学精准,表述规范,不造成歧义,便于操作. 评分标准要客观、公正,赋分合理. 解答题要提供解题的关键步骤和要点,即赋分点,并按照这些赋分点在解题过程中所起的作用大小赋予合理分值.
例如,例6增设一问后的参考答案与评分标准如下.
(1)如图8,将直线[y=3x-42]绕原点O逆时针时旋转45°得到直线y = -2x + 4.(2分)
求得y = -2x + 4与y = x2 + 1的交点坐标为M′(-3,10),N′(1,2).(2分)
由勾股定理,求得MN =[45].(1分)
(2)方法1:将M′(-3,10)绕原点O顺时针旋转45°,得点M,设点M(m,3m -[42]),(1分)
由题意OM = OM′,得9 + 100 = m2 + (3m -[42])2.(2分)
解得m1 =[722],m2 =[-11102](不合题意,舍去).(1分)
故点[M722, 1322].(1分)
方法2:如图8,过(1)中点M′(-3,10)作M′A⊥Oy,垂足为点A,将△OAM′绕原点O顺时针旋转45°,得△OA′M.(1分)
过点A′作x轴的垂线交x轴于点C,过点M作x轴的平行线交CA′的延长线于点B.(1分)
△A′OC与△A′MB均为等腰直角三角形.(1分)
易得OA = OA′ = 10,OC = CA′ =[52],MA′ = M′A = 3,BM = BA′ =[322].(1分)
故得点[M722, 1322].(1分)
(如果学生有其他解答,参照本说明酌情给分.)
分析及改进建议:此题有两道小题,满分是10分,分数不宜平均分配,更不能直接看最后结果,只要结果正确就给满分. 而应认真批阅解题的全过程,根据过程按点赋分. 此题第(1)小题有3个赋分点,第(2)小题方法1中有4个赋分点,方法2中有5个赋分点. 第(1)小题中第1个赋分点是解决问题的关键,思维含量较大,第(2)小题方法1中第2个赋分点运算量较大,赋分值可适当增大,为2分,其余赋分点均为1分.
解答题既要看结果,又要看过程,按点赋分时,赋分值要尽可能地不可再分割,以便于阅卷操作,对思维含量或运算量等难度较大的赋分点要适当倾斜,必要时适当给予文字说明,要尽可能地提供多种解法、过程与评分标准,对阅卷中出现的意外解法,要及时交流,统一标准,以保证等价赋分.
信度是衡量常规性考试试题可信程度的重要标准. 对试题信度的评价通常有考前定性评价与考后定量评价两种,考后信度的定量计算一般采用内部一致性系数和分半信度来鉴定,得到的信度系数比较精准. 素材的公平性、试题的科学性、解答的猜测度、试题的难易度及赋分的合理性等因素进行考前定性评价,更实效、更方便、更有利于提升命题质量. 因此,将这两种评价方式有机融合,能进一步提高试题信度与命题质量,同时,不断提升教师的命题水平.
参考文献:
[1]张梅. 基于信度和效度分析在优化试卷中的研究和实践[J]. 中国建设教育,2013,1(1):72-74.
[2]邓昌滨. 影响数学试题“静态难度”的四大因素[J]. 教育研究与评论(中学教育教学),2020(4):93-96.
[3]何小亚,李耀光. 初中生数学态度量表的编制及信度效度检验[J]. 数学教育学报,2013,22(2):37-43.3B40D382-7DD3-4C5B-ACB7-E2AF1D929357