包东妹
(江苏省锡山高级中学,江苏无锡,214174)
试卷质量分析是考试结束后不可缺少的一项工作,但往往被重点关注的是分数(平均分、高分、低分等等)和错误率比较高的题,而最容易被忽视的是对试卷命题质量的分析、思考和再修改.那么我们究竟应该从哪些方面入手分析,怎样评价一份试卷的好坏,如何对试卷进行再修改是值得思考的问题.
笔者结合教学实践,尝试总结出如下评价路径:分析试卷的信度、难度、区分度,分析试卷的考点和重难点,分析学生的解答情况,分析试题的优点和缺点,提出修改建议.
大数据时代给我们提供了很多分析工具,大大提高了分析的效率.本校采用的是中育系统的网阅联考,试卷批阅结束系统会立即生成信度、效度、区分度等数据,教师可以根据数据进行有效分析.
1.1.1 信度
信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度.信度系数愈高即表示该测验的结果愈一致、稳定与可靠.测验的信度系数如果在0.8以上,则表示该测验的信度非常好;信度系数0.7以上都是可以接受的;如果在0.6以上0.7以下,则该试卷应进行调整修改,但仍不失其价值;如低于0.6,则要重新出卷了.
1.1.2 难度
难度是指正确答案的比例或百分比,一般用字母P表示,P=平均分÷满分值.P越大表示试题越简单,P越小表示试题越难.试题设置应有梯度,因此各试题的难度应有不同,这是命制试题时要加以特别考虑的.一般认为,期中和期末考试不同于选拔性考试,不宜太难,中档题的难度指数在0.4~0.7之间,整份试卷的平均难度指数最好掌握在0.7~0.8之间,高于0.8和低于0.3的试题不宜太多.
1.1.3 区分度
区分度是指试题对被试者情况的分辨能力的大小.一般在-1~1之间,值越大区分度越好.试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好且需修改,0.19以下表明此题的区分度不好.
以本校高一的一次期末考试卷为例:
图1 难度分布
图2 数学难度-题量占比
图3 数学难度-分值占比
本测验的信度为0.69,略低于临界值0.7;区分度为0.27,略偏低;难度0.7,属于正常.具体到个体,有11个小题区分度低于0.19,属于简单题,其余题目的区分度都在0.3以上,有较好的区分度.不管是从题量还是从分值看,本测验的中等题偏少,简单题偏多.第22题难度系数0.2,一方面是因为时间不够,另一方面也是因为题目本身复杂、抽象,有较好的数学素养、理性精神的学生才能有序将其解出,全年级只有5个学生得满分,有一半的人得0分,本题对高一学生来说难度偏大.
通过上述分析,可以得出结论:本测验在信度、难度、区分度上都与期末考试的初始目标相比有偏差,但偏得不多,故只需要对试卷稍作调整与修改,它就仍不失为一份好卷.
每次测验必定会有考试范围和相应的重难点突破.
仍以上述高一期末卷为例.考试范围是人教A版数学必修第一册所有内容,包括五个章节:集合与常用逻辑用语、一元二次函数、方程和不等式、函数的概念与性质、指数函数与对数函数、三角函数.按知识点分类,考查集合与常用逻辑用语的有第1、2、13、15题,共占20分;考查一元二次函数、方程和不等式的有第11、18、21题,共占29分;考查函数的概念与性质的有第7、8、10、14、22题,共占32分;考查指数函数与对数函数的有第3、11、17(1)题,共占15分;考查三角函数的有第4、5、6、9、12、16、17(2)、19、20、21题,共占71分.当然,这里也有知识点交叉出现的题目,如第11题、第21题等.从知识点分布看,对三角函数和一元二次函数考查偏多,对指对函数考查偏少.
本测试重点考查了五大核心素养:数学抽象(8、10、15)、逻辑推理(16、20、21)、数学建模(8、19)、直观想象(7、10、15)、数学运算(16、17、20),全卷多处要用到数形结合思想(7、9、12、15、18、21)解决问题,重点压轴题(20、21、22)都考查了分类讨论思想,尤其是第20题和第22题,考查了通过阅读进行类比推理和归纳推理,并进行证明(演绎推理)的能力.从能力要求看,第22题要求偏高.
学生的解答情况可以从分数段、平均分、及格率、高分率和每小题的得分率等方面进行研究.
参加本次考试的是本校高一年级全体学生,共942人,总分150分,平均得分105分,标准差为17.98,高分率(130分以上)为9%,及格率(90分以上)为76.5%.将各分数段人数制成柱状图(如图4),基本呈正态分布,可见本次测验数据是有效的.
图4 2021高一期末考试分数情况柱状图
前十六个小题中得分低于4分的有7、8、12、15、16共五个题,其中第7题(考查含参反比例函数变形后的单调性)和第15题(考查韦恩图表达集合元素个数)的得分低于预期,说明在这两个知识点上学生理解不到位.后六个解答题中第20、21、22这三个大题得分较低,说明学生在推理论证、运算求解、逻辑推理等能力上还有所欠缺.
1.4.1 优点
本测验的亮点一是源于课本而高于课本.第8、15、20题都是书本题的改编,并有相当的阅读量,体现了新高考的一大特点,学生需要从具体情境中提炼和抽象出数学的本质,这种能力不是题海战术所能培养的.
本测验的亮点二是强化逻辑推理证明.第20题考查公式推导,虽然在课堂上教师会浓墨重彩地引导两角差的余弦公式,但学生的类比迁移和逻辑推理的能力还是相当薄弱.2021年教育部面向江苏等八省出的全国适应性考试卷让人记忆犹新,六个解答题中有四个涉及了证明,考查学生的逻辑推理能力,这恰恰是以往江苏高考卷不太呈现的形式.
本测验的亮点三是体现了不同学科间的交叉联系.第8题“依法纳税”问题揭示了学习数学的价值之一——数学服务于社会,第15题“学校巅峰体育活动”反映了学校生活中的数学,第19题“无锡的大气压力负荷与土壤水负荷引起的地壳垂向位移变化”体现了数学与地理、人文科学之间的紧密联系……这些无不体现了数学考查的基础性、综合性、应用性、创新性.
1.4.2 缺点
本测验的缺点是:试题难易比例、知识点比重等不够合理.
1.5.1 调整难度
作为一套期末考试卷,要检测学生一个学期的学习成效,一般将简单题、中档题、难题的比例设置为4∶4∶2比较妥当,如果要激励困难生的信心,可以适当增加简单题和中档题的比例.
本测试中区分度较低的11个题大多为期中考试前学习的内容,主要考查知识与技能,思维要求不高,命题者这样设置也是经过一番考虑的,可以保留部分,建议作如下修改:增加多选题第10、11题的难度,使其变成中档题;第18题情境过于简单,题型比较老套,可以将不等式与指数、对数函数结合,增加难度和区分度,同时也兼顾到本测验对指数函数和对数函数考查较少的弊端;22题作为压轴题难度过大,可以适当降低难度,或者去掉第3问;另外第20和21题也需要适当降低难度.
1.5.2 调整顺序
虽然我们经常跟学生讲“先易后难”,但学生心理上总认为排在前面的题会简单些,前面做得不好,后面答题的心态就会受到影响,解决问题的决心和毅力会大打折扣,从而也影响了后面试题的得分.
第20题给出阅读材料,要求学生类比推导公式,学生感觉陌生、有恐惧感,因为平时练习不多,对课堂推导公式的印象不深刻,更重要的是学生运用类比方法进行类比推理的能力不达标,而第21题的情境学生相对更熟悉一些,虽然要求有一定的分类讨论的思想,但学生不会害怕,所以将21题跟20题换一下顺序,这样第21题的得分会更高一些.
1.5.3 调整考点
对于一学期内容的考查,期末考试常采用的模式是4∶6(期中前∶期中后),重心向期中后内容倾斜是合理的,因为有两次考查期中前内容的机会,而只有一次考查期中后内容的机会.
从内容分布的比例看,对一元二次函数模型考查较多,对指数函数和对数函数考查偏少,尤其对数函数是期中后学习的内容,解答题可以增加对对数型函数的定义、图象、性质的考查,比如将18题如上修改,或者将20题的三角证明直接改成对数型函数的考查.
新课程标准对命题提出指导性建议:考查内容应围绕数学内容主线,聚焦学生对重要数学概念、定理、方法、思想的理解和应用,强调基础性、综合性;注重数学本质、通性通法,淡化解题技巧;融入数学文化.
通过与困难学生的交流,反馈得到的信息是学生对新情境有心理恐惧,甚至难以读懂题目.启示:课堂教学应重视书本题的来龙去脉、引伸拓展,注重问题情境的开放性和探究性,培养学生的思维过程、实践能力和创新意识.
证明题不同于一般的解答题和探索题,它指出了明确的目标,强调的是知识与思想方法之间的联系,注重的是合情推理和演绎推理,考查的是核心素养的落实程度.相比较于其他题,证明题更体现了数学推理的辩证性、逻辑性和严谨性.
从学生的解答情况可以看出,学生对定理和公式的证明不够重视,觉得只要会用就行.启示:课堂教学应注重数学思维的培养,强化逻辑推理能力.
在教育功能上,新高考实现了由单纯的考试评价向立德树人重要载体和素质教育关键环节的转变;在评价理念上,新高考实现了由传统的“知识立意”“能力立意”评价向“价值引领、素养导向、能力为重、知识为基”综合评价的转变;在评价模式上,新高考实现了从主要基于“考查内容”的一维评价模式向“考查内容、考查要求、考查载体”三位一体评价模式的转变.
启示:课堂教学应关注价值导向,用价值引领教学实践.