卞小娟 陈洪余
小学数学质量监测旨在通过对学生数学学业成就、身心健康、兴趣爱好、学业负担等方面的测量,全面了解学生数学素养发展情况,进而促进教与学的改进并提高教学质量。小学数学质量监测工具包括学业成就测试和问卷调查两部分,均经过拟定目标、搭建框架、确定指标、研发工具等一系列标准化程序研制而成,以确保工具的客观性和标准化。
监测工具要以质量为先
小学数学质量监测强调通过科学的方法和技术获取学生经过一定阶段学习后在数学领域所获得知识和能力的有关数据信息,对数据进行专业分析后对教育教学现状作出诊断,提供改进策略和决策依据。在这一过程中,监测工具的质量就显得尤为重要。
一套监测工具的编制必须在监测目标的基础上,按照编制双向细目表、研发试题、筛选试题、预试、组卷、再预试、质量分析、修正、定稿的程序开展。在编制过程中要结合实际情况,部分程序还要经过数次重复,如试题编制好后要在不同层次与类型的学校进行预试,根据预试结果进行修改,然后再预试、再修改,直至试题的各种数据达标才能最终确定。
为了获取更全面、真实、有效的数据信息,监测工具与传统考试题不同:一是传统考试无法用一张试卷完成所有知识点的考查;教育质量监测的矩阵平衡设计技术,通过设置铆题将监测工具拆分成若干题本进行测试,在不增加学生答题负担的情况下,达成对学科所有知识点的考查,更为完整、稳定地测量学生的学业质量。二是传统考试更多关注对知识的再现再认,也就是我们常说的是考查学生对知识的识记、理解、应用,而监测是考查学生运用所学知识与技能解决问题的能力,其中可能会用到识记与理解的层次,但重点是解决问题或创新的能力。如三角形面积公式这一知识点,传统考题基本上是告诉三角形的底边与高的长度求面积;监测试题则强调在具体情境中解决问题,例如有一根长10米的绳子,请你围成一个三角形并计算面积。两者之间差距很大,后者“怎么围”是学生解决问题的关键,同时因为不同的学生围的方法不一样,结果也就不一样,没有标准答案。三是传统试卷编制与阅卷往往是由经验丰富的教师或教研员完成,受人为因素的影响比较大;监测工具对题型、试题数量、试题位置以及每道试题的题干、选项、设问等都有严格要求,开放性题目的答案更是由一个个代码组成,有效控制监测工具因人为、环境因素影响而带来的问题。
如何编制质量监测试题
小学数学质量监测试题一般有客观题和主观题两大类,每一类都包含多种题型,下面重点介绍选择题和解答题的编制。
1.客观题(选择题)的编制。
选择题具有信度较高、覆盖面较宽、比较容易建立常模等特点,同时因其效度较低、測验时被猜测的可能性较大等问题,一般用于对陈述性知识的测验。一道完整的选择题由题干和选项组成,命题的一般步骤是:定测评点、根据测评点写题干和答案、写干扰项、修正题干和选项、排列选项、全卷调整答案分布。
题干主要包含情境、已知数学信息和数学问题,编制中要注意三个问题:一是设计的问题一定要指向双向细目表中的指标,即测评的内容维度和能力维度均要考虑;二是情境即题目材料要适用于我国所有版本的教材,要适合所有学生的程度,避免文化偏差,要能激发学生的进取心,要具有正确导向;三是语言正确、简洁、得体,同套工具的设问方式应该统一。
选项编制除了答案唯一,各选项独立,选项在长度、结构、类属、难度上保持一致,避免题目提供答案线索等要求外,还要做到编错误的选项可把正确概念的内涵、外延扩大;尽量不要出现“以上都不对”,刺激不均衡;编4个选项,一般按升序或降序排列;设计每一个选项的理由要明确,即所有的干扰项都应该代表不同的错误类型(见表1)。
2.主观题(解答题)的编制。
解答题相比选择题效度要高,但存在信度低、覆盖面窄、常模建立较难等问题,常常用于程序性知识的测验。解答题的编制主要有题干情境材料、设问、赋分和评分标准。呈现方式通常是用图文并茂的方式给出一个具体情境,再编两至三个答案是开放性的问题,并按由易到难的顺序排列。语言表述、内容选择、设问方式等要求与选择题编制要求一样,主要体现在赋分和评分标准的不同。对于开放性问题的赋分,核心是分析学生作答的思维活动,根据测量的目标把学生的作答情况分成不同类型和不同水平,然后用双位数编码计分,即用两个不同的数字表示学生的作答情况,一个数字表示正确程度,另一个数字表示反应类型。如一个计算机俱乐部有40名成员,其中60%是女孩,后来有10个男孩加入俱乐部。现在女孩所占的百分比是多少?写出计算过程(见表2)。
小学数学质量监测试题的质量分析
一道高质量的监测试题必须经过反复预试和修改才能产生。试题编制完成后,除了组织专家团队对内容、题干、选项等进行质性检核外,还要选择有代表性的样本进行预试,并根据试测过程中所收集到的有关该题难度、区分度、选项百分比等数据信息,对题目进行筛选与修订。
样题1:以下物品最可能为2公斤的是()。
A.一支铅笔 B.一块橡皮擦
C.一个苹果 D.一条草鱼
对样题l的选项、难度、区分度进行分析,结果如表3所示。
分析显示,此题的正确答案是D,选择A、B这两个错误选项的学生比例非常少,尤其是A,只有o.5%,说明这两个选项的干扰性不强。其次,区分度为o.12,区分度的标准一般如下:区分度>o.4,说明题目区分度非常好,能有效鉴别被试能力;区分度在o.30-0.39,说明题目区分度比较好;区分度在o.20-0.29,说明题目区分度一般,需要重新修改;区分度低于o.19,说明题目区分度不好,直接删除。
综合而言,这道题A和B的选项需要修改,进一步将A修改为“一个水杯”,B修改成“一箱牛奶”。再次进行质量分析,结果如表4所示。
分析显示,虽然此题正确答案是D,但是选择B这一错误选项的学生比例与D相当,这时候需要分析B是否也有可能正确,比如一箱的概念不明确,具体一箱有多少个可能会影响选择,因此需要对B选项再次进行调整,将B改成“5个鸡蛋”。再一次质量分析,结果如表5所示。
修改后的所有选项比例合适,难度适中,区分度合适,题目质量较好。
由于是主观题,测试前需要对学生的作答情况进行主观题编码,编码规则如表6所示。
预试后,对学生的作答情况进行编码,统计分析结果如表7所示。
对学生作答情况的分析显示,“部分对”的三种情况比例都较低,说明没有必要分成3种情况,可以将“ll”和“12”合并,这两种都代表一类错误,“13”并人“01”。另外,阅卷过程发现,将合唱队的长度画成舞蹈队1/4的学生比例较多,这一类学生在当前编码下只能判为“01”,全错。但是这部分学生的实际能力应该比其他学生强,因此对编码进行调整(见表8)。
根据新的编码规则重新阅卷,分析结果如表9所示。
修改后的所有编码比例合适,题目质量较好。