陈锦琪 廖树山 乔柳婷
摘 要:运用多维项目反应理论对高中地理学业水平合格性考试进行分析,可以有效测评学生的地理学科核心素养水平。教师可通过多维项目反应模型选择、建立地理学科核心素养Q矩阵表、将学生地理学科核心素养参数转换为地理学科核心素养水平,得出学生群体地理学科核心素养掌握情况、学生个体地理学科核心素养掌握情况,从而确定试题与地理学科核心素养属性考查之间的关系,进一步诊断学生的知识、能力、素养等水平。
关键词:多维项目反应理论;地理学科;核心素养;学业水平;地理合格性考试
中图分类号:G63 文献标识码:A 文章编号:0450-9889(2024)02-0052-03
地理学科核心素养包括人地協调观、综合思维、区域认知、地理实践力四个维度。一次地理考试需要考查学生多维度的素养水平,一道试题常常涉及多维度素养的考查。因此,如何通过试题测评判断不同维度中的学生地理学科核心素养水平成为亟待探讨的问题。多维项目反应理论(Multidimensional IRT,MIRT)为解决这一问题提供了新的途径。多维项目反应理论是基于单维项目反应理论(Unidimensional IRT,UIRT)和因子分析发展起来的新型测量理论,主要研究考生多种潜在特质和测验项目反应概率之间的关系,通过赋予试题考查的核心素养类型与考生群体作答情况,评估考生掌握不同维度核心素养的水平与概率,进而实现素养测评功能[1]。
核心素养是具有高度抽象、复杂结构的高阶能力,是隐含在学生品格与关键能力之中,超越以往知识和技能的范畴,这给地理教育测评带来了挑战。多维项目反应理论在学科素养测评的应用已经有一定的研究成果。林子植等学者运用PISA数学素养结构模型与多维项目反应理论模型对某地区八年级部分学生进行数学素养测评,结果表明,多维项目反应理论能够准确有效评估学生素养水平[2]。孟琪采用多维项目反应理论对某地区高一学生进行数学素养测评,能够深入分析学生在每个素养维度上的表现[3]。许志勇等学者采用多维项目反应理论对某省高考数学试卷进行分析,为提升命题质量和改进教学提供了依据[4]。由此可知,多维项目反应理论能够有效测评学生的地理学科核心素养。
基于此,本研究运用多维项目反应理论对某省高中地理合格性考试(以下简称地理合格考)数据进行处理,从而检测某省高中生地理学科核心素养表现水平是否达到国家学业质量标准水平2的合格要求。
一、数据来源与处理
本研究以2022年某省地理合格考无偏抽样10 000份考生作答数据为例,全体考生平均分为88.3分,标准差为12.0;抽样考生平均分为82.4分,标准差为11.8。可见,抽样数据质量良好。地理合格考试卷共有25道选择题,3道非选择题。其中,每道选择题为3分,非选择题以填空题为主,每空1分。由此,可将考生每道选择题分数整理成“0-1”计分形式。
二、研究方法与过程
根据多维项目反应理论的测评步骤与该省地理合格考模式,本研究主要过程包括以下步骤:选择合适的多维项目反应模型→确定试题的Q矩阵→导入数据进行模型拟合→估计考生的地理学科核心素养能力参数→将考生地理学科核心素养能力参数转换为地理合格考模式下的地理学科核心素养水平。
(一)多维项目反应模型选择
当前,地理合格考试题题型以“0-1”分值较多,但也有若干题为非“0-1”分值,为了用适合的数据模型进行计算,笔者采用多维等级项目反应模型(MGRM)作为多维项目的反应模型[2]。等级反应模型的数学表达式如下:
P([xij]≥k|[θi],[aj])=[11+exp[-D(aTjθt+bj,k)]]
式中,k代表第k级水平,[θi]代表第i名考生的能力参数,[aj]为第j道试题的区分度参数,D为模型调整常数,[bj,k]为第j道试题上的第k级水平的难度参数。
(二)建立地理学科核心素养Q矩阵表
地理学科核心素养中的Q矩阵可以用来确定试卷每道试题所考查的核心素养类型,即描述试题与属性间的关系。笔者邀请学科专家与一线教师对每道试题所属的核心素养类型反复论证,确定试题考查的核心素养Q矩阵,通过矩阵方式将核心素养转化为可观测的反应模式。在试题Q矩阵中,“1”表示考查了该素养,“0”表示没有考查该素养(如表1所示)。
(三)学生地理学科核心素养参数转换为地理学科核心素养水平
多维等级项目反应模型(MGRM)计算的核心素养参数结果大致以(-3,3)范围的正态分布,相对于百分制的呈现方式来说,教师和学生较难理解。同时,该省高中合格性考试的考试成绩以“合格”“不合格”呈现,“不合格”比例不超过当次当科考生总数的2.00%[5]。由于没有建立标准参照型考试的试题库,导致不同批次考试因实际难度差异而使合格分数发生变化,从而影响不同年份分数之间的比较。基于以上考虑,将MGRM模型计算的核心素养参数采取赋分的办法加以修正,转化为[100,0]数值范围。其中,对于成绩合格的考生,将其核心素养参数赋值为[100,60]之间,具体赋值公式如下:
[xmax-xx-xmin0.02]=[100-yy-60]
式中,x为某考生的地理学科核心素养参数,[xmax]为该考生群体中最大的地理学科核心素养参数,[xmin0.02]为该考生群体中2%分位的地理学科核心素养参数,y为转换后的学生地理学科核心素养水平。同样,对成绩不合格的学生,将其地理学科核心素养参数赋值为(60,0]之间。
三、研究结果及讨论
(一)学生群体地理学科核心素养掌握情况分析
省级地理合格考主要测评学生国家地理学业质量水平2级的达成情况。因此,当学生的某项核心素养水平达60分以上,即可认为达到国家地理学业质量水平2级的要求。基于此,笔者统计了学生各项地理学科核心素养的掌握情况(如表2所示)。
由表2可知,首先,学生地理学科核心素养掌握模式中“1111模式”的人数占比为94.79%,说明绝大多数学生在完成国家地理必修一、必修二课程之后,形成了“人地协调观”“综合思维”“区域认知”“地理实践力”素养,达到地理学科核心素养2级水平,满足了高中毕业学业水平质量2级的合格要求。其次,学生地理学科核心素养掌握模式中“1110模式”的人数占比为0.93%,说明这些考生掌握了人地协调观、综合思维、区域认知素养,但没有掌握地理实践力素养。这需要教师在日常教学中多开展地理实践活动,培养学生的地理实践力素养。另外,有2.40%的学生只掌握其中三种不同的素养,说明这些学生在学习过程中某些素养发展受到限制,教师需要对其进行针对性培养。从表2中我们还可以发现,随着学生对素养种类掌握的减少,人数占比也在减少。掌握其中三种素养的学生比例约为0.80%,掌握其中两种素养的学生比例约为0.20%,仅掌握一种素养的学生比例约为0.10%,而有大约0.30%的学生没有形成任何一种素养。
(二)学生个体地理学科核心素养掌握情况分析
与传统考试结果仅有一个总分相比,多维项目反应理论能够提供考生多维度的核心素养表现信息,为深入分析学生核心素养掌握情况提供重要参考。笔者按照满分组、高分组、中分组、低分组随机抽取2022年某省地理合格考试题中各分段的三名考生,分别对其地理学科核心素养掌握情况进行分析,结果如表3所示。由表3可知,考生原始总分越低,其地理学科核心素养水平越低,说明学生的地理学科核心素养水平大致围绕着总分高低波动。另外,即使是原始总分相同的考生在各维度地理学科核心素养掌握水平也有差异。其中,总分为100分的考生,其四项地理学科核心素养均为满分的水平,但在高分组中,不同考生的地理学科核心素养水平存在差异。如ID8817考生,其综合思维水平最高,为96.5分;其次是地理实践力水平,88.4分;最低为人地协调观水平,82.9分,说明该考生的综合思维水平较高,但人地协调观素养是短板,因此,教师在今后的教学中需要侧重对其进行人地协调观素养培养。同样,总分是90分的ID236考生,其区域认知素养达到满分水平,但是人地协调观素养表现欠佳,得分不到70分。在低分组中,考生的地理核心素养均低于60分合格水平;ID8970考生的综合思维水平为24.2分;ID9570考生的地理实践力水平为34.8分。可见,考生学科核心素養的缺失,导致其地理学业水平欠佳。
四、结论及展望
笔者根据多维项目反应理论对2022年某省高中地理合格考抽样数据进行分析,结果显示,接近95.0%的学生掌握了地理学科核心素养,达到地理学科核心素养2级水平,符合高中毕业生地理学科的合格要求,学生对地理学科核心素养掌握情况良好。多维项目反应理论能够提供更丰富的学生核心素养测评信息。高中地理学业水平合格性考试是普通高中教学质量监测的参考依据,是衡量学生是否达到国家规定学业质量水平的测评方式。因此,通过多维项目反应理论中的Q矩阵,确定高中地理合格考试题与地理学科核心素养属性考查之间的关系,根据学生对试题的应答模式推断学生掌握某项核心素养的程度与概率,深入了解学生的核心素养水平和结构存在的优势与不足,可以进行针对性教学,达到提升学校或地区教学质量的目的。
值得注意的是,本研究仅运用多维项目反应理论对学生地理核心素养水平进行分析,而学生的课标要求达成度、知识结构、思维模式、技能水平等其他信息尚未发掘。作为国家大规模考试,高中地理合格考是权威的教育测评方式之一,教师能够从中搜集大量的学生学习信息数据,通过运用现代教育测量理论建立学生学习信息追踪测评系统,深入诊断学生的知识、能力、素养等水平信息,为指导学生明确学习方向提供翔实的信息,避免题海战术,有效落实学生地理学科核心素养的培养。
参考文献
[1]康春花,辛涛.测验理论的新发展:多维项目反应理论[J].心理科学进展,2010(3):530-536.
[2]林子植,胡典顺.多维项目反应理论在数学素养测验中的应用[J].中国考试,2021(5):72-80.
[3]孟琪.基于多维项目反应理论在考试中的分析和应用[D].南京:东南大学,2015.
[4]许志勇,丁树良,钟君.高考数学试卷多维项目反应理论的分析及应用[J].心理学探新,2013(5):438-443.
[5]广西壮族自治区教育厅.广西普通高中学业水平考试实施办法[EB/OL].http://jyt.gxzf.gov.cn/ztzl/lsgd/gkzhgg/zcwj/t11015296.shtml,2021-12-23.
注:本文系广西教育科学“十四五”规划2022年度考试招生研究专项课题“省级普通高中学业水平考试合格性考试学生核心素养水平测评的研究”(2022ZJY2329)的研究成果。
(责编 杨 春)