刘晓萃
(沈阳市教育研究院)
2020年10月13日中共中央、国务院印发的《深化新时代教育评价改革总体方案》明确指出:“完善义务教育质量监测制度,加强监测结果运用,促进义务教育优质均衡发展。”《义务教育质量评价指南》(教育部基础教育司2021年3号文件)强调要强化评价结果应用,指出:“各地要不断完善义务教育质量评价结果运用的机制,充分发挥评价结果对提高义务教育质量的引领和促进作用。”如果说教育评价改革是基础教育改革的“最后一公里”,那么“结果应用”就是教育评价与质量监测的“最后一公里”。教育质量监测结果应用是教育质量监测工作的重要环节之一。本研究以数学学科为切入点,借助地方自主开展的教育质量监测项目所获得的数据,以“评价多角度、数据全反馈”为研究方法,从市级层面对监测数据结果进行分析与应用探索。
弄清楚教育质量监测、结果分析与应用、数学学业质量的概念,是本研究顺利进行的基础。
教育质量监测通常是指对大规模或较大规模群体采用抽样方式,围绕教育质量以及影响教育质量形成的相关因素采集数据,根据数据反馈的信息检查对应群体的教育质量是否符合质量标准的活动。在本研究中,教育质量监测是指由市级教育质量监测部门组织开展的,以教育质量综合评价为核心的,以“大数据·微诊断·深服务”为主要特征的,针对全市小学四年级学生、教师、家长自主研发的监测项目。本研究的样本量年均六万余人。
教育质量监测结果具有数据多样、关注全面、可多重比较、可关联分析的特点,其功能主要体现在三个方面:一是把握现状,为教育管理与决策提供参考;二是诊断问题,为教育教学改进提供依据;三是引导舆论,为社会、学校树立导向。在本研究中,市级层面的结果分析与应用其价值主要在于精准定位、诊断教学、找出顽疾。此外,其对于区县专业化建设和学校、教师的教学改进行为也具有重要作用。
学业质量是教育质量监测中的重要组成部分之一,本研究中的数学学业质量监测工具属于标准参照测验,其使用的目的在于诊断教学是否达到标准以及达到标准的程度。具有“新、实、活、准”四个特点,并遵循四个基本原则:一是依据课标,符合课标要求;二是突出素养,能力立意,避免机械记忆题;三是贴近生活,情境贴近学生实际生活;四是难度适当,不出偏题、怪题。工具的命制范围是四年级上学期学段学生应掌握的课程标准及学业标准规定的内容和应达到的能力水平。满分为100分,作答时间为60分钟。
当前,以学生发展水平及影响学生发展因素为核心建立国家级教育质量测评体系。用来监测基础教育是否达到应有教育水准,成为了许多国家的政府行为。一些国际组织也开展了跨国界基础教育质量大规模的比较研究。如国际数学和科学成就趋势研究(TIMSS)、国际阅读素养进步研究(PIRLS)、国际学生评估项目(PISA)、非洲法语国家联盟教育系统分析项目(PASEC)、南非东非教育质量监测(SACMEQ)、拉丁美洲教育质量评价实验室(LLECE)等。越来越多的国家开始关注如何使测评结果能够发挥更大的作用,如何能对教育质量的改变和提升产生积极的影响。
就我国而言,2015年正式发布的《国家义务教育质量监测方案》,在我国教育质量监测实践上具有重要的里程碑意义。2018年7月,教育部基础教育质量监测中心发布了《中国义务教育质量监测报告》,对我国义务教育阶段学生德智体美和学校教育教学等状况进行了客观呈现,并对如何进一步提升义务教育质量提出了建议。尽管我国大部分省市对来自大规模学业、非学业调查的数据应用范围与教育质量改进的研究还较为有限,但相应的行动已经起步。
2018年7月,教育部基础教育质量监测中心正式启动了国家义务教育质量监测结果应用试点工作,全国有35个县区成为试点县。深圳市福田区通过打造“数据玩家”和构建“结果应用体系”,从人才和机制两方面入手推进质量监测结果的研究和应用;四川省教科院构建基于监测结果应用的“省→市→县(区)→校”四级联动精准教研;成都市武侯区尝试根据教育质量监测结果及应用推广建立考核问责机制;江西省南昌市东湖区提出“一分监测,九分应用”。这些都表明,开展监测结果的分析与应用至关重要。
教育质量监测的价值体现依赖于对结果充分、有效的应用,而监测结果的应用重在关注如何能更好地发挥监测结果的作用、实现测评的主要目标、产生更有意义的影响,并最终促进基础教育质量整体水平的提高。
从实践层面上来说,监测和考试的最大区别在于拿到数据之后,考试划的是句号,监测划的是冒号。冒号前面,是设计方案、研制工具、组织实施、数据采集;冒号后面,是分析数据、发现典型、改进教学,核心在于数据的分析与应用。
本研究从市级层面入手,介绍相应的数据分析与应用策略,目的是强化学校和教师的数据意识,在教学中实现从经验型向数据型的转变,共同推进教育教学的反思改进。
我们将全市区县按照区域类型进行划分,如划分成市内、近郊、远郊,进行数学平均分比较。以2018年的数据为例,可以看出,无论是按学生全体还是按男生、女生比较,区域整体成绩由高到低的顺序均保持一致,即市内、近郊、远郊呈阶梯式下降。同时,与语文、英语等学科相比,男生、女生性别差异不大。分析区域类型,可以帮助教育行政部门对全市的数学学业质量有准确判断。(如图1)
图1 数学业成绩不同区域重型平均分对比情况
如图2所示,以2019年的数据为例,在全市13个区县中,有6个区的平均分高于全市整体平均,其他区县成绩低于全市平均。相对位置最靠前的A区,平均分数高于相对位置最靠后的M区14.82分,说明区域间的学业质量存在一定的差异。
图2 数学学业成绩各区县平均分对比情况
如图3所示,通过及格率的横向比较,可以看出,13个区县中有10个区县的及格率超过百分之九十。及格率最高的为A区,为98.72%,及格率最低的M区,为84.58%,两者相距14.14%。及格率反应了区县数学学业质量的达标程度,从数据中可以看到区县间的差异。通过差异分析,可以帮助行政部门从均衡发展的角度,制定相应的政策。对于发展水平较低或是质量相对薄弱的学校,行政及教研部门可以开展有针对性地联合指导服务。
图3 数学学业质量及格率对比情况
依据电子化测评系统,每年的学业质量监测数据都可以查阅到。为了使数据更有生命力,可以通过对不同年份的数据再挖掘,进一步分析区县的发展趋势,总结发展规律。如图4所示,可以将各区县的数学学业成绩平均分重新整合,对比全市,计算2017、2018、2019三年的提升百分比,(图中按照2019年的提升百分比进行排序)从趋势中找出各区县数学学业质量的优势和不足。从图中可以看出,A区、B区、C区数学成绩扎实稳步,优势明显,每年提升百分比超过百分之四;F区在2018年有显著地下降,2019年又逐渐回升,成绩高于全市;G区虽然连续三年低于全市,但差距较小;值得关注的是M区,其连续三年成绩均显著低于全市,且数学学业质量越来越薄弱,背后的原因需要深入挖掘,建议通过实地调研,利用座谈、听课、开展数学相关因素的二次调查等,找出破解之道。
图4 各区县三年数学平均成绩变化趋势
这里需要说明的是,为消除不同年份试题难度不同带来的分数差异,需要纵向比较,采用提升百分比进行计算。公式如下:
通过对教育质量监测的理解及对监测结果的分析,我们来探讨数学学业质量的教学改进路径。
对照课标,可将内容领域分为数与代数、图形与几何、统计与概率、综合与实践四个维度。从分布来看,全市学生在统计与概率维度得分率最高,综合与实践得分率最低。另一方面,女生在四个领域的得分率均高于男生,尤其是在得分率较低的综合与实践维度。通过四个维度的对比,可以看到,需要在教学中,根据具体情况,有针对性地加强综合与实践内容的教学,进而有效提升。(如图5)
图5 数学内容领域得分率分布情况
从能力层级分布来看,对照课标的了解、理解、掌握、运用四个层级,学生“掌握”这一部分得分率最高,“运用能力”得分率相对较低,女生在各能力层级得分率均高于男生。(如图6)因此,应加强教学中学生活学活用知识的能力,创设贴近生活的实际情境,提升他们的非常规问题解决能力,进而提升知识的运用能力。
图6 数学学科能力层级分布情况
要对试卷中的题目进行有效分析,从而找出教学的侧重点。如:
今年阅兵方队中的陆军学员方队除两名领队外共350人,排成25行,计算每行人数的正确列式是( )
A.350+25
B.350-25
C.350×25
D.350÷25
此题的出题意图在于考查除法运算中“常用的数量关系”,属于数与代数中数的运算部分的简单题目,对应能力层级为运用。这是实际考试中得分率较低的一道题目。分析得分率低的原因,主要集中在两个方面:一是数量关系的运用能力尚有待提高。学生平时的练习中要考查的多为单价、数量与总价的关系,而此题为新的情境,如何找出数量关系,是此解答题的核心内容;二是审题不够准确。从选项分布来看,选择C项的学生占比33.53%,错因是学生没有读懂题目要求,将350人看成了每排的人数。
教育质量监测的结果分析与应用的核心在于,当监测数据采集完毕并公布原始数据后,在实施过程中应让相关教育部门和教师去判断并决定在实践当中要采取什么样的调整措施。本研究中所阐述的策略仅仅是对数据的第一次加工和分析,还需要利用“服务引领模式、协同攻关模式、学校改进模式”的相关机制。要通过实地调研,聚焦专业化,让数据的应用主体,即参评的学校和教师,对数据进行二次开发;要构建从“拿数据—看数据—用数据”的闭环模式,从而促进教学质量的提升,为质量研究、质量管理的转型升级提供有力抓手。