王志国
问题背景
教育质量综合评价改革是一项涉及面广、专业性强的系统工程。提高教育质量是《国家中长期教育改革和发展规划纲要(2010-2020年)》的战略目标之一。2013年6月教育部发出文件《教育部关于推进中小学教育质量综合评价改革的意见》(教基[2013]2)(下简称《意见》)中提出了教育质量综合评价的5个方面20项关键性指标。不仅有学业水平发展的,还有非学业水平发展的。学业发展水平的评价是大家比较熟悉的领域,但也是综合评价改革的一个重点和难点。学业发展水平不仅仅是学业成绩,还包括学生的情感、态度与价值观;不仅仅只有知识和技能,还要能测量出学科思想方法、实践能力、创新意识。综合评价着眼于整体而非单个方面的教育质量状况,评价结果涵盖了学生的德智体美等各个方面的发展状况,以及影响学生发展的相关因素,如学校师资状况、课程教学状况、学校管理状况等。这次改革的指导思想,就是要贯彻党的教育方针,落实立德树人根本任务,遵循学生身心发展规律和教育教学规律,促进素质教育深入实施。改革的总体思路,主要是“强化导向,促进发展,协同推进”。《意见》强调要改革评价方式,要通过直接考查学生群体的发展情况评价学校的教育质量,注重全面客观地收集信息。我们知道,教育质量评价要做两件事:一是建立健全中小学教育质量综合评价体系,包括建立综合评价指标框架、健全评价标准、改进评价方式方法、科学运用评价结果等;二是运用一定的方法进行评价。从培养学生全面发展的角度出发,为了实现对学校的全面客观公正的评价,本文尝试构建科学的、综合的中小学教育质量评价指标。一方面,加强并充实对素质教育重要方面的评价,为评价提供多元的参照标准,建立健全教育质量评价指标体系;另一方面,使用研制出的指标对东城区及区域内各中小学校教育质量进行全面、深入的评价,认识教育质量现状,了解教育中存在的问题,引导社会、学校、教师和家长更加关注学生综合素质的培养,促进学生德智体美各方面的全面发展。
综合评价指标
首先将教育质量综合评价的指标框架的5大方面20个关键指标,进行了整合,分为学业发展水平、非学业发展水平和学业负担三大方面,形成具有东城区特色的评价指标体系。并围绕该指标体系设计六项指数。
1. 学业水平指数
首先我们必须承认,中高考是教育质量评价的重要方式,知识技能素养是衡量学生质量的一个重要方面,即使教育质量观在不断更新,教育质量评价内容越来越全面、广泛,我们也不可否认,学生的学业成绩始终是评价教育质量的关键内容。国际测评项目如 PISA、TIMSS 等都对学生进行了学科测试。但是其主要以单一的考试分数、学校升学率作为评价学生、评价学校的依据。在简捷有效地选拔人才的同时也引发了一系列的问题。在新的高考改革方案中,改革的重点是高考录取实行“两依据、一参考”综合评价方案。为了突出学业水平发展状况,并扭转长期以来单纯使用学生学业考试成绩作为教育质量评价的唯一指标的弊端,本文設计学业水平成绩,并仅作为教育质量评价的指标之一,反映教育质量的一个方面。学业发展水平又细分为知识技能、学科思想方法、创新意识、实践能力。前三项我们通过考试成绩来量化,实践能力我们将研发问卷,达到量化的效果。考试成绩数据我们将会利用现有中高考成绩,会考成绩或是一模成绩,不再单独设置考试,以减轻学校和学生负担。学业水平指数是将考试成绩转化为 T 分数后的各学科 T 分数的加权平均数(其中权重设置为课时比)的90%和实践能力维度T分数的10%构成。学业水平指数高,代表学生的学业成绩好,学科素养高,学校重视学科教学,关注中高考成绩。
2. 非学业素养指数
教育改革发展的重点是促进学生全面发展,着力提高学生服务国家服务人民的社会责任感、勇于探索的创新精神和善于解决问题的实践能力。在全面发展的教育质量观指导下设置非学业素养指数,是为了衡量学校对学生除学业素质以外所有素养的提升所做的努力程度。非学业素养指数是将学生品德发展、身心发展和兴趣特长养成三个维度的得分转化为 T 分数后的算数平均数(或加权平均数)。这三个方面的发展,关注的群体有所不同,比如品德可能是社会最关注的,身心发展应该是家长最关注的,而兴趣特长可能是孩子自己比较关注的,三者的比重是否应该一样,我们还需要探索。本指数的设计是想引导社会、对学校和家长,不仅要关注学生的学业成绩,也要重视学生的非学业素养,打破单一考试论英雄的状态。非学业素养指数高,代表学生的全面发展水平高,学校关注学生的全面发展,重视学生除学业素养以外的整体素质提升。
3. 学业产出指数
学业负担本身不是教育质量的组成部分,而是取得教育质量的付出。《意见》倡导“减轻中小学生过重的课业负担”,倡导“高质、低负”的教育教学模式和经验,提高课堂教学效率,使学生以轻松饱满的状态投入到日常学习中。学校教育不仅要使学生获得良好的学业成绩,还要减轻学生的学业负担和学习痛苦,促进学生健康、快乐的学习与成长。现在我们都在提倡减负,那么是不是学生负担越轻越好?肯定不是,自古就有“书山有路勤为径,学海无涯苦作舟”“一分辛劳一分才”等说法。当然过重也不行,不能损害学生的身心健康。既不能太轻也不能太重,所以我们关注在同样的付出下,学生获取成绩的效率,设置学业产出指数。学业产出是将两者相结合,既关注学生的学业产出,也关注其时间投入、学生的学习压力和感受。学业产出指数是学生的学业水平指数与学业压力水平维度分数转化为 T 分数后之比。学业产出指数大,代表学生在每个学业压力上所得的学业成绩高,意味着学生是在快乐的学习,轻松的学习,幸福的学习。
4. 相关指数
《意见》指出,综合考查学生发展情况,既要关注学业水平,也要关注学生的品德发展、实践能力提高、身心发展和兴趣特长等学生综合素质的考查。在引入非学业素养后,它与学业水平之间会产生什么样的关系?促进了还是拖后腿了,或者是没什么关系,要用数据说话。不能强调了非学业素养,就忽略了学业成绩。目前二者是什么关系还不能确定,应该还不至于到负相关,但是这也很难说,因为学习时间是有限的,非学业类也需要花费时间,那就要看产出效率。如果通过非学业发展,身心健康了,精神愉悦了,产出效率自然就高了,那么学业成绩就会提高。我们需要证据,来对学业和非学业之间进行平衡,于是设置相关指数。相关指数就是统计学中的相关系数。根据相关系数值的大小,一般相关系数值在-1到1之间,可确定相关关系。系数大于零是正相关,系数小于零是负相关,系数等于零则是零相关。系数的绝度值越接近于1,相关性就越强。
5. 分化指数
两极分化对大部分教师来说是个永恒的话题,随着东城区“就近入学”和“校额到校”等一系列招生制度的改革不断推进,很多教师已经感觉到了分化越来越严重,分化起始年级越来越低的现象。防止两极分化,促进学生均衡發展是学校教育任务之一。那么到底分化到了什么程度,我们需要数据来呈现,于是设置分化指数。借用经济学中的洛伦兹曲线来定义分化指数。将横轴设为累计学生百分比,纵轴设为累计学生学业成绩百分比。洛伦兹曲线与完全不分化的直线型的洛伦兹曲线构成的面积和完全分化的折线型的洛伦兹曲线与完全不分化的直线型的洛伦兹曲线构成的面积之比,定义为我们的分化指数。一般来讲,洛伦兹曲线弯曲程度越大,分化越严重。
6. 进步指数
2005 年《全民教育全球监测报告》中提到:评估教育的输出质量,即学生的质量,如果忽略了学生最初的差异可能会产生误导。陈玉琨教授也曾建议在基础教育质量监控体系当中,要关注学校给学生作了多少贡献,而不是学生的绝对水平。因此,在评价教育的输出质量,应考虑学生的基线水平,设置进步指数。进步指数是当年学业水平成绩指数与基准年份学业水平成绩指数比值和当年非学业素养指数与基准年份非学业素养指数比值的算术平均数(加权平均数)。进步指数以本校已有的教育质量为基线,通过纵向数据比较,考查教育质量的提升,学生整体发展状况增量的指数。进步指数是学校对学生提供需要的能力及其变化的工具。进步指数越大,意味着学校教育的增量越大,学校提供学生需要的能力越强。
评价结果
以学业发展水平、非学业发展水平和学业负担三个方面为核心,用六个指数来衡量,从综合的角度出发,关注学校发展的整体水平。难点在非学业水平测试工具的研发。核心的技术就是数据分析。我们是从学校和学区两个层级来进行。本评价指标能有效扭转单纯使用学业成绩作为评价教育质量的唯一指标现象,可以很好的区分这三类学校。第一,有的学校不仅学业成绩高,在其他多个指标上结果都很好,这样的学校是全面提升教育质量的结果,要引导、鼓励学校办这样的教育。第二,有的学校学业成绩优异,但在其他指标上结果呈现并不好,这样的办学理念不是正确的教育质量观,单纯学业成绩高的学校更加没有必要炫耀。第三,有的学校学业成绩仅处于中等水平,但是其他指标结果却很好,这样的学校是高教育质量的,如果单纯使用学业成绩评价教育质量,这些高质量的学校只能被失误地排除在外。
教育质量综合评价的最终目的不是对各学校过去所取得成绩进行甄别和排序,而是帮助各学校认清自身的教育现状、发现教育教学中亟需解决的问题和自身发展的瓶颈,找到未来发展的方向,是为教育决策部门提供科学的依据和有针对性地改进建议,引导正确的教育质量观。切实做到以评价促发展的宗旨,推动了中小学提高教育教学质量以及特色办学。
(作者单位:北京市东城区教育研修学院督导评价中心)