胡志桥 朱华伟 杨健辉 李莉芸
推进区域中小学教育质量综合评价改革的实践与思考*——以广州市首次阳光评价测试为例
胡志桥 朱华伟 杨健辉 李莉芸3
自2013年广州被确定为30个国家中小学教育质量综合评价改革实验区之一以来,广州市积极推进中小学教育质量综合评价改革,并在 2015年正式实施。中小学教育质量阳光评价项目具体的评价改革工作在全市116所试点学校展开。改革工作取得了一系列初步成效并积累了宝贵的经验,为阳光评价改革工作的进一步开展奠定了良好基础,其存在的不足也使阳光评价改革工作的未来努力有了一定的方向。
阳光评价;综合评价;教育质量;教育改革
党的十八大强调,把立德树人作为教育的根本任务,全面实施素质教育,深化教育领域综合改革。国家中长期教育改革和发展规划纲要也提出,改革教育质量评价制度,基本实现教育现代化,必须建立与之相适应的现代教育质量评价体系。2013年底,广州市被教育部确定为30个国家中小学教育质量综合评价改革实验区之一。2014年5月28日,广州市召开中小学教育质量综合评价改革全市动员大会,启动以“阳光评价沐浴成长”为标识的中小学教育质量阳光评价改革实验(以下简称阳光评价)。两年来,广州市按照《教育部关于推进中小学教育质量综合评价改革的意见》[1],把扎实推进中小学教育质量综合评价改革,作为今后一段时期我市教育系统工作的关键与主题,作为应对社会经济挑战,破解教育发展瓶颈的重要工作。
根据“市区上下联动”、“以点带面推进”的工作策略,2015年,广州市在全市选取116所“阳光评价”试点学校(其中65所小学、47所初级中学或完全中学,其中4所学校因故放弃参加测试)的六年级和九年级学生(学号单双号抽取人数的50%作为年度测试的参评样本),合计14289人率先展开综合评价测试。本文以广州市首次测试为例,就中小学教育质量综合评价改革的区域推进模式、策略和实效进行总结与说明,并对其未来发展方向进行展望。
(一)建立自上而下的引领和自下而上的创新相结合的工作思路
1.做好顶层设计,坚持行政部门主导、业务机构实施、高校协同创新的工作机制
申报实验区成功之后,市教育局成立了由主要领导任组长的实验工作领导小组负责实施工作的统筹领导,同时在市教育研究院设立工作小组,负责全市中小学教育质量综合评价改革实验的组织实施。各区则参照设立了相应的组织和工作机构,配备专门人员。此外,市教育局还与华南师范大学、中山大学等单位联合组建了广东基础教育质量监测与提升协同创新中心,以着重解决指标研制中的一些重大理论问题。通过招标等方式,市教育局还与广东省心理学会等第三方智力机构建立合作关系,协同推进测评工具的开发、云平台的建设、数据的处理和分析等环节的工作。
2.做好宣传工作,坚持科研引领、上下联动、区域推进的实验工作策略
鼓励先行先试。全市各区依照市实验工作方案并结合本区实际,有重点地开展评价实验。例如,天河区在小学试验综合素质测评并发布报告,萝岗区与第三方合作对学生的学业和非学业素养进行测评并发布评价报告,海珠区运用阳光评价的理念和指标开展现代学校评估,花都区关注学生减负,黄埔区和增城区关注阳光体育,番禺区关注学生的文化认同。
坚持“市区上下联动”“区域重点突破”“以点带面”“点面结合”等实验推进策略。广州市选定了 116所试点学校,并给予专项经费支持,最大限度地调动了一线学校和教师参与评价改革的主动性和积极性。
以科研项目带动和凝聚全市中小学和科研机构以及高校的力量,促进重大理论和实践问题的解决。将“广州推进‘阳光评价’的理论与实施研究”纳入广州市教育科学“十二五”规划2015年度重大课题选题,并通过其他一系列课题项目带动实验工作的深入开展。目前,围绕阳光评价的科研项目包括:国家社会科学基金“十二五”规划课题“促进区域教育均衡发展的学业质量评价体系研究”(2013—2016年)、广东省教育科研“十二五”规划2013年度课题“中小学教育质量综合评价改革与中小学德育质量提升研究”;广州市教育系统第二批学术创新团队“广州市中小学教育质量综合评价体系研究”项目。
(二)培养专兼结合的评价专业队伍,着力解决实验推进的专业保障
在实验期结束后,广州市将实现中小学教育质量综合评价工作常态化。这需要坚强的专业基础能力建设和队伍保障。依托华南师范大学、市教育研究院、广州市特级教师协会等专业机构,强化专业培训,逐步培养和建设一支具有先进评价理念、掌握评价专业技术、专兼职相结合的专业化评价队伍。截止到2016年4月,广州市完成了以全市义务教育阶段学校、普通高中学校和各区教育部门的管理人员(共 580人)为对象的教育评价与测量技术专项培训,组织了一期面向各区教育行政部门、教育科研部门和学校管理人员(共 120人)的中小学教育质量综合评价改革实验专项培训。六次市本级培训人数达 700人,覆盖所有的市和区直属学校,参与实验的教育行政人员、管理人员和业务骨干基本上接受了市本级的培训。此外,各个区和部分学校还组织了面向校长和全体教师的区一级培训和校本培训,取得了明确目的、转变观念、落实行动的效果。在所有这些工作的具体的推进中,广州市始终坚持教育部门顶层设计和统筹实施的主导地位,各项工作并不是完全委托和依赖第三方机构,而是派出人员与高校专业机构深度合作,密切研讨,共同推进,从而达到锻炼自身队伍的目的。
(一)基于核心素养,落实立德树人根本任务,建立具有区域特色的评价指标体系
建构广州市中小学教育质量阳光评价标准指标体系是广州市中小学教育质量综合评价改革实验工作的重点。广州市在建构阳光评价指标体系时,始终坚持落实以立德树人为根本任务的价值取向,参考了关于学生核心素养的最新研究成果,将核心素养中有关社会交往、文化素养和自主发展等指标融入进来,初步构建了涵盖小学、初中、高中三个学段,包括学生的品德与社会化水平、学业发展水平、身心发展水平、学习潜能、学业负担状况、对学校的认同六个方面共22项指标的广州市中小学教育质量阳光评价指标体系。这些指标体系总体上涵盖了教育部提出的核心素养的5大方面,原则上保留了20个关键性指标,同时在评价内容上增加了学校文化认同这一项,以反映广州市中小学近些年开展的以学校特色发展促进区域教育均衡发展、优质发展的成果,体现了地方特色。
(二)整合创新,建构科学简洁的学业和非学业评价体系,着力解决“评价落地”的问题
阳光评价通过直接考查学生群体的发展情况来评价学校和区域的教育质量。它注重全面客观地收集信息,根据数据和事实进行分析判断,改变过去主要依靠经验和观察进行评价的做法。评价内容每一项指标又包含若干个具体的观测点。如果针对每一个关键指标和观测点开发评价工具,并覆盖小、初、高三个学段,这不仅是一个庞大的系统工程,而且在实施上也缺乏可行性。为此,课题组采用整合创新的方法,研制了一套涵盖学业方面和非学业的评价工具体系。
1.在测评方面,采用“学业测试+问卷调查+非学业量表”相结合的方式,对学生进行多层面评价:通过学业测试,了解学生学业发展水平;通过与学业测试配套的问卷调查,探讨影响学生学业发展的相关因素;通过非学业问卷调查,从多方面了解和评价学生的综合素质。
2.在学业测试方面,继承广州市开展学业评价的宝贵经验,基于义务教育阶段17个学科学业质量评价标准,进行试卷的命制和学业影响因素问卷的设计。
3.在非学业评价方面,我们对各项评价关键性指标进行归类,并参考国内已有研究和国外的权威量表,编制了非学业测试的大量表。经试测后对数据进行验证性因素分析处理,根据结果调整题目后形成了能够覆盖六大方面的评价内容和包含所有的关键性指标的量表。另外,课题组将不同测试内容的问卷格式和计分方式统一起来。这一创新做法解决了因量表过多而导致的增加学生负担的难题。
(三)运用先进的分析技术和方法,解决评价的科学性与可靠性问题
1.初步建成了基于网路、依托大数据和云计算的评价实施技术平台。阳光评价改革涉及到对大量数据信息的梳理、分析与评判。目前已经初步开发了基于网络、依托云计算和大数据的评价实施技术平台。该平台具有数据上传、后台管理、抽样与数据采集、自动化报告等功能,并能根据不同用户的要求设置权限,完成不同的任务。
2.全面采用科学分类方法。本次阳光评价测试数据的分析利用新的学生分类方法——潜在剖面分析(Latent Profile Analysis,LPA)[2]。LPA以学生为中心,依据学生群体在学业发展水平上的特点,诊断学生学业发展的质性差异,把学生分成组内学业发展一致、组间学业发展具有差异性的组别。
3.科学解决了分数合成的误差问题。在阳光评价指标框架下,各关键指标是存在一定关系的——评价指标内的关键指标相对同质,不同评价指标间的相对异质,由此在各指标分数的合成过程中可能产生误差。为解决分数合成中的误差,引进了新一代的测量理论——多元概化理论(Multivariate Generalizability Theory,MGT),很好地解决了分数合成问题[3]。
(四)创新评价总结方式,科学运用评价结果
只有对评价结果进行科学的归因,才能更好地发挥评价诊断现状、促进发展的功能。课题组改变了过去由组织评价的单位运用评价结果对参加评价的学校和学生进行鉴定分等的方式,采取由评价组织机构与参评学校共同研究评价结果数据,依据数据并且结合学校实际进行科学归因,合作撰写评价报告的方式。这种评价主体多元化的举措,使评价对象由评价的消费者(被动接受者)转变为评价的贡献者(或积极参与者),不仅建立了新的评价文化,而且更加有利于评价结果在促进学校工作和学校发展方面发挥积极作用。
2015年广州市阳光评价工作率先在广州市的116所试点学校展开,改革工作初见成效。
(一)获得了反映全市中小学生综合素质的评价数据
长期以来,中小学对于学生的评价都是通过学业测试、品德评价、体质测评等不同项目分别组织开展的。由于依据的标准和使用的评价工具各不相同,形成的结果难以加和,因此广州市一直欠缺对于全市中小学生综合素质比较全面准确的评价数据。虽然2015年广州市阳光评价项目以抽样的方式进行,但是对评价对象的综合评价实行了统一指标,而且样本的数量足够,产生的评价结果对广州市基础教育人才培养现状的判断具有充分的价值和意义。
统计数据表明,广州市中小学生的综合素质各项指标评价结果比较均衡,发展态势良好,同时存在进一步提升的空间。其中全市六年级和九年级的评价结果和分析如下:
图1 全市六年级六大评价内容整体表现
图2 全市六年级22项关键指标整体表现情况
从全市六年级六大评价内容的整体表现图(图1)可以看出,六年级学生在品德与社会化水平、学业发展水平和对学校的认同三方面得分相对较高,发展水平较好。课业负担状况也不算严重(该指标是得分越低,结果越好)。但学生在身心发展水平方面的平均得分最低,为3.77(说明:因为2014年的“国家学生体质健康数据”将被试一年前的体质健康状况作为“身心发展水平”中的“身体健康”指标,所以,与被试学生体质健康现状会有一定出入。下文中九年级的评价结果同此情况),表明六年级学生在身体健康管理、心理健康管理方面有待进一步加强。
从全市六年级 22项关键指标的平均得分图(图2)来看,表现最为突出的是“国家认同”这一指标,平均得分为 4.62;其次是社会责任、科技与人文素养、课业质量和对学校的文化认同,平均得分都在4.2以上;得分最低的是身体健康,仅为 3.15,自我管理和国际理解得分也较低,平均得分都在3.6左右。此外,六年级学生的学习时间和课业难度的平均得分都在中等以下的水平,学习压力的平均得分则在平均水平以上这说明六年级学生的学习时间适中,课业难度不是很大,但却面临着较大的学习压力。
图3 全市九年级六大评价内容整体表现
图4 全市九年级22项关键指标整体表现
从全市九年级六大评价内容的整体表现图(图3)可以看出,九年级学生在品德与社会化水平、学业发展水平和身心发展水平三方面得分相对较高,发展较好;课业负担状况也不算严重,处于中等水平;在对学校的认同方面的平均得分相对偏低,为 3.59,表明九年级学生对学校认同感较弱。
从全市九年级 22项关键指标的平均得分图(图4)来看,表现较为突出的是“国际理解”和“国家认同”这两个指标,平均得分在4.2左右;其次是社会责任、科技与人文素养和心理健康,平均得分都在4.0左右。得分最低的是身体健康,仅为 3.14。然后是家校关系、对学校的文化认同和教学方式的认可程度,平均得分都在3.6以下。学习时间、课业难度和学习压力这三个指标都是得分越低,结果越好。学习压力的平均得分为3.49,说明九年级学生的学习压力比较大。
(二)对学生学业评价予以科学的引导
首先,命题时均充分体现《课程标准》(2011年版)的相关要求,并且分别按照文体类型或知识模块、能力层次或认知层次两方面进行题目命制,突出能力立意,改变了以往学业测试单纯指向学科知识技能的偏向,对学生学业评价给予新的导向。
其次,改变了过去单一的学科学业评价方式,采用“学业测试+问卷调查+非学业量表”相结合的方式,有利于引导学校和教师在进行相关学科学业测试的同时,也关注学生的非学业因素。多层面地了解学生学业发展水平,探讨影响学生学业发展的相关因素,对学生学业状况进行科学归因,并且根据评价结果发现问题,积极改进教学,探索符合教育规律的提升学生学业水平的有效机制。
(三)检验了推进基础教育改革与发展的各项重大举措
1.本次综合评价统计数据表明,广州市中小学生的综合素质各项指标评价结果比较均衡,发展态势良好,尤其在品德与社会化水平两方面得分较高。另外,六年级学生的“国家认同”与“社会责任”得分排在前两位;九年级学生平均得分较高的是“国际理解”和“国家认同”这两个指标,其次是“社会责任”。这都足以证明广州市基础教育在全面实施素质教育、坚持社会主义核心价值观、落实立德树人根本任务方面得到扎实的推进。
2.本次综合评价统计数据显示,六年级学生阅读素养测试的得分集中分布在高分段,低分段的人数相对较少,说明六年级学生在此次阅读测试中的得分普遍高于平均水平;九年级学生阅读素养测试得分集中分布在中等分段,表明大部分九年级学生的阅读水平都能达到中等水平。这反映了近年来广州市中小学积极组织开展全民阅读活动和经典阅读活动,建设书香校园等取得显著成效。
3.本次综合评价统计数据显示,中小学生尤其是小学生学业负担状况得分较低。这表明广州市中小学在严格执行国家法规,减轻学生课业负担方面做了不少努力,有力地保障了学生的健康、全面发展。
4.本次综合评价统计数据显示,小学六年级学生对学校的认同得分相对较高,在文化认同、教学方式、师生关系、家校关系等方面对学校具有较高的认同度。这表明近年来广州积极推进特色学校建设取得了显著的效果,增强了学生对学校的认同感。
5.本次综合评价统计数据显示,学生在学习态度、兴趣特长潜能、自我效能等方面有比较高的得分。这反映了广州市广大中小学校在深化课堂教学改革、调动学生学习的自主性、关注学生的个性发展等方面付出的努力取得了预期的结果。
(四)为广州市中小学教育质量的进一步提升指明了方向
本次综合评价揭示了当前广州市中小学教育质量方面存在的问题。如从学生身心发展水平得分分布图来看,全市六年级和九年级学生在身心发展水平方面均只处于中等水平,其中“身体健康”指标得分最低,“自我管理”这项得分也比较低,反映出中小学生仍需加强体育锻炼,并自觉提高独立思考的能力和自我管理的能力。无论小学还是初中学生在“学会学习”“实践能力”方面得分均比较低,因此,学校需要采取更加有效的措施,帮助学生掌握正确的学习方法,为学生的实践能力培养创造更多的机会。在学科素养方面,学生的知识识记理解层面的水平明显高于应用层面的水平,表明今后中小学教学要进一步加大对学生思维能力和创新意识培养的力度。从学生学业负担状况得分分布图来看,大部分六年级学生的学业负担不是太重,而大部分九年级学生的学业负担则比较重,并感觉到较高的学习压力(不排除来自家庭的压力)。因此,通过提高课堂教学效率,加强家校联系,切实减轻学生过重的学业负担,缓解其学习压力,将是今后工作的重点之一。另外,本次综合评价也显示了广州市义务教育不同区域、学校之间存在的差异,义务教育在教育质量方面的均衡发展还任重道远。
(五)帮助试点学校明确了其问题所在
由于这次进行的是涵盖阳光评价 6大方面、22项指标的综合性评价,因此对于参加评价的试点学校来说就是进行一次全面的“体检”,而且各学校又在项目工作组的指导下,认真研读评价数据,直接参与到“体检”报告的撰写和分析过程中,由此能够对学校教育质量的现状进行科学准确地归因分析。评价结果优秀的学校在充分肯定自身工作优势的同时,也冷静地寻找仍然存在的不足;评价结果不佳的学校更要对众多问题进行深入分析,把影响教育质量的主要问题作为突破口,并且对症下药,寻找改进的良方妙策,同时也不忘努力挖掘学校某些方面存在的优势,从而增强学校进一步发展的信心。
(六)有利于促进学生的全面发展和个性发展
学生综合素质的“阳光评价”,改变了过去单纯以知识为内容、以成绩高低为结果的学业评价方式,为学生发展提供了多把评价的“尺子”,使每个学生都能发现自己的“闪光点”和存在的不足。由此,此次评价不仅能够增强学生自主发展的自信心,明确自我提升的努力方向,而且能够帮助老师全面准确地了解每一个学生的长处与短板,进而为促进学生的个性化发展提供有效的指导与帮助。
过去两年,广州市在推进中小学教育质量阳光评价方面做了大量工作,承担国家试验区的工作也取得了有效的进展。然而这只是一个开始,后面改革的任务还很艰巨,对广州市首次阳光评价测试的深入反思,总结经验,查找问题的基础上,未来发展主要定位于以下五个方面:
其一,进一步完善阳光评价指标框架,使这一体系能落实立德树人根本任务,引领地方教育发展,结构清晰,易于操作,具有区域特色。目前这个指标框架还处于初步构建阶段,要通过实验数据和事实进一步界定指标内涵,全面融入学生发展核心素养;进一步明确各指标的观测点,探索体质健康、作业时间、睡眠时间、品德发展、兴趣特长等指标的量化评定方法。这是广州市作为国家实验区的一项重要任务。
其二,推进信息技术与教育数据的深度融合,完善阳光评价实施云平台,提升测量的科学性与数据解释的准确性。首先,要以科学的理论支撑学业测量;其次,测量工具的编制、测量过程的实施及测量数据的分析要体现其科学性;第三,对数据解释要客观、准确,提出的建议要有可行性。
其三,进一步加强非学业测量工具的研发,提升测量的信度与效度。非学业测量是评价的难题,非学业测量工具的研发,一方面要依托学术机构的专业力量,另一方面要充分调动起广大一线教师参与的热情,充分发挥其实践智慧。有的指标如理想信念、好奇心和求知欲、潜能发展等非常重要,但要有效地观察测量,还需要在工具方法的层面做出更加精细的设计与实验,弄清各种指标与现象之间的联系与相关性。
其四,注重阳光评价研究成果的实践检验,以阳光评价助推广州教育。要及时运用、检验阳光评价的研究成果,并在实践中不断完善阳光评价的理论与技术,以阳光评价的实践效能推进广州教育的优质发展。在结果运用方面,广州市可在适当时候把对各个区及各学校教育质量的综合评价结果以督导分级的形式予以公布,以促进区域中小学的全面发展。此外,也可把教育质量综合评价的结果作为制定教育政策措施、加强教育宏观管理的重要参考,作为评价考核区域及学校工作的主要依据。
其五,进一步加强市、区、校统筹和协作力度,扩大实验的范围。在目前改革试验的基础上,计划将改革试点范围扩大到 400所学校,并于今年上半年完成申报推荐和审批工作。同时,充实市一级专业机构的专业队伍,关注和指导各区和试点学校因地制宜地开展评价改革,加强对阳光评价专项课题的指导与管理,提高对全市各区和学校的综合评价改革的指导水平。
阳光评价实验项目的宗旨在于扭转“重分数”“重升学率”的传统倾向,全面贯彻党的十八大精神,落实立德树人要求,深化教育综合改革,提升育人质量,努力办人民满意的教育。在此后的工作中,我们将进一步深化、推进改革工作,总结经验教训,并认真学习吸取其他试验区的先进经验,不断提高基础教育课程改革管理水平,进一步提升广州作为国家中心城市的教育质量,提高广州作为南方教育高地建设进程中排头兵的示范性和影响力。
[1]教育部关于推进中小学教育质量综合评价改革的意见.[EB/OL].[2013-6-3]http://www.moe.edu.cn/publicfiles/ business/htmlfiles/moe/s7054/201306/153185.html.
[2]张洁婷,焦璨,张敏强.潜在类别分析技术在心理学研究中的应用[J].心理科学进展,2010(12):1991-1998.
[3]黎光明,甄锋泉,王幸君,蒋欢,梁正妍.多元概化理论在教育测量与评价中的多维化分析[J].教育测量与评价(理论版),2016(2):13-17.
(责任编辑吴全华)
Practice and Reflections on the Reform of Improving Comprehensive Evaluation for Education Qualities in Regional Primary and Secondary Schools——A Case of Sunshine Evaluation Tests in Guangzhou
Hu Zhiqiao & Zhu Huawei & Yang Jianhui & Li Liyun
Since Guangzhou was intended to be one of the 30 national experimental areas to carry out the reform of improving comprehensive evaluation for education qualities in primary and secondary schools in 2013,it has been actively promoting this reform and implemented sunshine evaluation tests in 116 experimental schools in the area in 2015.The reform has achieved preliminary success and accumulated precious experience,thus laying a good foundation for further carrying out sunshine evaluation reform,and its existing problems have also pointed out the improvement direction of the future.
sunshine evaluation;comprehensive evaluation;quality of education;educational reform
G521
A
2095-6762(2016)02-0014-08
2016-04-30
胡志桥,广州市教育研究院学前教育与义务教育教学研究室主任,政治教研员,高级教师(广东广州,510030);朱华伟,广州市教育研究院院长,教授,博士生导师,(广东广州,510030);杨健辉,广州市教育研究院小学数学教研员,高级讲师(广东广州,510030);李莉芸,广州市教育研究院地理教研员,高级教师(广东广州,510030)
* 本文系国家社会科学基金“十二五”规划教育学一般课题“促进区域教育发展的学业质量测评体系研究”(项目编号:BHA130053)、广东省教育科学“十二五”规划2013年度研究项目(德育专项)“中小学教育质量综合评价改革与中小学德育质量提升研究”(项目编号:2013JKDY014)、2015年广州市中小学教育质量阳光评价项目(项目编号:GZJY1437S/YD15G0218)研究成果。