白宇 闫温乐
摘 要:为帮助世界各国实现全民学习,使各国政策制定者和实施者可以系统地评估其现有教育系统,世界银行开发了SABER测评。文章对SABER测评的产生背景、主要进展、内容、方法等方面进行了介绍,并对上海2016年SABER测评结果进行了整理,得出SABER测评具有以教育系统作为测评对象、政策数据公开透明、不产生系统排名、为世界各国提供相关教育政策信息、提供评估教育系统的平台等特点。
关键词:SABER;教育系统评估;世界银行;上海
《2018年世界发展报告》强调“上学”和“学习”并不是一回事,当前世界上很多地区都面临学习危机,新的伙伴关系正试图通过向各国提供与改善学习成效有关的最重要的指标及数据来消除学习危机。2019年1月,世界银行、比尔及梅琳达·盖茨基金会和英国国际发展部在伦敦举行的教育世界论坛期间宣布其致力于开发一种可供政府用于更好地监测教育系统的工具,该工具可以帮助政策制定者做出实时决策以确保所有儿童都能学到知识。世界银行早在2010年就开发了“获得更好的教育成果的系统方法”(Systems Approach for Better Education Results,SABER)测评,以帮助各国系统地评估和改善其教育系统。SABER测评主要提供有关国家级教育政策和机构的数据,分析和评估现有政策在实现教育目标方面的有效性,帮助政府和利益攸关方确定他们可以采取的改善系统的行动。[1]
一、SABER测评的产生背景
教育是发展的强大动力,自1990年《世界全民教育宣言》和2000年联合国千年发展目标提出以来,世界各国已有数千万儿童接受了教育,这对许多发展中国家来说是一项巨大的发展和成就。尽管如此,仍有许多年轻人在没有获得最基本的识字和算术技能的情况下完成基础教育,即便在较发达的中等收入国家,大多数学生也无法达到经合组织成员国预期的学习水平。[2]
世界银行启动的“2020年教育部门战略”提出了加强全球教育系统的议程,指出减少贫困以及改善、增长和建立人力资本不取决于人们坐在教室里的年数,而是取决于人们在课堂内外获得的知识和技能[3],并鼓励国家层面的教育系统改革。
世界银行在《2018年世界发展报告:学习以实现教育的承诺》中提出,世界各地的许多教育系统中学生学到的知识很少,仍有数百万学生缺乏基本的识字和算术技能。为了确保所有儿童不仅可以上学,而且可以接受优质教育,有必要重点在以下三方面进行改革:更好地评估学习,了解课堂上发生的事情;根据实际情况采取行动,让学校为学生服务;协调各参与者,使系统适合学习。[4]
世界银行还指出,目前缺乏最有可能改善学习环境和学生表现的教育政策和计划的数据,缺乏各国为实现其教育目标所采取的步骤的可靠信息,发展机构也难以确定与其他系统共享资源的有效方法。[5]
基于以上背景,世界银行开发了SABER测评系统,以帮助世界各国评估其教育系统并指导教育改革,最终提高教育质量。
二、SABER测评的主要进展
自2010年SABER测评推出以来,已经在130个国家得到了应用,发布了13篇框架论文,11个领域的工具,1.6万个政策指标,为评估提供了框架和工具;产生了190多份国家报告,5个全球/区域分析,50多个案例研究和背景论文,记录了SABER的系统应用并为政策对话提供信息;发布了40多份简报展示SABER和其他工具如何引领世界各地的教育政策改革。
SABER与诸多国际组织开展了合作,包括联合国教科文组织、国际全球教育机会融资委员会、各国外交部、联合国儿童基金会等。例如,PISA利用“SABER-学生评估”作为柬埔寨、厄瓜多尔、危地马拉、洪都拉斯、巴拿马、巴拉圭、塞内加尔和赞比亚8个参与国的机构能力诊断和加强框架[6]。联合国教科文组织利用“SABER-教师”,帮助新加坡、墨西哥等国完成了教师招聘、培训和管理,并确保教育普及与质量改进相匹配。同时,SABER测评通过一系列全球高级别活动提高其全球影响力,将相关工具和知识带给更多的人,包括政府、发展和研究机构的从业人员,基层教育人员,家长等。[7]
当前,SABER测评开发了一套新的工具——“SABER SD”,用于评估政策实施质量,并向政府提供反馈,说明他们在改进教育计划方面的表现,该工具已在老挝、阿富汗和巴基斯坦试行。[8]
三、SABER测评的内容
SABER测评涵盖诸多教育领域,主要测评13个主题领域的概念框架制定、诊断工具开发、国家报告等。13个主题领域可分为4组,第一组是代表了教育阶段的兒童早期发展、劳动力发展和高等教育,SABER测评为上述领域的政策和机构提供了全面且具体的分析;第二组包括教师、学生、信息通信技术、学校健康和学校供餐,SABER测评分析上述4个方面是否为优质教育提供了资源和支持;第三组包括学校财务、教育管理信息系统、参与私立学校管理、学校自治和问责制四个与治理和财务相关的领域,SABER测评为系统的高效管理提供数据和信息;第四组包括侧重于为儿童和社区解决冲突的教育复原方法和关注全民学习的公平和包容。为了让学生、教师、家长、政策制定者和利益相关者共享教育成果,SABER测评围绕质量可靠性、覆盖范围广、及时性和相关性、透明度和开放性、协调一致性、可持续性六个方面进行了开发和构建。
四、SABER测评方法与实施步骤
(一)SABER测评方法
为了更好地确定与学生学习系统息息相关的政策和制度,帮助各国系统地评估和改善其教育系统,世界银行收集和调查了世界各地教育系统相关政策和机构的可比数据,基于对表现最佳地区的调查,对每个领域都进行了相应框架的构建[9],并在各领域框架的基础上制定了相应的调查问卷和规则,编制了全面的指标。各国可使用通过这些指标收集的数据来评估教育系统的发展水平,找出存在的问题和有待改善的方面。
(二)SABER测评实施步骤
第一,世界各国或地区根据SABER问卷进行数据收集。在仔细阅读SABER的框架文件、基准测试工具手册和问卷后,收集不同教育领域的相关信息,完成问卷后可以进行初步自我评估。
第二,各国将完成的相关数据及信息上传到SABER测评网站上。各国政府或地区政府可在完成问卷信息收集并经过检查和确认后,出于自愿将收集的数据和相关信息问卷上传到SABER测评网站中。
第三,世界银行的SABER测评团队将根据各国或地区提供的问卷数据和信息,生成国家诊断性报告。报告会对各国的教育系统情况进行细致的描述,并根据各国提供的信息为该国提供基准评分,根据评分研判其发展水平,说明该国或地区在相应教育领域的政策制度方面的优势和需要改进的方面,并为其提供提高教育发展水平的建议。在与测评国家或地区进行商讨后,世界银行的SABER团队将国家报告发布到SABER测评官网中。
第四,各国或地区针对报告中提出的问题,结合本国实际情况,参考报告中提出的改进建议,制定并实施适合自身发展的改革方法及手段。
五、上海2016年SABER测评结果
2016年上海在世界银行SABER测评政策框架下对其基础教育进行了评估,主要针对教师政策、教育资金、教育问责和学生评估四个方面,下文以上海的学生评估系统为例,对其2016年SABER测评情况进行了整理(见表1)。
SABER测评提供了包括课堂评估、考试评估、国家大规模评估、国际大规模评估在内的上海学生评估系统的信息,测试表明上海学生评估系统最低达到了“已建立”水平,在国家大规模评估方面已经达到了“先进”水平。这与中国悠久的考试传统有着不可分割的联系,同时高质量的教师培训和教学研究小组促进了教师的专业发展和学生评估,使上海在课堂评估方面表现得比较出色。
此外,测评也反映出一些有待改进的问题。例如,政府应该继续推行中考和高考改革,通过增加测试频率,扩大测试范围,在教育类型和层次之间建立多种途径,以减轻学生的负担。目前上海正在试行中考和高考改革,并将在2017-2018年推出一种经过修订的更灵活的方式。在未来还可以进一步发展大规模和基于样本的诊断测试。
六、SABER测评的特点
(一)以教育系统作为测评对象
在其他的国际大规模测评中,测评内容一般是学生的学业情况,关注的主要是各个国家和地区在一段时间内的教育质量和结果。例如,PISA通过收集各个国家和地区15周岁学生的数学、科学、阅读等学科的情况反映教育质量。而SABER测评考察的对象是一个国家或地区的教育系统,通过对教育系统中各领域相关政策的制定和实施情况进行分析和判断,对其各领域发展水平进行评估,从而发现教育系统中存在的问题和有待改进的地方。
(二)政策数據公开透明
SABER的目标是为政府、专业人员和公众提供可用于制定和实施教育政策的数据和信息。因此,任何公民均可以在SABER网站了解本国或其他国家各领域的教育政策[12]。SABER测评以更为详细的方式使教育政策变得更加透明。
(三)不产生系统排名
与其他大型国际测评不同的是,SABER测评不会产生教育系统的排名。教育排名确实在一定程度上可以推动排名不佳国家或地区改进教育成果,但SABER测评实施的前提之一是政策制定者等利益相关者已经具备改进政策的动力,力求通过SABER测评为其指引改进的方向或提供优秀的案例。
(四)为世界各国提供相关教育政策的信息
SABER测评为了确定最有可能影响学生学习效果的相关政策,系统地收集和整理了各国在教育领域的政策和制度,制定了相关教育框架。各国政策制定者和决策者可以免费获取他们想要学习的国家的系统,这些被效仿的国家可能不是全球领先国家,而是与其发展水平接近或具有相似经济结构的国家,对这些教育系统政策的分析可能更具有针对性。
(五)提供评估教育系统的平台
世界各国或地区均可以使用SABER测评来评估教育政策的实施情况和教育机构的发展水平。SABER在每个教育领域中,都利用广泛的文献调查和从业者提供的信息确定教育系统中的最佳政策和制度选择。根据这些良好的政策制度确立了一组指标,然后根据指标收集的数据来评估给定区域内每个教育系统的发展水平。SABER将每个领域的发展水平总结为4个由低到高的级别,分别为“潜在”“新兴”“已建立”和“先进”。例如,国家进行大规模学生评估时,可以通过“SABER-学生”评估所提供的指标收集数据和信息,进而确定该国每个指标所处的发展水平,据此确定政策改革的优先事项或进行进一步调查。
参考文献:
[1][3][4][5][6][7][8]World Bank. SABER Annual Report 2018: Building Education Systems That Deliver[EB/OL].http://wbgfiles.worldbank.org/documents/hdn/ed/saber/supporting_doc/Background/SABER_ annual_report_2018.pdf,2018-12-27.
[2][9][12]World Bank. Overview Paper, The What, Why, and How of the Systems Approach for Better Education Results(SABER)2013[EB/OL].http://wbgfiles.worldbank.org/documents/hdn/ed/saber/supporting_doc/Background/SABER_Overview_Paper.pdf,2018-12-26.
[10]World Bank.How Shanghai Does It[EB/OL].http://dx.doi.org/10.1596/978-1-4648-0790-9,2018-12-28.
[11]World Bank. What Matters Most for Student Assessment Systems:A Framework Paper(2012)[EB/OL].http://wbgfiles.worldbank.org/documents/hdn/ed/saber/supporting_doc/Background/SAS/Framework_ SABER- Student_Assessment.pdf,2018-12-26.
编辑 朱婷婷 校对 王亭亭