周世科
【摘 要】教育循证评价着力将教育的改革与发展建构在扎实的科学证据的基础之上,在数十年的发展过程中,其理念和举措都被证明,对于提升教育决策的科学性以及教育教学的有效性都有显著的成效。国际教育循证评价的经验对完善具有中国特色的教育评价体系具有较高的参考价值。江苏省借鉴国际教育循证评价的经验,依托省域内学业质量监测工作,着力提高测量与调查工具的科学性,大力推进“跟进式”循证改革项目,通过构建多方参与的改革共同体,极大地提升了监测的科学品质,形成了具有本土特色的教育循证改革路径。
【关键词】循证评价 国际经验 本土探索
自2020年中共中央、国务院印发《深化新时代教育评价改革总体方案》(以下简称《总体方案》)以来,建构具有时代特征、彰显中国特色、体现世界水平的教育评价体系越发成为政策实践和学术研究的重要议题。人们围绕这一主题,不但在学术层面开展了深入的讨论,而且在此基础上,着力推动了新时代教育综合改革的进程。
教育评价作为教育改革与发展过程中具有引领性的核心环节,其改革具有专业性强、牵扯面广、纷繁复杂的特点,很难毕其功于一役。到目前为止,人们尽管在学术研究与实践探索方面均已取得了一定的成果,但对于如何更好地完成《总体方案》的目标,仍有诸多未明之处有待进一步讨论与探索。针对于此,本文力图通过分析教育循证改革的国际经验与基于江苏省的本土探索,为深化当下的教育评价改革提供参考。
一、教育循证评价的国际经验
事实上,如何让教育决策和教育教学工作更为科学有效,是全球所有教育工作者的共同追求。但长期以来,教育改革与发展大多依赖人们的经验与情怀推进,这就使得相关工作存在较大的不确定性,人们对教育改革的效果也难以进行科学评估。这种情况带来的最直接结果就是,教育领域各种理论和观点横飞,看似热闹非凡,但却难以推动真正的教育变革,在造成理论的“空中楼阁”与实践的“沃野千里”渐行渐远的同时,教育一线工作者难以得到科学研究的滋养,长期处于迷茫与困惑的状态,教育教学工作效率低下,效果不佳。
针对于此,研究者们在推进教育改革科学化方面,做出了大量努力。在这一过程中,让教育评价能够准确、全面、科学地呈现出教育教学工作的流程、存在问题、效果、影响因素等要素,是教育教学改革的重要一环。自20世纪80年代起,伴随着循证医学和教育评价理论的发展,教育循证评价在各国的教育改革过程中发挥着越来越重要的作用,并取得了显著的成效[1]。
所谓“循证”,简言之即为基于证据或遵循证据行事,其目的是使相關工作构建于扎实的科学研究证据基础之上,以期更好地改进工作流程,获得更好的工作效果。需要指出的是,教育循证改革对于“证据”有着更严格的要求,教育日常场域中常见的经验性、个体性的经历与体验,由于并非良好设计的科学研究,并不能成为循证改革所依据的“证据”。2016年,美国联邦教育部出台了《非监管性指南:使用证据去强化教育投资》(Non-Regulatory Guidance: Using Evidence to Strengthen Education Investments)文件,将可以用于决策的证据分为四个等级,即高水平证据,主要通过设计和运转良好的大规模随机“实验研究”获得;中等水平证据,主要通过设计和运转良好的大规模“准实验研究”获得;具有可能性的证据,主要通过设计和运转良好的、控制取样偏差的“相关性研究”获得;呈现的原理,主要通过能够解释教育干预对结果影响原理的“逻辑模型”来呈现[2]。由此可见,在循证教育改革过程中,对证据的获取与质量都有严格的标准,以确保相关决策的科学性。
进入21世纪以来,教育循证改革的理念受到了西方主要国家的普遍认可,各国教育主管部门、学者与实践者共同努力,着力推动教育循证改革。在这一背景下,教育评价无论是在理论层面还是在实践层面,都获得了长足的发展,取得了显著的成效。
首先,伴随着教育循证评价的发展,“无证据不决策”已成为人们的共识,并转化为政策与实践行动。在教育循证的发展中,为教育问责提供扎实的科学依据是推动教育评价循证转向的重要驱动力。在21世纪初,美国通过《不让一个孩子掉队法案》,提升了教育问责的力度。为此,美国联邦及州政府必须拿出令人信服的证据,来评估各级各类政府、学校的绩效。在此背景下,大而化之、似是而非的评价越来越没有市场,人们需要更为精准、科学与客观的教育评价结果,并以此作为资源分配的依据。这在客观上促进了教育评价的循证改革。而相关政策法案的出台,则进一步强化了科学证据在教育评价中的重要地位。比如,2002年美国颁布的《教育科学改革法案》要求,所有的重大教育决策和投资都必须得到科学的实证证据支持[3],2006年德国各联邦文教部长联席会议颁布了《教育监测全局战略》,要求将PISA、TIMMS、TALIS等国际大规模教育评价的结果与德国国内的学业水平评价、学校评价、国家教育发展评价等结合到一起,“为所有州的循证教育政策奠定基础”[4]。这些举措在为循证评价提供政策依据的同时,也使得循证决策成为西方主要国家教育工作者的普遍价值导向与共识。
其次,伴随着对证据科学性的追求,教育评估的工具与方法日益严谨专业。循证评价的目的是为教育改革与发展提供“最佳证据”。这就要求教育评价者摒弃既往过度依靠主观偏好和个体经验的评价方式,采用更为科学有效的评价工具与手段,来获取具有稳健性和推广价值的证据。在这一过程中,大量研究者在评价方法上做出了大量的努力,共同推进了循证评价方法的发展与不断完善。以美国有效教学策略网(What Works Clearinghouse,WWC)为例,该网站不但呈现了大量有效教学的评估证据,还以手册形式发布了循证评价的证据标准、获取程序和处理步骤,相比传统的经验评价而言,这些方法流程更为科学严谨,其评估结果也更为科学稳健[5]。近年来,伴随着评估技术的进步,循证评估的方法亦呈现出多样化的快速发展态势。诸如人工智能、因果推断、大数据、信息技术、脑科学、元分析等前沿技术大量应用于教育评价过程中,凭借这些技术和方法,循证评价的应用场景更为广泛,评价结果的应用效果也越发显著。
最后,教育评价与教育实践紧密结合,推动了教育的改革与发展。与传统的教育评价主体与客体相对“独立”不同,教育循证评价往往采取“干预”式的评价,且更强调证据的实际应用,这就使得教育循证评价在推进教育改革方面有着更强的推动力,甚至于说,一些循证评价本身就是教育改革的组成部分。以美国的“为了所有人的成功(Success for All,SFA)”为例,该项目由美国约翰斯·霍普金斯大学的两位教授发起,是目前影响力最大的循证改革项目之一。SFA以合作阅读作为主要的干预手段,通过科学评估来获得学生学科素养提升的方法和路径[6]。其特点是,所有的干预与改进都立足于评价,而在评价的过程中,更多采取实验方法实施,这就使得项目本身的实施既是评估也是实践改革。这样的评估方式是诸多循证评价与改革的典型方式,不但解决了干预效果评价的问题,也使得相关教学改进举措均能得到全程的证据支持,从而获得更好的效果。
综上,教育循证评价着力将教育的改革与发展建构在扎实的科学证据的基础之上,在数十年的发展过程中,其理念和举措都被证明在提升教育决策的科学性以及教育教学的有效性方面,具有显著的成效,其经验对完善具有中国特色的教育评价体系具有较高的参考价值。
二、教育循证评价的本土探索:以江苏省为例
江苏省作为中国社会经济发达地区,教育改革探索也走在全国前列。但多年以来,在取得了丰硕成果的同时,江苏的教育也面临诸多问题。比如,教育发展观与质量观存在偏差,人们在教育改革与发展过程中,依然存在过度关注学业成绩,忽视学生的全面发展的“老大难问题”;教育决策过于依赖经验性实践,科学性不足,缺少对一般性规律的科学总结与归纳,从而带来主观性过强、实施效率低下、无法形成可靠实践模式等问题;缺少科学有效、综合全面的质量评估的标准与工具,难以保证测评结果的信效度与稳健性;学术研究与教育质量监测结果难以有效推动教研模式创新和教育质量提升,专业研究与实践工作往往各自为战,相关主体之间缺乏整合与协调,力量难以聚焦。理论与实践的分离,不但使得学术研究缺少实践的支撑与滋养,也导致实践工作常常处于盲目摸索的状态。
针对这些问题,江苏省依托教育质量监测,大力推进循证评价与改革,探索出了一条具有本土特色、科学有效的教育高质量发展之路。从2006年开始,江苏加入教育部基础教育课程教材发展中心“建立中小学生学业质量分析、反馈与指导系统”项目,每两年一次,对全省所有县(市、区)四年级、八年级学生进行学业质量监测,同时对学生的学习环境、学校的教学环境等因素进行问卷调查。2008年4月,“江苏省基础教育质量监测中心”(以下简称“监测中心”)在江苏省教育科学研究院正式挂牌成立,承担江苏省基础教育质量的监测调查、数据分析、信息反馈、政策建议、业务指导等工作。
在这一过程中,监测中心充分借鉴包括PISA在内的国际经验,逐步形成了覆盖全省、体系完备、功能齐全的学业监测体系。从2011年开始,监测中心以“课程教学现状”为对象,对全省普通高中25%的教师和10%的学生开展了大规模的调查研究;从2012年开始实施“建立学前与特殊教育质量监测点”项目,在全省设立若干质量监测点,采集和分析“办学条件、课程状况、教学管理、教学方式、学生发展、教师发展、家校联系”等方面的过程信息和研究质量状况,提供全省性的反馈和指导。目前,江苏省的基础教育质量监测工作已经覆盖了基础教育的全部学段和省域内的所有县市,各主管部门对这项工作给予了高度的重视和支持,力图将其打造成“江苏版的PISA”,使之成为全面、科学、及时地监测全省基础教育情况,提高基础教育质量监测工作的水平和质量,改善教育教学过程的服务手段,促进基础教育改革发展,为江苏省率先基本实现教育现代化提供切实保障。
省域范围内学业监测体系的建立与完善,为江苏省推进教育循证评价与循证改革提供了坚实的体系和数据基础。由于我国长期缺乏教育实验的土壤,因此以学业监测为突破口推动教育循证改革是十分现实且高效的选择。自2006年江苏省依托学业监测开始踏上教育循证之路起,十余年的探索硕果累累,也为中国教育循证改革积累了江苏经验[7]。
第一,提高测量与调查工具的科学性,着力解决数据的准确性问题。监测和调查工作要发挥应有的作用,首先要解决“测得准、问得对”的问题。监测中心在编制测试试卷和调查问卷的过程中,充分依靠专业力量,采用前沿的评估和调查方法,努力提高测试工作的信效度,力求得到可靠的测试和调查结果。在这一过程中,监测中心不但聘请具有丰富教学经验和教科研实力的一线教师与测量专家参与命题与问卷编制工作,而且还组织专人对PISA等国际学生评估项目的测量工具进行分析,充分吸纳此类权威评估项目的理论、经验与方法,使评估工具既充分实现监测工作的目标,贴近实际问题与本省教情,又可以前沿的方法、技术确保测量工具的可靠性。除了充分依靠专家提高评估工具的效度外,监测中心还在近些年监测数据的处理过程中,应用项目反应理论、结构方程、层次分析法等较为前沿的数据分析方法,检验数据的信效度,解决数据的赋权问题,这进一步提高了测量工具的精确性和数据的可靠性,更为精准地反映了江苏省的基础教育质量及相关影响因素的情况。到目前为止,江苏省不但已经构建了覆盖义务教育9门学科的学业质量监测工具,而且编制了包括办学条件、课程状况、教学管理、教学方式、学生发展、教师发展、家校联系等方面完整的调查工具,形成了11大类、15000多份教育质量监测分析报告,形成了体系完备的监测与调查工具体系。
第二,推进“跟进式”改革项目,以教育评估的证据推动循证改革。如何让监测评价的证据真正落地,是发挥教育循证评价功效的重要任务。为此,江苏省參考发达国家教育循证改革的经验,创造性地推进了“跟进式”改革项目,探索构建循证改革指导下区域教育质量提升的工作模型。2013年,在苏南、苏中、苏北各选择1个样本县,开展“基于测试分析,提升区域义务教育质量”的合作研究与探索,为全省各地在测试后开展跟进式的改革提供示范;2015年,在前期探索的基础上,江苏省教育厅在全省以项目推进的方式,设立了“基于测试分析的跟进式改革重大项目”,全省共立项29个;自2017年起,为推动质量监测与教研、科研的融合实践,将跟进式改革项目设为全省中小学课题研究专项研究,先后设立133个省级研究项目,各设区市、县(市、区)配套设置各级同类项目达700余项,极大地鼓励与推动了各地及学校探索跟进式循证改革。这些跟进式项目大多根据前期的监测评价数据分析的结果,以改革项目的形式聚焦重点问题予以探索和解决。这些项目中,有的聚焦学业质量区域差异的成因,有的着力推进区域循证教学管理实践研究,有的关注教育教学效率的提升。以江阴市教育局承担的“县域推进基于质量监测的教学管理变革研究”项目为例,该项目探索了从相关要素出发的教学管理整体推进路径,建构了区域推进教学管理变革的体系,概括了“工具研发、科学抽样、规范施测、数据处理、反馈指导”监测管理流程,形成了“前测—后测”相互衔接的闭环运行路径、“过程—结果”协调互促的动态改进路径。这样的跟进式改革,从科学研究出发,回馈实践工作,使监测成果无缝服务于实践工作,解决了专业研究与实践工作“两张皮”的问题,形成了理实结合的改革推进路径,提高了科学研究的针对性和有效性,强化了对实践工作的引领。
第三,构建多方参与的改革共同体,以“集团军作战”方式推进教育循证评价改革。在长期的探索过程中,江苏省已经形成了高校专业研究人员负责科研与技术保障、政府管理部门和教研机构负责行政管理与项目推进、中小学校等负责实践探索的优势互补与协同合作的改革共同体。这一共同体以教育质量提升为核心工作,将相关研究成果及政策举措落到实处,使相关研究成果能真正发挥作用,有效提高教育教学质量。为解决监测中心人员和专业能力不足的问题,江苏省大胆创新,在确保数据安全的情况下,开放数据资源,下放监测项目与研究主题的设计权限,尝试引入多方智力资源以提升监测质量和改革成效。以2020年监测为例,监测中心联合南京师范大学、南京大学、东南大学、南京市浦口区教育局等单位,重点关注学生减负、高效教学策略、弱势群体的教育公平、学生抗逆力、教师工作满意度、学生高阶认知能力发展、教育资源配置等方面的问题,在国内外权威学术期刊发表与问题高度相关的论文30多篇,为教育政策制定和改革决策提供了重要参考。
三、推进教育循证评价的未来启示
首先,须进一步改进数据条件,尝试建立包括更多科目的纵向跟踪数据。到目前为止,缺少纵向跟踪数据一直是制约我国教育研究、影响循证改革进程的重要问题。建立科学全面的纵向跟踪数据库,是精确评估相关教育教学举措的“增值”、分析其中的影响因素和机制的基础,是进一步推进教育循证改革的重要“基础建设”工作。
其次,须紧跟循证研究的进步,尝试引入更为前沿、科学的分析技术。伴随着科学技术的进步,更为前沿的技术与方法已经越来越多地应用到教育测评与循证改革的过程中。未来改革应在这一领域投入更多的精力,紧跟前沿技术并力图实现本土创新,尤其是,应当高度重视大数据、人工智能、信息技术、脑科学等前沿技术在教育评价中的应用,推动教育循证改革向着智能化、现代化的方向发展。
最后,须进一步强化“跟进式”改革的力度,让科学证据与实践工作更紧密地结合。尽管江苏省教育循证改革已经取得了显著成效,但仍存在科学意识不足,科学视野不宽,证据获取、理解和分析能力不足等问题。未来需要以更具灵活性和创新性的跟进举措,进一步加大证据推广、宣传和使用的力度,提高证据使用的效能。
参考文献
[1] SLAVIN R E. Evidence-based Education Policies:Transforming Educational Practice and Research[J]. Educational Researcher,2002,31(7):15-21.
[2] WHITEHURST G J. Evidence-Based Education(EBE)[EB/OL].(2006-05-02)[2022-12-28]. https://ies.ed.gov/director/pdf/2002_10.pdf.
[3] SLAVIN R E. How evidence-based reform will transform research and practice in education[J]. Educational Psychologist, 2020,55(1):21-31.
[4] 俞可,陈丹,赵帅.循证:欧盟教育实证研究新趋向[J]. 华东师范大学学报(教育科学版),2017,35(3):142-149+173-174.
[5] Institute of Education Sciences. What Works Clearinghouse Standard Handbook Version 4.0 [EB/OL].(2017-12-01)[2022-11-11].
https://ies.ed.gov/ncee/wwc/Docs/referenceresources/wwc_standards_handbook_v4.pdf.
[6] SLAVIN R E,MADDEN N A,CHAMBERS B,et al. Two Million Children:Success for All(2nd ed.)[M]. Thousand Oaks,CA.:Corwin Press,2009:1-14.
[7] ZHOU S K. The Role of Chinas Teaching Research System in Promoting Evidence-based Reform in Education: A Case Study of Jiangsu Province[J]. Best Evidence in Chinese Education,2021, 9(2):1227-1241.
(作者單位:江苏省教育科学研究院)
责任编辑:孙昕