金心怡 韦雪艳
随着全球化和社会转型对新型知识和人才的呼唤以及全球基于核心素养的课程改革的推动,21世纪的学习开始更多向个性化学习转变,作为基础教育质量监测重要组成部分的学业测评在科技化和大数据的背景下也将不再局限于传统的纸笔测验和终结性评价,许多国家已经陆续引进第三方评估机构作为过程性学业测评的主体,甚至开始组织大规模跨国评估。
近年来,我国相继出台了《关于深入推进教育管办评分离 促进政府职能转变的若干意见》《关于印发国家教育事业发展“十三五”规划的通知》《关于深化教育体制机制改革的意见》等多份文件,均强调第三方评估的重要性。2021年,教育部等六部门联合印发《义务教育质量评价指南》,鲜明地提出“注重结果评价与增值评价相结合,综合评价与特色评价相结合,自我评价与外部评价相结合,线上评价与线下评价相结合”的要求。[1]目前,我国在基础教育质量监测方面主要由政府牵头,评估主体与评估模式较为单一,而在教育管办评分离的政策背景下,要实现上述转变必然需要专业第三方评估机构的介入。作为这一行业中的佼佼者,美国西北测评协会(Northwest Evaluation Association,NWEA)已经具备了丰富的实践经验,带领美国教育测评进入了信息化与全球化时代。因此,考察NWEA的学业测评经验对透视基础教育质量监测的第三方模式具有较强的理论与实践意义,能够为本土实践提供新的视野与角度。
1973年,美国俄勒冈与华盛顿州的教育者和研究人员自发组成了一个致力于开发新型测评系统的协会。他们决心创建一种新的、精准的测评学生学术水平和进步的方法,并依据测评结果来进行针对性教学转型。[2]1977年,经过四年的发展,NWEA正式成立。在当时,公众熟知的教育测评系统还属于“一刀切”的统一纸笔测验,而NWEA的成立无疑为教育测评注入了新的活力。
目前,NWEA已经成为美国最大的教育测评机构,也是一家全球性非营利教育测评服务机构,致力于为中学教育前的学生提供第三方学业测评。其服务的五个关键目标为:为未来的高质量测评提供视野、赋予教师和校长作为教学领导者的权力、促进系统化和有凝聚力的早期学习机会、探索儿童的全人教育以及提升高中与大学和职业生涯的成功率。[3]
自创立以来,NWEA已经构建了一套完整的学业进步测评系统(Measures of Academic Progress,MAP),并取得了与美国教育部、国家科学基金委员会等政府机构,以及哈佛大学、耶鲁大学等常春藤大学的合作。NWEA的MAP学业测评系统已经在美国各州绝大多数的学校中投入使用,并在超过140个国家和地区的学校中被广泛采纳。
1.自适应模式下的分层干预
自适应测评指按被试的反应特征调整题目范围的测验。在这种测验中,每个学生的考题都不尽相同,后续题项的难度视学生对前述题项的回答情况而自动调整,是针对学生个人能力的个性化测评。在测评过程中,NWEA还为学生提供了自适应学习支架,根据不同学生对知识的掌握程度适时提供提示与反馈,以此来监测学生在学习阶段所能自主获得的水平,帮助学生准确定位其学习难度的临界点。[4]
自适应学业测评能够为教师提供有意义、可操作的数据,从这些数据中不仅能诊断学生现有的学业水平,实现高低分组,而且能精准定位学生超常掌握知识的水平以及亟待提升的能力,并给出相应的教学建议,为教师实施分层干预和差异化指导提供了条件,并在实行学业测评的同时引导学生发现自己的知识盲点,加强学习和自我分析的积极性。
2.过程与结果评价的一体化
在NWEA的理念中,学习是一个持续的动态过程,因此对学生的测评不能仅停留在横向层面考察其学业成绩与排名,也应在纵向层面关注其在学习过程中的进步。[5]基于该评估理念,NWEA开发了标准恒一的学业测评套件,能够提供连续的检测并使每次测评结果具备可比性,以便追踪学生在学期、学年甚至是整个教育阶段的学业进步状况,只需通过一个平台持续追踪就能完成对成绩和成长的双重监测,既能呈现静态的阶段性成绩,也能呈现动态的学业进步过程。此外,通过权威大数据的对照,NWEA能够明确学生在同龄学生中的学业位置,并以同龄学生的成长曲线为参考,判断学生的成长趋势在同龄人中所处的水平和状态。
3.最近发展区和潜能的挖掘
维果茨基(Lev Vygotsky)的最近发展区理论认为学生的发展有两种水平:一种是学生的现有水平,指独立活动时所能达到的解决问题的水平;另一种是学生可能的发展水平,也就是通过教学或他人帮助所能获得的潜力,两者之间的差异就是最近发展区。通过自适应学业测评,NWEA在测评报告中能够提供有关最近发展区的信息,包括增强、发展和新授三个模块。其中,增强部分提供的是学生需要进一步补足加强的技能与概念,即最近发展区理论中的学生现有水平;发展部分提供的是学生已经具备一定条件和可能去学习的技能和概念,是在“增强”基础上的知识扩充和深入;新授部分提供的则是更高阶的技能和概念,是在“发展”基础上的进一步输入,是教师可以为优秀学生提供的分层指导内容以及学生在达到最近发展区之后的进一步发展方向。
除了能够呈现不同学生在不同科目上的最近发展区,NWEA还为挖掘学生的最大潜能和预见学生的学业成绩开辟了通道。从小学五年级开始,NWEA的学业测评系统将会为学生预测他们的学术能力评估测试(Scholastic Assessment Test,SAT)成绩以及他们未来可申请的美国大学的范围。目前,这种预测的效度已经达到了0.50,说明其预测效果较为可靠。[6]
4.消除不平等的教育公平取向
NWEA非常注重教育中的公平问题,致力于缩小影响学生学业成绩的各类机会差距,在个人层面上重点关注贫困地区学生、低家庭社会经济地位学生、学习障碍学生和特殊学生等。为了助力特殊学生参与学业测评,NWEA利用技术手段提供了可刷新的盲文、放大屏幕倍率和颜色对比、键盘导航等创新解决方案,并与国家无障碍媒体中心(National Center for Accessible Media,NCAM)合作开发了一组用于在评估中创建图像描述的指南,帮助视障学生接受同等程度的学业测评。此外,NWEA还为在学术机会上面临系统性障碍的学生设立了补助金计划,以便更好支持特殊学生的学业发展并帮助消除教育中的不平等。[7]NWEA的学业测评能够为各州提供有关各学校发展进步状况的信息,以此来评估学校改进策略的有效性并找出那些最需要帮助的学校(如低成就、低增长的学校)。这对于通过数据发现校际差距,确保学校测评结果的可靠性,以及促进学校和地区层面的教育公平具有重要意义。
NWEA的测评题库是基于州立课程标准、国家课程标准以及成就水平描述(Achievement Level Descriptors,ALDs)研发的,具备与国家和地区教育系统协调一致的评价标准。学校与教育机构可根据自身需要选择相应题库进行测评,确保了NWEA的测评体系与国家和地区课程标准不脱节,有助于提升测评的科学性和可参考性。
为了明确学生在同龄学生中的学业位置,NWEA在50个州、5800个地区、超24500所公立学校的数百万次测试数据中采集了超过1100万名美国学生的匿名评估数据,并利用这些常模数据创建了一个国家级的基准组。NWEA将人口和地理因素、课程和教育标准的变化、实际教学天数以及其他可能影响学习的环境因素都综合考虑其中,并确保基准组学生的种族及社会和经济条件的比例都能够准确代表美国学龄人口的实际状况,创造了将全国任意两个学生进行比较的可能性。[8]NWEA每三至五年都会进行一次大规模的数据采集,这既是为了保证数据的实时性和代表性,也是为了检测NWEA学业测评体系的准确度和可信度。如,在2020年最近一次的数据采集中,NWEA发现四年级和八年级学生的平均数学和阅读成绩较2015年有所下降,通过与教育和政府部门支持下的教育评价的结果进行对照,NWEA发现这一趋势与美国国家教育进展评估(National Assessment of Educational Progress,NAEP)的报告显示是一致的,以此证明了NWEA学业测评体系和基准组的可靠性和有效性。[9]
NWEA的学业测评采用的是网络在线评估的模式,相较于传统的纸笔测验,这种基于计算机环境的自适应测评系统更有利于数据的收集、处理与分析。NWEA的在线评估可与目前大多数流行的操作系统和设备兼容,使得测评更加灵活。[10]在信息技术迅猛发展的今天,以计算机为媒介的学业测评具有储存量大、快捷、高效的特点,能够辅助建立起不断更新的动态试题库和数字化的信息管理与反馈平台。[11]正是由于NWEA选择了网络在线评估,才为内嵌创新技术手段帮助学习障碍与特殊学生完成测试,促进教育公平提供了内生动力和技术条件。
除了利用大数据和计算机网络技术作为技术支撑,NWEA还借鉴了丹麦著名统计学家格奥尔格·拉希(Georg Rasch)提出的项目反应理论模型,构建了一套RIT量表作为测评工具。RIT量表以等距进行测量,不受学生所处年级或表现的影响,是一套稳定的评分体制。[12]在全美成千上万的学生接受过测试后,MAP中的问题将获得RIT值,由于RIT值在各个年级之间具有相同的含义,因此可被用作跨年级比较的参考,以此来直观反映学生个体的成长和学业进步程度。NWEA开发的网络在线学业测评系统主要是MAP,其中又包括了MAP Growth、MAP Skills和MAP Reading Fluency三个相互联系的子系统,各子系统的测评内容、测评目标和适用年级详见表1。
表1 MAP子系统介绍表
在使用MAP进行学业测评后,会形成系统性的可视化诊断报告。这些诊断报告按照对象可以分为学生报告、班级报告、年级报告和学区报告,按照内容则可以分为学科成绩报告、学业水平报告、学业进步报告以及学生档案报告。不同的报告对应不同的呈现界面和关注焦点,能够为学生、教师、家长以及教育工作者提供多视角的学业测评信息。本文以学业进步报告和学生档案报告两份集形成性评价与结果评价为一体的报告为例,剖析NWEA学业测评的可视化呈现模式。
1.学业进步报告
MAP的学业进步报告可进一步拆分为三个主要报告部分:学业进步折线图、领域目标达成情况、学业进步细节表。
学业进步折线图共有四条以不同颜色和不同线形区分的折线,分别代表了学生每学期的学业成绩、基准组同年级学生每学期的学业成绩、同一学区同年级学生每学期的学业成绩、对学生未来学业成绩的预测。
领域目标达成情况更为详细地展开了学生在某一科目具体领域的发展状况,提供了学生在该科目技能和概念方面达成目标的状况,该部分会显示RIT分数范围,也可以将该分数转换为RIT分数描述,提供学生分数的百分比排名情况。
学业进步细节表提供的是学生随着学期推移和年级上升而带来的学业成绩变化以及与基准组的对比情况(见表2)。
表2 学业进步细节表
从表2可以看到,该学生在五年级的两次测评中,2011年秋季学期的RIT值为212,百分比排名为51,2012年春季学期的RIT值为215,百分比排名为34。从RIT值上来说,学生提高了3分,但百分比排名却下降了17,这说明同年级的其他学生学业进步的速度比该学生更快,因此百分比排名反而下降了。由此可以看出,只有过程与结果评价相结合,自我与同伴比较相结合,才能够真实反映学生的学业进步状况,而不是仅仅从一次的片面分数得出学生进步与否。
2.学生档案报告
MAP的学生档案报告可进一步拆分为三个主要报告部分:学业比较区、教学评估区、学业进步目标区。
学业比较区的目的是将MAP学业测评所得的RIT值与其他衡量标准联系起来,从更为全面的角度了解一个学生的真实成长和进步情况。其中,标准百分位数提供了有关学生学业进步与学业水平的排名,代表着有多少百分比的学生在学业进步和学业水平上落后或持平于该学生;象限图提供了有关学生学业进步与学业水平的另一种呈现方式,通过将学生的排名置于坐标系中来准确定位学生的学业进步和学业水平;条件性增长提供了有关学生学业进步的指数,0.0对应的是平均的典型增长,获得高于0.0的值表示增长超过了预测,反之亦然。
教学评估区的目的是详细列出评估的组成部分和各部分的RIT值,并针对性提供后续教学建议,为有的放矢地进行学习安排奠定了基础。通过手动选择呈现内容,增强、发展、新授的具体建议都能逐一进行浏览。
学业进步目标区的目的是为学生提供一个设立目标、制订计划、检验成果的空间,方便学生和教师按照预定目标努力,并在下一次学业测评结束后及时回顾目标,检验成果。
NWEA不仅是一个开展学业测评的执行机构,还是一个创新的研发机构,承担着评估和研发的双重职能。NWEA通过组织研究和创新中心(Research and Innovation Centers)来探讨最具挑战性的教育问题,并致力于为未来教育发展带来新的展望。研究和创新中心下设学生成长合作会(Collaborative for Student Growth)、学校与学生进步中心(Center for School and Student Progress)、产品创新中心(Product Innovation Center)三个子机构,研究团队由资深教育工作者和专家组成。各子机构分别承担不同的职能,以理论与政策研究、理论与实践相联系的合作研究、创新与改进研究环环相扣的研究链条三线并进,共同协作推动NWEA的发展(见表3)。
表3 研究和创新中心子机构职能表
除在机构内部组织一批具有高水准的专业研究人员,NWEA还通过设立金斯伯里研究奖(Kingsbury Research Award)支持新兴研究人员和学者。该研究奖以自适应成就测评的先驱加热·金斯伯里(Gage Kingsbury)博士命名,适用于没有项目资金的研究生和大学研究人员。获奖者将免费获得一个与其研究需求相关的匿名学生测评数据库和研究人员提供的技术援助,帮助他们进一步达成研究目标,同时为培养致力于学业测评和基础教育质量监测的下一代研究人员奠定坚实基础。[16]
NWEA一直致力于与各级各类组织和机构进行合作,目前已取得了与全美各地学校系统、州、大学和基金会的广泛合作。在国家级层面,NWEA已经开始与经济合作与发展组织(OECD)合作,作为国际学生评估项目(Program for International Student Assessment,以下简称PISA)在美国的考试提供方。[17]在此之前,PISA测试提供了国家间宏观教育系统的比较,而与NWEA的合作则可以把这种比较推进到学校和学区一级,以便开展国际间学校和学区的比较。通过跨国比较,可以帮助学校明确在全球化标准中所处的位置,帮助教育工作者了解学生和世界范围内领先的同龄人之间的差距,进而为学校制定国际化基准提供条件,有助于推动透明化的国际数据共享。
在NWEA开展的所有合作中,与学校和学区的联系是最为紧密的,如与著名的可汗学校(Khan Academy)合作开发了适用于3~8年级的个性化学业测评工具MAP Accelerator。[18]NWEA基于五种基本框架(5Essentials Framework)开发了与学校领导合作制订学校改进计划,提供个性化学业测评服务和技术支持的“学校改进模型”。作为学校改进模型的理论框架,五种基本框架是一种经过充分研究,以证据为基础的方法,侧重于提高学生成绩所需的五个基本因素:有雄心的教学(Ambitious Instruction)、有效的领导者(Effective Leaders)、合作型教师(Collaborative Teachers)、支持性环境(Supportive Environment)、积极参与的家庭(Involved Families)。研究表明,在这五个基本要素中至少有三个方面表现出色的学校在学生学习方面取得显著进步的可能性要比其他学校高出10倍。[19]因此,NWEA的“学校改进模型”侧重于培养学校领导者促进和维持有意义变革所需的能力,同时着眼于学生的起点和他们的学习准备情况,以确定潜在的教学调整,以更多样化、公平化和包容的方法来支持每个孩子的成长。[20]该模型的流程与各层面内容详见下图。
为了向基层教师和教育工作者传递有关如何使用MAP数据来支持目标设定、课程计划和分层干预的知识,NWEA还对外开放了大量的研讨会。教育工作者还可以通过NWEA的专业化网络学习平台进行学习,随时调节自己的学习进度。NWEA聘请了专门的专业学习顾问,他们均持有专业教学证书和高等教育学位,大部分人曾担任过教育工作者,能够帮助学校和教师获得真正有用的、个性化的学业测评知识与技能,为教师更好的教学赋能。
2015年5月,我国民政部出台了《关于探索建立社会组织第三方评估机制的指导意见》,该文件第二条明确了第三方机构需要具备的四个资质条件:“一是能够独立承担民事责任;二是具有相对稳定的专业评估人才队伍;三是内部管理规范;四是社会信誉良好。”[21]也就是说,作为第三方教育评估机构,必须具备独立性、专业性和权威性等基本特征。[22]通过对NWEA的学业测评经验进行分析,发现其符合我国对第三方教育评估机构的要求,同时又有美国背景下的独到特点,具备以下几大特征,对我国开展相关第三方教育评估实践具有一定的借鉴意义。
NWEA的独立与自主性体现在它是一个独立于美国教育行政部门的机构,它财政独立,自负盈亏,能够独立承担民事责任。虽然NWEA与美国教育行政部门时有合作,但其重要决策的制定及日常工作的运转并不受制于教育行政部门,而是有自己独立自主的运营模式和运营体系,总体来说有着非常大的自主性和独立性。
NWEA的专业性一方面体现在人员构成上,另一方面则体现在科学化、个性化的测评工具上。在人员构成方面,NWEA拥有专门的研究团队,其成员绝大部分为政府外部人士,且有一半以上是资深教育工作者,人员的任命具有相当严格的选拔与考核机制。在测评工具方面,NWEA开发的MAP学业测评系统经过40余年的发展已经相当成熟,其常模数据和基准组的选取具备科学性,整个学业测评体系较为完善。此外,NWEA具有健全的内部管理规范机制,下设董事会、国家解决方案部、评估和专业学习部等专业部门,按照既定职权范围履行职责。目前,NWEA的学业测评已经成为了除美国教育部门组织开展的美国国家教育进展评估(NAEP)外最大规模的学业测评,其结果被各州和地区以及国家教育行政部门广泛认可,对于教师、学校和地区教育教学政策与方法的改革具有较强的公信力和影响力。
由于NWEA的学业测评并非简单停留在对学业水平进行文字描述的水平上,而是融合了学业水平和学业进步,融合了过程和结果的动态测评,因此能够为教育工作者和学生本人提供对学习情况的全面认识。在此基础上,NWEA注重联通学校、地区、教师、学生和家长,为教育教学涉及到的每一主体都提供了观察学业测评结果并根据结果针对性改进教育实践的机会,且格外注重发挥学校领导和教师的调动作用,以对学校领导和教师的培训作为改进学业测评模式、创新基础教育质量监测的出发点,有助于扭转学业测评只“评价”不“行动”的局面,让学业测评真正发挥出教育指挥棒的诊断和指导作用。
教育质量的评估与监测越来越受到广泛关注和重视,教育质量监测的模式也在不断更新与发展。美国NWEA在40多年的探索实践中,形成了独具特色的第三方教育质量监测模式,通过开发MAP学业测评系统为美国及其他国家提供了基础教育质量监测的新路径,其自适应学业测评、过程与结果结合、关注最近发展区和潜能、推动促进教育公平的评估理念和方式在国际上具有先进性和创新性。此外,NWEA凭借其独树一帜的评估基准、技术路线、可视化呈现以及不间断的研究创新和与社会各方的密切合作实现了学业测评真正服务于学生发展并为教师和学生提供参照系的作用。
在我国管办评分离和积极引入第三方教育评估机构的政策背景下,NWEA为我们提供了新的视野和角度,值得借鉴。我国首先需要在测评理念上有所转变,坚持以学生为中心的评价理念,赋予过程性测评以合理定位,并依托发达的互联网技术尝试构建个性化测评体系,便于大数据的收集与分析。与此同时,必须承认的是,NWEA的成功是特定社会、文化、历史等背景共同造就的,它的成功经验是“舶来品”,无法在我国完美复制粘贴。我们能做的是合理吸取其精华,并结合我国实际推动本土化模式的落地,为更好助推我国和世界教育发展贡献力量。