李唯一
(上海师范大学教育学院,上海 200234)
国家教育进展评估(National Assessment of Educational Progress,NAEP)作为美国久负盛名的大型教育质量监测,对该国教育及社会作用深远。其中,在教师层面对教师行为产生了积极与消极的双重影响。本文分析NAEP 对教师行为的影响,归纳总结教师应用NAEP 数据的工具与途径,以期为我国义务教育质量监测的改进提供思路。
NAEP 也被称为“国家报告卡”(The Nation's Report Card),自1969 年来,主要针对公立及私立学校中四、八、十二年级的学生,开展包含数学、阅读、科学等9个科目知识与能力的持续监测。NAEP的评估体系由三个模块构成,分别是主评估、长期趋势评估和专项研究。其中,主评估致力于评价学生当前在核心学科领域的学业成就,反映当下美国基础教育的质量。此外,NAEP 通过划分“基础”“精通”和“高级”三个等级,来区分学生对课程标准掌握程度的差异。有赖于NAEP 良好的保密性,加之其制定了可供州与全国、州与州之间进行直接比较的通用标准,NAEP 始终被广大教育者视为“美国教育最可靠的数据来源”。[1]为方便教师了解并使用NAEP 数据改进教学、改善学生学习体验,NAEP 开发了丰富的在线数据工具,该工具主要有以下两点特征。其一,操作简单便捷。NAEP 开放一站式服务,将面向教师的在线数据工具及资源进行整合,依据题目、评估、框架等进行分类,工具界面简洁并提供操作教程,只需按提示进行操作,对技术薄弱的教师十分友好。其二,数据可视化程度高。如“成就差距仪表板”“NAEP 项目地图”“州概况”和“地区概况”等都对数据进行了可视化分析,所形成的图表一目了然。
在后疫情时代,美国可以通过NAEP 获取学生在疫情期间的学习经历,了解学生的学习困难并给予帮助,广大教育者也可从NAEP 获取改善学生学习体验及教育成果的资源,这些彰显了NAEP 对美国教育的重要性。然而,NAEP 也曾对教师行为产生过负面影响。2001 年《不让一个孩子掉队》(NCLB)法案出台,NAEP 的教育问责功能得到空前强化,各州需在方案执行期间的每一年达成“成就目标”,学生需表现出实现这一目标的“适当年度进展”(AYP)。各州的NAEP 结果将作为教育问责的重要参考,甚至直接影响参评学区的学校奖惩。
教师在教育质量监测中扮演着多重角色,课堂教学是教育质量提升的立足点。NAEP 持续关注并推进教师协同参与项目实施与结果应用,旨在开发面向教师的在线数据工具,促使教师在课堂层面加强对NAEP 数据的理解与应用。但NCLB 法案的出台使得NAEP测试结果成为衡量各州是否达成适当年度进展的标尺,作为学校中的教育主体,教师需尽力使学生在国家规定的测试中表现出色以保障学校达标。基于此,NAEP 对教师行为产生了积极和消极影响。
1.对教师行为的积极影响
(1)针对性帮助教学改进
教学质量影响着学生的学习,当教师获得高质量的反馈和支持时,教学将会得到改善。借助NAEP面向教师提供的在线数据工具(表1),基于工具操作简便及数据可视化程度高等特点,教师增强了对NAEP 数据及结果的理解与应用,获取了教学改进上的帮助。
表1 NAEP在线数据工具
在教学资源上,教师可以通过“立即参加NAEP”,使用已发布的NAEP 测试问题作为课堂资源。目前面向四、八年级开放了数学和阅读2 个科目的试题,题目选自2017 NAEP 测试,每个年级有两套试题。此外,教师可以利用“NAEP 问题工具”浏览超过3000 个NAEP 测试例题,例题数据库涵盖阅读、数学、科学、经济学、地理、艺术等12 个科目,面向四、八、十二年级。教师可以根据例题内容、类型、难度、年份进行选择。开源的数据库和灵活的自定义测试增强了教师课堂教学的针对性,教师在NAEP 框架下对班级学生的学业知识进行“量体裁衣”式的测评,了解每名学生对知识的掌握情况。一方面,教师能够根据学生层次有针对性地匹配教学目标、教法、作业设置。如在“兵教兵”的小组合作中进一步明确“强兵”与“弱兵”的学习需求,教师可以根据学生的程度适配差异化的基础性及挑战性任务,激发学生的学习兴趣,提升合作学习的效率和效果。另一方面,教师可以利用在线测试工具实现对学生成绩的数字化管理。既能总结班级学生测评结果的总体情况,同全国、各州学生进行直接比较,又能归纳和查找学生的知识漏洞并生成成绩曲线,进行个性化辅导。
在教学评估上,教师可以用NAEP 框架作为教学的指导方针。由于NAEP框架提供了国家层面下特定科目应掌握的重要知识内容及高阶技能,因此利用NAEP框架进行课堂评估将更直观地体现出学生应达到的认知水平。例如通过研究数学框架,教师可能会发现他们在测量这一单元的大部分教学时只涉及程序性知识,在考察学生应用周长和面积公式的能力时,似乎只强调套用公式,而忽略了通过应用题发现学生解决真实问题的水平。[2]这种方式有助于改进教学内容,拓宽教师的思路与视野。
(2)全面地洞察学生水平
通过NAEP 在线数据工具,教师可以观察与了解学生的进步情况。宏观上,教师能够依据“州概况”和“地区概况”了解所在州或地区(学区)学生的NAEP 测试结果,并将自己的课堂期望和学生成绩与全国学生进行直接比较。两个工具能提供四、八、十二年级学生在数学、阅读、科学和写作4 个科目上的测试结果。“成就差距仪表板”则公开了具体的成绩差距,通过两组学生(如不同肤色学生)之间测试分数的对比揭示不同因素影响下的学生差异及教育经历。此外,教师可以通过“NAEP 数据浏览器”搜寻全国范围内所有NAEP测试的结果,数据跨越数十年,包含了公立、私立及特许学校,以此可以了解不同州、地区(学区)学生之间的差距,探究所教学生的表现与教学实践、学校资源等因素之间的关系。教师通过了解所教学生在全国所处的水平,可以动态调节课堂期望,并知晓学生在哪些知识内容上还未达到预期,从而进行有的放矢的教学与测试。值得注意的是,以上工具的最大特点是数据处理及呈现的可视化程度高,教师在操作过程中,可以自主地分析、组织数据或信息并获取直观的呈现。一方面,这对教师关于NAEP 原始数据的了解程度提出了要求,教师需要思考如何筛选所需的因素、条件等变量,如何选择和使用可视化工具进行分析。另一方面,基于NAEP 庞大数据的可视化呈现提升了教师对于NAEP 结果的理解深度,使得教师在数据可视中得到有利于实践的实时反馈,对教育教学进行不断优化与改善。
微观上,教师可以利用“例题手册”了解NAEP评估的方向、期望等信息,学习如何挑选测试问题和测评对象、如何分析测评结果和创建个性化的定制评估。此外,“NAEP 项目地图”说明了学生在各种量表对应的成就水平上需展示的知识和技能。教师可以选择学科、年级和年份构建学生整体表现的项目图。
(3)及时获得专家指导
教师在利用NAEP 数据工具改进教学的同时,难免出现质疑自己的课程、教学及评估质量的情况。利用“全国”评估在教室中进行“地方”尝试同样会在施行过程中出现困惑。基于此,NAEP 提供线上平台以促进教师与专家的直接交流。为了帮助教师及时获取NAEP 评估的最新解读信息,其官方博客“NAEP PLUS+”定期发布文章,综合NAEP各项数据探讨学生的成绩及教育经历,旨在帮助教师寻找改进教育教学的机会。同时,NAEP 定期邀请领域内的专家举办线上演讲或座谈会,活动主题围绕学生在NAEP 中的表现及改进等问题展开,例如探讨“少数族裔在学习过程中存在的优势与弱势”“学生性格对于学生在校表现的影响”等内容。教师在向专家学习的过程中不断加强对于NAEP原始数据的理解,解决实践中在NAEP 结果应用上存在的困惑,促进了专业发展。
2.对教师行为的消极影响
NCLB 法案所代表的“标准驱动”问责模式提升了美国基础教育领域的学生成绩,但备受诟病的AYP 问责给学校及教师带来了一定的消极影响。NCLB法案施行后,各州所有三至八年级学生必须参加NAEP数学、阅读和科学考试,并提出了所有学生须在2014年前达到“精通”程度的目标。[3]
一方面,由于各州对于“精通”水平的标准差异较大,仅参考各州自行组织的州评估结果并不能对学生成绩做出令人信服的推论。研究表明,NAEP结果与州评估结果之间存在显著差异,达到NAEP的“精通”水平对各州更具挑战性。此外,NAEP 所代表的国家评估成为问责制的核心,以往的NAEP结果并不会给学校、教师和学生带来影响,但NCLB法案强制要求各州参与NAEP 考试,利用NAEP 结果来验证州评估结果,以此衡量各州取得进步的真实性和准确性。另一方面,NCLB 直接以学生成绩作为考核学校及实施奖惩的指标,未达标学校均会被要求在监督下进行改进,更严重者将被强制更换校长或收归政府管理。学校、教师及学生的压力随之而来,教师行为也因此受到了消极影响。
(1)滋生应试教学观念
作为大型教育质量监测,NAEP 主要的“诊断”功能使其区别于一般考试。低利害性的特点决定了教师不太可能因NAEP 而产生“为考而教”的观念,但随着AYP 问责带来的压力,成绩成为检验学生是否进步的重要指标,帮助学生“通过考试”成为学校与教师的共同期望。在应试观念增强的背景下,教师可能会采取“课程收窄”策略,将不属于考试范围内的教学内容进行删减,并倾向于传授应试内容和应试技巧以帮助学生达成NAEP 测试中的“精通”水平及进步目标。以NCLB法案施行期间的2003 年和2015 年的数学教师背景调查为例,可以发现教学重点发生了明显的变化(表2)。
表2 2003年及2015年美国四年级数学教学重点占比①选取2003 年与2015 年的教师背景调查,是因为这段时间为NCLB 法案的执行期。2015 年后,《让每个孩子都成功》法案(ESSA)正式取代NCLB 法案。
四年级数学的教学重点始终在于“数字和操作”,其他知识内容的比重则较为平均,但“代数和函数”在NCLB 法案实施的12 年间涨幅明显,这代表代数和函数的知识逐渐受到重视。究其原因,NAEP 四年级数学框架中强调了代数和函数知识的重要性,NAEP 2015数学框架中表明,“代数作为强大的表征工具和作为综合概念(如函数)的载体,构成了整个年级期望的基础”。2015 年NAEP 教师背景调查结果显示,四年级数学教师如果很少或根本不重视除代数与函数以外的知识内容,学生成绩低于“基础”水平或在“精通”水平之上的差异并不显著。这意味着在教学中增加代数与函数相关知识的比例将有助于提升学生在NAEP数学测试中的表现。事实上,应试教学正是导致学生产生“分数膨胀”的主要因素之一,即一些实际能力不强的学生也有可能会在NAEP 中取得好成绩,教师可能因此无法准确识别学生在哪些知识上存在漏洞与薄弱之处,继而也不会投入相应的时间和精力进行补救。长期来看,这严重影响了学生对学科知识体系的搭建,不利于真正发展学生的能力。教师的教学策略对学生表现有显著影响,没有哪种教学策略是最佳的,学生取得高分往往离不开多种教学策略的共同作用。而当教师不确定用什么方法可以提高学生成绩,特别是针对不同学生时,以舍弃非考试课程内容和知识范围、传授应试技巧、利用以前的试题来让学生为考试做好准备,但不加深对内容的理解等为代表的应试教学策略成为提高成绩的普遍选择。
显然,在国家评估及标准驱动的问责制影响下,教师的专业自主权受到影响,教师定位逐渐“工具化”,成为被动的接受者。由于成绩将被公布在当地报纸上,这种近乎透明化的监督方式将教师直接置于公众目光之下,因为害怕承担NAEP 成绩低下的责任,被动改变自己的教学观念及标准也在无形中增加了教师的挫败感,并直接导致教师的工作满意度下降。
(2)降低了教学设计灵活度
由于学校面临着若无法在NAEP评估及州评估中达标将被整改的压力,为保证学生成绩取得进步并达到要求,教师需要在教学设计中体现考试内容,但这也限制了教师的创造力。
在教学目标上,为保证所教内容与评估内容紧密一致,教师存在将教学目标定义为“孤立的事实和技能”的现象,即在规定时间内按部就班地教授这些技能,而不管学生的能力如何。在教学行为上,课堂教学有趋于统一和常规的倾向,教师存在改变个人教学行为、实施统一教学模式的风险。例如使用相同的课文和统一制定的单元学习表,循环复习以及组织小测验等。在课堂互动上,教师提问的指向性愈加明显,师生间的问答是为了训练学生掌握问题的正确答案,而非评估学生是否真正具有探究意识与能力。此外,开放式提问减少,封闭式提问增多,学生并没有对问题进行真正思考,其自主学习的兴趣和动力也受到影响。
教学设计灵活度的降低不但使教师产生对工作失去控制的失落感,也间接导致课堂不再生动活泼和有创造力,教师充满为完成目标而背负的紧迫感与责任感。[4]
开展教育质量监测的根本目的在于监测结果的应用,这需要多主体的积极参与和配合。教师因素贯穿教育质量监测的全过程,教师行为与参与程度影响着监测结果应用的效果。借鉴美国NAEP的经验,我国在今后开展义务教育质量监测中应趋利避害,提高对教师行为的积极影响,防范对教师行为产生消极影响。
1.搭建资源共享平台,促进教师对监测结果的应用
教育质量监测的结果主要运用于为区域教育管理与决策提供依据,为学校和教师的教育教学改进提供参考,[5]为教育问责制度服务等。其中,教师作为教育质量监测过程的参与者与结果的应用者,扮演了重要角色。为促进教师理解并应用监测结果对教学进行改进,不仅需要培养教师的数据素养,提高教师对数据的分析与解读能力,[6]还要搭建集数据展示、数据分析、能力报告、全国比较、因素分析等功能[7]于一身的资源共享平台,提供操作性强的在线数据工具。NAEP 通过创建丰富的在线数据工具、搭建开源的习题数据库、提升数据分析的可视化程度,促使教师在教学改进、学生评估等方面获得持续性支持和帮助,对教师行为产生了积极影响,增强了监测结果的应用,值得我国义务教育质量监测借鉴。国家义务教育质量监测自2015年正式启动以来,截至目前共进行两轮监测,资源共享平台还未完全搭建。在促进监测结果的应用上,侧重以研讨会、论坛、讲座等形式对数据进行说明和解读,针对试题、数据、测评、框架等可供教师使用的在线数据工具仍未开发,教师可供参考的资料也相对有限。
为进一步提升国家义务教育质量监测的影响力,实现教育质量监测成果的有效转化,切实指导一线教师的教育教学实践活动,未来,国家义务教育质量监测可以尝试从以下几点进行改进。其一,提高开放程度,特别是试题、数据的公开。事实上,监测数据的共享化已经成为世界上大型测评项目发展的主要趋势。NAEP 公开原始数据,及时向政府和公众提供反馈结果,鼓励研究者对项目数据进行多角度、多层次的挖掘与分析。[8]于教师而言,公开试题、为班级制定以需求为导向的定制评估,利用数字化管理形成每名学生的学习轨迹,可以直接同全国学生进行比较,这无疑是对学生提供个性化支持的重要基础。其二,强化工具开发,特别是服务性数据分析工具的开发。操作简单、可视化程度高的在线数据工具适合目前大多数数据素养较弱的教师,目的是使教师能够自发地积极使用,协助其教育教学工作的开展。基于此,在线数据工具应当让教师能用、乐用、善用,这应成为国家义务教育质量监测工具开发的基本理念。事实证明,NAEP的各类在线数据工具促进了教师行为的积极转变,在一定程度上强化了NAEP 结果的有效应用及转化。因此,我国应重视对在线数据工具的开发及对资源共享平台的构建,促进教师对教育质量监测结果的应用。
2.警惕标准驱动问责,规避教师行为的功利化风险
“评估和问责,是监测制度所具有的两种不同功能。”[9]评估结果的有效应用离不开教育问责制度的保障,尽管教育问责包含改进与惩罚的双重特性,但其价值取向与功能定位决定了“真正的教育问责应该定位到问责的改善性上”。[10]
从NCLB 法案施行下的NAEP 实践结果来看,基于标准驱动的教育问责制不但强化了其惩罚属性,还会使教育质量监测蒙上高风险测试的阴影。基于评估结果的教育问责绝非“唯结果论”,尽管NCLB 法案的初衷在于缩小教育差距,促进教育的公平与卓越,但其鲜明的AYP标准问责模式产生了一定的消极影响,其中,教师功利化行为的上升便是特征之一。教师的应试教学观念与行为逐渐滋生,进而引发对自身定位的困惑,对教学设计的灵活性产生制约,并增加了教师的工作压力与负担。意识到标准驱动问责带来的不利因素与负面效应,2015 年,美国《让每个孩子都成功》(ESSA)法案颁布并取代NCLB 法案,正式取消AYP 和联邦层面的强制性考试,将新法案的实施与监督权交还各州,ESSA 标志着美国教育问责制的全面转向,NAEP 的评估与问责两大功能得到进一步平衡与优化。
2020年2月,中共中央办公厅、国务院办公厅印发了《关于深化新时代教育督导体制机制改革的意见》,标志着“督政、督学、评估监测”三位一体的教育督导体系正式确立,评估监测成为教育督导的重要组成部分。目前,政府尚未出台基于标准的强制性问责政策,但需警惕教育质量监测结果应用于督导问责过程中可能产生的唯结果迹象。尽管我国的教育督导体制还不成熟,仍处于增强督导权威性的过程中,但随着教育质量监测的深入开展以及督导问责权重的增加,教师在参与教育质量监测时同样存在功利化行为上升的风险。因此需在开展教育质量监测、进行督导问责的同时保证教师教学的自主性与灵活性,减轻教师的压力与负担,激发教师参与的积极性与主动性,使教师乐于通过教育质量监测结果进行教学改进和专业发展,从而促进教育质量的提升。