美国基于标准的绩效问责改革策略研究

2014-03-12 11:47刘春香

当代教育与文化 2014年3期

刘春香

（华东师范大学课程与教学研究所，上海 200062）

20世纪90年代，美国兴起了基于课程标准的教育绩效问责变革，到2012年奥巴马政府推动各州实施基于 “共同核心州立标准”①（Common Core State Standards，CCSS，以下简称共同标准）及评价的绩效问责改革，美国基于课程标准的绩效问责实施已有近二十年。历经了基于州立课程标准的绩效问责尝试、全国统一绩效问责模式、差异化绩效问责改革试验、基于共同标准的绩效改革共四个发展阶段，并逐渐形成以学校作为教育质量负责主体，以课程标准预期的学业结果作为评价学校发展指标的教育制度。研究美国基于标准的绩效问责制度的变革历程、改革成效、新绩效制度发展趋势及潜在问题，可为我国新课程改革提供有益借鉴。

一、基于标准的绩效问责的发展历程

（一）基于州立课程标准的绩效问责模式

美国基础教育绩效问责理念源自公共行政问责制度的发展及教育市场化改革实践，其核心观点是公共职能的行使主体应对其职能后果承担责任，制定明确的绩效目标，量化绩效评价指标，将奖惩措施与绩效评价结果相匹配。20世纪80年代美国兴起基于课程标准的教育改革运动以来，绩效评价与课程标准的学业预期联系日益紧密。1990年代初期美国完成全国学科课程标准制定后，多州建立了基于州立课程标准或学术标准的绩效问责制度。2001年，全国已有40多个州发布学校报告，20多个州有学校等级评价，并帮助或惩罚学术表现不佳的公立学校。［1］

1990－2001年各州基于课程标准的问责模式体现了某些共同特征:将学校视为学生学业成就改善的负责主体；将绩效结果与能力水平相关联；对学校的绩效责任进行分类；定期考察并发布报告等。［1］基于州立课程标准的绩效问责理念由关注教育资源投入的应用，转向关注教育资源的输出效率，逐步形成了美国基础教育绩效问责制度的雏形。

（二）全国统一绩效问责框架的实施

2001年布什政府根据1965年《初等与中等教育法》授权，签署了《不让一个孩子掉队》（No Child Left Behind，NCLB），要求公立学校负责提高所有儿童的学习成绩，并缩小四类学生子群的差距。其预定的绩效目标是所有学生在2014年的数学和英语阅读达标，要求设置年度可测量目标（Annual Measurable Objectives，AMOs），以是否达到适当年度进步（Adequate Yearly Progress，AYP）作为考察学校发展的绩效指标。连续两年不达标学校要拿出州Title I资金②的20%为学生提供择校、补偿性教育辅导等，对三到五年不达标的学校要被重组、接管或关闭。［2］

各州根据NCLB法案的绩效要求，在2002－2013年实施期间，形成了全国统一的 “课程标准－标准测试－绩效报告－问责措施”的绩效问责制度。目前为止，没有申请放弃NCLB核心绩效要求的州和地区，仍然沿用该绩效问责模式。

（三）差异化绩效问责改革试验

全国统一的绩效问责模式在教育部严格执行两年后，根据美国教育政策中心（Center on the Educational Policy，CEP）的调查，由于绩效目标难以实现，评价指标过于甑别和惩罚学校，NCLB形成的统一绩效问责模式遭受到不同州与学区的抵制。［3］基于此，教育部于2008年实施了 “差异化绩效问责实验项目”（Differentiated Accountability Pilot Program），批准了包括弗罗里达、伊利诺斯、印第安纳等9个州参与该项目。旨在鼓励各州探索在NCLB统一绩效框架下改变 “被甑别学校”的类型和干预强度，以集中资源为真正需要改进的学校提供帮助。

参与该实验的各州改革采取了某些共同的绩效措施:考虑学校没有达到年度进步指标的原因，对学校重新分类并延长干预的期限；设置专家组对未达标学校做教育改进的需求评估；将成绩数据运用于学校改进和教师的教学决策。

（四）基于共同课程标准的绩效问责变革

2010年共同核心课程标准颁布以后，美国加速了基于共同核心标准的绩效问责改革。在2010年申请国会重新授权修改《不让一个孩子落后》法案的提案暂时未获通过的情况下，教育部尝试鼓励各州放弃NCLB某些不合理的核心绩效要求。2011年－2012年9月，教育部正式批准了包括马萨诸塞州在内的33个州及哥伦比亚特区的放弃申请，并于2012－2015学年实施。［4］目前这些州已拉开了基于CCSS绩效问责变革的帷幕，尝试在提高学生成绩与缩小学生差距的绩效目标引导下，将共同绩效问责框架与各州差异化绩效问责措施相融合。

教育部要求改革州建立基于共同标准的绩效问责制度，包括采纳升学与就业标准；重新设置合理的绩效目标；增设表现性绩效评价指标；根据测试结果对学校重新分类；依据数据考核学校教师和校长的绩效。［4］

二、基于共同标准的新绩效问责改革的方法

（一）绩效目标的制定依据学校历史发展数据

NCLB的实施表明 “2014年所有学生数学和阅读达标”的绩效目标根本不可能实现。根据教育政策中心的统计数据，以2000年NEAP年数学和英语的 “熟练”比例为基点，要达到2014年绩效目标，每年全国 “熟练”比例的平均增幅要高达2%－3%，但实际上每年平均增幅比例不到1%－2%，且有历年下降的趋势，各州增幅迥异。［5］因此，基于共同核心课程标准的新绩效改革的重大措施之一，就是重新设置合理的绩效目标以替换NCLB绩效要求。

新绩效问责制度改革开始深入思考 “什么是合理的绩效目标”及 “如何制定合理的绩效目标”的改革议题。此次绩效目标的制定表明:合理的绩效目标要兼具 “有抱负”和 “可实现”这两个特征，要依据学校和学生学业成就的历史数据和发展趋势，并考虑不同地区的实际水平，允许存在各州差异。因此，联邦基于共同标准的绩效目标主要有三类:在6年内降低一半学生及特定子群非 “熟练”水平比例；2019－2020年基于新升学与就业标准和测试，达到100% “熟练”水平；根据州发展水平设置 “有抱负又可实现”的绩效目标。［6］多数州选择了第一类和第三类，形成各州多元的绩效目标。

（二）绩效问责理念由惩罚失败转为奖励进步

NCLB的绩效评价指标过于甑别和惩罚学校。按照绩效要求，四类学生子群和所有学生都必须达到AMOs才能合格。在其实施的十年间，不合格学校数量逐年上升，2010－2011学年全国没有达到AYP学校上升至49%。如果不实施绩效改革，教育部预计2012－2013学年不合格的学校比例在将会超过80%。［2］对数量如此庞大的公立学校实施改进、择校、重组或接管，给州、学区和学校带来沉重负担，因此这些学校问责措施并没有得到有效实施。

鉴于此，新绩效制度通过改变鉴别和分类学校及学生子群的方法，由惩罚失败转为奖励进步。虽然仍要求学校报告AMOs，但不再以AYP作为学校分类的主要依据；除非州和学区要求，被甄别的学校也不再提供额外教育辅导或择校服务。新绩效问责根据学校在全州成绩及学生子群差距状况甑别三类学校:“受奖励学校”、“优先学校”和 “焦点学校”，后两类学校需要接受集中或定向干预，但这两类学校分别只占州Title I学校的5%及10%，以减少需要干预学校的数量。

表1 对不同学校及学生子群的分类［7］

另外，为避免某些儿童被重复计算，新绩效改革对学生群组的分类采取了合并子群或宽泛分类的方法，将四类处境不利儿童合并为一类或两类。采取的主要方式有:将学校成绩最低的25%－30%学生或所有成绩在 “熟练”水平以下的学生合并为一组，或将少数民族儿童、残疾儿童、英语学习者、低收入家庭儿童四类子群合并为一组或两组。值得注意的是，各州对少数民族儿童归类区别较大，如弗蒙特州将所有非裔、西班牙裔、亚裔、少数民族儿童归为一组，而南达科塔州将非裔儿童和西班牙裔儿童归为一组。

（三）设置评价学校效能的多维绩效指标

新绩效改革选用多维度的量化与质性指标全面考核学校的发展状况。除了报告年度可测量目标、学生 “熟练”比例、高中毕业率以外，增设了学生发展模型、学校提高学生成绩与减少不同子群差距的总体进展、学生测试参与率，对高中学生则需要报告升学与就业准备相关的指标:ACT与SAT测试分数、职业技术教育（career and technical education，CTE）证书、参与 AP进阶课程（Advanced Placement）测试及分数或高校升学率等。另外，不少学校将学校氛围、教师与校长的效能也设置为绩效问责的表现性指标。如内达华州采取的学校表现计算方法如下:［7］

中小学校效能＝学业进步（40%）＋成就水平（30%）＋缩小子群间差距（20%）＋其他因素（10%，出勤率或学校氛围）；

高中学校效能＝成就水平（30%）＋缩小子群间差距（10%）＋毕业率（30%，所有学生及不同子群）＋升学与就业准备（16%，SAT/ACT，AP，补救课程等）＋其他因素（14%，9年级学分、出勤率或学校氛围）；

（四）建构基于增值评价的内部绩效问责系统

在近20年的实践中，美国基础教育绩效问责建构了基于联邦、州、学区和学校职责的外部绩问责系统。它由联邦制定绩效问责政策、提供专项资金、实施全国质量监测；州制定具体的绩效框架、预算资金、实施标准测试；而学区和学校则参与标准测试、报告年度进步、提供改进计划、接受奖惩措施。但对外部绩效的研究结果表明:在没有建立学校和教师内部绩效责任的情况下，外部绩效责任不能产生显著成效。［8］最有效的绩效问责制度是将内部绩效与外部绩效系统有机融合。

表2 绩效问责的内部与外部结构图

对于 “应该如何确立教师、校长和学校的内部绩效责任”这个问题，统一绩效问责模式尝试以标准测试的考试成绩作为评价校长和教师的绩效方法，这导致美国基础教育的应试危机:课程范围缩小，教师高度关注应考的学科内容，缩减其它学科的教学时间；教师仅关注有望达到 “熟练”水平的学生群体，忽略 “精通”与 “不及格”水平的学生发展需要；学生由于应试技能的提升而使分数的提高，但并不意味着学习能力发展。

鉴于此，受增值性评价的理论和实践影响，新绩效问责改革要求建构基于学生和学校发展数据的教师和校长评价体系，确立教师、校长和学校的内部绩效责任，以期绩效改革能真正促进教学改进。增值性评价考察一定时期学校、教师对学生学业进步的影响，它综合考虑学生成绩起点、背景特征、学业态度、学校环境和背景等多种因素，在排斥不受教育影响的因素后评价教师和学校的效能，可更精确衡量学校和教师对学生成绩的积累效应。［9］由于比较客观地考察了学生的成绩起点等因素，可促使教师由关注测试成绩转向重视课堂教学和学生进步。

（五）形成 “七位一体”的绩效问责模式

经过各州绩效问责实践，并由《不让一个孩子掉队》法案制度化，美国绩效问责已经形成了包括课程标准、绩效目标、问责主体、标准测试、评价指标、绩效报告、问责措施这七个要素构成的系统。此后，差异化绩效问责实验和基于共同核心标准的绩效改革，是在此模式下对这七个具体构成要素的更改，但总体的绩效问责框架并没有发生大的变化。在该绩效模式下，美国继续探索如何设置合理的绩效问责目标、问责主体的职责、评价指标的性质和维度以及促进学校发展的有效问责措施等问题。

三、基于标准的绩效改革存在的问题与思考

基于课程标准的绩效改革不断探索绩效问责的构成要素，明晰绩效问责制度的目标，建构各类评价指标，寻求奖优惩劣的有效问责方法。新绩效改革则鼓励各州在某些共同绩效模式下探索基于共同标准的新方法。目前，虽然基于共同标准的绩效问责制度改革仍处于起始阶段，但获准放弃NCLB绩效要求的各州采用的复杂、多元、不透明的绩效问责方法已引起某些争议。

（一）各州特色与联邦统一模式的争议

NCLB统一绩效问责模式实施的成效之一，就是所有州根据学生 “熟练”百分比、学校达到AYP状况、高中毕业率等评价指标发布成就报告，建构了全国学校发展数据网络，为公众监督教育质量和基于数据的教育决策提供了依据。［10］因此，联邦仍希望各州基于共同标准的绩效问责改革能保持NCLB某些一致性原则。但许多州明确表示希望能保留各州发展的绩效结构，参与 “差异化绩效问责改革”的州目前在放弃NCLB申请中提出将新的联邦问责系统融入州的绩效问责模式中。就目前基于共同标准的绩效改革来看，尽管有联邦统一的绩效规定，但各州的绩效目标、评价指标、分类方法、问责措施等要素多元，各州的绩效报告不会具有一致性和可比性。

（二）对学校和学生子群分类的争议

新绩效改革对学校分类方法的改变可有效减少需要干预的学校数量，使州、学区和学校能够集中资源应对 “优先学校”和 “焦点学校”的发展需要。但研究者认为 “优先学校”占5%的比例太低，很多学业发展水平低但高于 “优先”水平的学校会逃避关注和干预。另外，NCLB实施的过程表明，联邦对不同分类的学校所规定的干预、改进、重组、关闭等措施对学校改进的效果并不明显，［2］而基于共同标准的绩效问责改革也没能为需要关注的两类学校提出合理的资源配置以及有效的改进方法。再者，对学生四类子群的合并方法虽然便于学校统计和管理，但会忽略某些学生子群的特殊教育需求。

（三）对教师及学校效能统计方法的争议

基于共同标准的绩效问责改革采用了增值评价法以评价学校及教师对学生成绩的积累效应，并运用多维表现性指标评价考察教师和学校对学生发展的影响。但增值评价作为一种统计方法，其建模方法多元，目前美国各地增值评价方法就存在着协变量矫正模型、获得分数模型、多元模型等多种方法，不同的建模方式有其适用性，评价结果的信度也存在争议。［11］另外，在运用表现性指标评价学校效能时，各州所考虑的绩效指标、影响因素和权重赋值很不一致，因此，很难依据绩效评价报告鉴别教师及学校的绩效水平。这些问题仍有待各州在基于共同标准的绩效问责改革中探索和解决。

［注释］

① 共同核心州立标准是美国全国州长协会（National Governors Association Center for Best Practices，NGA）和各州教育长官委员会（Council of Chief State School Officers，CCSSO）于2010年6月发布全国性课程标准，包括数学及英语阅读学科，要求采纳该标准的州课程标准85%与该标准相同，目前已有45州及哥伦比亚特区采纳了此标准。

② Title I是美国根据1965年《初等与中等教育法》设置的联邦基金，用于为处境不利儿童，特别是家庭贫困的低学业成就儿童和残疾儿童提供额外的教学辅导以提高其学业成绩，目的在于促进教育公平。

［1］李敏.政策导向——1980年以来美国基础教育政策的演进［M］.合肥:安徽教育出版社，2009:174－194.

［2］Kimberly Scriven Berry ＆ Carolyn D.Herrington.States and Their Struggles With NCLB:Does the Obama Blueprint Get It Right？［J］.Peabody Journal of Education.2011，（6）.

［3］Tom Loveless.The Peculiar Politics of No Child Left Behind［EB/OL］.http://books.google.com.hk/books？.2013 － 09 － 12c.org /publications/index.cfm？selected Year＝ 2009.2009－09－03.

［4］CEP.Accountability Issues to Watch under NCLB Waivers［EB/OL］.http:// www.cep－dc.org/display Docu ment.cfm？Document ID＝411.2012－10－02.

［5］CEP. HAS STUDENT ACHIEVEMENT INCREASED SINCE NO CHILD LEFT BEHIND？［EB/OL ］. http://www. eric. ed. gov /contentdelivery/servlet/ERICServlet？ accno ＝ED520272.2011－06－12.

［6］CEP.What impact will NCLB waivers have on the consistency，complexity and transparency of state accountability systems？［EB/OL］.http://www.cep－dc. org/ publications /index. cfm？selectedYear＝2012.2012－10－02.

［7］CEP.Major accountability themes of second－round state applications for NCLB Waiver［EB/OL］.http://www. cep－dc. org/display Document.cfm？DocumentID＝411 2010－10－02.

［8］迈克尔·富兰，彼得·希尔.突破［M］.北京:教育科学出版社，2006:22.

［9］王维臣.绩效制背景下美国教师评价的改革及其启示［J］.外国中小学教育，2011，（10）.

［10］赵中建.质量为本－美国基础教育热点问题研究［M］.合肥:安徽教育出版社，2010:118.

［11］周燕，边玉芳.美国教师效能增值评价研究与应用进展［J］.全球教育展望，2011，（10）.