美国纽约州教育问责制度下表现性评价的运用和启示

2011-11-27 05:36:48郑海红段作章

当代教育科学 2011年13期

关键词：问责制表现性协会

● 郑海红段作章

● 郑海红段作章

表现性评价是针对传统的标准测验的不足而出现的。美国纽约州的标准协会在问责制的支持下，成功地运用表现性评价方法检测学生的学习成果。这对我国目前积极进行的评价改革具有借鉴意义。

纽约州；教育问责制；表现性评价

一、美国纽约州实施表现性评价的背景

为了促使教师和行政管理人员对学生的学业成绩负责，美国实施了教育问责制。在教育问责统一标准的前提下，越来越多的学校依赖于标准化考试结果决定学生的毕业、校长的奖金、教师的薪水以及学校的评级。有学者描述绩效问责实施的现状为：“标准。分数。学校报告卡。国际比较。当然，还有考试，无处不在的考试。我们的教育工作者、家长、学生以及公众时时被耳提面命着我们国家的学校成就，没有一天不这样。”[1]不难看出，大规模的标准化考试受到了学界的批评。针对基于标准的多项选择测验的不足，美国许多州采用了表现性评价作为考试评价的一种形式。所谓表现性评价，美国国会技术评价办公室1992年提出了一个描述性的定义：要求学生模拟真实情景，创造出答案或产品以展示其知识或技能的测验。[2]大量的国际实验研究证明，表现性评价为评估系统服务于它们的最初目的提供了机会——支持学生的学习和教师传授高阶的知识技能。纽约州作为美国教育发达的一个州，成功地设立了性能标准协会(New York Performance Standards Consortium)来支持问责制下表现性评价的实验研究，并且取得的成就超过了标准化测验。1995年纽约州前教育厅长托马斯．瑟伯尔（Toms Sobol）和性能标准协会学校的领导人一起努力获得了从五门会考科目中放弃四门考试的权利，仅有英语语言艺术科目需要参加会考考试。所有参与该项计划的28所学校必须在四门核心课程中，完成基于标准的表现性评价的任务方可毕业，个别学校也可以在艺术、外语、实习等方面增加额外任务。他的继任者比尔（Richard Mills）颁布了一项高利害考试政策，而且强制性地通过五门考试才能毕业，但是协会学校仍然保留弃权，允许学生递交协会的评价结果给会考考试中心，这很大程度上是因为这些学校的成功。

二、表现性评价的实施过程

公共问责和透明度是纽约协会学校成功的关键。其成功地运用表现性评价，主要表现在设计、专业发展、技术质量（信度和效度）三个方面。

（一）设计

（资料来源：http://performanceassessment.org/performance/pcomponents.html)

加涅将学生的学习结果（他称之为后天习得的性能）分为五类，即言语信息、智慧技能、认知策略、动作技能和态度，所以人的能力是复杂的，单纯的大规模标准化考试无法保证测得学生能力的多维性。为了保证基于问责的表现性评价顺利运行，性能标准协会专门建立了一个评估系统以评估学生的能力。评估系统由七个组件组成：主动学习、形成性和总结性文件、纠正行动策略、学生多种方式来表达和展示学习、与学习标准相一致的毕业级别的表现任务、学生作品的外部评价者、聚焦于专业发展，具体如上表。

同时拿到高中毕业文凭需要完成四个普通的、延长时间的表现任务和一个核心学术科目（英语）。这些任务是基于技能和内容两方面设计的，呈交的作品既有书面形式的，也包括口头报告。具体的四个任务分别是：文学分析、高级数学的应用、科学工程或者独创实验、社会研究领域内的研究论文。书面写作和口头描述任务的结果由学生、教师以及外部评估者（有些是他们领域的专家）来评估。在整个高中阶段，鼓励学生参与学校课程设计和教学，以促进学生在11和12年级完成毕业任务时取得优异成绩。美国协会学校根据具体的任务，设计相应评定量表，确定学生的等级，详实具体的量表由老师和问责制下外部评估者设计，评估任务组成了评价系统的重要部分。

除此之外，许多协会学校利用档案袋收集学生知道的和可以做的信息。表现性评价审查委员会的主要成员为教育家和评估专家，每五年审查一次从而决定这些学校是否开发了一套支持表现性评价以一种可持续发展道路运行的框架。

（二）专业发展

纽约标准协会成立了专门的咨询中心，开展一系列针对教师和行政人员的促进课程、教学、评价发展的研讨会，支持协会学校的评估工作。这些研讨会都有具体的内容和评估的重点。咨询中心还经常组织跨联盟会议和参与教师的学校互访。

（三）技术质量

协会学校近几年参与了一项适度研究（moderation studies）项目，该研究的目的是收集评分信度的证据，通过三个阶段来完成：(1)协会学校的教师每个人都参与学生作品的打分，然后作为一个组达成一致；(2)外部评审者再评估学生的作品并打分；(3)学校组织基于政府的适度研究的作品与本学校的作品对比。咨询中心的成员收集每个学校为毕业而设计的作品然后建立学生作品包，到了秋季，协会学校的教师们各自依据评分规则，以小组的形式讨论得分。如，2007 年罗伯特．E．斯德克（Dr.Robert E．Stake）做了一项调查，来自协会学校的150名教师收集学生的作品，每个教师评价三份卷子，然后与来自不同学校的十个教师交流，他们一块讨论了试卷的质量以及他们个人的评价，然后一起完成了一个“一致性量表”。最后将达成一致的试卷递交到协会学校，运用协会量规做基于学校的评估。适度研究结果被认为是可靠的，收到了超过80%的达成一致性。[3]咨询中心报告了跨评价者间的高信度评分，并且在每个表现层次上都创造并公共发布了收集的范例文件。

性能标准协会将预测效度看作是关于效度的最重要证据。一项2001年至2002年的研究表明，一组毕业于性能标准协会学校的高中毕业生，他们与其他公立学校学生相比，家庭收入较低而且具有不同的肤色，但这些学生在进入的大学的比率、坚持上大学二年级的比率、在申请大学GPA考试中分数等方面超过了全国平均水平。[4]协会学校学生仅英语科目参加州标准测验，所以无法将表现性评价结果与标准测验结果做一个效度比较，但是协会和咨询中心认为，将表现性评价的结果与其他测试的结果做同步效度比较，会偏向于高利害的标准化测验，因此，没有计划执行这项研究。

三、协会学校的成效

显而易见，协会学校没有使用州标准考试作为一种问责手段。关于实施表现性评价的成效，调查发现，协会学校的学生每日出勤率、升大学率、学业成绩等方面均有所提高，辍学率、发生事故率降低，教师满意度提高，更多的家长愿意参与互动，更好地支持了需要帮助的学生，而且增进了整个学校的文化氛围。2003年的一项调查显示，协会学校与整个纽约的其他学校对比，协会学校的辍学率更低（10.6%VS 20.3%)，上大学的人数更多 (87.8%VS70.1%)。[5]在2002至2003年协会学校的每日出勤率更高（87.6%VS84.7%)。[6]为了验证协会学校是否为他们的学生升大学做好了准备，协会学校参加了一项调查研究。2001年18所协会学校参加调查（要求应届毕业生签署协议，协会的研究者允许获得他们大学成绩单），平均有74%的学生返回了协议。2002年的7月，又有15所学校参加调查，同样返回率为74%。在整个纽约学校样本的学生人口中，20.1%是白人，26.0%是黑人，44.0%是拉美裔，9.8%是亚洲人和其它种族的人，60.3%有权获得免费午餐。对比协会学校，19.4%是白人，27.6%是黑人，43.5%是拉美裔，9.6%是亚洲人和其它种族的人，60.7%可以获得免费午餐。[7]2002年的12月，第一批签订的协议送到了大学，2004年2月第二批签订的协议又送去了大学，最后返回了666份成绩单。经过统计分析，共有77%的协会学校学生上了4年制大学，19%上了两年制大学，4%参加了暑期或技能培训。在上四年制大学的学生当中，7%的学生在竞争最激烈的大学就读，14%在竞争相当激烈的学校就读，30%在竞争很激烈的大学就读，32%在竞争激烈的大学就读，14%在竞争欠激烈的大学就读，2%在竞争不激烈的大学就读，1%在专门学校就读。[8]升入大学的学生78%完成了第二学年的课程。四年制大学的学生84%完成了第二学年的课程，两年制大学的学生59%完成了第二学年的课程。相比全国平均水平，只有73%的四年制大学学生和56%的两年制学生继续第二学年的课程。[9]

这些结果表明，协会学校是成功的，尤其是对于非裔美国学生、拉美裔学生以及经济处于弱势的学生来说，有效的帮助他们为升大学做好了准备。

四、对我国评价改革的启示

纽约性能标准协会学校关于表现性评价从步骤、方法到结果的完整运行和实施，对于我国中小学的教育评价改革具有重要的启示。

首先，真正的问责体系并不是使用统一的基于结果的标准化考试。问责制是合理的，它反映了教育系统中各个参与主体的责任分担，明确了教育的义务和权利，引起了学生和教师对学术的重视，有利于国家的长远发展。但是，标准化考试并不是评价的最有效方式，问责制同“高考”一样，是在促进学生发展的基础上，选拔更优秀的人才，而选拔方式本身就需要综合评价。纸笔测验仅仅反映学生的知识掌握程度，人是社会性的人，21世纪的人类需要掌握21世纪社会发展必要的技能，包括复杂思维、分析技能、计算机技能、创造性、媒体素养和跨文化技能。所以可以看出美国目前的问责制仍然不完善，而纽约标准协会作为一个试验区，成功的运用表现性评价方法于教学实践中，结果令人满意。可见，我国在构建问责制评估系统时，不能全部使用客观试题来测验，问责权下放给地方政府和学校，鼓励学校根据本校的特点，坚持在校本评价和终结性评价中使表现性任务占据一定的比例，可能更有利于激发各方面的积极性和创造性。

其次，面对新世纪的挑战，我国需要加快转变评价范式。课程、教学、评价是一体的。新课程改革的重点是促进学生发展，新世纪的学生是按照2001年《基础教育课程改革纲要》的内容学习的，但是学业水平考试、高考仍然按照标准的参照测验评价学生，这就使课程、教学、评价出现了不一致性。传统的评价模式是按照泰勒（Ralph W．Tyler）的模式实施的，而斯塔弗比姆首创的CIPP评价模式由背景（context）评价、输入（input）评价、过程（process）评价和成果（product）评价这四种评价组成的一种综合评价模式，强调教育除了活动要达到预期的目标外，还会产生各种非预期的效应、效果，这些结果同样需要评价，而且对学生的影响很大。由此可见，评价范式面临着冲突，如何将定量评价与定性评价统而合一，是目前亟需解决的问题。

再次，我国应建立专业化的评价系统。建立高质量的评价任务和评价量规，一直是实施表现性评价的难题。借鉴纽约协会学校的经验，我们应该促进评价的专业化。为了保证评价的有效性，协会学校成立了专门的评估委员会，每隔五年审查一次评估系统。审视我国的教育现状可以看出，反馈环节做得不到位。如在日常的教学过程中，我们也有意识的使用档案袋收集学生的信息，但是很少花费精力对收集到的信息进行分析，而且教师对测量学知识懂的并不多，不能很好地把握住评价的“度”。这就启示我们，要建立健全评价任务的内容和量规，每隔几年对档案袋信息进行反馈，教师也需要学习测量学知识，以保证评价的质量。

[1]Macpherson,R.J.S.The Politics of Accountability:Educative and intemational perspectives[M].Thousand Oaks,CA:Corwin Press.1998:112.

[2]Hambleton,R.K.Advances:in Assessment models and Practices[M].In D.C.Berliner,R.C.Calfee(ed.).Handbook of educational Psychology.New York:Simon&Schunster MaCmillan.1996:902.

[3]The center for Inquiry in Teaching and Leaming.New York Performance Standards Consortium,Center for Inquiry in Teaching and Leaming Moderation study,2007-2008[EB ／OL]．

http://performanceassessment.org/performance/pcenter.html,2008.

[4]Foote,M.M.Keeping Accountability Systems Accountable[J].Phi Delta Kappan,88(5),359-363,2007,(01).

[5]The New York City Department of Education.New York City Consortium Schools’Statistics Compared to Citywide Statistics[EB/OL].www.nycenet.edu,2003.

[6][7]The New York City Department of Education’s 2002-2003“Annual School Report cards” and the New York State Department of Education's 2002-2003“New York State Report Card Comprehensive Information Reports.” The Consortium school’s data were compiled from each school's individual report card or information report.The overall New York City high schools’data are found on every New York City school report card for comparison purposes.

[8]Barron.Profiles of American Colleges[M].College Division of Barron’s Educational Series 25th Edition,2003.

[9]Mortenson,T.Freshman-to-Sophomore Persistence Rates by Institutional Control,Academic Selectivity and Degree Level,1983-1998[J].Oskaloosa,lA:Postsecondary Educational Opportunity(Number 74).1998,(8).

郑海红/徐州师范大学2009级硕士研究生段作章/徐州师范大学教育科学学院院长、教授

（责任编辑：刘丙元）