美国基础教育中SBAC学业评价体系的构建与启示

2013-03-24 04:55陈淑清王秀红栾慧敏
关键词:测验学业报告

陈淑清,王秀红,乞 佳,栾慧敏

(1.东北师范大学 化学教育研究所,吉林 长春130024;

2.东北师范大学 国际与比较教育研究所,吉林 长春130024)

SBAC组织由美国三个教育评价机构,即引领计算机自适应测验创新的“教师和教育研究者的终结性评价资源多州联盟”(SMARTER)、开发综合性学习评价体系的“平衡联盟”(Balanced constrium)以及以开发形成性评价的 MOSACI联盟合并组成[1]。2010年,美国政府为深化基于标准的教育改革,颁布了全国统一性质的《共同核心州立标准》(Common Core State Standards,简称“核心标准”)。为促进核心标准的实施,进一步提升基础教育质量,美国政府通过“力争上游计划”,拨款3.5亿美元研发基于核心标准的评价体系,SBAC评价体系正是美国政府资助的研究项目之一①。SBAC的总体目标是通过评价促进学生学习和改善教学,以确保所有学生高中毕业时已为升学和就业做好准备。目前,美国已有27个州参加该评价体系的研发[2]。本文拟对美国构建的SBAC评价体系的框架性内容加以探讨。

一、美国基础教育中构建SBAC评价体系的背景

(一)“共同核心州立标准”的出台

20世纪90年代以来,美国兴起了“基于标准的教育改革”运动。由于美国实行地方分权教育体制,各州自行制定课程标准(简称“州标准”)。由于各州的课程标准在内容上存在较大的差异,导致美国教育质量参差不齐。2001年美国颁布的“不让一个孩子掉队法案”(The No Child Left Behind Act of)明确提出,对不能达到州课程标准(以下简称“州标准”)的学校实行严厉问责。为此,各州为免受责罚,纷纷降低州标准的内容要求,以使学生学业成绩“达标”,这在一定程度上导致美国教育质量的下降。为改变这一现状,美国颁布了旨在统一美国K-12年级课程的“核心标准”[3]。在这一背景下,为推动“核心标准”实施,构建与之相适应的评价体系成为美国基础教育领域中重要的课题。

(二)现有基于州标准评价体系改革的诉求

针对美国当前评价体系的种种问题,美国教育部长邓肯(Arne Duncan)指出:“我们从教师那里听到的最大抱怨是州的标准化考试,迫使教师实施应试教学,而考试却测不出真正重要的东西。”[4]这表明美国现有评价体系存在严重弊端,一方面州标准化考试缺乏科学性、有效性,学业成绩考试无法对学生的高级思维技能与深层次的学习能力进行考察;另一方面,由于缺乏统一的、高标准的学业评价体系,美国各州的学业评价结果也必然缺乏全国可比性。例如,2008年南卡罗莱纳州公布的评价结果显示,有82%的学生通过了州的学业水平考试;但是,该州的考试结果与全国考试管理委员会(NAEP)的考试结果相比较时发现,实际该州只有20%的学生达到了州标准要求[5]。为改变美国基于州标准学业评价效果不好的现状,基于核心标准构建下一代评价体系,成为美国学业评价改革的迫切诉求。

二、SBAC评价体系框架性内容的阐释

SBAC评价体系的框架性内容由终结性评价、形成性评价、临时性评价和网上报告系统等四部分组成。

(一)计算机自适应测验与表现性任务相结合的终结性评价

SBAC评价体系下的终结性评价一般在学年的第12周实行(也可选择在学年初进行)。终结性评价由两部分组成,即综合性的期末计算机自适应测验和表现性任务。这两部分评价将为学生提供他们在为升学与就业做准备方面所取得进展的信息,用于支持高风险的学生、学校、教师和校长的问责决策。

1.计算机自适应测验(Computer Adaptive Testing)

计算机自适应测验是运用计算机手段,根据学生的作答情况对试题难度进行自动调整的测验[6]。在该测验中,若一个学生正确回答了一个试题,那么接下来将呈现一个挑战性的试题;若回答错误,那么将呈现一个较简单的题目。计算机自适应测验在每个内容域下将有大约40—65个试题,包括选择题、建构题、技术增强题[7]。选择题与技术增强题由计算机计分,其他题目则由人工智能引擎进行可信的电子计分,电子计分题中的10%将由人工重复计分,以确保引擎的准确性[8]。

2.表现性任务(Performance Tasks)

表现性任务是以课程目标为导向,学生亲自完成的评价活动。通过观察学生在实际任务中的表现,评价者对学生的知识、技能和能力做出一定判断。在SBAC评价体系下,学生每年将完成阅读、写作和数学等方面的表现性任务。表现性任务将通过计算机发送,一般要求在一至两课时内完成。表现性任务的计分一部分由计算机实行,另一部分由人工进行。其中,10%的建构题和33%的表现性任务由教师进行计分,但教师不能够对自己学生的作答计分[7]。

(二)计算机自适应测验与操作性任务相结合的临时性评价

研究表明,无论终结性评价设计得如何完备,也无法向教育工作者充分提供他们所需要的学生在学校发展中的全部信息。临时性评价与形成性评价弥补了终结性评价的这一缺陷。临时性评价是在学年中进行,实施周期介于终结性评价与形成性评价之间的一种评价类型,通常在学校或地区一级实施。临时性评价在实际操作中具有较大的灵活性,教师和管理者可以根据实际情况选择学年中的某一时间点进行测验,也可选择测验题针对核心标准中某一具体的内容集群进行深层次的评价。临时性评价包括计算机自适应测验与操作性任务,不同的是临时性评价的测验题与操作任务绝大多数是公开的。临时性评价的结果将在两个星期内返回,测验结果的报告规模与终结性评价类似,但评价的结果不累计用于问责的终结性评价分数之中。

(三)通过教师诊断学习能力和改进教学相结合的形成性评价

保罗·布雷克(Paul Black)和迪伦·威廉(Dylan Wiliam)研究发现,有效的形成性评价包括以下特征,即教师对评价证据做出教学调整的反应;学生得到他们学习的反馈与他们进行什么样改进的建议;学生参加到自我评价的过程中[9]。概括地说,评价只有在其信息是用于调整教学以满足学生需要时才是形成性的[9]。

SBAC评价体系中的形成性评价的目标是帮助管理者和教师有效地使用终结性评价和临时性评价的数据,并培养他们在教学过程中收集证据以诊断学生学习能力,从而促进学生学习。为了实现这一目标,SBAC评价体系将通过专业学习工作小组提供培训和合作的机会,帮助教师提升评价素养;理解核心标准的内容要求;开发示范性的课程单元;协调课程、评价与教学的关系;深层次地认识学习过程以持续地改进教学实践,促进教师专业发展。

(四)标准化报告和定制化报告相结合的网上报告系统

为将上述三种评价的结果有效反馈给评价利益相关者,SBAC还将开发安全的网上报告系统。SBAC报告系统由标准化报告和定制化报告组成,以满足不同利益相关者的不同需要。开发SBAC报告系统有以下目的,即管理一个综合的评价与问责系统,以满足成员州的需要;提供“早期预警”信息来监管课程、教学和学习;及时地进行有根据的课程和教学改进;支持教师专业发展;向评价利益相关者,包括高等教育机构提供可比较的学生成就信息,以用于地区、州和联邦水平的教育问责。

在报告内容上,SBAC报告系统既包含动态的部分,如与教学单元、教案和课程资源相联系的评价结果;也包括静态的部分,如与问责制和成长模式相联系的评价结果。在报告形式上,SBAC报告系统将同时提供标准化的纸质报告和技术化的网络数据分析工具,通过一系列的数据分析和报告生成工具来创建定制报告;通过各种各样的图表清晰、形象地展示数据;在报告系统的安全性方面,SBAC将进行保密设置,并提供各种各样的访问界面,每一类使用者只能访问相应的评价信息。与此同时,SBAC还将仔细检查报告的框架为地区和学校管理者以及教师提供有效解释评价结果的培训,以便于他们对评价数据进行更为明智的使用。

三、启 示

(一)评价体系的构建应凸显评价方式的平衡性

SBAC评价体系的一个重要特征就是评价方式的平衡性。可以说,SBAC评价体系有效地平衡了终结性评价、形成性评价和临时性评价三大评价方式。其中每一类都有不同的侧重点与作用,但三者之间又相互联系,共同构成完整的综合性评价体系。SBAC终结性评价的主要目的是对学生的成绩进行地区、学校、班级等各级别的比较,从而对学校、校长、教师工作有效性进行问责。由于终结性评价需做到严谨、精确,以保证评价的公平性和有效性,这会导致终结性评价缺少必要的灵活性,使教育者无法对学年中出现的非预期的学生表现进行评价,也无法收集学生学习发展过程的信息。为此SBAC评价体系通过形成性评价和临时性评价加以补充与平衡。形成性评价发生在课堂教学中,教师用其诊断学生在学习中处于什么状态,在认知和理解的何处存在差距,从而有针对性地改进教学。形成性评价被嵌入到学习活动中,并与当前教学单元直接相连,经常被称为“每时每刻”的评价或是形成性教学[10]。临时性评价介于终结性评价与形成性评价两者之间,实施规模与周期均处于中等水平。临时性评价的结果与形成性评价一样,可以为教师的课堂教学提供信息,但两者又存在一定的差别,临时性评价的结果可以进行有意义的整合并在更广泛的水平进行报告,而不局限于课堂。同样,实施的时间也可能是由学校或地区来控制而非教师。发生在课堂的形成性评价,与关注课堂但不局限于课堂的临时性评价将一起为教育者提供学生学习发展状况的信息,从而弥补终结性评价的不足。我国目前的学业评价体系设计中主要采用终结性评价方式,过分关注学生的学业成绩,因而导致评价过于关注学习结果,而忽视学习过程等问题的产生。借鉴美国的经验,我国在学业评价体系开发过程中,应把形成性评价等评价方式纳入到评价体系中来,构建终结性评价与形成性评价相结合的平衡体系。

(二)评价体系的构建应以先进技术为支撑

SBAC评价体系是以创新的、高效的技术服务为支撑。SBAC评价体系的显著特征体现在多方面,如结合计算机自适应测验的精确性与有效性特点;广泛使用先进技术促进组织开发创新的、贴近现实生活的题目类型;通过记录学生广泛的长期的表现,为当地教师、管理者专业发展与能力建设提供有效信息与资源;通过共同使用的电子化平台与跨州资源,远程发送评价以并创建标准化的及可定制化的报告等。SBAC评价体系以技术为支撑的评价体系符合了成本效益性原则,能够适时地追踪和分析学生个体、学生群体、班级、学校、地区、州在为升学与就业做准备的学生学业状况。我国目前的评价体系中的技术程度有待提高,电子信息平台的建设和利用还不到位,这会导致学业评价信息无法实现共享的问题。借鉴美国的经验,我国在学业评价体系的设计上,应加强评价信息平台的搭建,提高学业评价体系的技术含量,促进评价体系在先进技术的支持下,高质量运行。

(三)评价体系的构建应体现评价结果处理的多元化

SBAC评价体系的评价结果处理是多元化的:一是由于SBAC评价体系的根本目的是了解学生学业表现,促进学生为升学和就业做好准。因此,评价的结果将及时反馈给学生,帮助学生了解自己学习进展情况以及与核心标准的学业水平目标之间的差距。二是利用评价结果改进教师教学和促进教师专业发展。在SBAC评价体系框架下教师不仅可以在课堂中使用学生测验数据,改进教学;也可以进入数字化图书馆,获得专业发展的资源。三是用于学校的问责。SBAC终结性评价的结果也将用于学校问责。评价数据在学校水平上得到了更为显著的使用,那些被确定为年度教学质量低下的学校将受到惩罚,而年度教育质量高的学校将会受到奖励。目前,我国学业评价结果的处理还不够完善,评价目的主要是用于教育质量的监测与评估,用于学校的问责和掌握学生总体学业水平状况;而忽视评价结果用于促进教师专业素质提高和学生个别化指导的作用。借鉴美国的经验,我国在学业评价体系设计上应充分考虑评价结果多样性需要,实现评价结果处理的多元化。

[1]Vermont Department of Education.SMARTER Balanced Assessment Consortium (SBAC)frequently askedquestions[EB/OL].http://education.vermont.gov/new/pdfdoc/pgm_curriculum/EDU-SMARTER_Balanced_Assessment_Consortium_Frequently_Asked_Questions.pdf.2011-03-21/2012-10-31.

[2]SMARTER Balanced Assessment Consortium.Member States.[EB/OL].http://www.smarterbalanced.org/about/member-states/.2012-09-24.

[3]周琴,杨登苗.为升学和就业做准备:美国共同核心州立标准述评[J].比较教育研究,2010(12):13-17.

[4]李茂.美国中小学迎来考试2.0时代[N].中国教师报,2010-10-13(4).

[5]项贤明.20世纪90年代以来的美国教育改革[J].比较教育研究,2003(5):28.

[6]SMARTER Balanced Assessment Consortium.Computer Adaptive Testing[EB/OL].http://www.smarterbalanced.org/wordpress/wp-content/uploads/2011/12/Smarter-Balanced-CAT.pdf.2012-11-27.

[7]Center for K-12Assessment &Performance Management at ETS.Coming Together to Raise Achievement:New Assessments for the Common Core State Standards[EB/OL]. http://www. k12center. org/rsc/pdf/Assessments_for_the_Common_Core_Standards.pdf.2011-6/2012-10-24.

[8]Shavelson,R.J.et al.On the Impact of Curriculum-Embedded Formative Assessment on Learning: A Collaboration between Curriculum and Assessment Developers,Applied Measurement in Education[R].2008:295-310.

[9]Margaret Heritage.Formative Assessment and Next-Generation Assessment Systems:Are We Losing an Opportunity?[EB/OL].http://www.edweek.org/media/formative_assessment_next_generation_heritage.pdf.2010-9/2012-11-27.

[10]Marianne Perie,Scott Marion,and Brian Gong.Moving Toward a Comprehensive Assessment System: A Framework for Considering Interim Assessments[J].Educational Measurement:Issues and Practice,Fall,2009,28(3):5-13.

猜你喜欢
测验学业报告
艰苦的学业
音乐提升学生学业表现
树起学业担当之心
《新年大测验》大揭榜
报告
两个处理t测验与F测验的数学关系
报告
报告
你知道吗?
35