●冯翠典 朱卫平
基于课程的评价:教师课程能力的支撑点*
●冯翠典 朱卫平
基于课程的评价有别于传统的“防教师”的高厉害测试,是依赖于教师深度参与、基于课程的评价模式。其评价任务设计直接来自于课程标准和课程材料,依靠预制性的等值性任务检核学生在所学内容上的一般性成果。并通过持续的评价提供关于教学和学习的具体信息,从而为教学的决策提供证据。基于课程的评价,本质上是教师课程能力的支撑点。实施基于课程的评价的过程,是教师理解课程、开发课程和评价课程的能力得以体现的过程,也是教师这些方面能力的提升过程。
基于课程;评价;课程能力
基于课程的评价 (Curriculum-based Measurement&Curriculum-based Assessment)是有别于传统外部评价的评价模式。外部评价一般在以下几方面备受诟病:第一,测验没有经常进行,对学生短期学业成就变化不敏感。教师不能使用评价信息来改进课程材料或教学方法。第二,通常是常模参照的,重在获得群体学生的总体数据以及标定个体学生在某群体中的位置,而不是着重诊断个体或群体学生的学习需要。第三,设计一般是“防教师”的,不能根据具体的课程内容,特别是每学年的课程要求来设计评价任务,一般会出现评价内容和课程要求不匹配的问题。二者不匹配时,结果往往是教学追随评价,而不是基于标准。另外,一些非正式的方法,比如,对学生表现的课堂观察、学生对教师提问的回答、每天批改作业等,是教师主要的评价方式。但这些非系统的日常评价,并不能作为学生学业成就评价的全部。在这种背景下,多种基于课程的评价模式被开发。其中,基于课程的评价得到持续研究。基于课程的评价是研究非常广泛的领域,本文着重在介绍其内涵和主要特征基础上,拟澄清其核心观念,藉此对教师相应的课程能力提出要求。
基于课程的测量(Curriculum-based Measurement,CBM)和基于课程的评量(Curriculum-based Assessment,CBA)分别由迪诺(Deno,S.L.)[1]和格克林(Gickling,E.E.)[2]在上世纪80年代提出。几十年间,基于课程的评价一直关注特殊教育领域,集中研究教师如何影响学生的阅读、拼写、数学等。但随着普通教育中班额增大以及学习困难学生增加,研究也开始关注普通教育,且从小学阶段的研究扩展到初中和高中。
就二者关系,一般认为基于课程的评量(CBA)要比基于课程的测量 (CBM)更广泛,[3]CBM属于CBA。[4]“Assessment”内涵广泛,CBA指的是用来直接观察和记录学生在学校课程中表现的任何方法。这是一种标准参照的评价模式,课程目标是确定教学目标以及确定评价状况的依据。CBA的一般要求是:第一,测量材料和学校课程是匹配的;第二,测量是经常的;第三,评价信息用来形成教学决策。[5]从CBM的定义看,这些CBA的基本要求,CBM也是遵从的:CBM是历时性地在日常教学中标明学生学习熟练程度的一套评价方法。通过每周让学生参与能代表每年课程要求的等值性测试,教师可以确定学生进步的整体情况,也能使用这些信息形成有效的教学决策。[6]CBA和CBM都被认为紧密地联结了评价、课程和教学。另外,CBM从两个方面有别于CBA:第一,每个CBM都是难度等值的评价;第二,CBM是一个标准化的,信度和效度良好的评价。[7]
基于课程的评价并不指某种单一的评价活动,而是包含了非常多样化的实践,也出现了很多的模式,理解其主要特征是前提要求。
CBA是一系列非正式的评价程序,而CBM是一套具体的标准化程序。首先来看CBM的主要特征:[8]首先,CBM评价的是学生朝向长期目标的进步。CBM最主要特征是评价指向一般性成果(General Outcomes)而不是具体的下位技能 (Specific Subskill)或连续的目标 (Successive Objective)。使用CBM,应考察学生朝向长期目标的表现而不是当下学习的技能或内容的掌握。测量分数表明了学生和长期目标相关的表现怎么样。教师也可以使用学生的课程之外的材料来进行评价。以阅读能力为例,学生在和该年级水平适应的多样化材料上的总体性进步被认为是一般性成果,而不仅仅是学生在现有课程材料上的成功,这种后者的成功,被认为是具体的下位技能或连续的目标的成功。CBM第二个重要特征是对学生的分数进行图表式的呈现。学生一般每周或每两周参与评价一次,然后分数记录在一个时间连续的、间距等值的图表上。因为测量的内容或难度以及时间间隔都是一致的,从而,学生在不同时间的表现变化就可以比较。教师可以使用这些图表化的数据来判断学生的进步是否令人满意,以及是否在特定时间点达到了期望水平。换句话说,CBM被用来预制性地确定学生是否为达到长期目标做好准备;而且,数据也被用来判断相关的当下表现如何,以及用来确定当下使用的教学方法是否有助于学习。第三,CBM的另一个核心特征就是足够的技术性指标,即信度和效度可以得到保障。使用信度和效度良好的测量工具是任何评价方法很重要的要求。当具体内容或课程变化时,CBM评价程序可以保持不变。从而教师可以有效地判断学生的表现是否变化了。而且,多个评价中获得的累积性数据也降低了测验误差。
在如上CBM基本特征中,因为CBA使用的方法更为多样和非正式,不能完全满足第二、三个特征,但也面临这样三个问题:第一,通过学生表现的一般性成果是什么?(评价内容);第二,设计什么样的评价活动才能产生准确的数据?(评价方法);第三,这些数据是否用来改进了教学和教学材料?(评价使用)。这些问题也是CBM开发过程中的核心问题。[9]其中,第一个是最核心的问题。
在操作层面,任何评价首先要定位评价内容。就这个问题,基于课程的评价一直有两种模式。一种模式是,“基于课程”的涵义表现在评价内容直接取自学生所用的课程材料,着重当下内容和下位技能的掌握;另一种模式是,“基于课程”的涵义表现在评价内容指向于每学年末的课程要求,着重一般性成果和整体性能力的考查。就前者来讲,在操作层面和布鲁姆的掌握学习如出一辙。但基于课程的评价在关于评价内容这一核心问题上,最根本的看法是后一种观念。即不是从学生的课程中抽取材料作为评价内容,而是从学生的课程要求中抽样作为评价目标,这被称为一般性成果测量(General Outcomes Measures,GOMs)。[10]一般性成果测量的特点:第一,评价的是一般性成果的熟练程度,第二,依赖标准化、预制性的测量方法论来产生学生表现的关键指标。[11]但传统上,甚至当下很多的CBA实施,并不是一般性成果测量。下面借助哈里斯和裴西那(Harris,A.,Pasigna,A.)的研究比较这两种操作。[12]
(一)具体技能的掌握测量
实践中,基于课程的评价的大多数形式都是具体技能的掌握测量,这种方式把总体性的课程要求拆分成一系列的下位技能,这些下位技能排列成短期的教学目标。其测量针对较小的短期的领域。核心特征如下。
第一,技能层级。具体技能的掌握测量的第一个核心维度是教师被引到使用技能层级来思考教学,这个技能层级是预制好的用于教学和测量的一个序列。但这种序列对于个体或小组学生是否合适,并不得知。这种模式另一缺点是教学层级决定了测量。当测量嵌入到技能层次中,教师不能使用这些数据来评价另外的技能层级的有效性或者不同教学方法的差异。在这样的框架里,教学被认为是选择、教学、测验一系列具体技能的活动。
第二,学习的保持和转化。具体技能的掌握测量的第二个特征是掌握测量不能自动地测量相关技能的保持和转化,这是因为测验和教学重点之间是一一对应的关系。即教学形式和评价工具特别紧密的联系会造成一个受限的教学重点,从而限制学习的保持和转化。
第三,测量短期的教学目标。具体技能的掌握测量的第三个特征是教学和测量都关注一系列短期的目标,教学和测量联系紧密。这种紧密联系的优势是评价信息对教学效果非常敏感;即评价的教学性效度非常明显。但另一方面,这种紧密联系的劣势是测量框架有限。学生的分数仅仅反映了测试中出现的狭窄框架,测量的内容效度降低了。
第四,测量的多变性。具体技能的掌握测量的第四个特征是测量的多样性;因为测量指向特定的技能测量,每次只关注一个技能。从而,可能会出现的情况是,新的技能学习后,以及相应的测量方法改变后,学生的分数会下降;而且,也不能期望学生面对不同的技能掌握时所花费的时间是一样的。
第五,测验的准确性。具体技能的掌握测量的第五个特征是依赖教师开发的测验或地方性开发的试题库。而这些测验的信度和效度如何很难调查。即使教师依赖商业化的测验,这些测验的心理测量学特征也不确定。从而,大多数掌握测量的准确性是未知的。
(二)一般性成果的测量
上述具体技能的掌握测量有两个问题。第一,自由地从一系列多样化的评价方法和评价内容中选择,造成了可信性和可靠性不好的测量。第二,关注短期目标的掌握性测量,并不能提供有用的证据来回答关于学生进展的宽泛性问题,比如:教学能否产生学生的进步?和其它教学方法相比较怎么样?而用开发测验来测量学习的一般性成果这种方式,就能解决这些问题。这样的测量方法需要标准化。即测量的核心行为以及测量这些行为的程序都必须是预制好的。而且针对的测验目标应是长期目标,长期目标的测量需要相对连续。一般性成果测量的核心特征如下:
第一,教学性的层级。这是一般性成果测量的核心特征。和具体技能的掌握测量相比,一般性成果的测量需要教师在测量之前就预定和说明教学的层次。为了确定一般性成果测量的系统,教师必须确定一年间他们用来测量学生熟练程度的相关问题。这会有几个优势:首先,具体技能的掌握测量对应的是旧有的学习理论,而一般性成果测量模式和当下的学习理论吻合。上世纪之交,学习观念是这样的:学业进展是可以操作的,也可以分成许多小的单元,从而产生一个序列来达到最终的表现。这种对学习的观念影响到教育评价。比如,在布卢姆掌握学习中,学习步骤和评价是紧密相连的。然而,在新的学习理论下,学习过程被认为是整体性的,虽然对学习的评价也需要对所学任务的清晰陈述,但不需要把这个任务拆分成高度具体的阶段和技能,也不需要评价与整体学习任务孤立的一个个下位技能。相反,应该在最终的任务情境中来看更为下位和更为具体的技能。其次,把测量的重心放在每年末的一般性成果上,避免了把课程分解和划分成一系列教学模块的繁重任务,这节省了教师的时间;也避免了如下潜在的错误:在细化以及排列教学模块过程中的错误。再次,一般性成果的测量并不像掌握测量那样决定了教学的内容和程序。下位技能的掌握测量的结构具体规定了需要教什么,也决定了教学内容的顺序,并要求在当下技能还未掌握时不能教授新的技能。从而,使用掌握测量,自变量(教学)和因变量(测量)紧密地纠缠在一起。相比较而言,一般性成果测量和教学不是同步的。测量(因变量)并不和教学重点或教学程序(自变量)紧密相连。
第二,学习的保持和转化。一般性成果测量也自动地评价学习的保持和转化,因为从较广泛的领域中进行的抽样包括了当下教学重点所指向的技能,也包括了过去及后续教学的目标。
第三,测量长期课程目标的表现。一般性成果测量的第三个核心特征:关注课程较为长远的目标而不是一系列的短期目标。如果认为评价的主要目的是确认学生是否掌握了所教授的技能,那一般性成果测量就牺牲了一些教学效度。具体技能的掌握测量模式测量的是当下的教学重点,一般性成果测量抽样的是一年间累积的关键性行为和内容。从而,一般性成果测量对当下所教的具体技能不如掌握测量那么敏感。但其提供了对教学效果比较敏感的数据库,从而对教学决策非常有用:第一,一般性成果测量对每个课程技能的抽样概率与该技能在课程中出现的几率吻合;大多数技能都包括在大多数的测验中,通过较少量的测验,就可以找到大多数的技能。第二,一般性成果测量是通过学生在每年课程的关键行为上的熟练情况来描述,那么内容效度(即多大程度上代表了期望的成果)以及标准效度(即多大程度上和社会性的成就指标是相关的)就比较高。
第四,测量的变化。使用一般性成果测量,教师可以不改变测量就能监控学生的发展。因为一般性成果测量是从整个课程中抽样材料,测验的难度在全学年中是保持稳定的。这和具体技能的掌握测量的框架非常不一样,因为具体技能的掌握测量的测量领域及测验难度都随教学内容的变化而变化。学生在不同任务中的不同表现,是无法解释的。而一般性成果测量比较稳定,就允许使用这些数据库来进行关键的比较。
第五,测验建构。一般性成果的测量是一种预制性的测量方法。即当教师确定了一年间用来测量学生学习的领域后,这种方法可以预制性地提出测量哪些成果指标,应选用什么方法来设计、实施、评分,以及使用这些测验对学生进行有意义的描述。
基于课程的评价理论对教师的课程能力提出了新要求。实施基于课程的评价过程,既是教师的课程理解能力、课程开发能力的践行过程,也是这些能力的提升过程。这样的过程,从根本上体现了基于课程的评价对课程与教学的回流作用。格拉瑟(Glaser,R)提出,“测验,因为和教育过程关系密切,将发生重大的转变。虽然这种转变很艰难,但不可能被忽视。未来评价程序或者测验的标志是协助建设性地调整教育项目的能力”。[13]
(一)课程理解能力
如果基于课程的评价是一种具体技能的掌握测量,那教师就可以停留在教学层面而不用上升到课程层面来思考问题。因为具体技能的掌握测量的内容直接来自于教学材料,而考查目标也是检验当下的教学目标是否完成,至于课程标准是什么,课程要求是什么,从逻辑上来讲教师是不用理解的。但如果基于课程的评价测量的是一般性的学业成果,是超越具体教学内容的,为了达到课程要求,教师不仅需要思考当下的教学内容是否恰当,还需要思考除了当下的教学内容,还可以利用哪些内容达到目标。而这些方面的前提就是要教师具备基本的课程理解能力,这包括理解课程整体结构和基本目标,以及理解课程要求在每学年的课程内容上的具体要求。从另一个方面讲,基于课程的评价主要用于监控学生的学业进展。即主要用来确定学生进步的程度,以及识别没有达到标准的学生。从CBM中获得的数据需要给学生的学业成就提供经常性的一般性指标,类似于学生学习的“温度计”,[14]但教师应该理解学生学习的正常“温度”范围是什么样的,判断学生学习状况的基本标准是什么,这就需要对课程导向和课程目标的理解。
(二)课程开发能力
基于课程的评价测量的是一般性学业成果,是超越具体教学内容的,教师单纯地实施教材内容并不能确保达成课程标准的要求,还需要具备相应的课程开发能力。从而,基于课程的评价的要素就涉及到确定能反映每个年级各门课程一般性成果的试题库或评价内容。
基于课程的评价对教师课程开发能力的要求体现在三个方面:第一,设计每学年的一般性学习目标。这样的目标应该是可达到的,有挑战性的。第二,开发与课程要求相匹配的教学材料,对当下教学材料进行补充或替换,并根据评价结果不断调整教学材料。第三,开发能检核课程要求的评价任务。用来确定学生进步的足够程度,确定教学是否需要调整,并比较不同的教学要素的有效性。基于课程的评价对教师评价任务开发的能力提出了更高的要求。从这个层面上讲,课程不仅指的是国家或地区层面要求教师采用的标准。同时,课程也指向有意义地生成的一系列活动和材料,这些活动和材料是从动态的师生互动中得出的。[15]而评价就是为做出有效的课程和教学决策以及评价教学的成果而收集有效的证据的过程。[16]另外,对于学生的评价需要基于课程或者基于课程标准,这是得到共识的。但需要明确的是,对学生评价的驱动力应该是学生在课程中做了什么以及做得怎么样,而不是把课程标准中规定的内容强加给学生。[17]也就是说,仅仅有课程标准,并不能确保课程标准的目标实现,这中间需要合宜的课程材料、教学活动以及评价任务的一步步落实。而且,课程标准以及课程材料是不灵活的,没有考虑学生的水平和需要,从而给许多学生的失败提供了可能。课程必须进行管理或开发,才能保证给学生提供成功的条件。
(三)课程评价能力
研究表明,当教师使用评价来为教学决策提供信息时,教学更为有效,学生也更能了解他们的表现,从而提高学业水平。[18]研究表明,使用基于课程的评价作为反馈系统,以及及时做出相应的教学调整的班级的学生成就,远远高于其它班级的学生成就。[19]根据学生的表现来调整教学是有效教学的一个基本原则。不管使用基于课程的评价的方式有多么多样,最初的目的是让教师能使用简短但有效的数据来记录学生的进步,并确定是否有必要调整教学。期望教师能够根据学生的表现调整教学,以更好地对学生的学业进步负责。而对教学做出调整本身就是在驱动课程,其前提条件是要对课程材料、教学方法有个基本的判断,即首先要对教学材料、教学方法进行判断,才有可能进行调整。
[1]Deno,S.L.Curriculum-based measurement:The emergent alternative.Exceptional Children,1985,52(30):219-232.
[2]Gickling,E.E.,&Thompson,V.P.A personal view of curriculum-based assessment.Exceptional Children,1985,52(3):205-218.
[3]Tucker,J.Curriculum-based assessment is not a fad.The Collaborative Educator,1987,1(4):4-10.
[4]Jones,C.J.Teacher-fridendly Curriculum-based Assessment in Spelling.Council for Exceptional Children,2001,34(2):32-38.
[5]Tucker,J.Curriculum-Based Assessment:An Introduction. Exceptional Children,1985,52(3):199-204.
[6]Deno,S.L.Curriculum-based measurement.Teaching Excep-tional Children,1987,20(1):41-42.
[7]American Institutes for Research. (2009).National Center on Response to Intervention.U.S.Department of Education,Office of Special Education Programs.http://www.rti4success.org.
[8]Pamela M.Stecker.Using Curriculum-based measurement to improve student achievement review of research.Psychology in the School,2005,42(8):795-815.
[9]Deno,S.L.,&Fuchs,L.S.Developing curriculum-based measurement systems for data-based special education problem solving. Focus on Exceptional Children,1987,19(8):1-16.
[10]Fuchs,L.S.,& Deno,S.L.Must instructionally useful performance assessment be based in the curriculum?Exceptional Children,1994,61(1):15-24.
[11]Fuchs,L.S.,&Deno,S.L.Paradigmatic distinctions between instructionally relevant measurement models.Exceptional Children,1991,57:488-500.
[12]Harris,A.,Pasigna,A.Curriculum-based Assessment:Linking Curriculum,Assessment and Learning in Developing Education Systems.Improving Educational Quality Project(no.PN-ABZ-283),1993:1-13.
[13]Glaser,R.Cognitive and environmentalperspectives on assessing achievement.Proceed-ings of the 1987 ETS Invitational Conference,Princeton,NJ:ETC.1988:329-330.
[14]Cusumano,D.L.Is it working?An overview of curriculumbased measurement and its uses for assessing instructional,Intervention,or Program Effectiveness.The Behavior Analyst Today,2007,8(1):24-34.
[15]Heshusius,L.Curriculum-based assessment and direct instruction:Critical reflections on fundamental assumptions.Exceptional Children,1991,57:315-328.
[16]Calfee,R.C.The school as a context for assessment of literacy.The Reading Teacher,1987,40(8):738-743.
[17]Thompson,V.P.,Gickling,E.E.A personal view of curriculum-based assessment:a response to“Critical reflections……”.Exceptional Children,1992,58(5):468-471.
[18]Deno,S.L.,Fuchs,L.S.,Marston,D.,&Shin,J.Using curriculum-based measurement to establish growth standards for students with learning disabilities.School Psychology Review,2001,30(4):507-526.
[19]Fuchs,L.S.,Fuchs,D.,Hamlett,C.L.etal.(1994).Classwide curriculum-based measurement:Helping general educators meet the challenge of student diversity.Exceptional Children,1994,60:518-537.
(责任编辑:张 斌)
*浙江省社会科学联合会课题“美国新课程改革背景下新一代教师教育模式研究”(2013N152)和浙江省教育厅基于“导学案”的数学教学模式研究(Y201329203)成果。
冯翠典/台州学院教师教育学院,博士,主要研究学习评价和教师教育
朱卫平/台州学院教师教育学院,硕士,主要研究数学教育和教师教育