高凌飚
(华南师范大学 教育科学学院,广东 广州 510631)
考评:评价概念的去价值化和拓展
高凌飚
(华南师范大学 教育科学学院,广东 广州 510631)
学业评价概念的去价值化和拓展导出了考评这一新的概念.讨论考评概念的涵义,厘清评价和考评在概念上的差别,介绍3种不同的考评方式:对学习的考评、为学习的考评和融入学习的考评.3种考评都是基于学习和发展的需要,是全面的考评体系不可或缺的部分.
评价;考评;对学习的考评;为学习的考评;融入学习的考评
从2001年开始的新课程改革,取得了很大的成效,但也存在许多问题和遗憾.其中很重要的一项,就是评价改革的滞后,特别是对学生学习质量的评价改革的滞后.学业评价改革为什么滞后?原因是多方面的.既有社会和教育体制的原因,也有评价本身的原因,即由于概念的混乱所导致的评价改革在理念上的矛盾,方法和措施上的不到位,以及分析和解释上的混乱和错位.使得全面检测学生的学习质量在相当程度上成为一句空话,反过来制约了课程改革,特别是实践中学校教学的改革.
现代教育评价的概念产生于20世纪30年代,在这之前只有考试与测验的概念[1].20世纪初,杜威指出不能只是简单地以考试和测验来衡量学生的进步,特别是学生在成长和学习过程中的进步.泰勒接受了这一观点,把测量作为一个过程来使用,作为一种方法用于课程的改进,评定课程的有价值的目标达成的程度,从而提出了教育评价的概念[1].泰勒提出:“评价过程在本质上是一个确定课程与教学计划实际达到教学目标的程度的过程.”[2]
从二次世界大战之后到20世纪60年代,世界各国都进行教育改革,以图提高教育质量.但是,改革的结果却不如人意,人们开始意识到,不能等到改革尘埃落定之后再来检测教学的质量,而应该在改革之始以及改革过程的各个阶段都及时进行检测、及时发现问题、进行矫正,才能保证改革的顺利进展和成功.基于这样的认识,斯克瑞文(Scriven)提出了“形成性评价”概念,将此前的评价称为“终结性评价”[3].布卢姆等人进一步拓宽了形成性概念的定义,把形成性评价定义为:在课程建构、教学和学习的过程中为了改进这些过程而进行的系统性评价.把终结性评价定义为:在教学发生之后收集数据来做出关于教学的一些判断,比如,评等级、颁发证书、评价进步、或者研究课程有效性[4].
上面简要的回顾表明,从20世纪30到70年代,教育评价概念逐步形成,从先前的教育测量、测验之中延伸出来,再从由单纯的选择、认证,逐渐扩大到对课程、教学的关注.尽管如此,评价的概念是基于管理的视角,从外在于学习的立场来衡量学习的效果,所看重的是学习的结果,要求对学习对结果进行价值判断,以便判定教育教学工作的成效,判断学生达到的学业水平是否符合社会的要求,确定教育投资的收益.
形成性评价把在较长时段的学习之后实施的一次性评价变成多次性的评价.但是评价所对准的依然是学习的效果,只能判断学习者在认知学习方面存在的问题,不能判断问题的确切所在.要达到后一目的,不能只是以管理的视角从学习的外部来对学习进行检测,而是需要从学习者自身的视角出发,从学习的内部去察看学习的过程,去收集有关学习者本身以及学习过程的资料,包括学习者的动机、态度、学习策略以及元认知水平等等方面.更重要的是,收集资料的目的也不是为了进行价值判断,而是要对学习进行诊断.这样一来,作为评价概念的核心要素的“价值判断”和“学习效果”的地位发生了变化,问题诊断代替了价值判断成为新的实践活动的核心,新的教育需求和实践不仅关注学习效果,还关注学习过程.需要用新的概念来描述教学过程的新需求和新实践,于是产生了考评的概念.考评一词对应的英文是assess/assessment,最初的意思是指评价过程中为收集数据和资料所进行的活动,从属于评价的概念[5].通常assess/assessment没有价值判断的含义,但有时也与evaluate/evaluation混用.正好符合人们对评价概念进行去价值化的需要.进一步的考究表明,“assessment”一词来源于拉丁文“assidere”一词,意思是“和某人坐在一起(to sit with)”[6].引申为坐在学生旁边,代表一种亲密的关系和经验的共享.表达了教师和学生在一起(with),收集以至共享有关学生学习知识、技能和方法以及形成特定情感态度等方面活动的信息这样一种活动[7],符合人们拓展评价概念内涵的需要.人们因此用考评(assess/assessment)表达一种与评价的目的有所不同、旨在反映学习质量、诊断学习问题的证据和资料收集和分析解释的过程,一种和学习过程相伴的检测、判断、反思和改进的活动.换句话说,考评是为了促进学生进一步学习而收集证据、分析解释和策略反思的持续性过程;考评不仅从外部对学生认知性成就进行测评,还在学习过程中对学习的多个方面进行了解;考评不只是给予学生等级或分数,还意味着教师与学生间持续的互动和交流.
评价与考评有着重要的差别[8].第一,评价的主旨是价值判断,回答的是学生的学习有没有完成预定的目标,是否收到预期的效果这一问题.考评则不强调价值判断,回答的主要是学生的学习进行得怎么样,存在什么问题,应当如何改进这样的问题.第二,评价过程侧重的是与预设的标准进行对比并据此做出判断.考评过程侧重的是建构,通过外部的协商和内在的建构来认识、理解和把握学习认知的规律,促进自身的发展.第三,评价强调以课程目标或同辈人群为参照.考评注重的是学生自身在学习过程中表现出来的认知与发展水平与存在的问题,虽然也需要一定的标准和参照,但不是最重要的.第四,评价强调过程的客观性和解释的公平性,要求尽可能用量化的手段来进行评价和表达结果.考评则不强调这两个方面.实际上由于质性方法的引进,考评过程不可避免的带有主观性.考评注重学生个体的发展,不要求横向的比较,公平性也不再是重要的因素.第五,评价通常是由学生之外的主体,如教师、教育行政当局等主持进行的.考评的主体不仅包括外在于学生的教师和教育行政当局,还包括学生本身的自评和互评.有时候,学生的自评和互评所起的作用还更为重要.第六,评价的结果往往与被评价对象的功利有关,从而可能导致资料的虚假.考评的结果会影响学习的进程和效果,但一般不会直接涉及功利,因而有更好的真实性.第七,评价只能是间歇式地对学生的学习进行抽样式的了解,不可能关注到学生学习的整个过程,也不可能对学习的质量有全面深入的了解.考评,特别是过程性的考评则是全程式的,积少成多,由浅入深,对学生学习情况的了解和把握是全方位的和深入的.
考评与评价在目的、基本理念、标准、主体、对象、内容、证据性质、分析和解释的方法等方面存在着重要的差异,因而,尽管它们也有交叉重复的地方,都是衡量学生学习水平和质量的必要途径,但是在实践中不能混为一谈,否则会引起非常不好的负面反应.
考评与评价是两类不同性质的质量检测活动.但考评本身也存在3种不同的方式,第一是“对学习的考评(assessment of learning)”,第二是“为学习的考评(assessment for learning)”,第三是“融入学习的考评(assessment as learning)”(或称“学习化的考评”).
2.1 对学习的考评
对学习的考评着眼于对学生学习成果进行检验,可以为评价学生的学习质量提供依据,也可以为诊断学习中存在的问题、探讨未来努力的方向提供依据.对学习的考评通常在学习进行了一个阶段之后进行,通过与一定的标准进行对比并评定等级(分数),考评的结果会向学生及家长进行报告,因此和终结性评价有类似之处.但是必须注意,对学习的考评与终结性评价是有区别的,主要在于:
对学习的考评当然涉及判断,但这种判断主要不是价值的判断,而是状况和问题的判断,学生的进步情况如何,学习中存在什么问题,等等.当然,也可以将考评的结果作为评价学生学习成效的依据,在后一情况下考评成为“获取进行评价所需要的证据和资料的过程”,也就是评价理论初创时期对考评的涵义的定位.
对学习的考评需要有目标的参照,即要有预设的目标,但与终结性评价所强调的统一的最终目标有所不同.考评的目标应是根据具体学校和班级的学生实际情况来决定的,而且在教学过程中不断根据实际情况发展的.换句话说,对不同的学校和学生,在不同的学习阶段进行考评,具体的检测目标都应有所不同.如甲校和乙校,甲班和乙班,课后测验、单元测验和期末测验,针对同一内容的目标要求是不一样的,是逐步扩展和深化的.
对学习的考评在检查学生对所学内容的掌握程度的同时,注重诊断学习中的问题,以便在后续的教学中加以补救.学习的情况以及存在的问题因校而异甚至因人而异,因而主张由任课的教师组织进行考评检测.
对学习的考评所检测的内容当然包括相关的知识技能,但更重要的是透过对知识与技能的理解掌握运用所表现出来的能力,是对学习的情感态度,以及通过学习积累形成的价值观念.后者一般很难通过纸笔测验来检测.纸笔测验效率高,有相对成熟的评阅方法和统计分析手段,但是难以检测出学生的学习态度、元认知水平、创意和价值观念.表现式的、真实性的考评方式有利于对学生的思维和能力进行深度的考察,但是因为采用完全质性或基于质性的方法,考评所需要的时间长,资源消耗多,标准不统一,解释带主观性,难于较大规模或较为频繁地使用.因此需要采用多种多样的检测方式,相互补充,达到全面检测学生学习的目的.
对学习的考评并不是为了选拔学生,不应当利用考评的结果对学生进行排队.
对考评结果的反思和分析,特别是组织学生进行反思,从中找出前阶段学习中存在的问题,包括知识上、方法上的缺陷,找到弥补的方法,进一步加以纠正,是考评工作不可或缺的一环,应高度重视并认真做好.
2.2 为学习的考评
为学习的考评所指的是学习者和他们的教师为了确定学生现在的状况(where),进一步努力的目标和方向(where),以及如何(how)更好地达到目标而收集和解释证据的过程[9].为学习的考评不再单一指向学生所学的知识和技能,而是强调要检查学生在学习过程中的表现,特别是对学习的兴趣、意愿和态度,进行学习的方式方法,元认知水平,透过学习过程所反映出来的、与知识学习直接相关的情感态度和价值观念上的转变.为学习的考评强调多样化的手段,考评所依据的不仅是量化的数据,还包括各种质性的资料,如成长记录、作业练习、教师的观察和谈话,等等.为学习的考评主张一般没有必要给学生评定等级或打分数,给学生的反馈更多地采用口头或书面的描述,着重说明学生的优势、存在问题和努力方向.通过考评,教师本身也了解教学存在的问题并加以矫正.考评的过程性是为学习的考评的最大特点,它要求考评存在于整个课程教学的过程中,在这一意义上,为学习的考评有时也称为过程性的考评.
在“为学习的考评”这一概念最初出现的时候,人们将其与形成性或诊断性考评的概念等同使用.所谓形成性的考评是从布卢姆的形成性评价概念发展过来的,但是强调概念的核心不在价值判断,而在于对学习和发展过程的了解和诊断,指的是学生和教师为了给教与学的调整提供反馈信息而采取的所有活动[10].随着认识的不断深入,人们把思考问题的视角完全转移到了学习和学生之上,更加突出了学生的主体作用,强调了在学习进程中不断进行的自我回顾、检测和反思.它要求学生认识所要达到的目标,懂得自我检测,能够从检测中找到可供进一步学习的指导性信息并反馈与自己的学习,也即要求学生学会考评.“为学习的考评”的特征是[11]:
(1)基于所有的学生都能改进的信心.
(2)考评嵌入到教与学的过程中,是教与学过程的必要部分.
(3)要求学生参与决定学习目标.
(4)目的是帮助学习者理解和认识到他们所达到的程度.
(5)要求学生进行自我考评和同辈互评.
(6)提供可以引导学生认识下一步应采取的步骤以及如何实施这些步骤的反馈信息.
(7)要求教师和学生共同地回顾和反思考评数据.
2.3 融入学习的考评
融入学习的考评概念从建构主义的学习观出发,认为学习是外来信息与学习者原来储存的信息能动地相互作用的过程.学习者既需要通过与外来信息的互动进行新知识的建构,也需要通过考评进行反思和检讨以确认建构的过程和新知识的合理性.因此,考评和学习构成一个统一体,是一个完整的过程.这一概念也是在对元认知的认识基础上建立起来的.通过考评对学习过程进行反思和检讨显然也是元认知规范的过程.一般认为,元认知包括元认知知识和元认知调节两大部分.元认知知识又分3个层次:第一,对学习者本身的知识以及影响学习者表现的因素的知识;第二,有关学习策略的知识;第三,有关在什么时候使用某种策略以及使用的原因的知识.元认知调节分3个阶段:第一,计划,指的是与设定目标并激活相关的背景知识的活动;第二,调节,指控制和自我检验的活动;第三,评鉴,指对成果以及生产成果的规范过程进行鉴定[12].基于这样的立场,融入学习的考评完全聚焦于学生的学习上,强调考评作为一种元认知要素并不外在于学习,而是学习的一个组成部分,应融入学习之中.从这样的认识出发,融入学习的考评要求学生对学习的目标有所认识并能够对自己在学习中的表现进行批评,认为考评包含在从制定目标到实施到结果反馈的整个学习过程之中,体现了学生的学习主体地位和学习责任.
融入学习的考评实际上是从更微观、具体的角度来界定考评的地位和功能.考评的目的在于实现对学习的自我调节.考评融入到学习之中,成为学习过程的组成部分,因而在学习的每一个细节上都包含有考评活动.学生是进行考评活动的最主要的主体.考评的主要内容包括学生对学习任务和目标的知觉,对学习过程的合理性的检验,对学习成果的合理性的鉴定.考评是全程式的、反思式的,在有意或无意之中进行的.考评的结果立刻反馈到学习的过程,对进一步的学习产生即时的、直接的影响.
融入学习的考评强调学生在考评中的主体地位.这样做并非要削弱教师的作用,相反是拓展了教师的作用.教师不仅要教学生知识,更重要的是要培养学生具有自主学习的能力,即要帮助学生学会把学习技能、态度、安排、自我调节、元认知掌控等要素组合成为一个有机的整体加以运用.为此,学生需要知道学习这些概念和技能的目的是什么?应该怎样进行学习?采用什么样的策略最为有效?自己学懂了没有?学习的目标达成了吗?进一步改进学习的准则是什么?[13]学生进行自我考评的能力只有通过潜移默化,通过模仿和反复的练习才能获得.为此需要教师在日常的教学中作为一个榜样向学生展示如何进行自我考评,指导学生设定学习的目标并调节学习的过程,与学生一起构建实践的准则,向学生提供调节和反思的机会,了解学生的学习过程和元认知过程并及时向学生提供反馈意见.
要了解学习的质量,既需要从外部对学习进行评价,也需要从内部对学习进行考评.从外部对学习的评价包括了终结性的和过程性的评价,从内部进行的考评包括了对学习的考评、为学习的考评和融入学习的考评.一个完整的评价体系必须包括所有这些方面.评价与考评在内涵上有所交叉,但也有本质的区别.在制定教育教学政策的时候,在实践中,必须区分和认识它们在概念的内涵和功能上的不同,不能混为一谈,否则将产生不良的影响.比如,伴随新课程而公布实行的综合素质评价方案,就没有弄清其性质到底是从外部管理的视角出发的评价,还是从素质(包括学习)发展内部的视角出发的考评,既要求综合素质评价采用包括成长记录在内的多种质性考评的方法,又要求综合素质评价像终结性评价一样具备功利性的功能(作为高考和中考的参考).结果让一线教师难以适从,综合素质评价在实践中名存实亡[14].又如新课程改革刚开始的时候,有人试图以为学习的考评取代对学习的评价,结果在实践中引起混乱[15].谨记这些教训,厘清评价与考评的区别,全面检测学习的质量,才能真正发挥评价和考评促进学生发展的功能.
[1] Stufflebeam D L, Madaus G F, Kellaghan T. Evaluation Models: Viewpoints on Educational and Human Services Evaluation [M]. Kuuwer Academic Publishers, 2000.
[2] 泰勒.课程与教学的基本原理[M].施良方译.北京:人民教育出版社,1997.
[3] M C Alkin. Evaluation Roots―Tracing Theorists’ Views and Influences [M]. London: Sage Publications, 2004.
[4] Burn M K. What Is Formative Evaluation [R]. Minnesota Center for Reading Research, October, 2008.
[5] Husen T, Postlethwaite T N. The International Encyclopedia of Education (2nd Edition, Vol,1) [M]. Oxford: Elsevier Science Ltd. 1994.
[6] Satterly D. Assessment in Schools [M]. New York: Basil Blackwell Ltd., 1989.
[7] Marsh J Key. Concepts for Understanding Curriculum 2 [M]. London: Falmer Press, 1997.
[8] 高凌飚.考评概念浅析[R].在天津师范大学成立55周年教师教育与基础教育协同发展高端论坛上的报告,2013.
[9] Assessment Reform Group. Assessment for Learning: 10 Principles [R]. Cambridge: University of Cambridge, 2002.
[10] Harrison C, Swaffield S. Formative Assessment in Action [A]. In: Richardson C. Whither Assessment, Qualifications and Curriculum Authority [C]. 2003.
[11] Assessment Reform Group. Assessment for Learning: Beyond the Black Box [R]. Cambridge: University of Cambridge, 1999.
[12] Brown A L. Metacognition, Executive Control, Self-Regulation, and Other More Mysterious Mechanisms [A]. In: Weinert F E, Kluwe R H. Metacognition, Motivation, and Understanding [C]. Hillsdale, NJ: Erlbaum, 1987.
[13] Schraw G. Promoting General Metacognitive Awareness [J]. Instructional Science, 1998, (26): 113-125.
[14] 高凌飚.对综合素质评价的几点思考[J].基础教育课程,2011,(4):63-64.
[15] 高凌飚.过程性评价的理念与功能[J].华南师大学报,2004,(6):102-106.
Assessment: The Devaluation and Extension of Evaluation
GAO Ling-biao
(School of Educational Science, South China Normal University, Guangdong Guangzhou 510631, China)
This paper argues that the devaluation and extension of the concept evaluation leads to a new concept assessment. The connotation of assessment and the differences between assessment and evaluation are discussed. Three types of assessment that can normally be found in schools, assessment of learning, assessment for learning and assessment as learning, are then described. It also argues that all these three types of assessment are necessary for the all-round improvement of the quality of student learning and development.
evaluation; assessment; assessment of learning; assessment for learning; assessment as learning
G40-058.1
:A
:1004–9894(2014)01–0016–04
[责任编校:周学智]
2013–10–06
高凌飚(1944—),男,广东汕头人,教授,香港大学博士,博士生导师,国家基础教育课程教材专家工作委员会委员,主要从事课程与教学论、科学教育、教育评价研究.