基于历史发展的视角:教育增值评价观的再审视

2018-03-07 14:58彭顺绪
梧州学院学报 2018年2期
关键词:评价学校发展

彭顺绪

(梧州学院 文法学院,广西 梧州 543002)

教育评价是引导学校、教师和学生行为的一种外在机制,它对于规范学校办学行为,衡量教师教学成就,激励学生成长有重要的现实意义。教育评价机制的改革是教育体制改革的重要组成部分,如何在当下复杂的教育现实中寻求教育评价方式的变革和突破,这是值得研究的重要问题。从系统论的观点来看,教育评价方式的选择既关系教育系统内部的发展,又受制于社会大系统对人才培养的诉求。增值评价模式,契合了教育现实与社会需求两者发展的需要,为我们研究教育评价方式变革提供了一个备选的方案。

一、当前评价机制的不足

(一)当前评价机制与教育现实的困境

在传统的教育评价领域,对学生认知能力的评价是一个主流方向,无论是从泰勒的评价观还是布鲁姆的教育目标分类来看,评价都是依据目标的实现程度来展开的,是一种目标指向型的结果性评价。这种早期的教育评价模式对教育的发展产生了广泛而深远的影响。

对我国而言,目标指向型评价在操作中已经简单化为结果性评价,大家过分注重教育结果,这已经成为当前教育生态中众多混乱现象的原因之一。以高考为例,这种结果性评价最直接的结果就是导致了不同学校升学率、重点率的简单攀比,更极端的是直接比较考上北大清华等重点高校的学生数,以此来衡量学校的办学水平和获得社会认可的程度。学校之间如此,在学校内部,不同班级之间也存在这种以成绩的简单比较来衡量班级水平高低的情况。与这种评价机制相契合的是,入学前班级间存在以学生入学成绩为依据的分班现象,在教学中,教师对重点班与非重点班学生给予“差异化”(1)的关注。这样发展的结果就导致了学校间生源竞争,以各种优惠政策吸引优质生源和优秀教师,以少部分的优秀成功者替代了对大部分学生成长的关注。另外,这种评价机制也容易引发家长盲目让学生“补课”,通过增加资源投入来提高成绩,而忽略了学生的全面发展。

(二)评价体制改革与创新人才培养

现实情况往往是,那些在将来的事业中能够做出开创性工作的人也并非完全是在学校中学业成绩最突出的。一些极端的例子是,有些杰出的人士可能并没有接受过更多的学校教育,甚至早早地选择离开学校。正如有学者指出,创新性拔尖人才或许根本不是学校能培养出来的,只是在一种有利的环境中自动“冒”出来的(3),这反而引起了我们对当前教育正在“扼杀”潜在杰出人才的担忧。

随着社会的转型升级,中国经济发展需要以创新来驱动,这就需要各种创新和杰出人才的不断涌现作为支撑。这条道路从以美国为代表的发达国家的发展历程中足以见得。新世纪初,美国《不让一个孩子掉队》法案的颁布,通过增进教育公平,让每一个孩子都能够具备基本的阅读能力与数学能力。差不多同时,我国于1999年启动了新一轮基础教育课程改革,强调关注每一个学生的发展,让学生积极主动地建构学习,改变传统学习中的应试趋向,落实素质教育。一个真正的人才首先应该是一个人,教育应该首先着眼于人的发展,关注人的基本需求和基本能力的培养,为人的成长成才提供条件。

过分注重结果型的教育评价体制,容易引发教育中的功利主义倾向,从而让学校、教师和学生将教育当作是一种可供交易的产品,而不是一种从人性发展中萌发出来的自我需要。有专家指出,我国本土难以涌现出诺奖级的创新成果与我们现行的评价体制有关。科研环境不再纯净,名气和官阶意味着项目和资源,这容易打击那些广大踏踏实实做科研的人员的积极性。而且,我们的资源往往向那些能冲击各种奖项的项目和人员身上倾斜,很难想象我们能对一些缺乏短期现实回报的项目和人员进行投入。这种评价的方式可能会在短期形成很好的成果效应,但是真正的创新级成果是基于对现实规律和整个社会发展长期的探求得来的,这种短平快的评价体制对培养真正创新型人才来说显得明显不足。因此,从国家的长远发展来看,改革目前的教育评价体制显得尤为必要。

二、教育评价模式和教育评价观

(一)多元的教育评价模式

通常,我们将现代意义的教育评价的原点追溯至泰勒(Ralph Tyler)。泰勒的评价观与当时学生学力的检测活动有着紧密的联系。在19世纪末到20世纪初的美国,测验主要还是围绕教科书来编制的,测验的内容注重对知识的识记,这种片面的测验并不能反映学生实际的发展情况。泰勒针对这种情况,提出了一套以教育目标为核心,依据课程和测验编制的原则,以此将社会和学生的需要通过课程和测验反映出来。正如泰勒所说:“评价过程实质上是一个确定课程与教学计划实际上达到教育目标的程度的过程”[1]。但是,这种目标达成式的评价模式渐渐被人们过分关注评价结果所取代。所以,人们更多地将泰勒评价模式看成是一种总结性评价模式。

科隆巴赫(Cronbach,L.)是教育评价模式发展的重要推动者。他针对泰勒模式中过分关注结果的弊端,强调“评价能完成的最大贡献是确定教程需要改进的方面”[2],将评价的重点放在了教育过程中,通过对过程的评价来改进教育工作。通常,人们将科隆巴赫的评价模式看成是一种形成性评价模式。

科隆巴赫的评价观已经实现了对泰勒模式的超越,他将评价的内涵扩展到对活动的改进上。斯塔佛尔比姆(Stufflebeam,D.L.)继承了科隆巴赫的评价观,他也强调“评价最重要的意图不是为了证明,而是为了改进”,于是,他将评价界定为“为决策提供有用信息的过程”[3]。为了达到改进活动的目的,他将评价扩展到实施的整个过程中,界定了背景—输入—过程—成果,简称CIPP模式。通过这四种评价提供的决策来实现工作的改进,所以,人们又将CIPP评价模式看成是决策导向型评价模式。

(二)评价理念的变迁

目前,教育评价学界已经有“第四代评价”的说法。每一代评价都有各自相对独立的特征。在第一代评价中,主要体现了“测量”的纯技术性特点,如阿尔弗雷德·比奈(Alfred Binet)设计的心理测验,就是一种测量心理特质的技术。又如《斯坦福成就测试》(Stanford Achievement Battery)第一次评估了学生在多种学科中的相对名次,也体现出了技术应用的特点。在第一代评价中,有学者指出,学生被看作是学校“工厂”中由学校“主管”充分控制管理的需要“加工”的“原料”。测试通常被看作是学生是否达到学校制定的“规范”的方法。所以,第一代评价通常是针对那些能够被测量的事物,对那些无法测量的事物则无法做出评价。同时,测量工具的选择也很重要,如果没有合适的工具,评估者还需要开发相关的测量工具[4]。

1) 碎末率。碎末率为茶叶加棒做形后碎茶所占比例。茶样称重(M茶样)后用筛子筛出碎茶,并称碎茶重量(M碎茶)。

第二代评价体现出了“描述”的特点,它将评估者的角色塑造成了描述者。尽管第二代评价依然延续了上一代评价中技术性的特点,但是,评估已不再等同于测量,而只是将测量作为评估使用的一种工具。如泰勒(Ralph Tyler)所领导的“八年研究”试图突破当时评价学生的卡耐基学分体系(指定毕业所要求的课程单元的类型和数量)的束缚,而要向世人证明,只要有设计合理的目标,开发精选的课程并确保其发挥作用,即使没有经过传统学校正规的学业训练的学生依然可以在大学中取得成功[5]。

第三代评价则将评估者置于评判员的角色,但同时也延续了评估的技术性和描述性的功能。正如有批评家指出,评估不能忽视对事物的判断,描述和判断都很重要,它们是评估的两个基本方面[5]。如CIPP模式和鉴赏力模式等都或多或少主张将评估者界定为评判员。

前三代评价的发展是一脉相承的,没有第一代评价测量技术的积累,就不会有第二代评价对客体的清楚描述,没有前两代评价的发展,也不会有第三代评价对于价值判断的关注。但是,从公共政策的角度来看,也有批评家指出前三代评价中存在一些理念上的问题,比如过分强调管理主义,将评估置于一种特定的活动场域中,通过评估联系不同相关利益者,在这种场域中所理解的评估先天带有利益的关系,难以消除管理主义的趋向。同时,由于教育评估的活动主要是在美国等发达国家兴起和发展,对于评估的价值取向也为人们所注意。随着多元化价值观的确立,人们开始反思前三代评价中缺乏对多元价值的关注。再者,前三代评价中过分强调了研究方法的科学范式。也就是说,看似科学的方法所得到的评估结果未必是真实有效的。基于前三代评价中存在的问题,目前正在形成关于“第四代评价”的理念,那就是基于响应式的建构主义评估理念。这种理念认为,“真理”存在于建构者达成的共识中,而不存在于客观事实[6],关于“第四代评价”的理念还在不断形成中。

三、增值评价对现实的回应

(一)增值评价的起源

“增值”原本是一个经济学中的术语,又称为“附加值”,是经济主体新创造出来的产品价值。可以理解为在生产经营过程中,附加在原有价值上的新价值。研究“增值”这一概念之所以有意义,在于它衡量了生产者有效劳动的价值。关于“增值”的来源,也是一个颇有意思的话题,知识、技术、管理等要素都可能构成有效劳动的组成部分,从而带来产品的“增值”。

“增值”概念引入教育领域的时间并不算太长。在上世纪60年代的美国,以詹姆斯·科尔曼为首的学者开始调查美国学校的效率问题,并提出了著名的《关于教育机会平等性的报告》,简称“科尔曼报告”(Coleman Report),这一报告指出了学校对学生成就的影响程度很低的事实,进一步印证了人们对学校普遍缺乏效率的担心是有根据的。

这股对学校质量关注的热潮,引发了世界范围内对学校效能的关注,同时,也催生了学校效能增值性评价的出现。由于对统计技术的依赖,增值评价的研究和运用率先在英美等国出现并得到了长足的发展。随着技术的完善,这种评价方式已经在不少国家和地区得到了推广和实施。

(二)增值评价模式

增值评价其实也是面向过程的一种评价模式。首先,它着眼于发展性评价。强调活动对参与者发展程度的影响,但是这种发展不是对参与者达到的绝对程度的衡量,而是一种相对衡量,是对活动带来的发展增量的衡量。其次,它着眼于探索性评价。在教育系统中,教育问题大多属于“灰黑系统问题”[4],这本身源于教育活动的复杂性,企图为教育评价构建一个“决定模式”本身是行不通的,也是不科学的。教育系统本身也在随着社会的发展而变化,对于教育评价模式的选择也是一个发展变化的过程。增值评价模式试图通过探索影响教育产出的因素,构建起一个探索性的评价模型,在这个模型中,分析学校行为、教师行为和学生行为及其交互效应,客观化地去接近教育发生的影响机制,从而提供一种可供参考的评价标准。从某种意义上说,增值评价不是一种评价手段,更多体现的是一种科学探索过程,评价只是这个过程的一种副产品。再次,增值评价着眼于全面的发展。它的基本理念是学校和教师应该保证所有水平的学生都以几乎相同的速率取得学习上的进步,即每一个学生在某个时间段内的学业增值幅度应当差不多。或许这一点是增值评价带给评价理念上的一大突破。它关注了每一个人的进步,而不仅仅是优生,能够在更加微观的教育层面上实现教育的公平。

(三)增值评价的理念

增值评价的出现和发展,源于社会的发展对教育的需要,是社会对人的差异性、独立性、发展性和价值性的尊重在教育中的体现。人生来是千差万别的,智力水平、家庭背景、生活环境等彼此不同,这就决定了每一个人的发展基础并不一样。但一个人一出生,就已经成为这个社会中的独立个体,需要面对生活的一切,谁也不能代替谁去过属于自己的生活。同时,每一个人也面临着能达到的不同的发展阶段,教育就充当了这样一种外在的力量,促进个体生命的发展和完善。对社会来说,不同个体的价值可能并不一样,但这并不否认普通大众价值的存在,个体价值的存在源于个体的独立性。

按照布鲁姆的说法,学校的责任是寻找能使每个学生达到最高学习水平的条件。学校的存在,应该为每一个个体的发展提供条件,让他们在原有的起点水平上取得应该取得的进步。这是学校教育存在的价值和意义。与其说增值评价是一种教育评价的技术,不如说它创新了一种新的评价理念。

增值评价理念也是对其他评价理念的继承和发展,差异性主要体现了第一代评价中“测量”的特点,个体的差异是测量的基础,没有差异性也就无法测量。发展性最能体现增值评价理念,它将教育对促进人的发展融入到评价中,教育的意义也就是促进人的全面发展,而评价也为着这一目标而努力,也就是第二代评价中对不同评价模式的优劣进行“描述”。同时,发展性也体现了第三代评价中“判断”的特点,这里的判断是对人的价值实现的判断,也包括物对人的价值贡献的判断。而增值评价的价值性则体现为正在建构中的“第四代评价”的理念,“增值”不仅是一种量化的物,能佐证人在受教育过程中的进步,同时,这种“增值”也体现了一种价值和意义,这就促使我们不断建构和丰富它的价值内涵。

增值评价观立足于教育的过程性和发展性,是对当前教育评价中结果型评价取向的扭转。它能推动学校或教师从关注少数优秀学生发展到关注每一个学生发展的转变,让每一个学生的价值都得到体现,同时也有利于激发学校的管理效能,调动老师的积极性,实现学校的内涵式发展。更重要的是,能为我们评价学校的效能提供依据,为最终打开教育的“黑箱”提供一种可能性。所以,改革我国目前的教育评价体制,需要树立先进的评价观,才能做到正本清源。通过引入增值评价模式,来促进当前我国教育评价体制的改革,不失为一条可选之路。

(四)增值评价的实现

1.需要方法的不断改进

美国学者格朗兰德(Gronlund,N.E.)在1971年将教育评价简单描述成,评价=测量(定量描述)或(和)非测量(定性描述)+价值判断,这一表述方法也构成了我们对教育评价直观的理解。所以,进行评价判断的前提是客观的描述现实,由于教育现象本身的复杂性,我们很难像研究自然科学一样定量化地得出精确的规律。但是,这并不否认社会科学的科学性。著名社会学家谢宇说,社会科学的研究结果依然具有客观性和永恒性,通过运用实证方法可以更加具体地描述现实,在保持其他条件不变的前提下,依然可以确保现象的重复性。这就说明,不断改进和完善技术手段可以让我们更加接近客观的现实。目前,在增值评价的方法上,包括简单描述性统计分析,线性回归模型和多水平模型。每一种方法对实现评价结果的要求是不一样的,这种要求更多的体现在数据和技术手段上。未来在方法上的改进需要来自教育学、心理学和计量方法的推动。

2.需要统计数据的不断完善

长期以来,我国的社会科学研究的主流方法是理论分析,对于实证分析重视不够,表现为缺乏数据意识。随着科学的发展,尤其是统计理论的发展,加上大家对经济领域的关注,刺激了经济学研究的发展,使得经济学讲求数据和实证的思维方式不断渗透到其他学科中,催生了很多与经济学相关的交叉学科。同时,互联网、大数据和信息技术的发展与交融,使得对于数据信息的挖掘成为不可逆转的趋势,这种影响已经开始在教育领域中显现出来。学校、教师、家庭和社会对于个体的教育影响到底如何,需要从大量个体的追踪数据库中来获得解释。

3.需要理论和现实的结合

教育现实的复杂性决定了我们在使用任何一种评价模式上都必须小心翼翼。同样地,增值评价也不是唯一或者完美的评价模式,它需要不断在技术手段上进行改造以适应现实发展的需要。同时,它也不是一套固定的评价程序和模型,同样需要与教育理论相结合,激发出能够更好地解释现实的建模创意。所以,教育建模不仅是一门技术,更是一门艺术。只有将教育理论和现实结合起来,才能真正地发挥增值评价的功能。

增值评价,以其新的评价理念顺应了社会对于人才培养的需要,体现了教育对个体的差异性、独立性、发展性和价值性的尊重,是教育评价观在新的社会现实中的发展和完善。从技术操作层面上讲,增值评价需要不断改进统计方法,运用更丰富合理的数据,增强与教育理论的互动,同时,结合教育现实的需要完善分析技术,做到“教育建模”技术性和艺术性的统一。随着教育走内涵式发展的道路,学校问责将会打破学校既有的平衡,使得绩效评价更加凸显出来,通过增值评价观的再审视,为推进我国教育评价体制的改革提供一种选择的可能,最终实现营造符合当前和未来教育发展的制度环境。

[注释]

(1) 这里的“差异化”不是因材施教,而是一种功利化的对待,一部分学生由于升学无望就被学校或教师放弃了。

(2) 这里的不公平有入学机会的不公平,接受教育的过程不公平,最后教育的结果也不公平。

(3) 来自钱颖一在2014年12月14日“中国教育三十人论坛”首届年会上的演讲。

[1] 泰勒.课程与教学的基本原理[M].施良方,译.瞿葆奎,校.北京:人民教育出版社,1994:85.

[2] 科隆巴赫.通过评价改进教程[M]//教育学文集.教育评价.陈玉琨,赵中建译.北京:人民教育出版社,1989:164.

[3] 斯塔佛尔比姆.方案评价的CIPP模式[M]//教育学文集.教育评价.陈玉琨,译,施良方,校.北京:人民教育出版社,1989:301.

[4] 查有梁.教育建模[M].南宁:广西教育出版社,2003:11.

[5] Egon G.Guba,YvonnaS.Lincoln.第四代评估[M].秦霖,蒋燕玲,译.杨爱华,校.北京:中国人民大学出版社,2008:5.

[6] Worthen B R, Sanders J R.Educational evaluation : theory and practice[M]// Educational evaluation: theory and practice.C.A.Jones Pub.Co.1973.p109.

猜你喜欢
评价学校发展
迈上十四五发展“新跑道”,打好可持续发展的“未来牌”
中药治疗室性早搏系统评价再评价
砥砺奋进 共享发展
改性沥青的应用与发展
学校推介
基于Moodle的学习评价
“会”与“展”引导再制造发展
保加利亚转轨20年评价
多维度巧设听课评价表 促进听评课的务实有效
I’m not going back to school!我不回学校了!