● 邵朝友
评价是课程的基本要素,形成性评价是促进学生学习的重要评价手段。然而形成性评价难以实施的事实中外皆然,实施的困境值得深究。在升学主义重压下,选拔与甄别是我国中小学过去评价的主要功能,2001年政府公布第八轮课程改革政策后,评价的发展性功能得到大力提倡。但历经十多载,中小学的评价现实似乎巍然不变,那么,形成性评价的困境为何?本文将采用活动理论,针对A校形成性评价的困境展开分析。
形成性评价正式提出可追溯至上世纪六十年代。1967年,斯立克文(M.Scriven)区分了课程评鉴的两种形式,即总结性评鉴(summative evaluation)与形成性评鉴 (formative evaluation)。1969年,布卢姆(B.Bloom)及其同事建议在学生学习评价领域借鉴这两种课程评鉴形式,此处的学生学习评价就是所谓的学业评价(assessment)。[1]此后,形成性评价与总结性评价逐渐被人们接受,但形成性评价受关注程度远远低于总结性评价,许多人认为它对于日常学校教育没有多少实践意义。[2]这种格局一直延续至1998年才有所彻底改变。
1998年,英国学者布莱克与威廉(P.Black&D.Wiliam)在综合了250篇文章的研究结果基础上,得到一个令人惊讶又激动的结论:形成性评价能极大提高学生学业成就,对学生学业成就的效值(effect sizes)高达0.4-0.7。[3]事隔多年后,合作者之一威廉认为这样的发现之所以令人振奋,是因为研究结论乃基于证据。为了进一步用数据来说明形成性评价的巨大作用,威廉重新分析当今被认为能有效提高学业成就的四种因素——教师专业发展、教师学习风格、神经科学、学科内容知识,并比较它们与形成性评价对学业成就的实际影响,最终结论是,前四者要不缺乏证据,要不效值小于形成性评价。[4]
英国评价变革小组深受布莱克与威廉的发现所鼓舞,认为国家课程评价应大力提倡形成性评价。实质上,布莱克与威廉的核心发现是形成性评价对学业成就的巨大作用,高达0.4-0.7效值是目前所有教育方案对学业成就作用能达到的最高值。在教育政策制定者眼里,形成性评价如此巨大的作用,意味着能提高学生分数与成绩,将成为各国教育竞争的胜负手。因此,除英国外,其他国家与学者也纷纷关注形成性评价。以美国为例,早在1992年,在美国督导与课程发展协会(Association for Superision and Curriculum Development,ASCD)年会上,詹姆斯(M.James)就引介形成性评价。此后更多推进工作被采取,如2005年,斯蒂金斯(R.Stiggins)大力普及形成性评价的思想。[5]至目前为止,形成性评价,已成为美国教育系统的重要一员。
形成性评价作用的发现并不意味着,我们能轻而易举地开展形成性评价。恰恰相反,形成性评价在实践中几乎举步维艰。深入分析个中原因,教师评价素养、校外考试制度等是重要因素,只是这些分析大多以单个维度来进行,缺乏整体关怀。而形成性评价涉及方方面面,需要做整体的分析。
分析形成性评价的困境,情境脉络的处理是不可忽略的选择。注重情境的理论是本文选择理论架构的首要考量。活动理论(activity theory,AT)是当前情境处理的一种重要理论与方法。
活动理论又名为文化—历史活动理论,理论的核心前提是中介。中介概念在恩格斯托姆(Y.Engestrom)延伸的理论中进一步彰显:活动理论以三角形为分析架构(见图1)凸显活动的多重复杂中介结构。[6]
主体(subject)为活动中的成员,透过工具的中介来接近目标,因此三角形的上层有一个工具中介组件。此外,单一主体并非孤立于世、而是社群的一部分,因此上三角形拓展到下层。下层有两个较为隐讳的社会中介工具:规则与分工。主体是透过规则的中介与社群建立关系,社群通过分工的中介与目标建立关系。规则包括外显与内隐,例如该社群的成文法则与既定俗成的运作规则等。分工指的是活动如何分散在社群各成员间,包括各成员在活动中扮演的角色、各自行使的权力、所负责的任务等。中介具有双向性的本质(图各组件之间的双向箭头),意指社群中的工具、分工、规则这些中介工具也会反向影响生活其中的主体。图1右侧组件目标之外,还有一个结果,即是凸显目标具有某种程度的理想性,在实践中历经转化的过程,涌现的结果通常不同于目标。
图1 活动体系的中介结构
个案A校为某课程改革试验区初中学校,有9个教学班。为提高课堂成效,该校近年来一直致力于有关形成性评价研究。但从相关信息看,该校在实施形成性评价并不顺利,尤其是校长调换后,形成性评价陷入低谷。
经联系与协商后,两位教师同意笔者的采访,下面先对三位教师做一简介。
教师K:任教初中语文,教龄为16年,已获得中学高级职称,长期从事教育科研,在学区科研论文评比中多次获奖。在访谈开始,教师K就表现出坦诚、豪迈性格。
教师T:任教初中科学,教龄6年,已获得中学一级职称,喜欢教育科研,参与过省市骨干教师培训,富有新课程理念,注重课堂评价。访谈开始阶段略显拘束。
教师M:任教初中科学,教龄14年,中学高级职称、特级教师后选人,是T教师所在学校的主管教学业务的副校长。能很好地融合新课程理念于教学实践,深受学生喜欢。访谈过程始终表现得比较稳重,坚持自己想法,对自己的行动有信心。
上述受访者的选择采取了关键个性抽样,关键个性抽样选择那些可以对事情产生定性影响的个案进行研究,目的是将从这些个案中获得的结果逻辑地推论至其他个案。推论的逻辑是:“如果这个事情在这里发生了,那么它也就一定在其他地方发生。”这类个案通常代表一种“理想”的好状态,如本研究的三位受访者及其所在学校具有开展形成性评价的较好条件,如果连这样的个案都不能实施某种行为,那么其他个案一般也是无法实施这种行为的。
形成性评价是种学习活动,如果把它置于活动理论之下来考察,我们更能明白形成性评价促进学习的内在机制。下图中,要促进学生学习(目标),教师与学生开展各种有效形成性评价实践。实践过程中,教师与学生、学生与学生存在合作与分工关系,他们不断加深、调整自己在评价中身份理解。同时,实践过程中,教师与学生受隐性或显性的学习观点(规则)及所在班级、学校、社区的影响与制约。上述分析仅仅从主体出发,实际情况更为复杂,下图中任何一个元素都直接或间接作用着其他元素。
图2 作为活动体系的形成性评价
虽然访谈具有较大的灵活变化特点,一些事先准备的问题可能在访谈过程不会得到运用,但做好事先准备还是必要的。为此,本研究设计了如下大致提纲。
表1 访谈提纲
通过整理录音,整理出三次访谈内容。现用下表统一呈现相关内容,由于访谈过程及细节有所不同,故呈现的每次访谈问题或细节都不一样。
表2 访谈内容(节选)
寻找访谈意义需要通过对内容进行登录。登录是资料分析中最基本一项工作,是一个将资料打散赋予概念和意义,然后再以新的方式重新组合在一起的操作化过程。[7]例如对于下述访谈内容,登录时可开始建立码号:
(注:码号翻译——1=理念吸引人;2=不会评学生;3=需要耐心;4=教师考核制度)
建立码号后,我们可以将所有码号汇集起来,组成一个编码本。这是一个将所有码号按照一定分类标准组合起来的系统,反映了资料浓缩以后的意义分布和相互关系。编码本有两个主要作用:将码号系统地排列出来,使得我们了解现有码号的数量、类型以及码号所代表的意义之间之联系,由此而决定现有的码号是否合理、是否需要增加或减少新的码号、是否需要改进码号系统的整体结构;为我们今后查找码号提供方便。[8]完成编码本后,还需要对所有资料进行归类,最终得到4个主题。
表3 主题化访谈内容
1.工具层面:教师评价素养不足。工具中介是主体与目标,主体通过中介接近目标,目标落实过程也可能因工具的中介效果而影响主体,主体于是在一次次工具中介下,可能受到影响而改变动机或目标。
主体达到目标的外显工具是各种形成性评价实践,但问题是教师虽然知道形成性评价非常有用,却没有相应评价知能。
Y(研究者):就您的了解,贵校流行开展形成性评价吗?
T:上届校长比较注重教科研,号召大家尽量少点考试,多从学生角度出发,把评价作为促进学生学习的手段。开始大家还是积极的。
Y:这么积极的原因是什么?
T:其实大家也都觉得考试太多了,学生学得好辛苦,也有一些人开始认识到要好好改变考试的性质。只是真正行动起来的,也只有那两三个教研组。
Y:为什么会这样?
T:很惭愧,不少老师在实施时不知道到底该怎么做,虽然总觉得到处可做形成性评价,但就连怎么写作业评语都不知道怎么操作比较合适,加上也没有得到专家引领,最后还是不了了之。
2.规则层面:教师形成性评价制度缺位。规则中介是主体与社群的关系。社群通过规则来约束主体,主体也可以冲撞规则来转化社群。教师和学生之间通过规则制度,或关于学习的观点(隐性或显性)来显现。
有关教师关于形成性评价的观点与看法在社群里流行,它们对形成性评价的影响巨大,尤其是学校内教师的评价制度。
Y:要开展形成性评价,您有何建议?
M:我个人认为,首先要学校层面做出行动,如果学校本身不重视,教师是不会积极参与的,只能是一些自发性行为。
Y:学校怎么行动比较好?
M:不说别的,一个重要条件是,提供制度保障。就是说,学校要在教师考核里加入形成性评价,只有这样,大家才能放心去做,否则还不如让学生多做题目。
3.分工层面:学生缺学习主动性。分工中介是社群与目标。社群通过分工来接近目标,同样目标可能打乱原有的分工来转化社群。
教师与学生、学生与学生之间的合作与分工,是社群分工主要构成。就其本质,无论是合作还是分工都建立在学生学习积极性上,而实际显示学生学习积极性非常匮乏。
Y:您认为形成性评价存在哪些主要困难?
K:这个原因很多,嗯,从学生角度看,形成性评价最终就是让学生负责起自己的学习责任,因此,学生要有学习积极性。
Y:从评价角度看,学习积极性怎么体现?
K:我看,一是能自我评价,就是对自己的作业或作品进行评价:二是对同学的作品与作业进行评价。
4.社群层面:学校和社会缺配合。学校是个小社会,学校氛围对形成性评价有着重大影响,而传统上考试文化也渗透于学校评价实践。此外,校外一些条件,如教师教育课程设置也是影响形成性评价重要因素。
Y:开展形成性评价过程,您遇到哪些挑战?
M:这方面的挑战有校内的氛围,作为主管教务的副校长,据我观察,学校目前还没有达成形成性评价的共识,大家都是走着瞧态度。实事求是地说,就那么几个老师在做,不过我觉得已经很不错了。
Y:还有其他什么因素吗?
M:另外一个挑战是我不大想说的,因为无法改变。不过说说也无妨,这个挑战就是我们老祖宗留给我们的考试文化,你说这个我们有能力改变吗?
Y:呵呵,您还有什么补充没有?
M:我还是认为,教师的个人专业素养和评价素养是第一位的,但是现在师范毕业生在这两方面都不过硬。因此,我建议师范院校要加大学科内容的培养,以及开设评价专业课程。
本文以活动理论来分析一所初中形成性评价的实施困境,基于上文分析,从中得到如下相关结论:
在工具层面教师评价素养不足,在规则层面教师评价制度缺位,在分工层面学生缺乏学习主动性,在社群层面学校和社会缺乏配合。
由于本研究访谈问题设计中,设计的问题可能略少,不能充分了解被访谈者的全部想法,或者遗漏一些其他制约形成性评价的因素。
此外,由于研究并没有收集其他方面的证据以便开展三角验证,因此还有待做更深入、全面的调查来检验研究结论。
[1]Wiliam,D. (2006).Formative assessment:Getting the focus right.Educational Assessment,11(3&4),283.
[2]Popham,W.J. (2008).Transformative assessment.Association for Supervision and Curriculum Development,p4.
[3]Black,P.,& Wiliam,D. (1998). Assessment and classroom learning.Assessment in Education:Principles,Policy and Practice,5(1),7-73.
[4]Wiliam,D. (2011).Embedded formative assessment.US,Solution Tree Press,pp27-33.
[5]Bennett,R.E. (2009).A critical look at the meaning and basis of formative assessment.Princeton,NJ:Educational Testing Service.
[6]Marsh,C.J. (2007).A critical analysis of the use of formative assessment in schools.Educational Research for Policy and Practice,6,25-29.
[7][8]陈向明.质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:279、286.