于世华
摘要:课程评价突出表现为以选拔与淘汰为价值取向的考试评价,作为分数的符号之所以大行其道,是因为分数符号具有诸多的交换价值。课程评价能以符号代替真实,其根源在于课程评价的表征要求,而质性评价主观性强,在国家层面上是无法操作的,所以课程评价最终以分数符号居于主导地位。课程评价是一种价值判断,反映了分数符号与社会的交换,分数符号代表课程的社会功能实现程度。分数符号不是简单的符号,它是有价值的,它凝结着学习者学习时间的累积,对学生来说,分数在一定意义上是时间累积的等价交换。分数符号与教学也有交换,评价与教学是一个矛盾的两个方面,忽视评价的教学就是在否定课程目标,当教学没有目标时,教学也就不存在了。
关键词:课程评价;分数符号;交换价值
中图分类号:G42 文献标志码:A 文章编号:1673-9094(2014)04-0003-05
在教育实践中,课程评价突出表现为以选拔与淘汰为价值取向的考试评价,它是以国家课程内容的自然正确为前提的,课程评价不是评价课程的,而是评价学生掌握课程知识的程度,以及间接地评价教师的教学水平的。评价结果大多以分数形式呈现的学生成绩,作为分数的符号之所以大行其道,是因为分数符号代表课程的社会功能实现程度,并存在诸多的交换价值。
一、分数符号与真实的交换
课程评价能以符号代替真实,其根源在于课程评价的表征要求。评价本身就带有需要反思的意味,只有人的行为才需要反思。“天地不仁,以万物为刍狗”,对于自然而言,没有对与错,一切都在因果必然性之中。而人的行为选择有多种可能,就有利弊得失之忧,这是人的有限性决定的,人不能控制一切变量,人无法准确预测未来,有选择就有风险,而评价也超越不了人的有限性。人的理智无法直观事物的发展状态,学生发展程度更是复杂多样的,无论是教育理论家的解释,还是实践者的解释,课程评价是都无法超越评价的表征要求的。泰勒的“行为主义评价”就是个典型例子。“评价是一个确定实际发生的行为变化的程度的过程。……由于评价涉及获得有关学生行为变化的证据,所以,任何有关教育目标所期望的行为的有效证据,都可提供一种适当的评价方法。”[1]人的行为变化的表现是多方面的,因而,评价也是多方面的。泰勒特别强调,纸笔测验只是评价方法之一,此外还有观察、交谈、问卷、收集学生制作的产品样本等等,都是恰当的评价方法。显然,泰勒的课程评价是围绕着课程目标的实现程度,是为了课程的不断改进与完善,而不是为了选拔学生。泰勒认为,“抽样是评价的另一个基本概念。……为了了解课程所产生的效果,不必非要知道每一个人的反应。”[2]我国学者王策三先生也认为,课程评价是对教学效果的检查、分析和评定,检查的根本问题就是能真实地反映出教学的实际情况,并作出正确的符合实际的判断和评价。根据诊断,对下一个教学过程,修改原订的计划或重新拟定计划。[3]显然,课程评价不等于选拔意义上的考试。不仅如此,两位教育理论工作者认识的另一个共同点是,课程评价是要用学生行为来表征的,泰勒强调评价程序中要确定学生有机会表现教育目标所隐含的那种行动的情境。王策三先生强调教学的实际情况必须要反映出来,才能做出判断和评价。理论上的课程评价是依据学生实际行为的变化情况来检验、纠正、矫治或完善课程的,而事实恰恰与之相反,课程评价是依据课程标准对学生行为变化的检验、评价。
课程评价是定位于课程标准还是定位于学生经验的改造?前者强调国家层面的宏观上的课程编制,具有整体性、计划性和目的性的特点,笔者认为教育的社会功能在国家课程标准中居主导地位,最终以学科知识体系的形式成为课程实体。后者是在课程实施的微观层面上师生的课堂互动结果,与师生的文化背景、经验水平、能力、情绪、情感、价值观等因素有关,无法计划和预测,具有生成性。这两个层次的课程评价表现为两种价值取向。国家层面的课程评价倾向于客观量化的硬评价,对知识点的考查有明确的能级要求,如,某知识点的能级要求是了解、理解还是运用。微观层面的课程评价侧重于教育的学生发展功能,理论上讲最有说服力的是学生自己的感受,比如,学生对某学科感兴趣,喜欢上某学科的课;教师感觉自己的课堂充满活力,学生脸上常露出会意的微笑。其评价主体就是课程实施的师生。这一评价强调评价过程中的人与人的交流,但缺乏客观性,主观性强,对评价者个体依赖性较大。其实,定位于学生经验的课程评价是极其脆弱的,学生的感受受教师影响,教师的感受也不具有独立性,受考试评价的强烈影响。有学者认为,课程评价应努力协调课程的计划性与动态生成性。“通过评价使课程设计不断逼近现实,并根据实施的反馈情况进行调整,使课程计划由空中楼阁变为现实中的美景。同时,通过评价及时对课程实施情况进行诊断分析,防止可能出现的偏差。”[4]理论的预设总是理想的,实践中课程评价的两种差异根本就无法协调。首先,主体不同。国家层面的学科专家与实践中的绝大多数普通教师数量比例悬殊,又缺失对话、交流的渠道,因此,课程评价的计划与实施无法贯通。其次,各自代表的教育功能不同。国家层面代表的教育的社会功能与实施层面代表的教育的个体发展功能存在差异和矛盾。再次,力量对比悬殊。学科专家拥有强势话语权,实践的反馈对课程的调整力度远远弱于国家评价对课程实施的矫正力度。最后,也是最致命的一点,微观层面的课程评价是依赖于个体而不是国家。质性评价主观性强,价值多元化,总体效益较低,在国家层面上是无法操作的。正因为如此,课程评价最终让分数符号居于主导地位。
二、分数符号与社会的交换
课程评价是一种价值判断。课程不是单纯的知识体系,而是一个特定的文化传递系统,是由特定的政治、经济权力和意识形态决定的价值系统。我国学者吴永军先生从课程知识、学生“能力”“智力”的界定、评价手段、评价人员的意识形态、评价模式等方面对课程评价的社会属性做过详细分析。[5]比如,古代社会道德修养的知识地位高于农业技能方面的知识。随着工业革命的推进和科技的发展,科学知识的地位明显高于古典文科课程,其背后不仅有着意识形态的影响,而且有着深刻的政治经济原因。科技与经济效益相联系,当代国际竞争的实质是以经济和科技实力为基础的综合国力的较量,能带来经济增长的科技知识的地位当然高于其他学科知识。在教育实践中,上述价值判断是通过课程知识所占的分值与考试时间表现出来的。例如,南京市2014年中考改革过渡方案规定:“2014年中考初三学生参加6场笔试。语文(满分120分)、数学(满分120分)两场考试时间均为120分钟;英语(满分120分,含人机对话考试30分)考试时间为90分钟;思想品德与历史(合场合卷、开卷考试,满分各为60分),考试时间为100分钟;物理(满分100分)考试时间为90分钟,化学(满分80分)考试时间60分钟。”[6]各学科的轻重不言自明。
一方面,教育为社会经济发展提供可使用的劳动力,可以说教育是经济再生产的必要条件;另一方面,教育也是社会经济关系的再生产,以及建立在经济关系之上的政治关系的再生产,一句话,教育是社会关系的再生产。“教育并非一个价值中立的事业,无论教育者是否意识到,他们已经被卷入了一项政治活动。”[7]企图将教学与文化、政治、经济权力划出界线纯粹是主观臆想,现实的课程与教学活动反映和代表了统治阶级的意识形态和文化资源。因此,教育在本质上是一项政治活动。比如,教师对学生智力的评价往往以数理逻辑推演能力为主导,不难看出,这一标准是社会历史的产物。教师根据学生社会的、道德的和知性的行为作判断,也是依据特定的意识形态——一般认为,彬彬有礼、待人得体、举止稳重的学生为优秀生;靠争吵打架解决问题的学生为差生。在资本主义社会里,中产阶级子女熟悉教师的思维方式,而劳工阶级子女的思维方式正是教师认定的“差生”的思维方式。或者说,教师对学生品德鉴定的标准蕴含着社会优势集团的意识形态。
代表学业成绩的“分数”也与学生表达的语言特点相关,特别是人文学科,不同学生在同一教师的教导下对学科知识的理解是有差异的。教师上课多为学科语言,尽管是口头表达,但有着类似书面语的语言结构。中产阶级子女更熟悉这种表达,答卷时,书写答案更符合要求,因而考试更易得高分。早在20世纪60年代,伯恩斯坦就曾用编码理论对文化传递、语言类型与儿童社会化的关系等课题进行了有益的探求。
根据编码理论,伯恩斯坦具体分析了社会阶级、语言的使用以及儿童社会化之间的关系。伯恩斯坦认为,语言不仅是教育运用的工具,而且是认知的部分内容。儿童通常是通过运用语言来接受教育知识的,因此,语言的学习在某种程度上决定了儿童社会化程度及学业成败与否。社会阶级不同,运用语言的习惯也不同。伯恩斯坦通过实证研究发现,存在两种不同类型的语言。一是大众语言编码,又称局限语言编码,多为劳工阶级所使用,其特点是语法结构简单,句子不完整,机械呆板地使用形容词、副词和连接词,常以事实命题作为理论或结论,不利于精密组织意义及关系的沟通,更无法从事深层次的讨论。二是正式语言编码,或称精致语言编码,多为中产阶级所使用,其特点是语法、句型结构正确严密,连接词富于变化,善于运用新鲜生动的形容词、副词和连词,运用符号化的情况较多,这样有利于个人自由选择组织的机会,并有利于分析推理,能够在一个比较复杂的概念层次中统整组织经验。典型的中产阶级家庭创造并珍惜语言交流的机会,常共同讨论;而下层阶级家庭缺乏有组织的家庭活动,语言交流机会少,影响子女的阅读准备,也影响了其智力的发展。由于学校起源于中产阶级开办的一些机构,教师又属于中产阶级,而语言的传递又大部分在中产阶级中进行,因此,中上层阶级的子女在入学时就已经对课程传递的语言十分熟悉,而下层阶级子女则受到很多限制,这就造成了他们在知识上的差异,最终形成学业上的差异。[8]
同时,由于评分标准的存在,学生会模仿,即使下层劳工子女开始不适应,但终究能学会精致语言编码,尤其是在以考查学科知识为目的的考试评价中。基于学生的勤奋和对知识的熟练掌握与运用,考试也会成为阶层流动的一个通道,有利于社会的人才选拔。
三、分数符号与价值的交换
在课程评价方法上,主观主义评价、人文化评价的呼声越来越高。这些评价方法重视教育的自有的人性特征,强调评价方法上的人文特点,认为客观主义的定量评价把教育中一些无法量化的实质性问题排除在评价之外,其结论的有效性常常值得怀疑。尽管如此,数量化、科学化的评价方法仍然占绝对优势,人性、人文化评价方法常常只是停留在原则上,实践中的评价方法仍然以实证化方法为主,人文化方法为辅;人文化方法只是被用来为实证化方法服务,没有自己的独立地位。当我们批判一种“不合理”的现象多年后,发现它仍然有着顽强的生命力,我们就不得不对其“不合理”重新进行审视。分数符号不是简单的符号,它是有价值的,它凝结着学习者学习时间的累积,对学生来说,分数在一定意义上是时间累积的等价交换。再高明的教师,没有一定的时间积累,也无法让学生掌握所需的技能。动物的学习有大量的试误,条件反射也需要大量的练习才能建立起来,人尽管有顿悟、想象力、创造力,但这些能力不是空中建高楼,都需要坚实的基础。关于这一点,最有说服力的大概是美国教育心理学家R·M·加涅的累积学习理论了。
比如,关于个体的智慧发展,加涅认为,“智慧技能有‘累积的性质——他们以可预测的方式逐步建立,并且为安排教程结构提供了最有用的模式”[9]。“为了解决学习中的问题,学生要获得一些‘高级规则(即复杂规则)。问题解决要求他们回忆一些较简单的,先前习得的‘规则和‘定义性概念。为了获得这些规则,学生必须先习得一些‘具体概念,而为了学习这些概念,他们又必须能提取一些先前习得的‘辨别。”[10]我国学者乔炳臣先生认为,“智慧不能从教师传授的知识中直接获得,它不是教出来的。智慧的获得必须有一个过程:即在已经占有的知识经验基础上,只有经过独立思考和解决实际问题,形成自己的体验和感悟时,才算把知识转化成智慧”[11]。在教学实践中,常有学生抱怨,知识都记住了,为什么考试还是考不好?这就是知识运用能力的问题。考试虽说与教师的教学有直接的关系,但更关乎学生对知识的深层次理解,在不同问题情境中尝试运用知识解决问题,没有这些功夫的积淀是不可能获得高分的。因此,分数符号是一个学生勤学苦练的结果,与学生的付出呈正相关。
从教学过程看,高分的获取与复杂的课堂活动相联系,而简单的课堂活动只能停留在知识的表征层面上,学生运用知识解决问题的能力无法获得,通常考试成绩与低分相关联。这一点类似于马克思的复杂劳动与简单劳动的区别——复杂劳动的价值量是简单劳动的价值量的数倍。我国学者潘洪建先生认为,“个人知识存在于个人思维、感受与操作之中。课程实施过程中个人知识的生成大致经历外化表达、交流讨论、活动体验、反思内化等阶段。个人知识的教学策略有:情境激活、表达展现、经验共享、亲历与反思”[12]。有学者从个人知识的特性来探索如何把知识转化为智慧的教学路径:“个人知识的情境性决定了教育实践的生活世界取向,个人知识的介入性决定了教育实践的体验取向,个人知识的意会性决定了教育实践的表达取向,个人知识的建构性决定了教育实践的理解取向,个人知识的实践性决定了教育实践的效用取向。”[13]可见,分数符号不仅与学生的学习复杂性有关,也与教师劳动的复杂程度相关,由此,考试评价的客观性、科学性、数量化被普遍认可和采用。
四、分数符号与教学的交换
1.评价与教学是一致的
评价是基于课程目标的实现程度的检验与判断,教学也是围绕课程目标的实现,两者都围绕教学目标的完成。从这一点看,教学与评价是一致的。教学为了更好地完成课程目标,即为了更好地评价,评价为了更好地教学,教学与评价是相互作用、相互促进、滚动向前的。在教学与评价是同一个主体时,这一点表现得特别明显。一位教师在课堂上提出问题,看学生回答得怎样,然后根据学生的回答采取进一步教学的措施。你一定认为,这是再也平常不过的课堂提问,是教学环节。其实,这也是一个评价环节,通过提问检验学生的知识基础,判断学生对所学知识掌握得如何。教师用半节课时间对近阶段所学内容进行检测,用半节课评讲,也可以看作一堂课的教学。平时阶段性检测也可以看作是为了更好地教学而进行的评价,当然可以归到教学的范围内。
评价与教学的对立性表现在不同主体之间,因为他人具有超越性,不会随你的意志为转移,你必须应对。比如,教师随意的课堂小测验,学生就会如临大敌,赶紧准备,教师非常清楚学生在为评价而学习,教师大可不必惊异地向学生解释:你们不要把为学习的评价当成了为评价而学习。其实,教师要的就是这个效果,因为评价与学习可以相互转化。同样,国家为了实现课程目标(课程目标应该有选拔人才的社会功能)而进行的考试评价,从国家看当然是为了课程(教学)的评价,但代表国家意志的学科专家是不以教师的意志为转移的,教师会如临大敌,教师必须应对。所以,教师的教学就会成了为评价的教学。其实,国家也很清楚,教师在应对考试而教学,这不正是评价对教学所起的作用吗?因为评价与教学是相互转化的。
评价与教学是一个矛盾的两个方面,忽视评价的教学就在否定课程目标,当教学没有目标时,当什么都可以看作是教学时,那么教学就什么都不是了,教学也就不存在了。
2.教学对课程评价的改造
我国学者杨启亮先生认为,能囊括教育学所有问题的“大课程”是“理想的课程”,这种理想课程试图让每一堂课都体现太多的理想指标,其实,教学的可能性是极其有限的,这样,理想的课程势必遭遇到教学的可能性问题。[14]事实上,理论上的课程评价是在追求“理想的课程”,然而,如何应对选拔和考试,却成了各层次的教学实践者以至学生家长们解释教学评价的依据,这应该是现实的课程,在理想与现实之间的中间区域就是教学的可能性。在这中间区域,教学通过形式或实质的改变,不断地对理论上的课程评价进行“调试”,通过“穿新鞋走老路”的形式变化来改造传统的“一言堂”;通过讲授内容中的思维能力、道德因子的挖掘,在满堂讲授的形式中体现交往、对话、自主学习、研究性学习的精神实质。正是因为教学的可能性,才产生了理论上的课程评价与现实中的应试评价的张力,使应试评价得以丰富扩展,如,让学生能更轻松愉悦地应试,“教师们营造出热烈的气氛和师生问答的形式,这虽然与理想的课程有距离,但可能正是他们从实践的教学的可能性出发的解读”[15]。同时,教学也对理论上的课程评价进行改造,使它能适应教学的可能性,使之不断走向现实。“‘课堂上提出来的问题基本上是教师的问题,如果是教师引导学生学习的问题的话,这很可能是教学的有限性使然。”[16]也就是说,要求课堂上完全由学生提出问题、由学生相互讨论解决问题的评价只是理想状态而非现实。
3.表演课是对评价理论的佯真诡计
教学能改造评价,评价也能改造教学,即使与严峻的考试竞争不太相关的,甚至对考试竞争有妨碍的课程评价理论,也会对实际教学产生影响。比如,体现课改要求的表演课。针对选拔性考试的是常态课,而以课程评价理论指导的则是表演课。表演课是对评价理论的佯真诡计,因为它不是教学的常态,而是应对的临时策略,老师们上过表演课后,还得抽时间按考试要求向学生再明确一下考点能级。
然而,事物总是一分为二的,表演课与常态课并非完全对立。同一个教师能驾驭两种教学及评价,其结果是不仅两种教学能相互渗透,而且两种评价也能相互借鉴。比如教师的教学评价或许能有所改进,既能让学生考得好,又能让学生获得真真实实的发展,由此带来的是评价的丰富性与教学的丰富性。
参考文献:
[1][2][美]拉尔夫·泰勒.课程与教学的基本原理[M].施良方,译.北京:人民教育出版社,1994:85-86.87-88.
[3]王策三.教学论稿[M].北京:人民教育出版社,1985:298.
[4]刘志军.发展性课程评价方法的探讨[J].课程·教材·教法,2004(1).
[5]吴永军.课程评价的社会学分析[J].教育评论,1995(5).
[6]钱红艳.我市2014年中考改革过渡方案公布[N].南京日报,2013-11-22(A1).
[7][美]迈克尔·W·阿普尔.意识形态与课程[M].黄忠敬,译.上海:华东师范大学出版社,2001:1.
[8]武晓伟.小学语文教科书中的性别研究[D].南京师范大学,2007:43.
[9][10][美]R·M·加涅,等.教学设计原理[M].皮连生,等译.上海:华东师范大学出版社,1999:51.55.
[11]乔炳臣.知识、智力、智慧与创新学习能力[J].教学研究,2010(3).
[12]潘洪建.论课程实施中个人知识的生成[J].课程·教材·教法,2010(7).
[13]蔡春.个人知识:教育实现“转识成智”的关键[J].教育研究,2006(1).
[14][15][16]杨启亮.论理想的课程与教学的可能性[J].教育研究,2009(12).
责任编辑:杨孝如