安丰亮
1 教育评价的产生和发展简介
1.1 教育测量和评价的产生
教育测量和评价的产生与对学生学力和学业成就的检测活动的发展有着繁密的联系,其历史源远流长,早在我国的西周时期期,就初步建立了学校教育制度,开始了教育测评到公元606年,我国隋朝开始实行了科举制。而在西方,其中主要是在美国,自19世纪后半叶以来,教育测量和评价得到了迅速的发展。
19世纪上半叶以前,学校考试的基本方法是对学生逐个口试。1845年,美国波士顿文法学校首先引入了书画考试。但这时学生成绩评定的客观标准问题仍然未能得到解决。1864年,英国教师费台尔( Gcorgcfisher)收集了许多学生的成绩样本,编制了第一本《量表集》,作为度量学生成绩的标准,1897年,美国的莱斯(1.M.Ric)博士发表了他对20个学校的16000名学生所作的拼字测验的结果:1905年,第一个智力验量表——法国的《比纳一西蒙量表》发表。1916年,美国斯坦福大学心理学教授特曼(L.M. forman)发表了对比纳量表进行修订后的更完善的智力测验表一一《斯坦福量表》,育次引入了智商的概念,使智力测量有了比较科学的计算方法,标志心理测验已达到了比较成热的阶段。
桑代克被称为教育测量学的鼻祖。1918年以后,教育测量的使用范逐渐从小学发展到中等以上学校,许多大学也开始设立了教育测量学课程,至本世纪20年代末,教育测量已发展到全盛期,教育测量在学力检测与教育成就的定量化、客观化、标准化方面取得了大的成就。
从1934年始到1942年止,美国俄亥俄州立大学教授泰勒(R.W. Tyler)受卡内基基金会的资助,进行了历时8年的课程与评价研究,这就是教育评价发展史上著名的“八午研究”,在对以往的课程和测验设计进行了尖锐批评的基础上,泰勒提出了一套以教育目標为核心的课程和测验编制原则,试图以此把社会的要求、学生的需要反映在课程与测验中,为了把这一思想与早期的测量区别开来,泰勒和他的同事正式提出了教育评价的概念:“在本质上,评价过程乃是一种测量课程和教学方案在多大程度上达至到了教育目标的过程”;即认为教育评价就是衡量教育活动达到数育目标程度的一种活动,测量是它的手段。
1.2 教育测量和评价的发展
泰勒等人的教育测量和评价观点以及相应的“目标评价模式”是教育测评历史上第一个比较完整的、影响较大的理论,为了发展泰勒评价模式的实施技术,美国教育心理学家布卢姆等人提出了教育目标分类学理论,对完善教育评价理论起了重要作用。但由于教育目标概念与教育结果的概念紧密相关 ,这就容易使人们将更多的注意力集中到对教育结果的评价上。
克龙巴赫(L。J. Cronbach)修改了泰勒的评价定义,将评价定义为:“为作出关于教育方案的决策,收集和使用信息。”他强调:“评价能完成的最大贡献是确定教程需要改进的方面。”斯塔佛比姆(D.L. Shufilcbcar)给评价的定义是:“为决策提供有用信息的过程。”并强调:“评价最重要的意图不是为了证明,而是为了改进。”在这一观点的基础上,他提出了著CIPP( context—input— Proccss— Product),即把对背景、输入、过程,结果四个方面的评价结合起来的一种评价模式。受斯塔佛比姆等人的影响,美国教育评价标准委员会给评价的定义是:“评价是对某些现象的价值和优缺点的系统调合。”
2 我国物理教育测量和评价的研究现状及发展趋势
上世纪80年代我国物理教育评价的实践几乎完全被布卢姆的教育评价理论所支配。布卢姆的教育评价理理论有两个核心问题。其一是发展形成性评价,使原先在选拔性评价体制下难以完成学业的学生也能逐步达标。其二是发展客观性评价,使学生在传统课程学习中,无论在认知、情意和动作技能诸方面都获得相应的控制。
布卢姆的教育评价思想显然受到泰勒的群体性“目标一量化”评价理论以及华生的行为主义理论的巨大影响。这些早期的行为主义者曾经抱有这样一种信念,即通过“黑箱”原理,通过输入信号和发生行为变化的控制可以对人进行任意的塑造。它们的理论,正是在这种信念下完成的。然而,近几十年来教育心理学的巨大发展证明,,人的发展并非都是可以用“黑箱”的方式加以控制的。也没有必要用控制的方式去造就千人一面的人。
布卢姆教育评价思想产生的背景跟我国物理教育界运用这一评价思想的背景之间具有较大的反差。这种反差主要表现在以下几个方面。首先,在美国崇尚个人中心的教育价值观,强调适合于个人发展的教育。而在我国则倾向于国家中心的教育价值观,强调同一水准的基础教育。其次,在美国中学生使用各种不同的课程设置,必修选修、主修副修、长课程短课程,各不相同。教材的供求遵循市场的规律,教师对于教材自有选择的标准。就以物理课程为例,有艰深的学术性教材——原子键物理。也有通俗易懂的课题式教材——社会的物理。同样是高中毕业生,有的物理读的很浅,有的却可以读的很深。全屏教师的判断。而在我国数以亿计的中学生使用一套完全相同的教材,教师没有选择教材的自由。50年代初期规定全国都要用苏式的学术性物理,因此,物理教师很少能从课程观的高度去认识物理教材的选用。在这样两种完全不同的教育背景之下去使用布卢姆的评价理论,其效果上的差异是可想而知的。
我国物理教育界自80年代后期以来,广泛地使用布卢姆的评价理论,是有一定好处的。这些好处是物理教师对包括教育评价在内的教育理论有了一些认识和重视,他们的知识视野从纯化学的领域开始扩展到科学的教育理论领域。此外,由于使用目标控制的办法,使某些原先化学成绩较差的地区,物理考试的成绩有所提高。在全国性和地方性的统一物理考试中,命题的科学水准也有所提高。但是,正象前面所述,由于我国中学物理课程的单一性,物理教师的任务似乎就是教会数亿中学生懂得一本教材中的物理知识,以及在物理考试中取胜的技巧,物理教育的评价功能几乎只有单一的选拔性。在这种情况之下去使用布卢姆的教育评价理论也同时造成了以下的困感:(1)在强烈的竞争性背景之下去搞形成性评价,使不少学生深感物理之艰深难学,不堪重负。我们一方面每年都在降低物理教材的理论要求,另一方面又在用物理知识并不深奥的逻辑游戏式的偏怪难题去区分出所谓学物理的尖子。同时又让下年的学生通过形成性评价去学习上一年的难题。然后再降低要求,再区分尖子,再让人人成为尖子,如此的循环往复,使物理教育陷入怪圈之中。这就使我们不由得怀疑在这种大一统的强烈选拔性的教育背景之中,布卢姆的形成性评价理论的价值究竟何在。(2)当前我国的物理教育正处于变革之中,它需要使各种物理课程价值,包括学术性和研究性的基础课程,也包括课题式、应用性、综合性的基础课程都得到承认的教育环境。而布卢姆的评价理论,恰恰使大一统的目标得到进一步的强化,滞后了物理教育价值多元化的转机,所以我们要探索符合我们自身的物理教育评价理论体系。
近年来物理教育测量和评价的功能逐步被开发和利用,物理教育测量和评价改进教学活动的功能已经日益被认识和开发,形成性测评与总结性测评相结合,并注意形成性测评,是近年来测评功能开发的显著特征。
物理教育测评要以物理教育目标为客观标准,建立物理教育目标系统是物理教育测评的
必然要求。目前,对物理教育目标系统的研究还多集中在认知领域,对于情感领域和实验技能领域内目标的研究比较缺乏;对目标系统的内容、形式等方面还未能取得共同认识,这些将是今后物理教育测和评价研究的重点课题之一。
物理教育测评方法和技术也逐步改进,教育测量的理论、方法和技术逐步用于物理教育测量。教育统计方法和电子计算机技术逐步用于对测量结果的统计、分析过程。目前,物理教育实际中对情感领域和动作技能领域物理教育目标的测量还缺乏行之有效的工具。
指导教师:王剑华
(作者单位:陕西理工大学)