谢小庆 刘晰萍
所谓“钱学森之问”,是问为什么我们的学校培养不出一流的人才。“钱学森之问”曾刺痛了不少关心中国发展的人。经过2018年春的“中兴事件”之后,更多的人愈发真切地感受到这种刺痛。
美国有自己的问题,问题之一体现在大众教育。43-17=?48/3=?在中国的小学毕业生中,5秒钟内不能做出正确回答的比例可能不足5%;在美国的小学毕业生中,5秒钟内不能做出正确回答的比例可能高达50%。但是,美国在优秀人才培养方面却做得非常好。美国在全球许多经济领域处于利润丰厚的上游,与美国成功的创新型人才培养机制关系密切。美国的学校不仅培养了比尔·盖茨、乔布斯、扎克伯格等一大批科技和商业精英,而且培养了一大批诺贝尔科学奖的获奖者,使美国一直在科技领域保持着领先地位。
特朗普之前的美国历任总统都将教育问题摆在重要位置。2001年美国国会通过了小布什总统主持制定的新教育法案《2001年一个都不能少法案(No Child Left Behind Act of 2001)》(简称NCLB)。其后,美国展开了一场轰轰烈烈的教育改革运动,“一个都不能少”的口号家喻户晓,“一个都不能少”教育改革在法律的保护下稳步推进。
NCLB教育改革最核心的理念是“达标”和“问责”。达标,就是要求所有学生都要完成规定的学习任务,达到规定的知识掌握水平和能力要求。具体的措施是要求各州在3年级到8年级进行州统考,在高中的一个年级(一般是10年级或11年级)进行统考。要求所有的学生都达到最低能力和知识要求。如果有学生不能达到要求,出现“掉队”,就要对学校和教师进行问责。
虽然NCLB在解决学生“掉队”方面有一定成效,但仍然有许多学生无法达标。无论怎样降低考试难度,无论将标准定得怎样低,总有一些学生的成绩不能达标,甚至与标准要求相差很远。
2015年美国国会通过了奥巴马总统主持制定的新教育法案《每一个学生成功法案(Every Student Succeeds Act)》(简称ESSA)。新法案于2018年正式施行。
强调“人人成功”的新法案ESSA与强调“一个不少”的NCLB法案的重要区别是以“达标+成长(growth)”概念取代了“达标”概念。今天,美国的大多数州都采用了某种成长评估模型。
目前,应用于美国各州的成长模型共有7种:增分模型、渐进达标模型、分类模型、残差模型(包含残差百分等级排列模型)、学生成长百分等级模型(简称SGP模型)、投射模型、增值模型。
根据成长评估的理念,学习不仅要追求“达标”,更要追求“成长”。对于一些基础好的学生,实现“达标”并不一定能够实现“成长”;对于一些基础薄弱的学生,即使暂时“达标”有困难,仍然可以通过学习获得“成长”。这就是新的“达标+成长”的教育理念和教育评估模型。
美国强调“成长”,主要的着眼点是那些可能掉队的学生,是力图帮助那些“达标”有困难的学生获得“成长”,鼓励那些帮助这些学生获得一定程度成长的教师和学校。中国与美国的国情不同,我们强调“成长”,主要的着眼点应是那些基础较好的学生,力争帮助他们不仅“达标”,而且获得实际的“成长”,鼓励那些帮助这些学生获得进一步成长的教师和学校。
成长评估基于两个重要的教育理念之上,第一是“个性化学习”理念,第二是“能力发展”理念。
一、 成长评估基于“个性化学习”理念之上
成长评估基于正视“个别差异”的教育理念之上,体现了人工智能时代的个性化学习。就像世上没有两片一样的树叶,世上也没有两个完全一样的人。每个孩子都有自己的兴趣、爱好、梦想、禀赋、生活环境、生活经历,都是唯一的,都是独一无二的。为了获得最好的学习效果,需要尊重学生的个性,需要因材施教,统一的标准很难适用于所有学生。
传统的西方和东方的教育都是个性化的,西方是家庭教师,东方是私塾。伴随工业化进程,学校也成为批量化生产劳动力的“人才工厂”,虽然大大提高了效率,付出的代价却是学生个性的丧失。
在希腊神话中有一个强盗叫作普洛克路斯忒斯,住在埃莱夫西斯附近。他设有一张铁床,强迫被捉到的人躺在床上,把身材矮小的拉长,把身材高大的截短,使他们的身体与铁床的长短相等。现代的学校恰像一张普洛克路斯忒斯的铁床:不管人的个别差异,将快的拉慢,将慢的拉快。“小学数学”所规定的6年的教学内容,有的孩子可能仅仅用3年就可以学完,但他必须跟着全体“齐步走”。
学生不是一只通过训练就可以获得某种能力的“巴甫洛夫的狗”或“斯金纳的鸽子”,学生是一个有好奇心、有求知欲、有情感的人,不同的学生需要以不同的方式、不同的节奏来满足自己的好奇心和求知欲,来完善自己的人格,来发展自己的能力。在科技迅速发展、社会快速变化的21世纪,需要改变以往像工厂生产标准化产品一样生产统一规格学生的学习方式,需要改变像马戏团训练小狗整齐划一地表演节目一样的学习方式,需要找回在工业化过程中丢失的个性化学习。
计算机和互联网的发展使个性化的学习重新成为可能,人工智能可以替代许多以往老师所从事的讲课、批改作业的工作。科学技术的发展为重新找回个性化学习提供了可能性,为基于个性化学习的成长评估提供了可能性。
今天,社会各行各业正在提供越来越多的个性化、订制化的服务,出现了订制化的美容、汽车、网页、健身等方面的服务,学校也需要向学生提供订制化的教学服务。
正是基于这种“个性化学习”的教育理念,我们才需要进行成长评估,不仅关心学生是否达到了某个统一的标准,同时要关心是否每一個学生都获得了实际的成长。
二、 成长评估基于“能力发展”的理念之上
成长评估是一种关于能力的评估,而不是一种关于特定知识记忆的评估。
在科技和社会发展速度使人瞠目结舌的今天,在快速变化的21世纪,学生将来从事的行业今天可能还未出现,今天的一些热门职业那时可能已经消失。
在获取特定知识越来越容易的“移动互联”时代,在特定知识快速老化更新的今天,重要的已不再是记忆特定知识。知识再丰富的人,也远不如一部联网智能手机,也远不如“百度”或“谷歌”。学习的目标,是要成为一个不会被智能手机或机器人所取代的人,是要成为一个不会被“百度”或“谷歌”所取代的人。
对于知识与能力的区别,中国的古人早就做出了非常清楚的回答:“授人以鱼,不如授人以渔。”送给别人一些鱼,不如教给别人一些打鱼的方法。鱼,就是知识;渔,就是能力。知识性考试,就是看一个人篓子里有多少鱼;能力性考试,就是让人打两网鱼看看,看其渔之高下。
“鱼”和“渔”之间有区别,“知识”与“能力”之间也有区别。在心理学中,能力和知识是一对既有联系又有区别的概念。能力的形成离不开知识的积累,但能力不是简单的知识积累。孔乙己会4种“茴香豆”的“茴”字写法,拥有一定的知识,但很难说他拥有能力。
首先,能力与知识的区别体现在二者对活动的影响面不同。知识仅仅影响到一个人在有限领域中的活动,例如,光学知识仅仅影响一个人解决有关光学方面的问题,国际法知识仅仅影响一个人解决有关国际法方面的问题,对他在其他方面的活动影响并不大;能力则影响人在较广领域中的活动,例如,逻辑推理能力影响一个人的多种活动,影响一个人治学、经商、从政等许多方面的活动。最核心的能力就是智力,几乎影响人的一切活动,从洗衣做饭、唱歌跳舞,到格物致知修身齐家治国,各种活动都会受到智力的影响。
其次,能力与知识的区别体现在二者的变化速度不同。相对来说,知识是一种“快变量”,既可能通过强化训练而获得,也可能由于遗忘而失去。能力则是一种“慢变量”,能力的形成过程恰似“冰冻三尺非一日之寒”,不是一朝一夕的事情。
第三,能力与知识的变化方向不同。能力的变化基本是单向的,只增长,不减少,用数学的语言讲,是“单调增变量”。在衰老之前,能力呈单向增长的变化趋势。能力一旦形成,一般在衰老之前不会失去。知识则不同,是“非单调增变量”,变化是双向的,可能增加,也可能减少。三角公式、化合物的分子式、积分公式等知识,我们大多曾经拥有,也曾经应付过相应的考试。今天,许多已经遗忘了。
知道了知识与能力之间的差异,就很容易发现能力考试与知识考试的不同。
首先,能力考试不容易受到短期强化辅导的影响,往往是无法准备的。能力考试所反映的是学生的实际水平,而不是辅导教师的水平。除了长期积累,别无提高分数的捷径。
其次,能力考试对记忆力的要求较低。记忆力是人基本的认知心理特征,较好的记忆力是完成工作、学习任务的条件之一。但是,取得成功所需要的能力是多方面的。与记忆力相比,可能言语运用能力、计算能力、判断推理能力等更为重要,尤其是在今天这个借助移动互联可以信手拈来特定知识的时代。
成长评估,主要是对能力的评估,尤其是对核心能力的评估。成长评估,主要是评估学生的交流沟通能力(主要是口头和书面表达能力),邏辑推理能力和审辩式思维。
三、 结语
2018年3月16日,教育部部长陈宝生在“两会”教育问题专题记者招待会回答记者问题时说:“要改变评价方式,完善学业考试办法,建立综合素质评价制度,不允许以分数高低对学生排名…这次高考改革之后,高中阶段对学生的考核,增加了综合素质评价这样一个内容。这是非常明显的素质教育措施。”在学生的综合素质评价中,可以是忽视学生个性、千人一面的“达标评估”,也可以是尊重学生个性、因材施教的“成长评估”。
每一个足球、篮球、乒乓球的教练都知道,为了战胜对手,一定要研究对手的长处,一定要学习对手的长处。在今天这个面临严峻挑战的时候,我们更应该努力研究和学习对手的长处。美国教育改革从小布什“达标模型”到奥巴马“成长模型”的发展,可以给我们带来一些启发,值得我们思考借鉴。