朱 丽
2021 年3 月,十三届全国人大四次会议审议通过的《中华人民共和国国民经济和社会发展第十四个五年规划和2035 年远景目标纲要》提出要“建设高质量教育体系”,“这是新时代教育发展的新主题、新方向、新目标、新任务”。实现教育高质量发展成为我国“十四五”期间乃至更长一段时间的教育发展目标。何谓高质量教育体系?它指向能够满足人民群众日益增长的更高质量、更加公平、更加满足多样需求、更可持续发展、更为安全可靠的教育体系,是体现创新、协调、绿色、开放、共享的新发展理念的教育体系。[1]高质量教育体系可谓是新发展理念在教育领域的具体体现。
教育发展方向既已明晰,接下来需要思考的就是如何构建高质量教育体系、如何衡量教育质量的高低等一系列问题。众所周知,质量与价值是一对紧密相关的概念,质量的高低决定了价值的大小,而价值与评价又相伴而行。从评价的词源来看,“评价”(evaluation)一词源于“价值”(value)这个词,甚至有时评价和价值被当作同义语使用,因为价值的大小往往取决于评价,当然这种理解未必准确,因为价值是先于评价而独立存在的客观实体,但足可说明评价与价值是一对联系紧密的词。通过价值,质量和评价也紧密相连。质量的高低及其改进需要以一定的评价标准为依据,评价在质量的改进中往往起着导向与评定的作用。因此,构建高质量教育体系同样需要有相应的教育评价与其匹配,高质量教育评价既是高质量教育体系的重要组成部分,也是高质量教育体系的重要保障。
教育评价既有正式评价,也有非正式评价,在日常教育教学实践中几乎无处不在,“对教育实践具有巨大的导向作用,好的评价促进教育和个人的健康发展,不好的评价则会误导、阻碍教育和个人的发展”[2]。2020 年10 月,中共中央、国务院《深化新时代教育评价改革总体方案》(以下简称“《总体方案》”)指出,“教育评价事关教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向”。教育评价的重要性被提升到前所未有的高度,必须深化教育评价改革,发挥好教育评价的指挥棒作用。从某种程度上来说,深化教育评价改革的目的就是提升教育评价的质量,建立与高质量教育发展相匹配的高质量教育评价体系。
要明白什么样的教育评价可以称得上“高质量”,其前提是需要明白何谓质量,如何判定其高低。“质量”是人们日常生活中常见、常用的一个词,通常用于企业领域。2000 版GB/T19000—ISO9000 系列标准将质量界定为“一组固有特性满足要求的程度”。从其界定来看,“质量”包括两层意思:第一,质量由一组固有特性组成,这些固有特性需要满足顾客和其他相关方的要求;第二,质量由其满足要求的程度加以表征。前者是指产品和服务的特性符合给定的规格要求,通常是定量化的要求,可以看作是质量的客观性;后者是指产品和服务满足顾客期望,是质量的主观性。对于物品而言,质量好坏、高低是决定其价值大小和市场价格高低的关键因素。当然,从现实来看,如果仅以满足顾客需要的程度来评判产品的质量有些绝对,如毒品等坏的东西,无论怎么能够满足用户的需求都不能说是高质量的。因而高质量的“高”内含着正向的价值判断,意味着好的、值得欲求的东西。
某种程度上对教育评价质量的反思也可看作是对“什么是好的教育评价”的追问。从问题的属性来看,对教育评价本身好坏的评价属于元评价范畴。元评价概念最初产生于美国,由斯克里文(Scriven,M.S)于20 世纪60 年代末提出,他认为元评价就是所谓的“二阶评价”(second-order evaluation),即对评价的评价,由另外的评价者(有别于原评价的评价者)对已实施或已完成的评价进行评价,将原评价作为评价对象,对原评价活动及评价者的表现进行价值判断,以期提升原评价的品质。[3]斯克里文的元评价是对原评价的评价,但高质量教育评价并非简单地指对已实施的评价的评价,“高质量”内含着更加公平、更加科学等“好”的价值,因而可以将高质量的教育评价等同于好的、理想的教育评价。从根本上说,高质量教育评价具有以下4 条衡量标准。
就本质而言,教育评价是一种工具、手段,是基于事实判断做出的价值判断,要基于事实、尊重事实,强调实事求是,这决定了其必须体现科学性和专业性,只有这样才能客观真实全面地评价不同对象。
《总体方案》也明确提出要“坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”。科学的本质在于求“真”,是人类主观世界对自然、社会、人类思维领域客观规律和本质的认识与反映,科学本身也可看作是一种值得追求的价值。科学性从“真”的意义上规定着教育评价,高质量的教育评价必然要符合“真”的要求,要遵循教育评价自身的规律性。从实践来看,教育评价的科学性体现在方法、技术、标准、内容等方方面面,强调基于数据、客观信息来评价,追求评价结果的客观性、准确性及稳定性等。
首先,由于教育评价是基于事实基础的价值判断,教育评价的科学性应该体现在循证性上,即基于事实和数据的真实评价。符合科学性的教育评价靠真实的“数据”“证据”说话,其结果经得起事实的检验。比如,对学校的评价,不纯粹靠“口碑”,而是通过多种途径,向不同利益群体采集关于学校发展的各种信息来综合判断,只有这样的评价结果才具有公信力。
其次,教育评价的科学性体现在信度、效度上。信度和效度是教育测量中常用的两个专业术语。信度(reliability)通常是指测量是否可被重复,即如果我们在某一特定的条件下重复测量过程,是否能够从该测量工具上获得相同的(或者相似的)结果。效度(validity)一般指我们是否测量了想要测量的东西:一个测量是否能够“很好”地代表一个特定的构念。[4]有效的测量不应该有偏差。高质量的教育评价应该具有较好的信效度,能够真实有效地评价学生、教师等群体,不能仅凭经验,过于主观地进行评价。
最后,教育评价的科学性体现在技术手段的先进性上。Schwandt 和Halpern(1988)假设一个好的评价需要有技术质量的保证、调整偏差的能力。[5]一项高质量的评价往往公信力较高,能够真实有效地诊断评价对象的发展水平。在信息技术时代,教育评价应充分利用各种信息技术(包括互联网、大数据和人工智能技术等)改进传统的评价方法,对评价对象做出客观、全面的评价,使评价结果具有更高的可信度和参考价值。
规定性亦称“规定”,即对事物自身的限定,是一事物区别于其他事物的本质特性。对教育评价而言,合规定性意味着作为一种手段,教育评价应该回归到自身来考量其价值。何谓教育评价?被誉为“教育评价之父”的美国学者泰勒在其著名的“八年研究”(1933—1940)报告(《史密斯-泰勒报告》)中正式使用“教育评价”这一概念,他明确提出:“评价过程本质上是一个确定课程与教学计划实际达到教育目标的程度的过程。但教育目标本质上是指人的行为变化,因此,评价是一个确定行为发生实际变化的程度的过程。”[6]显然,从本质属性来看,评价是确定人的行为实际发生变化的一种手段。在《第四代评估》中,古贝和林肯虽然在理论上将评价的发展划分为“测量、描述、判断、建构”4 个阶段,但在实践中,评价的内涵依然常常被窄化为“测量”,甚至等同于标准化测试,呈现出明显的功利主义、管理主义等价值取向,强调效率至上,对教育实践起到了消极的导向作用,成为当前“唯分数、唯升学、唯文凭、唯论文、唯帽子”顽瘴痼疾的根源之一。
高质量的教育评价不仅体现为合科学性,更要突显其育人价值,回归育人本位,着眼于“培养什么样的人”这一根本问题。“测量”充其量只是评价的一种手段、类型。教育评价依据不同维度可以分为多种类型,如《总体方案》中提出了“过程评价、结果评价、增值评价、综合评价”等“四个评价”,因而不能仅仅关注教育评价的某一类型而忽略了其他类型,在发挥评价的甄别、选拔功能时要注重发挥其发展性功能,为评价对象的发展提供更精准的指导;不仅关注效率,强调标准化,也要关注个性化,促进评价对象的多元发展。合规定性意味着需要对教育评价本身进行研究,探索分层、分类评价,不仅注重评价的效率,更要注重评价的效益,即评价给人和社会带来的好处、整体收益等。
任何行为与行动都是由某种或某些目的引导的。何谓目的?按《现代汉语词典》的解释,“目的”是指想要达到的地点或境地、想要得到的结果。在英文中,可作“目的”解的词包括aim、end、target、purpose、intention 等,教育的目的一般取“aim”或“end”,但二者也是有区别的:end更指一个个具体的目标,各个end 的实现即aim。另外,在古希腊语中,telos 的意义既是目的、终点,又是最高、最好的状态。所以目的就是最好的终点。教育评价既然是一种教育活动,它无疑既要合乎教育目的,又要有助于教育目的的达成。亚里士多德说:“一切技术,一切规划以及一切实践和抉择,都以某种善为目标。”[7]只有以善为目标的教育评价才可以说是合目的性的,而高质量教育评价的重要标准必然是合目的性的。
合目的性包含两个基本问题:一个是合乎谁的目的,另一个是合乎什么样的目的。首先,教育评价应该合乎谁的目的?教育作为社会的一个子系统,属于社会的上层建筑,它必然要服务于特定社会和国家的总体利益与发展,这决定了在不同的国家以及同一国家的不同发展阶段,教育评价的目的都有可能不同。例如,在我国封建社会,特别是自隋唐以来,科举制是选拔人才的一种评价方式,是为封建王朝选拔文官的制度,“学而优则仕”是无数文人考取功名的唯一途径。那么,科举制必然是为封建王朝服务的,挑选出来的人才必然是忠实于封建皇权的“经世治国”之才。而在今天,教育是党之大计、国之大计,承担着为党育人、为国育才的重要职责,这决定了我国当下的教育评价目的必须合乎党和国家的利益,为培养新时代中国特色社会主义的坚定信仰者、维护者及建设者服好务。
其次,教育评价应该合乎什么样的目的?《说文解字》中这样解释:“教,上所施下所效也”“育,养子使作善也”。教育就其本质而言是一种使人向善的活动,是为了“育人”。人是教育的核心,教育是人(教育者)与人(受教者)共同进行的活动,没有了人,教育不可能发生。如此,人是教育的出发点,实现人的全面发展则是教育的最高鹄的或称终极目的。教育中所有的手段都应该服务于这个终极目的,教育评价也不例外。合目的性的教育评价必须回归到教育中人的发展上来,教育评价是手段,人的发展是目的,不能本末倒置。
科学性可以看作是教育评价工具理性的要求,但教育评价除了要合乎工具理性,还需要合乎价值理性。工具理性和价值理性是德国哲学家马克斯·韦伯提出来的,他认为工具理性关注有效性、科学性、专业性,而价值理性则关注价值的正当性,是行为人注重行为本身所能代表的价值,即是否实现社会的公平、正义、忠诚、荣誉等。价值理性所关注的是从某些具有实质的、特定的价值理念的角度来看待行为的合理性,突显了善的价值。
“教育从本质上来说是一种道德实践而不是一种技术事业”[8],教育的本质属性决定了教育评价同样不是一项单纯的技术活动,因而难以如自然科学那样做到完全的价值中立。正如古贝和林肯所言,“我们没有把评估当作一种纯粹的科学过程,因为我们确信这样做会完全忽略评估学的社会、政治、价值取向等基本特征”[9]。仅仅关注教育评价的科学性是不够的,因为“科学能回答是什么和曾经是什么的问题,但回答不了应当是什么和应当做什么的问题”[10]。而且科学的“真”限于人类特定时期的认识局限性以及人类自身的有限理性,并不是亘古不变的,而是随着科学技术的发展和人类认识的提高而不断变化的。因此,如果仅仅关注教育评价的“真”,可能会忽略掉更多更具价值的东西。以学生评价为例,由于学生的情感态度、思维发展等特性难以测量,对学生的评价如果仅依赖于标准化测试中知识的掌握程度,考试分数就会成为衡量学生发展的唯一尺度,从而产生一系列不良后果。正如有论者所言,“对学生的每一次评价,乃至每一次测验、每一个分数都会对其造成影响。僵化呆板的测试,不管其技术成分如何完善,都会影响学习者以后的发展与创新”[11]。
高质量的教育评价不仅要以合乎科学的方式进行,还要以合乎道德的方式进行。对于教育评价科学性的重要指标“效度”,荷兰学者比斯塔将其分为“技术性效度”和“规范性效度”:前者是关于“我们正在测量的是不是我们想要测量的”,后者是关于“我们在测量我们真正重视的,还是仅仅在测量我们能轻易测量到并且最终能评估的东西”[8]。结构效度、内容效度均属于“技术性效度”。除了重视评价的技术性效度,我们同样要关注其“规范性效度”,不仅要关注评价方法的有效性,还要考虑其价值性,即对谁有用、为什么有用。英国评价协会的指南概括了好的教育评价的8 项原则:目的明确(clarity)、结论真实(integrity)、独立开展(independence)、结果可及(accessibility)、公正可信(trust)、平等守正(equity)、原理透明(transparency)及多样性观照(diversity)[12],这些原则从评价的目的、过程、结果等多个方面对“什么是好的教育评价”进行了规定性描述,其中公正可信、平等守正、多样性观照等都可以看作是教育评价合伦理性的表现。
一个合伦理性的教育评价应该包括公正、民主、关怀等多种伦理价值。公正可以看作是教育评价的首要伦理价值,一个不公正的教育评价无论技术多么完美,都是没有价值的。公正的教育评价不仅要做到程序公正,也要保证结果公正,正确处理好程序公正与结果公正之间的关系;民主体现在教育评价的利益相关者都应有权正当表达自己的利益诉求,并不同程度地参与到评价中来,而不仅是评价结果的被动接受者;关怀体现在教育评价应该关照评价对象的差异性和多样性,既要坚持同样的衡量标准,又要兼顾个性与差异。
从现实来看,我国教育评价仍存在诸多问题和困境。当前乃至今后很长一段时间,教育评价改革应致力于破“五唯”,不仅要“破”,更要做到“立”。“破”的目标很明确,但为何要“立”、“立”什么,这些需要回到教育评价自身去进行原点式思考,形成人们对高质量教育评价的共识,去除教育评价的功利价值,引导其重归人的本体价值,以此建立良好的教育生态,避免陷入“评价不改,改革难以成功”的恶性循环中去。
人的发展问题是马克思主义哲学的一个根本问题。马克思主义认为,人的发展是“人以一种全面的方式,也就是说,作为一个完整的人,占有自己的全面的本质”,“人的发展的最高境界是人的自由全面发展,是人的本质的真正实现”。“人的全面发展”可以看作是马克思主义思想的核心。进入新时代以来,习近平总书记高度关注人的发展,提出以人民为中心的发展思想,多次指出要“不断促进人的全面发展”。他在《之江新语》中指出:“人,本质上就是文化的人,而不是‘物化’的人;是能动的、全面的人,而不是僵化的、‘单向度’的人。”这是对马克思主义人的全面发展思想的继承,也是习近平新时代中国特色社会主义思想的重要内容。人的培养是教育的首要职责与核心使命,而“培养什么样的人”始终是教育首先要回答的问题,这是方向性的问题。2018 年,在全国教育大会上,习近平总书记站在党和国家事业发展全局的战略高度,指出教育工作的根本任务是“培养德智体美劳全面发展的社会主义建设者和接班人”。教育评价是教育工作的“指挥棒”,人的全面发展需要与此相应的评价来引领和保障,否则,全面发展的育人目标永远只是“空中楼阁”,可望而不可即。
测量的效度不能仅考虑其技术性效度,即是否有效,还要考虑其规范性效度,即“对什么有效”,这关系到对“什么是高质量教育”问题的回答。高质量教育必然是关注人的全面发展的教育。高质量教育评价必须服从于、服务于高质量教育的目的,即促进人的全面发展。
元评价是教育评价专业化发展到一定阶段后的产物,它基于对教育评价的批判与反思而产生,能够更好地推动教育评价的专业化发展,对教育评价质量起到重要的保障作用。《总体方案》是新时代引领教育评价改革的一个纲领性文件,彰显了新时代教育评价改革的重要性和艰巨性,在这一背景下,建立完善的教育元评价机制以提高教育评价质量就显得尤为重要了。
一是建立教育元评价制度。当前,党和国家非常重视教育评价改革,除了《总体方案》,还陆续出台了《幼儿园保育教育质量评估指南》《义务教育质量评价指南》《普通高中学校办学质量评价指南》等系列文件,对基础教育质量评价进行深入、系统的顶层设计,为基础教育高质量发展提供了标准和方向。美中不足的是,这些文件均指向教育质量,对教育评价的元评价尚未涉及,还需要建立教育元评价制度,确保教育评价自身的高质量发展。
二是制定教育元评价标准。标准是衡量一个产品质量好坏的“尺子”,规定了产品的类型、品种、结构等,对生产者的行为起着引导和规范作用。对于什么是高质量的教育评价也应该制定相应的评价标准。美国教育评估标准联合委员会(JCSEE)制定了元评价标准,分为4 类:效用性标准(utility standards)、可行性标准(feasibility standards)、适切性标准(propriety standards)及精确性标准(accuracy standards)。[13]2011 年,美国教育评估标准联合委员会在此4 条标准的基础上增加了评估问责标准。具体的元评价指标主要是依据这5 条标准来制定的。笔者认为,前4 条标准更多的是从科学性的角度进行评价,而评估问责标准则是依据评价结果来实施相应的奖惩,并不能全面评价何谓高质量的教育评价。如前所述,高质量教育评价具有多重价值,除了合科学性和合规定性,还应该包括合目的性和合伦理性,这是由教育自身的工具属性和道德属性所共同决定的。
三是确定元评价主体。评价发生在评价主体与评价对象之间,那么,谁来评价教育评价呢?元评价根据实施主体不同可分为内部和外部评价两类。内部元评价主要是元评价的实施主体依据相关评价标准对评价设计、实施等进行评价,查找元评价实施过程中存在的问题与不足。外部元评价主要由评价委托方或者其他利益相关者(如学校)发起,独立、中立的第三方评价机构是实施元评价的主体,它必须独立于前二者,且要具有更高的公认的权威性,以便客观地实施元评价。
在信息技术时代,5G、大数据、云计算、人工智能等已深深影响了学校教育教学变革,在为教育评价改革发展带来挑战的同时带来了新的机遇,也为探索“四个评价”改革、破除“唯分数”“唯升学”的顽瘴痼疾提供了新的思路和技术支持。高质量教育评价需要技术赋能,更充分地掌握评价对象的有效信息,从而对评价对象做出更加客观、更加科学的评价。
当前,评价改革是教育综合改革进程中的难点问题,而信息技术既需要先进的设施设备与之配套,也需要评价者具备较高的信息素养和评价专业素养,因而以技术赋能高质量教育评价依然处于探索阶段。首先,要设定多维度的综合评价标准或维度,借助现代信息技术伴随式地采集被评价者学习、生活的长程数据,如通过“依靠智能传感器、智能可穿戴设备、智能摄像头、智能学习终端等采集非结构化行为数据”[14],形成大数据库,依据评价指标筛选、处理、分析数据,对被评价者进行全过程、全方位的评价,形成每一个个体的“数字画像”,这对强化过程评价、改进结果评价能起到很好的支持作用。其次,开发更加智能化的高质量教育评价系统,探索增值评价和综合评价。增值评价以发展为导向,最早由美国田纳西州于20 世纪80 年代开发,因而又被称为田纳西增值评价系统(TVAAS)。为解决以学生单次测试成绩衡量教师水平所造成的教育公正问题,增值评价以学生标准化测试成绩间的进步幅度衡量教师效能,综合考量各种因素对学生学习结果的影响,显然这一做法对学校特别是薄弱学校更加公平。而综合评价不仅是评价内容的综合,也是评价方法和评价主体的多元。开发现代智能测评,不仅要评价学生学业成绩,也要评价学生的学习品质,如学习兴趣、毅力、思维品质等,同时要积极探索德、体、美、劳等四育评价,破解学生综合素质评价的难点。在评价学校时,有效剔除学校自身无法控制的因素来测量学校系统、教师对学生学业进步的“净影响”,做到公平、公正,引导学校树立正确的人才观,营造更好的教育生态环境。