唐懿滢 陈晓珊 谭维智
从“由人”到“为人”:教育质量评价中质量量化方法论的本质回归与实现路径*
唐懿滢1陈晓珊1谭维智2
(1.曲阜师范大学 教育学院,山东曲阜 273165;2.曲阜师范大学 中国教育大数据研究院,山东曲阜 273165)
进入算法时代,对教育质量进行数量化分析已成为教育质量评价的关键技术手段,然而已有研究集中于对教育质量量化方法进行的构建与反思,较少涉及针对方法论本身的完整思考与建构。为此,文章聚焦教育质量评价中的质量量化方法论,从质量概念内蕴的确定性、数量性、比较性与可分解性特征中分析了对教育质量进行数量化分析的可能性。然后,文章剖析了当前教育质量量化方法论的实质,并厘定了由测量主体主导的以注重“中介性手段实现”为终极目的的教育质量量化的工具论基础。最后,文章指出,作为一项以“为人发展”而存在的评价活动,未来教育质量量化方法论应基于教育立场从“由人”评价向“为人”评价转变,并在此基础上对其实现路径进行人本性重构,以期为落实新时代教育质量评价改革提供参考。
质量量化;教育质量;教育质量评价
教育质量评价作为教育转向何处的风向标,是教育数字化转型不可或缺的要素之一。早期相关主体对于教育质量的评价大多依赖经由分散、独立的“专家意见”形成的声誉,自20世纪80年代起,受“新公共管理”思想及文献计量学发展的影响,定量评价开始用于“客观测量”教育质量并逐渐替代传统“同行评议”的质性评价方法。当前,随着以大数据和人工智能技术为代表的信息通信技术的发展,基于“证据”的算法时代已然来临,“数据为本”的教育质量量化成为评价教育质量的重要方式。从已有的研究来看,目前关于教育质量评价的研究已得到不少学者的关注,具体到教育质量评价方法的研究大致呈现两极趋势:一类是关于教育质量评价标准、指标体系等的构建研究[1][2],另一类是关于教育质量评价方法的反思研究[3]。然而,这些研究较少涉及针对教育质量评价方法论本身的建构与完整思考。鉴于此,本研究将从原理层面对教育质量量化方法进行研究与阐释,通过阐释教育质量量化的内涵及其可能性,分析现今教育质量量化方法论的实质,找寻其内在的工具论基础,并提出重构教育质量量化方法论的实现路径,以期为落实新时代教育质量评价改革提供参考。
在教育质量评价实践的历史中,人们一直以来致力于追寻教育质量评价的科学性与客观性,教育质量评价活动逐渐呈现以数字作为考核与评估要件的倾向。作为一种教育质量评价方法,对教育质量进行数量化分析的主要优势在于,能够毫不费力地实现从复杂的质量理论到统计设计所需定量手段的有效界定的转变。简单来说,教育质量量化即根据一定的数学模型或数学方法,对收集到的质量数据进行数据化处理分析,从而给予数量化描述的一种教育质量评价方法。
一种现象是否可以被量化和计算,取决于想要量化或数据化之现象的本质、尺度与单位问题。也就是说,教育质量是否可以量化在一定程度上取决于质量本身。依据马克思主义哲学中的质量规律理论,“质为一事物成为它自身并区别于他事物的内在规定性,主要由属性表现出来;量则是事物存在和发展的规模、速度、程度,以及它的构成成分在空间上的排列组合等可以用数量表示的规定性”[4]。基于此,作为事物在质与量两种内在规定性对立统一关系下的稳定存在,质量的完整表述应为“蕴含于事物的质之中的量”,表示事物保持自身质的量的范围,事物的质量则特指同质(事物)范围内事物某一方面或某几方面属性的情况。因而,教育质量是一个确定的概念,涉及教育某一方面或某几方面的发展情况,被纳入教育质量评价范围的“总体”并非是教育整体,而是教育的某个方面。其中,“量”特指同类事物的外部属性,如大小、轻重、高低等构成了事物的数量、规模等外在形态的属性,观察并测度这些形态可以判断事物所处的阶段、性质、功能以及变化走向[5]。因而,质量概念中蕴含的这种可以测度的“评价规定”表明,对于质量的评价就是基于同质(事物)范围内对事物进行量的比较分析,如此说来,教育质量概念既蕴含数量特征,同时也具有程度比较的价值。除此之外,“教育质量是可以分解的”[6],按教育目标分类的一般理论,作为教育质量的载体,人的发展可以分解为三大领域:认知、情感和动作技能,每一领域又可分为多个层次。可见,教育质量概念内蕴的确定性、数量性、比较性与分解性为教育质量量化的实施提供了可能性。
质量概念内蕴的量化可能性,决定了教育质量量化的关键在于计算工具的运用。现有的教育质量量化方法背后的原理机制大致可总结为:由测量主体依循“将质转化为量”的观念,在旧有的测量模型上利用尚存的模式识别与回忆,将难以量化的非结构性的质量转化为可以进行数据处理的有效形式。然而,目前的方法论操作中存在滞后性、孤立性、绝对化与简单化问题。
模型构建是教育质量量化的概念框架,在牢固的教育传统基础上“沉淀”出量化规则,筛选移植已有的开源代码与现成算法,提炼教育质量量化算法模型,是教育质量量化模型构建的底层逻辑。简言之,惯习性理念下的模型建构的实质是对已有教育模型的重新包装。然而,每一种模型背后都有其应用边界与条件,不同时代背景、不同领域的“算法移植到教育中会产生专业性与针对性不足等问题”[7]。对于教育质量评价而言,从理论认识到应用实践是一个异常复杂的过程,“特别是作为对人的培养活动进行审视的教育评价实践,其评价对象的复杂性、丰富性、发展性与模糊性”都使“向前看”的教育无法用“向后看”的模型阐释[8]。遵循“已有评价模式的教育新应用”的滞后性模型构建理念无疑严重忽视了教育质量评价的现实实践基础,因而很难说其能够真正有效地测量教育质量。
指标设置是教育质量量化的前提基础,采用还原论思维构建的质量量化指标体系,将难以测量的、模糊的、复杂的教育质量层层分解为具体可测的、可行为化的、可操作化的评价指标。不可否认,还原论思维在处理简单的数量级关系方面不失为一个成功的方法论原则,但面对复杂系统的乏力也是显而易见的。还原论主张复杂系统可层层分解为其组成部分,并通过各部分间简单机械式的互动加以解释。数量可以通过同一类型较小的量相加而得,因为这些较小的量构成了它的组成部分,而质量并非如此,整体与部分的非一致性造成强度较弱的质并不能构成强度更强的质。运用还原论思维构建的教育质量测量指标,只是简单地因式分解了教育质量内部能够被数量化的内容,至于那些无法被数量化但可能极为重要的内容则因方法论限制而被忽略。经过一系列“还原”操作后,教育质量的复杂意义逐渐被“消解”,使每一个被确立的指标都看似合理地表示了质量,但实际上由一个个孤立性的指标相加得到的指标体系却构成了一个似是而非的质量定义。
算法制定是教育质量量化的标准参照,由算法思想蕴养的教育质量量化方法论背后的“精确”观念就是要用类似的数学语言对质量问题进行确定性测量。如此一来,算法的确定性与质量的模糊性之间的相异性导致教育质量量化的一系列过程存在绝对化特征:①算法推出的绝对化。为了追求高度标准化,在量化教育质量的过程中大多采用行政性评估机制自上而下推出算法来对教育质量进行评估与衡量。从实证论意义上来说,这种以预先设定的标准为轴心的“霸权”,会以一种无形的方式抹杀利益相关者的行动智慧和意义建构[9]。②算法公开的绝对化。为提高评价结果的科学性与公信力,算法公开被视为不容置喙的金科玉律。然而,算法公开的本质理应是“通过问责实现算法规制”[10],而非通过标准化测量证明成功。与此同时,目前的算法公开并不是真正意义上的算法透明,而只是算法输出结果的公布,对于更重要的算法输入过程并没有做到真正的公开。另外,有限的算法公开环节也并未形成完整的闭环,对于公开内容的不当之处,缺少为信息受众提供批评、质疑等意见的反馈渠道。
数据收集是教育质量量化的关键环节,基于某种信息的系统性收集是保证教育质量量化的科学性与精确性的重要前提。繁杂性是教育质量呈现的事实,然而便捷性却是教育质量量化方法论遵循的原则,现有的整个数据收集环节在便捷性原则主导下呈现简单化特征:①数据获得的简单化。就测量过程中的数据收集方式而言,存在避繁从简地收集数据的问题,如忽视数据来源的差异性、教育系统间的异质性、相关主体的能动性,采用一刀切的方式进行数据采集。②数据种类的简单化。信息的收集种类与数量总是会受到高质量数据和证据的可用性限制。由于定量数据本身具有的“更易概括推广与验证信效度”的先天优势,在数据选取的过程中评价主体更倾向于抓取定量而非质性数据。③数据处理的简单化。从大量数据中简化并提取所需的数据信息并非易事,其中的错误与虚假数据会严重影响结果的准确性。因而,必须保证只有经过严格审查的数据才能用于构建指标。但现实情况却是,在质量量化的过程中对于收集到的信息并没有进行二次分析审计,从而无法保证各数据源会一致无偏地提供真实的数据。
当前,由测量主体主导的教育质量量化方法论始终在精神性与工具性之间存在张力。作为引导教育发展的工具性手段,教育质量评价理应为教育发展发挥其“中介性”作用。然而,内发于底层的工具论制约,“由人”评价主导的教育质量量化活动执着于修正与完善教育质量评价的科学范式,将“手段实现”的重要性凌驾于以“为人”评价的教育质量量化的终极目的之上,导致“由人”评价内部主导的工具论基础彻底异化了教育质量量化所负载的本己性任务。
教育质量评价是关于教育的认识论建构,通过对蕴含于其中的价值的发现与挖掘,澄清教育的原则和立场,继而规范与引导教育发展,是确保教育价值得以实现的重要手段。手段存在的意义原在于实现目的,但作为以实现教育发展为终极价值的重要手段,完备的教育质量量化活动的实施在现实的教育实践中具有凌驾于一切活动之上的价值“优先性”,主要表现为:
①从科学主义与管理主义出发的教育质量量化方法论隐晦的前提,是一切列入评价标准之内的教育内容都是可以被精确陈述的。但教育内部充斥着种种无形的、难以量化的细节,一味追求教育质量量化的具体化与可操作化,放大可量化部分,甚至是强行量化、滥用量化的行为渗透至教育的各个角落。②为了证明方法论本身的客观性与科学性,教育质量量化主体倾向于通过简单的“复写”,集合已有的“稳定性”与“恒常性”的确凿性因果证据,从而实现“高效”的证据给出。不可否认,对于教育人的计算一定是一种基于经验的计算,但这种强调效率优先的“科学”建构取向将使教育本身具有的现实性减化为量化统摄下的可能性。忽视教育本身的复杂属性及教育实践的复杂性,强行追求质量量化本身的客观、理性、中立的外在性,无疑使教育质量量化陷入了一种逃离教育遁入技术的工具论狭隘之中。
从教育质量评价活动的根本出发点来说,“关注人的进步与发展应体现在评价理念、思想、技术与方法的每一环节”[11]。当前,以“实现人的全面发展”为口号开展的教育质量评价条目不胜枚举,但在效率至上的管理逻辑支配下,教育质量量化方法表现出一系列游离于教育本质之外的实质性评价贫困,主要表现为:
①致力于描述与分析教育质量的外部性特征,“由人”评价主导的教育质量量化方法鲜少关注与反映教育质量的本质要求。“当我们只关注硬数据和自然科学,企图把人类行为量化成最细小的单位或部分时,其实是在削弱自身对所有无法如此分割、减化的知识的敏感度。”[12]而测量主体将教育质量减化为一连串外显性行为数据的集合时,也往往会因错失行为背后的意义联结,而费尽周章地衡量了一种最低级的事实。②利用“精细化”的因式分解方法将复杂的教育质量简化为几个关键性的数字指标,教育质量的量化过程大多是“简单地数一数发了多少篇论文,获得多少个项目……项目的级别如何,课程的类型为何”[13]。这种以测量点值选取及简单地统计分析为主要计算工具的教育质量量化方法,使教育质量评价内部秉承的价值取向从“评价什么是最重要的”科学取向偏离至“评价什么是最方便的”技术取向。③现今“几乎所有的评价都依赖他人的评价”[14],教育质量量化指标、算法、数据大多是间接获取的,缺乏立足于教育实践开展的实质性评价。教育质量评价数量与类型上的“浮华”仅是新名目的迭出,当前教育质量量化对于引导与规划教育发展的终极价值的发挥仍是“形式主义大行其道”。
教育质量量化的生存与发展有赖于整齐划一的标准化尺度,其背后据持的教育事实与价值事实分离的认识原则认为,只要找到了科学性的测度标准,就能够对教育质量进行科学化测量。“这种技术思维方式使建立教育质量标准的哲学依据、测量过程的信效度以及测量结果的教育意义被认为是无关紧要的,技术手段的发展和使用反而成为首要问题。”[15]技术的重要性取代了教育质量量化的本真性,技术性控制的合理性瓦解了教育发展的各种可能性,具体表现为:
①为确保可比性,消解了不同教育类型间的异质性,人为地对其进行融合同构。通过对教育质量进行的去情境化处理,测量主体人为地抹平了各种教育质量类型之间的差异,潜设了以“发展人的可发展性”为终极目标的各种教育类型具有实效等质的价值定位。②为获得可计算性,将教育整体集中在有限的制度单元,以数据为中介强行分解了整全性的教育。经过对教育质量进行的某种程度的化约与抽象,继而施以拼接与加总的方法获得教育整体的认知,测量主体实则使教育质量评价陷入了一场由工具论僭越造成的科学化而失真的量化反噬之中。③为保证结果的权威性,排斥多元价值介入,漠视了教育实践者的主体性。在教育质量量化的过程中,测量主体秉承强势主体主导原则,抑制与遮蔽内隐于教育质量内部的主体性特征,消解教育领域内外不同主体身份与地位之别,以对教育质量进行“去人格化”处理。人的发展的不确定性和不可完全预设性赋予了教育的不确定性。现今附加在教育实践中用于捕获和规约教育发展的控制性质量量化方法,本质上与真正的教育发展相对立。
工具论规制下的教育质量量化方法论严重偏离了教育实质,背离了教育质量评价的初衷。将教育质量置于其本身出现的情境之中进行思考,不难发现:作为教育质量认识的起点与依据,教育质量评价通过对蕴含于“质量”之中的价值的发现与挖掘,联结的是一种“持续改进教育实践的具身行为”而非“关涉各类徒具外表的假设性要素的结果给出”。作为一项以“为人发展”而存在的活动,未来教育质量量化方法应聚焦人的发展,以“人”的价值为核心,在技术理性与价值理性之间谋得平衡,以实现从“由人”评价向“为人”评价方法的合理转变,本研究为此总结了具体的实现路径:
模型构建是一种行为预测活动,其实质是一种模拟,而“精确合理的模拟在一定意义上是一种语境的模拟,这种语境的模拟包含各种语境信息类型的模拟以及它们的关系模拟,同时还包含现实世界的高层次语境抽象模拟”[16]。也就是说,基于语境性的模型构建应将有意义的语境因素引入形式化的建构之中:①基于语境性的模型构建应该回到其所构成的证据“原点”,关注证据背后的时代背景与具体的教育问题。将语境视为算子引入逻辑系统,表征与解释以现实为基础而形成的对一种行为结果的事前预测性活动,其背后的深度假设与价值预设都应该包含丰富的现实内涵与实际意义。②模型的构建应在过去经验与未来智慧之间形成某种意义的联结,使面向未来的评价不仅忠实地代表教育发展中的当前现实,还可能代表教育发展的未来现实。基于此,每一次进行的教育质量量化活动都需要重新构建测量模型,以确保基于真实环境开展教育质量评价活动。
面对还原论在处理质量中可量化部分的成功而应对不可量化部分的乏力,指标设置可以引入具有综合性与集成性的整体论思维,从整体角度出发调和还原分析与归纳综合融贯的方法论,从而使确立的指标能够涵盖“质量的(同质)整体”与“(非同质)整体的质量”:①为保证指标能够涵盖“质量的(同质)整体”,应摒弃以往“世界万物皆可数据化,万物都可用数据表征”的思维[17]。正视测量过程中的“可能”与“限度”,肯定质量量化方法在保证数据客观可靠、统计分析科学精确等方面的优势,也应承认因方法论本身的限制而造成测量盲区。对于方法的不足之处,可以采用具体化、行为化、可操作化的定性分析方法予以补充。②为保证指标能够涵盖“(非同质)整体的质量”,应一改以往采用统一标准衡量非同质对象的做法。各类教育系统之间有很多的相似与不同,它们既不可能完全地融合同构,也不会简单地分解为更多类型。基于此,在制定指标的过程中,应在一致性和多样性之间寻求适当平衡,既不为强行追求一致性而肢解多样性,也不能极端拥护多样性而否定一致性,以此确保指标的设置足够还原教育质量的真实性。
质量具有的主体性特征决定了教育质量内蕴的主体相对性,但教育质量量化方法的展开需要对极具多样性的教育质量规定相应的算法尺度,由此多元价值协商形成共识就成为教育质量量化的必然选择:①共识性是一种无须借助外界强制性力量,通过各利益主体平等协商对话便可达成的准则。基于共识性的算法制定,可以在保留质量本身具有的主体性特征的基础上,经过相关主体一系列争议和选择之后实现以价值认同为基础的科学算法制定,使制定的教育质量量化算法源于教育内部利益相关群体的实际诉求,符合利益相关者的实际需要。②在这一共识框架下算法制定的全过程应是完全透明的,这种“透明”区别于以往的算法公开,它既不是为了实现问责的“公开”,也绝非为了实现以提升公信力为目的的“公开”,而是一种更为自主、和平的开放制度。基于共识性的算法制定过程的“透明”,是在保证教育质量主体性基础上达成的利益相关者间的价值共识,通过面向外界充分开放数据收集、筛选、确认、处理等过程,从而实现“全景场域”的透明。
确实性是一种与客观性相类似的准则。与客观性一致,确实性可确保数据解释和调查结果扎根于环境和评估者之外的人,而不受调查者个人的主观影响,但又区别于客观性对调查方法的依赖,其对数据归属性的确认扎根于数据本身[18]:①基于确实性的数据收集讲求的是数据收集的情境性,它之所以能够获得脱离于调查者的价值、动机、偏见,发现并追踪至数据根源,主要在于其主张涉及调查的利益相关者应在情境交互中实现视域融合,并通过差异性的交互超越最初个人视域的成见和问题。②为了保证基于确实性的数据收集可追踪至数据根源,确认性稽核程序必不可少,需要测量机构与学校相关人员共同组成审计调查组,通过对收集到的“原材料”和“压缩过程”进行检验并确认,在完成相应“审计”之后提出应答性意见。同时,测量机构应明确规定“审计”流程中的相关人员要为自己的行为承担法律责任,任何越界的行为都将受到法律的约束。
[1]王海涛,董玉雪,于晓丹,等.教育质量评价标准的价值建构[J].湖南师范大学教育科学学报,2017,(1):103-108.
[2]周兴国,任超.澳大利亚高等教育教学评价体系重构实践研究——以学习与教学质量指标系统为例[J].中国高教研究,2023,(1):51-56、70.
[3]杜明峰.教育质量评价的科学取向及其伦理反思[J].教育发展研究,2022,(6):65-70、77.
[4]丁晓红.马克思主义哲学原理[M].上海:同济大学出版社,2004:51.
[5]刘振天.破“五唯”立新规:教育评价改革的本体追求与成本约束[J].高等教育研究,2022,(4):8-17.
[6]陈玉琨,欣文.教育评价理论的突破与创新——陈玉琨教授访谈[J].学术月刊,2000,(5):108-113.
[7]谭维智.人工智能教育应用的算法风险[J].开放教育研究,2019,(6):20-30.
[8][11]荀振芳.大学评价活动的基本逻辑与价值选择[J].清华大学教育研究,2021,(3):39-46、64.
[9]杜瑛.高等教育评价范式转换研究[M].上海:上海教育出版社,2013:112.
[10]沈伟伟.算法透明原则的迷思-算法规制理论的批判[J].环球法律评论,2019,(6):34.
[12][丹]克里斯蒂安·马兹比尔格.谢名一,姚述译.意会算法时代的人文力量[M].北京:中信出版集团,2020:前言XII.
[13][14]叶赋桂.教育评价的浮华与贫困[J].清华大学教育研究,2019,(1):18-21.
[15]刘旭东,屈塬.论教育质量话语创新与教育高质量发展[J].国家教育行政学院学报,2023,(5):57-65.
[16]崔帅,郭贵春.科学解释的计算化[J].科学技术哲学研究,2022,(5):60-67.
[17][英]维克托·迈尔·舍恩伯格,肯尼思·库克耶.盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:105.
[18][美]埃贡·G·古贝,伊冯娜·S·林肯.秦霖,蒋燕玲,等译.第四代评估[M].北京:中国人民大学出版社,2008:178.
From “By people” to “For people”: The Essential Return and Realization Path of Quality Quantification Methodology in Educational Quality Evaluation
TANG Yi-ying1CHEN Xiao-shan1TAN Wei-zhi2
In the era of algorithms, quantitative analysis of education quality has become a key technical means of education quality evaluation. However, existing studies have concentrateon the construction and reflection of the quantitative methods of educational quality, and seldom involved the complete thinking and construction of the methodology itself. Therefore, this paper focused on the quantitative methodology of educational quality evaluation, and analyzed the possibility of quantitative analysis of educational quality from the deterministic, quantitative, comparative and decomposable characteristics inherent in the quality concept. Secondly, this paper analyzed the essence of the current educational quality quantification methodology, and further determined the instrumental basis of the educational quality quantification dominated by the measurement subjects and focusing on “intermediary means to achieve” as the ultimate goal. Finally, it was pointed out in this paper that as an evaluation activity existing “for the development of people”, the future quantitative methodology of education quality should shift from the evaluation of “by people” to the evaluation of “for people” based on the educational standpoint, and accordingly reconstructed the humanistic of its realization path, expecting to provide reference for implementing the reform of educational quality evaluation in the new era.
quality quantification; education quality; education quality evaluation
G40-057
A
1009—8097(2023)10—0024—07
10.3969/j.issn.1009-8097.2023.10.003
本文为国家社会科学基金2018年度教育学青年课题“大学排行对‘双一流’建设的影响研究”(项目编号:CIA180275)的阶段性研究成果。
唐懿滢,在读博士,研究方向为教育学原理,邮箱为tangyiying1994@126.com。
2023年3月27日
编辑:小时