朱德全 吴虑
摘要:按照图灵奖获得者吉姆·格雷的划分,科学研究可分为四种范式,将理论、实验和计算仿真统一起来的数据密集型科学范式(eScience),即为第四范式,其强调通过数据来发现并理解世界,为人类认知和科学研究提供了新方法和新视角,该范式与教育评价的结合必然会开创“数据密集型评价”,并将教育评价推向智能化阶段。第四范式将从本体论、认识论、价值论和方法论层面引发教育评价变革:丰富教育评价本体论,将教育评价视为嵌入式评价和多元化评价,打破单一类型评价观;重塑教育评价认识论,通过促进教育评价主体多元化,支持教育评价对象主体化,助推评价主体与评价对象形成“联结机制”,走向平等协商共同参与,消解单主体权威评价观;深化教育评价价值论,坚守“问题”导向的底线价值,凸显“目标”导向的中线价值,强调“效能”导向的顶线价值,超越传统评价的甄别和选拔导向;变革教育评价方法论,形成“全样本数据+复杂模型+归纳分析+可视化反馈”的评价路径,扩大教育评价主体的有限理性,从而使教育评价不断走向智慧化和专业化。
关键词:教育评价;大数据;专业化;第四范式
中图分类号:G434 文献标识码:A 文章编号:1009-5195(2019)06-0014-08 doi10.3969/j.issn.1009-5195.2019.06.002
教育评价是我国深化教育体制改革,推进教育现代化的关键环节,其重要性不言而喻。但囿于科学性和技术性不足,我国教育评价名目繁杂浮华,实质评价缺失,评价功用贫困,公信力大打折扣(叶赋桂,2019)。如何优化教育评价深受政府和学界关注,党的十八大以来,国家出台了系列招生考试、人才项目评价改革文件,2018年全国教育大会更是明确强调,要坚决破除“五唯”顽瘴痼疾,从根本上解决教育评价指挥棒问题。当前,教育信息化的持续推进使得大数据正在进入教育的方方面面(维克托·迈尔-舍恩伯格等,2015),其作为“数据、技术、思维三足鼎立的产物”(维克托·迈尔-舍恩伯格等,2013),能为教育评价带来海量时间尺度密集、空间尺度多样、价值尺度多元的教育大数据(王战军等,2015),同时提供挖掘教育数据潜在价值的技术手段和思维方式(赵伶俐,2014)。为此,国务院在《促进大数据发展行动纲要》中专门提及教育文化大数据工程,要求推动教育基础数据的伴随式收集和全国互通共享;《国家教育事业发展“十三五”规划》也明确提出,“鼓励学校利用大数据技术开展对教育教学活动和学生行为数据的收集、分析和反馈,为推动个性化学习和针对性教学提供支持”。诚然,大数据的价值日趋凸显,已成为教育评价变革与创新的重要驱动力量。
一、第四范式教育评价分析框架
大数据时代的到来,将事物的可量化程度和范围空前推进,催生出数据密集型的知识发现,驱动着科学研究范式转换。按照图灵奖获得者吉姆·格雷的划分,科学研究可分为四种范式:用于描述自然现象的实验科学范式(Empirical Science),利用模型和归纳法的理论科学范式(Theoretical Science),对复杂现象进行计算机仿真的计算科学范式(Computational Science),将理论、实验和计算仿真统一起来的数据密集型科学范式(eScience),也称之为第四范式。第四范式是通过仪器收集数据或通过模拟方法产生数据,然后用软件进行处理,再将形成的信息和知识可视化呈现(Hey et al.,2012)。这使得人们不需要再借助“望远镜”或“显微镜”来观察世界,而只需通过数据来发现并理解世界。毫无疑问,大数据的诞生为人类认知和科学研究提供了新方法和新视角,其与教育评价的结合必然会开创“数据密集型评价”新范式,并将教育评价推向智能化阶段,即基于全样本、全过程、全景式的元教育大数据进行数据挖掘和学习分析,使教育评价专业化成为可能。
“范式”是贯穿于库恩科学哲学思想的一个核心概念和理论体系。库恩在1962年出版的著作《科学革命的结构》中对“范式”作出了系统性阐释,但由于将概念从认识论范畴上的共有范例扩展为科学共同体共有的信念、基本观点、价值标准、具体操作规范等认识世界和理解世界的工具、精神定向工具的综合体(陈俊,2007),导致“范式”富有“过分的塑造性”,“几乎可以满足任何人的任何需要”(托马斯·库恩,2004),从而引发了诸多误解和争议。针对库恩提及的21种“范式”概念,英国学者玛格丽特·玛斯特曼从三个层次进行了概括:一是哲学层面的形而上学范式,即科学共同体所共识的信念;二是社会学范式,即科学共同体普遍认可的学术传统和学术研究的理论框架,主要包含概念系统、基石范畴和核心理论;三是构造范式或人工范式,即解决问题的工具与方法,这三类范式相互联系成为一个有机体(Masterman,1970)。库恩认为范式间具有不可通约性,这是导致范式更迭或转换的根本原因。当旧范式的基本理论和方法在解释或解决某一问题时出现反常,就意味着原有范式已经面临危机,而范式的世界观功能及其作为“认知工具”的本质性意义,决定了只有转变世界观,基于新的立场和认知视角才能包容反常(托马斯·库恩,2012)。一旦立场和认知视角发生转变,科学共同体对研究目标和价值标准的设定以及研究方法和操作模式的选择必然也会受到相应影响,这可归结为范式的价值论和方法论功能(杨怀中等,2008)。据此,第四范式即“数据密集型评价”的出现,将会从本体论、认识论、价值论和方法论层面引发教育评价变革。因此,笔者以本体论、认识论、价值论和方法论四个方面作为分析框架,深入探讨第四范式如何促进教育评价走向智慧化和专业化。
二、丰富本体论:第四范式拓展教育评价意涵
如何理解教育评价、解释教育评价,是现代教育评价基本理论的首要问题,直接关系着教育评价活动的立场和认知视角。得益于大数据技术,第四范式教育评价在教育活动监测上实现了时间维的连续性、空间维的全域性和价值维的多元性,相应地,对教育大数据的识别和采集也突破了时空和类型限制,海量实时性强、真实度高、颗粒度细和内容广泛的教育评价依据全面汇聚,利于打破单一评价类型,使教育評价更加科学多元。
1.第四范式教育评价是贯穿于教育活动始终的嵌入式评价
教育是一个反馈调控的过程,教育质量的高低在一定程度上取决于其是否能成为一个自我调控和自我完善的系统(裴娣娜,2005)。教育系统要实现自我调控和完善,就必须依赖教育评价对教育活动进行实时监控并提供持续性信息反馈,即实现教学评一体化。回溯教育评价发展历程,现代教育评价自发端以来经历了测量、描述、判断和建构四个时代,依次形成了工具导向、目标导向、决策导向和价值导向的教育评价理念,评价方法实现了由简单到多元的扩展,评价类型也从强调终结性评价转向形成性评价。但从评价时间和空间来看,这四代教育评价与教学和学习活动仍然是相分离的,尚未真正实现教学评一体化,教育评价的智能化水平不高。具体而言,教育评价与教学的“共时性”被阻断,教育评价通常在教学之后,是教学的终点;“共域性”被隔断,教育评价和教学不在同一个情境或空间之中(于开莲,2016)。这导致教育评价相对滞后,评价无法实时获取过程性教育数据,更不可能为教学活动改进及时反馈最有效的信息。大数据时代,泛在网络、移动通信、传感器、云计算等信息技术飞速发展,教育数据爆炸式增长,同时大数据技术能够对教育活动中实时产生的海量数据进行动态捕捉和深度挖掘,这使得第四范式教育评价成为一个智能化的动态信息反馈系统。具体而言,大数据支持下的教育评价能够对教育活动进行动态监测和控制,持续搜集和处理与教学相关的信息,并及时将评价结果反馈给利益相关主体,使其不断调整和变革教学和学习行为,实现教育系统的动态平衡和教育质量的持续改进。可以说,大数据时代的教育评价并非单向度的结果性评价,而是贯穿于整个教育过程的伴随式评价,教育评价与教育教学活动不再是线性关系,而是构成一个反复迭代的循环回路,其能促使教育成为一个“自我纠正系统”,真正实现以评促改、以评促教、以评促学、教学评合一。
2.第四范式教育评价是一种多元化评价
“五唯”顽疾在我国教育评价中根深蒂固,评价学生“唯分数”,评价学校“唯升学”,评价教师“唯论文”,引进人才“唯文凭”“唯帽子”,这种“一刀切”的评价方式已经严重困扰我国教育质量的提升和教育现代化的推进。作为评价改革的“牛鼻子”,考试招生制度首当其中。受“学而優则仕”传统观念的影响,“唯分数”和“唯升学”的评价观在当前教育质量评价中大行其道,政府和教育行政部门将学生学业成绩和升学率视为统一的评价标准,过度关注非自然状态下学生的单维认知能力发展结果,对其他能力的评价则被遮蔽,严重影响了学生的全面发展。事实上,“唯分数”和“唯升学”的教育评价属于抹杀学生特质和个性发展的终结性评价,其对教育发展起到的只是监测作用而不是反馈和促进作用。随着知识经济时代的到来,社会对复合型人才和创新型人才的需求日趋迫切,单一的评价内容已经无法适应需要,市场更看重学生解决问题的能力、探究精神、创新能力、沟通合作能力、社会责任感和良好的心理素质等,这就意味着教育评价要实现范畴和内容上的扩展,重视德智体美劳综合评价。大数据时代,教育评价能够依托生物信息技术、虚拟现实、情境感知技术等,嵌入式采集学习者在真实状态下展现出的复杂能力数据,并通过建模绘制出学生综合能力发展轮廓图,从而大大增强教育评价结果的可用性。可见,从评价内容或范畴而言,第四范式教育评价以“落实立德树人根本任务”为统领,将评价扩展到“一切教育和教育的一切”(朱德全等,2013),使评价真正能够促进学生全面发展和教育质量的提升。从评价目的而言,第四范式教育评价涵盖了诊断性评价、形成性评价和终结性评价。大数据技术能对不同阶段的教育活动进行监测评估,即对一个完整的教育过程实施前馈控制、实时控制和后馈控制,每个阶段都依赖于从教育信息流中提取数据、分析处理并进行反馈,这种基于数据又超越数据的反馈能够更好地服务于教育管理和决策。从评价范围而言,第四范式教育评价既关注对群体的评价,又重视对个体的评价。大数据技术不仅能够对整个教育活动进行“全面性”质量监测、“全员性”主体关照、“全方位性”数据搜集、“全域性”监督跟踪(朱成晨,2018),而且能够对评价对象个体进行“个性化”“适应性”考量,这使得教育评价既能从整体上促进教育的改进和发展,又能关注到个体发展的特殊需求,真正成为评价对象发展的“脚手架”。从评价方法而言,大数据技术能够综合处理结构化、半结构化和非结构化数据,将定量评价和定性评价进行统整,有效避免单一量化评价导致的绝对性,从而增强评价结论的科学性。
三、重塑认识论:第四范式催生教育评价共识
认识论的核心是认识主体与认识对象的关系,而技术手段会极大地影响两者间的关系(吕乃基,2014)。大数据时代,“数据驱动”激发了越来越多的教育利益相关者参与教育评价,且增进了评价主体之间、评价主体和评价客体之间的交流,这在一定程度上消除了评价过程中的“信息孤岛”和“数据壁垒”,克服了教育评价认知有限性和模糊性,使教育评价更加全面精准。
1.大数据驱动教育评价主体多元化
教育评价作为一项具有极强复杂性和丰富性的实践活动,其生命力源于多元主体共同参与和协商(陆启越等,2018)。追溯教育评价发展史,“多元主体参与”最早由美国教育评价学专家派特(Patton,M.Q.)于1978年在《使用定向评价》一书中提出,主张只有将需要使用评价信息的各方人士邀请到教育评价中,并让其基于各自立场对教育评价提出要求和建议,才能使教育评价结果更好地满足不同使用者的需求(蔡敏,2003)。随后,第四代教育评价加以继承发展,进一步明确提出多元主体“全面参与”“协商对话”“共同建构”以及“价值多元化”评价理念。可见,理想的教育评价应该是相关利益主体共同参与并表达多元价值诉求,进而通过平等协商的方式在评价标准和评价关键点上达成共识。但长期以来,我国教育评价主体较为单一,政府和教育行政部门是最主要的评价主体,学校、学生、家长和社会等教育利益相关者则处于边缘被动地位,评价过程缺乏对不同利益主体内在发展价值诉求的协调,评价标准过于统一和刚性,忽略了不同主体间的差异性,严重制约了教育评价结果的客观性和有效性。大数据时代,教育信息化的不断推进既让多元利益主体能借助网络平台获取所需教育信息,同时又为其提供了信息交流和信息共享渠道,使各个利益主体能够及时表达自身发展需求和价值诉求,并实现交流协商,从而共同制定出一个科学合理的评价标准,使教育评价更具有针对性。
2.大数据支持教育评价对象主体化
从应然层面看,教育评价对象主体化是教育评价必须遵循的逻辑,这是由教育评价自身本质所决定的(熊杨敬,2018)。教育评价主体要对评价客体作出价值判断,不只是需要认识评价客体本身是什么和有什么的事实,而是要结合评价主体的主观意图,即基于评价主体需要什么以及能够接受什么来认识评价客体的事实。教育评价主体的主观意图和评价客体的客观事实两者有机结合才构成“教育价值判断”的前提。换言之,“评价客体能够或已经给评价主体提供了什么”“评价主体能够或已经从评价客体那里获取了什么”,即教育供给方供给了什么,以及其对教育需求方的满足程度才是教育评价所要认识的对象,这又称之为“价值事实是主体性的事实”(李德顺,1987)。在传统教育评价中,客体对主体的满足程度无法准确量化,只能依据评价主体的经验和主观感受作出大致判断,这导致教育评价结果存在模糊性,无法为教育改进提供精准反馈。而大数据的出现和发展将教育活动的可量化程度空前推进,依靠大数据技术能够动态捕捉海量的教育过程性数据,尤其能够在真实情境中采集教育利益相关者的行为数据并进行深度挖掘和对比分析,准确找出供需差距,进而对教育评价客体作出精准的价值判断,增强评价信度。
3.大数据助推教育评价主体与评价对象的关系由主客体转向主体间性
一般而言,教育评价主体与评价对象是彼此交融相互渗透的一体,当教育评价对象是人时,两者还可以相互转换,这意味着任何科学的教育评价中都不能将两者视为简单的主客体关系。但在传统教育评价中,以管理者为主的单一评价主体往往被视为“裁判员”,处于绝对的主体地位,决定着教育评价内容和评价标准,评价对象只能被动、无条件地接受。这种强调单一评价主体相对于评价对象的主导地位,过分夸大了行政主体或权威主体对教育评价对象的支配作用,容易导致教育评价流于形式和脱离实际,从而制约教育评价效果。大数据时代,多元主体参与教育评价重塑了评价主体与评价对象的关系,即由主客体关系转为主体间性关系,被评者以主体身份积极参与到教育评价中,由被动接受评价转为主动合作,同其他主体一起通过平等协商参与教育评价,在评价中进行自我反思和自我学习。总之,第四范式教育评价能促使评价主体与评价对象之间的关系发生交互,形成一种“联結机制”,使两者彼此信任,相互合作,从而消解传统教育评价中的单主体权威评价观,建立起平等对话模式,为达成“教育评价共识”提供可能。
四、深化价值论:第四范式回归教育评价本真
根据范式的价值论功能,其不仅能为科学共同体确立研究目标,也能引导共同体的研究和决策走向细微化、专业化(杨怀中等,2008)。就教育评价而言,价值论可以通过评价的导向体现出来。不同于传统教育评价的甄别、选拔导向,第四范式教育评价的价值论主要体现为精准改进、达成目标和促进发展。
1.第四范式教育评价坚守“问题”导向的底线价值
这主要体现为教育评价能精准诊断问题和预测问题,为即将进行的或正在进行的教育活动提供信息反馈,进而调整和改进教育方案、教育计划、教育活动或教育过程中存在的问题,以达到提升教育质量的目的。对教育活动问题的诊断和预测主要体现在教学领域,即学情分析和对前一阶段学习情况的评价。在传统教育评价中,往往以标准化测试和常模测试产生的结构化数据作为依据,局限于对学习者群体特征的关注,忽略了个体发展差异,对问题的诊断和预测也缺乏精准性和针对性。而在大数据时代,教育评价能基于数据挖掘算法、机器学习、回归分析等学习分析技术,多维度多层次收集学生学习行为相关数据,如原有知识基础、学习态度、学习动机、学习兴趣等认知和非认知数据,并借助复杂算法挖掘数据背后的潜在价值,精准诊断当前学习存在的问题,或是通过相关关系法则精准预测学习者未来的学习趋势(孙洪涛等,2016),从而及时调整教学设计和教学策略,干预和消除教学和学习中的不确定性因素(杨现民等,2016)。如加拿大著名的教育服务公司Desire2Learn利用“学生成功系统” (Student Success System), 结合已有的学习数据预测学生是否适合某门新课程,以及在未来课程学习中可能面临的问题,这既有助于客观评估学生的学习能力,又能引导教师适时提供科学的教学介入以确保教学和学习的有效性(杨现民等,2015)。总之,第四范式教育评价能够基于数据精准地诊断和预测教育活动中的短板,并及时作出改进。
2.第四范式教育评价凸显“目标”导向的中线价值
“目标”导向的价值是指教育评价要充分发挥鉴定和导向功能。从应然层面看,要以教育目标为基准,一方面鉴定教育组织、教育方案、教师或学生等评价对象是否达到了教育目标,以及达成教育目标的程度,并对比两者找到“最近发展区”;另一方面,要通过开展科学的教育评价活动,引导评价对象达成教育目标。可以说,教育评价的目标导向价值实质上是要促使评价对象的行为产生某些期望的变化(Tyler,1949),这意味着评价要更加关注个体,以及个体学习行为发生的过程和程度,即重视过程性评价。在传统评价中,由于数据采集和处理技术较为粗糙,无法对自然状态下评价对象的真实学习行为轨迹进行监控,导致无法鉴定其学习状态与预期目标之间的差距,也就不可能实现基于证据的个性化教学和适应性教学。可以说,传统教育评价更多是以终结性评价的方式对群体水平进行鉴定,没有针对个体发挥精准的导向功能。与之不同,第四范式教育评价更加关注个体,重视通过数据生发个性化学习决策。具体而言,其能借助Experience API(xAPI)技术、Wiki技术对真实或虚拟学习中个体的学习行为特征数据进行精细化记录和无损采集,并能存储和检索可扩展的学习记录,如学习交互、学习进度、学习时间和频率、学习轨迹、情感表现、任务用时等复合化数据(吴虑,2019)。然后,从这些海量数据中了解个体的学习特征、学习进程和进一步学习需求,并在此基础上进行教育教学决策,即结合个体需求定制个性化学习资源和学习路径,不断缩小个体的“最近发展区”,在最大程度上达成教育目标。例如,MOOCs和翻转课堂在大数据技术支持下,能够对学生的学习行为进行实时监控和评价,为教师精准判断不同学生的学习偏好、学习风格、知识缺陷等反馈可靠依据,并引导教师有针对性地实施个性化教学,从而促成教学目标。总之,第四范式教育评价以大数据为支撑,以计算和建模为手段,能实现针对个体的精准数字画像,洞察个体“最近发展区”,这在很大程度上提升了教育评价的科学性和有效性。
3.第四范式教育评价强调“效能”导向的顶线价值
正如第四代教育评估理论创立者埃贡·G·古贝所言,“评价的意义在于促进发展”(埃贡·G·古贝等,2008)。增进效能意味着发展,包括教育教学的发展和人的发展。其一,就促进教育发展而言,要求教育评价必须是一种增值性评价。增值评价是基于“学校能增加‘价值到学生学习成就中”这一假设提出的(萨丽·托马斯等,2005),强调通过收集学生在不同时间节点上的标准化测验成绩,同时将不受学校和教师控制但又会影响学生学业成绩的因素(如学生原有认知水平、人口学变量、家庭背景情况、生源地经济发展水平等)剥离开来,考察学生在某段时间内的“学习增益”,估算出学校和教师对学生学业发展的“净效应”,并进一步计算学校各个因素对学校和学生发展的影响程度,找出制约学校教育质量提升的关键因素,从而有针对性地提升学校发展效能(辛涛等,2009)。长期以来,对学校和教师的评价通常依据学生的平均成绩或升学率,指标较为单一,且无法控制影响学习成绩的非学校因素,这导致评价结果的信效度受到质疑。大数据时代,依托超时空的信息采集和先进的分析技术,第四范式教育评价能够超越简单的分数统计,引入多元线性回归模型和多水平分析模型,严格控制变量,准确计算出学校和教师的效能,并检视教育发展中存在的问题及其影响因素,同时不断加以改进实现教育的增值。其二,就促進学生发展而言,我国的教育评价必须坚持“把立德树人作为根本任务”,指向学生的生命成长。传统教育评价过于追求功利价值,学生的发展被条分缕析的评价指标体系与统一的评价标准所控制,这导致学生的个性特征逐渐迷失,精神追求逐渐衰微,生命活力被遮蔽(杨鸿等,2018)。第四范式教育评价依托大数据技术能够实现对个体教育数据的超时空、持续性采集和匹配推送,实现对学生生命成长的精准服务,不再将学生视为工具人、单向度的人,而是作为一个独特的、完整的个体,在评价中实现对个体发展差异的关照;同时大数据支持对个体成长的纵向追踪,这利于建构学生的生命成长轨迹,同时唤醒和激发学生的主体精神,促进学生的生命成长。
五、变革方法论:第四范式增强教育评价智慧
审视我国传统教育评价,囿于教育数据稀缺和分析技术滞后,评价的方法论主要体现为基于假设或评价目的有针对性的小规模抽样实证,或是依托教师的经验总结和理论推导,这导致教育评价结果过于同质化、经验化和抽象化,严重制约了教育评价质量提升。随着大数据的深入驱动,智能化技术开始追求全样本,接受数据的混杂性和非精确性,关注数据隐含的相关关系(维克托·迈尔-舍恩伯格等,2013),这改变了传统以抽样数据为主的评价方法,促使教育评价各环节即信息采集、价值判断和结果反馈都始终贯穿于整个教育数据流中,依靠数据发声,从而推进教育评价精准智慧运行,提升教育评价信效度。
1.全时空场域数据无损采集提供可靠性依据
信息论奠基者香农认为,信息是对事物运动状态或存在方式的描述,获得信息就可以消除认识主体对于事物运动状态和方式的不确定性。要使一个系统从无序变为有序,必须从外界获取信息(唐世伟等,2008)。教育评价正是通过教育信息来认识教育活动并作出价值判断,教育信息的多寡、真实与否直接关乎价值判断的可靠程度。换言之,要增强教育评价信度,就必须提升教育信息的数量和质量。当前,大数据、人工智能和物联网等新兴技术与教育的融合重塑着教育秩序和教育生态,日趋开放智慧的教育系统在开展教学、管理、科研和服务等活动中正在生成海量的教学数据、学生数据、管理数据和教育舆情数据等,这些源于国家、区域、学校、课程和个体层面的教育大数据汇聚成立体化数据网络(杨现民等,2015)。不同于传统评价,大数据支持下的教育评价信息采集不再是取决于评价目标的小规模抽样,也不只局限于非自然状态下产生的时段性断层数据,而是通过物联网感知技术、视频录制技术、图像识别技术和平台采集技术,对教育过程中实时生成的多源、异构、多模态、不连贯语义的大数据进行持续性采集。这种采集方法在数量上强调全域性、全样本和细颗粒;类型上关注表象性结构化数据,重视价值隐喻的半结构和非结构化数据;质量上凸显真实性和客观性,纵深采集教育活动中产生的情境化和过程性数据。可见,教育评价第四范式的数据采集方法有助于极大增强教育评价依据的可靠性,为专业化教育评价提供强解释力证据。
2.多元方法的数据融合分析驱动精准化判断
价值判断是教育评价中最为核心的环节,其直接关系到教育评价的信效度。传统教育评价主要利用“小数据”定量评估方法,以及基于因果关系思维进行逻辑推理,以验证相关假设或佐证专家判断。由于整个教育评价过程依赖于专家,所以评价专业性取决于专家经验和知识的权威程度,评价的科学性则由票决、回避和公开等程序性规定来保证(王战军等,2015)。这种经验主义取向的教育评价主观随意性强,评价结果的可信度和权威性面临挑战。当前,大数据技术的崛起颠覆了传统数据分析方法,能更快速、精确、有效地从海量细颗粒教育大数据中挖掘出有价值的信息。与传统评价对结构化数据的简单统计不同,大数据技术能对海量繁杂的教育数据进行清理、脱敏和转换,以控制数据冗余与缺失引起的不确定性,驾驭数据高速增长与交叉互联引发的涌现性(徐宗本等,2014);并利用学习分析和数据挖掘技术进行多元回归分析、分类聚类算法、语义分析、系统建模和决策树分析等,进而从隐喻、模糊、毫无关联的教育大数据背后洞见本体共生的表征价值、交互产生的关联价值以及多方协同创生的决策价值(刘桐等,2018),最大限度地实现数据分析的科学化和理性化。
同时,大数据驱动教育评价走向专业化和精准化,还在于大数据能结合所挖掘信息作出具有更高解释力和预测力的价值判断,这是由大数据思维引发的方法论变革所决定的。大数据思维强调由“始于假设”的“小数据”评估转为“基于证据”的“大数据”实证研究,由强调因果关系转为探究事物间的相关关系或某种规律性,这使得评价方法论由“假设-演绎逻辑”转向“数据-归纳逻辑”。具体而言,深受波普尔证伪主义影响,传统教育评价的价值判断环节主要遵循“定性-定量-定性”的分析方法(李金昌,2014),首次定性是提出评价假设,为定量分析提供教育数据采集方向和范围;而定量分析是对有限数据进行统计推断,并结合概率由样本推断整体,即从“小数据”中演绎出尽可能多的信息量;再次定性则是以定量结果回应专家判断或是检验评价假设。由于传统教育评价各环节都依赖于相关理论体系或评价主体的知识经验,这容易导致评价结果存在“路径依赖”和“个性依赖”倾向(刘涛雄等,2017),一旦某个环节出现问题,那整个教育评价将毫无意义,甚至会阻碍教育决策与管理。大数据的出现,催生了“数据驱动”的教育评价范式,使得教育评价结论的获取由演绎法转向“数据+模型+分析”基础上的归纳法。这意味着教育评价活动不再受预设的限制,也不局限于因果关系探究,而是借助特定算法对“大数据”进行分析,从而归纳出教育数据背后隐含的关联性和规律性。此外,大数据通过对复杂教育系统中动态变化的相关关系进行分析,还能实现对教育活动的预测和干预。总之,大数据不仅为教育评价提供了高速、客观、准确的数据分析方法,也为教育价值判断革新了方法论,这在一定程度上消除了教育评价中的主观性和不确定性,扩大了教育评价主体的有限理性。
3.直观可视化结果及时反馈增强评价有效性
有效的教育评价离不开教育信息的“深入浅出”,这表明既要能对教育信息进行深入挖掘,更要及时将评价结果清晰准确、直观简洁地反馈给评价对象和相关利益主体。可以说,教育评价是否有效,在很大程度上取决于教育评价结果的反馈质量。传统教育评价在结果反馈过程中,时常面临信息不对称和信息超负荷双重矛盾(王战军等,2015):一方面,人们试图从教育评价结果中掌握尽可能多的信息,但结果反馈往往是几组缺乏深层次解读的数据,或笼统模糊的文字描述,可读性不强;另一方面,卷帙浩繁的反馈信息超出了个体的信息接受和处理阈值,造成认知负荷,从而制约评价效用的发挥。大数据时代,第四范式成为助推教育评价走向现代化和智能化的革命性力量,其通过变革反馈形式、反馈周期和反馈范围,不断促进评价结果的高效交付,进而增强教育评价效能。具体而言,在反馈形式上,大数据技术借助数据可视化工具将教育评价结果以直观明了的图形、图像信息呈现出来,增强了评价结果的可读性,使评价结果能够清晰有效地传达给相关利益主体。在反馈周期上,大数据技术通过对教育活动的即时动态监测,能从实时生成的教育大数据中挖掘出有价值的信息,并及时反馈,使得“评价-反馈-改进-评价……”反复迭代,以实现对教育活动的持续性改进。在反馈范围上,一是由教育决策者扩大到教育利益相关者,让多元利益主体能够基于不同立场全面客观地了解教育发展概況和把握教育发展趋势,进而引发“循证性”教育决策;二是由面向群体反馈发展为面向群体和个体的反馈,尤其强调进行有针对性的个性化反馈,这使得教育评价专业化水平不断提高。
参考文献:
[1][美]埃贡·G·古贝,伊冯娜·S·林肯(2008). 第四代评估[M]. 秦霖,蒋燕玲. 北京:中国人民大学出版社:29.
[2][美]托马斯·库恩(2004). 必要的张力——科学的传统和变革论文选[M]. 范岱年,纪树立等. 北京:北京大学出版社:287.
[3][美]托马斯·库恩(2012). 科学革命的结构(第四版)[M]. 金吾伦,胡新和. 北京:北京大学出版社:79-113,114.
[4][英]维克托·迈尔-舍恩伯格, 肯尼斯·库克耶(2013). 大数据时代:生活、工作与思维[M]. 盛杨燕,周涛. 杭州:浙江人民出版社:160,29.
[5][英]维克托·迈尔-舍恩伯格, 肯尼斯·库克耶(2015). 与大数据同行——学习和教育的未来[M]. 赵中建,张燕南. 上海:华东师范大学出版社:1,121.
[6]Hey, T., Tansley, S., & Tolle, K. (2012). 第四范式:数据密集型科学发现[M]. 潘教峰,张晓林等. 北京:科学出版社:10.
[7]蔡敏(2003). 论教育评价的主体多元化[J]. 教育研究与实验,(1):21-25.
[8]陈俊(2007). 库恩“范式”的本质及认识论意蕴[J]. 自然辩证法研究,(11):104-108.
[9]李德顺(1987). 评价论[M]. 北京:中国人民大学出版社:25.
[10]李金昌(2014). 大数据与统计新思维[J]. 统计研究,(1):11-16.
[11]刘涛雄,尹德才(2017). 大数据时代与社会科学研究范式变革[J]. 理论探索,(6):27-32.
[12]刘桐,沈书生(2018). 从表征到决策:教育大数据的价值透视[J]. 电化教育研究,(6):54-60.
[13]陆启越,余小波(2018). 高校德育评价范式及其转变[J]. 湖南师范大学教育科学学报,(2):103-108.
[14]吕乃基(2014). 大数据与认识论[J]. 中国软科学,(9):34-45.
[15]裴娣娜(2005). 现代教学论[M]. 北京:人民教育出版社:325.
[16]萨丽·托马斯, 彭文蓉(2005). 运用“增值”评量指标评估学校表现[J]. 教育研究,(9):31-35.
[17]孙洪涛,郑勤华(2016). 教育大数据的核心技术、应用现状与发展趋势[J]. 远程教育杂志,(3):41-49.
[18]唐世伟,刘贤梅(2008). 信息论[M]. 哈尔滨:哈尔滨工程大学出版社:4.
[19]王战军,乔伟峰,李江波(2015). 数据密集型评估:高等教育监测评估的内涵、方法与展望[J]. 教育研究,(4):29-37.
[20]吴虑(2019). 大数据支持下学习评价的价值逻辑[J]. 清华大学教育研究,(1):15-18.
[21]辛涛,张文静,李雪燕(2009). 增值性评价的回顾与前瞻[J]. 中国教育学刊,(4):40-43.
[22]熊杨敬(2018). 教育评价多元主体的共同建构——基于对话哲学的视域[J]. 教育研究与实验,(5):74-78.
[23]徐宗本,冯芷艳,郭迅华等(2014). 大数据驱动的管理与决策前沿课题[J]. 管理世界,(11):158-163.
[24]杨鸿,朱德全,宋乃庆等(2018). 大数据时代学生综合素质评价:方法论、价值与实践导向[J]. 中国电化教育,(1):27-34.
[25]杨怀中,邱海英(2008). 库恩范式理论的三大功能及其人文意义[J]. 湖北社会科学,(6):101-104.
[26]杨现民,唐斯斯,李冀红(2016). 发展教育大数据:内涵、价值和挑战[J]. 现代远程教育研究,(1):50-61.
[27]杨现民,王榴卉,唐斯斯(2015). 教育大数据的应用模式与政策建议[J]. 电化教育研究,(9):54-61.
[28]叶赋桂(2019). 教育评价的浮华与贫困[J]. 清华大学教育研究,(7):18-21.
[29]于开莲(2016). 评价与教学:从分离走向融合[J]. 教育理论与实践,(4):53-56.
[30]赵伶俐(2014). 量化世界观与方法论——《大数据时代》点赞与批判[J]. 理论与改革,(6):108-112.
[31]朱成晨,闫广芬(2018). 现代化与专业化:大数据时代教育评价的新技术推进逻辑[J]. 清华大学教育研究,(5):75-80.
[32]朱德全,宋乃庆(2013). 教育统计与测评技术[M]. 重庆:西南师范大学出版社:230.
[33]Masterman, M. (1970). The Nature of a Paradigm[C]// Criticism and the Growth of Knowledge. Cambridge: Cambridge University Press:59-90.
[34]Tyler, R. W. (1949). Basic Principles of Curriculum and Instruction[M]. Chicago: The University of Chicago Press:105-106.
收稿日期 2019-06-30 责任编辑 田党瑞