高维嘉
(云南师范大学 信息学院,云南 昆明 650500)
近年来,人工智能、大数据等一系列信息技术被广泛应用于教育领域,数据驱动教育评价成为数字技术与教育深度融合的热点之一。2020 年10月,中共中央、国务院印发的《深化新时代教育评价总体方案》强调,要充分利用信息技术,提高教育评价的科学性、专业性、客观性[1]。2022年,教育部发布的《教育部2022年工作要点》中明确提出:“实施教育数字化战略行动。”[2]教育评价是教育发展的“指挥棒”,教育评价作为一种导向,影响着教育发展的方向。长期以来,我国的教育评价依然存在着模式陈旧、指标单一、数据资源匮乏、评价主观性强和算法灵活性差等问题。当前,传统的评价方式已无法满足教学质量监测评估的需要,因此,必须将数字技术赋能于教育评价中,进一步规范评价工作,逐步扭转当前评价工作中出现的“五唯”问题[3],构建科学化、客观化、智能化的教育评价体系。
基于此,本文借助CiteSpace 软件对我国数据驱动教育评价的相关文献进行可视化分析,通过对关键词、高频词、突现词的分析,探讨数据驱动教育评价的研究现状与热点,以期为未来我国教育评价的研究与实践提供参考。
本文采用系统文献综述法对收集的文献进行分析[4],这种方法可以清晰梳理要研究的文献的内容,通过选择、评价和整合等帮助研究者更好地开展研究。知识图谱以图形、图像形式来表示节点和关系,可以直观呈现相关知识概念并挖掘概念间的复杂关系,最终辅助用户决策[5];CiteSpace 软件能够用知识图谱的方式将研究内容的演化路径和前沿问题进行分析与预测[6]。因此,为了探索数据驱动教育评价的最新研究进展,本文以CiteSpace5.7R 5 为主要研究工具,对相关数据进行可视化分析处理,以直观的知识图谱方式展示作者合作、机构合作、关键词共现、关键词聚类、突现词等内容,并进行结果分析,以此揭示大量数据背后所隐含的规律,探究数据驱动教育评价的研究趋势。
文献数据来源于“中国知网”(CNKI),检索时间范围选定为2000 年—2022 年,采用高级文献检索方式。将“教育评价”设为第一个检索主题词,先后增加“数据驱动”“信息技术”“数字化”“智能化”“智慧化”“智能测评”等为第二个主题词进行检索,并精确匹配定位主题。筛选标准为:(1)国内中文文献;(2)排除学术会议论文、新闻报道、导读、硕博论文,主要采用期刊文献;(3)研究的核心主题要与技术赋能教育评价相关。按照以上标准,逐一检验和筛选结果,摘除相关性低、质量差的文献,选取与本次研究吻合度较高的文献。筛选后共获得955篇文献,本研究主要选取2010年—2022年的论文作为研究数据。
本文将检索到的955条文献信息导入CiteSpace,去除重复文献,选取了2010年—2022年发表的共813篇文献来绘制年代分布图,并按照论文发表的年份进行频次计数,得到2010 年—2022 年我国教育评价研究各年文献数量分布图(如图1所示)。
图1 近13年我国教育评价研究各年文献数量分布图
从图1中可以看出,从2010年至2022年,技术赋能的我国教育评价研究文献的数量呈直线上升的趋势,尤其是近两三年来增加的数量较为明显,且刊发在核心期刊(包括SCI、北大核心、CSSCI)上的论文数年均都在35 篇以上,在一定程度上也体现了技术赋能教育评价的研究有趋热的迹象。可以预见,在教育数字化发展的背景下,人工智能、大数据等新兴技术能够为重构评价机制、推动智能评价、建立师生画像、建设评价平台等提供支持。
利用软件对发文作者进行分析,可以得到数据驱动的教育评价研究领域的相关作者共现图谱(如图2所示)。该图谱有326个节点,111条连接线,各节点之间的连接过少,呈点状分布,仅有1/3的作者有合作关系,说明该领域的作者还缺乏团队合作研究,还需要加强各作者之间的联系。其中,图谱中显示该领域发文量排名前三的作者分别为:发文量为7 篇的董奇,其研究方向以科技赋能、智能教育评价为主;解成君、郑勤华两位作者并列排名第二,均发表了5 篇文章。解成君的研究方向为人工智能数字技术助力教育评价发展,郑勤华的研究方向主要是人工智能监测和在线学习测评;排名第三的是刘云生,发表了4 篇相关文章。除此之外,还有很多发文量为1-3篇的作者,他们构成了数据驱动教育评价领域的核心作者群,为教育评价的相关研究做出了较大贡献。
图2 作者共现图谱
进一步对排名前10 的发文机构进行统计(如表1 所示),可以发现:北京师范大学的发文量高达33篇,可见其已成为该领域的核心研究机构。发文量排名靠前的研究机构除了高校的教育学部外,还有部分高校(如华东师范大学和华南师范大学等)的教育信息技术学院和计算机学院。可以看出,研究者越来越关注数字信息技术与教育评价的融合发展研究。根据发文数量可以看出,对教育评价的研究主要还是集中于各个高校和一些教育评估研究院所。另外,各大高校研究机构之间的连接线几乎为0,说明以独立研究为主,机构之间缺乏合作,需要加强交流和合作,这样才能共同产出高质量的研究成果。
1.关键词分析
关键词的高频次和高中心性能够从某个角度反映出一段时间内该领域研究者普遍关注的核心内容,因此可以被用来确定某个研究领域的热点[3]。本文选取词频较高的前16 个关键词进行展示(如表2所示)。结合关键词共现网络图谱可知,目前研究者主要围绕“教育大数据”“智能测评”“深度学习”“信息技术”等技术开展教育评价研究。“教育大数据”出现的频次最多,说明大数据技术引起了研究者的高度重视。同时,“增值评价”“综合素质评价”也是学者研究的重点。
表2 我国数据驱动教育评价的文献高频关键词表
“高等教育”“职业教育”不是检索词却出现在了词表中,反映了研究者对这两个领域的高度重视。另外,“增值评价”“教学评价”“深度学习”等关键词的中心性值分别为:0.5、0.16、0.24,说明其在该领域中也起到了重要作用,但其词频却相对较低,说明研究者对其的重视程度还不够。
2.关键词聚类分析
为进一步明确学界对教育评价的研究主要集中在哪些细分领域,热点主题及其相互关系,本文通过CiteSpace 软件的关键词聚类功能,对近13 年我国数据驱动的教育评价进行关键词聚类分析(时间跨度选择2010-2022 年,时间切片选择1 年),生成关键词共现聚类图谱(如图3 所示)。图中关键词出现频率多少可由节点面积的大小展现,节点越大则表示出现的频率越高,可以从宏观上反映当前数字化环境下教育评价的研究现状。结合以上各细分领域,本文从新时代教育评价、评价理念、评价体系、评价主体、评价方法与工具五个方面总结教育评价研究的热点。
图3 关键词聚类图谱
(1)新时代教育评价
新时代教育评价是教育评价研究领域当前的重点和焦点,其关键词包括“立德树人”“破‘五唯’”“升学率”“考核评价”等,不同学者从不同角度发表了自己的观点与看法。例如,破除“五唯”是国家就深化高考改革和高等教育评价提出的新的要求。为此,不少学者就多元化评价展开积极探索,如李浩等人指出“建立多元评价录取标准,实现评价主体多元化,完善健全监督机制是中国高考多元评价体系探索实践之路的关键着力点”[7]。研究者积极探索教育评价的改革路径,旨在为贯彻党的教育方针,提高教育治理水平,促进教育现代化提供理论和实践上的价值。
(2)评价理念
《深化新时代教育评价总体方案》提出了“改进结果评价,强化过程评价,探索增值评价,健全综合评价”的“四个评价”新理念,成为我国教育评价的重要行动指南。“过程性评价”与“发展性评价”是我国教学评价模式改革的重要方向,其研究的难点在于对学习者学习过程的全程跟踪、数据收集和实时反馈。为此,上超望等学者研究了学习者的数据挖掘、学习分析和过程性评价数据结果展示等技术,能充分发挥过程性评价的优势,促进学习者学习质量的提升[8]。李景奇等试图通过借助大数据技术建设大数据监测预警平台,将发展性评价推广应用[9]。
“增值评价”是以学生发展为核心的一种评价模式,是国内外教育研究领域的热点和难点。增值评价倡导学生的进步、纵向的发展,也就是“自己和自己比”的纵向成长。学者汶莎莎等指出,增值性评价以促进学生进步为主,兼顾教育评价的“诊断”“激励”与“改进”功能,体现了教育教学评价的动态性和生成性,这种评价鼓励学生用自身独特的学习成果来展示个性化的发展“增值”,正是新时代教育评价的核心诉求[10]。但目前,增值性评价的数据获取主要还是依靠自陈式量表与标准化测试等途径,可见数据采集方式还比较传统、单一。为了能让数据更好地驱动评价方式的改革创新,研究者还需要不断探索增值性评价系统的开发,高效、客观、公正地对学生的学习进行增值评价,从而促进学生的全面发展。
(3)评价体系
《深化新时代教育评价总体方案》明确指出,我国要从学校、教师、学生三个层面进行评价改革,建立更加科学健全的教育评价体系。关键词聚类图谱中的节点“教育评价体系”包括了“评价指标体系”“中小学”“高考评价体系”等主题词,这说明我国教育评价体系的建设仍需在中小学评价、考试招生制度、教育督导、数据密集型评价新范式等重点领域持续发力[11]。目前,教育部考试中心发布了《中国高考评价体系》,有不少学者也对针对高考“学业评价”“综合素质评价”等相关主题开展了深入研究。
(4)评价主体
教育评价主体就是教育评价的实施者和组织者,评价主体多元化是当前评价改革的重要理念和方向。新课程改革要求,在课堂评价主体上要打破一元化评价的现状,开展教师评价、学生自评、学生互评的主体多元化评价。然而,在“学生评价”中,存在评价主体错位、学生自评意识不足、教师评价观念落后、学校评价功利性较强等问题。“教师评价”容易被绩效、问责、学生成绩、标准化等因素所影响。彭波等学者依托大数据和智能化技术,开展技术赋能的教育评价平台建设研究,以教育大数据为中心,通过智慧教室、在线学校系统等采集数据,实现人机交互的精准评价,关注学习过程的智慧多主体评价,消除主体单一、错位等不利影响,激发多元评价主体参与的积极性[12]。
(5)评价方法与工具
评价方法创新是建立教育评价体系的重要内容,当前国内外有的评价工作过于依赖数据,过于强调定量研究。其不足主要表现为:表征的教育现象单一,作为评价依据有孤立、偏向性和不全面性等缺点,数据本身可能存在可靠性问题[13]。因此,研究如何改进和应用计量评价,提升评价质量,成为新的课题。根据文献统计,学者们在评价方法或评价工具上多选择量化工具开展研究,量化评价研究成果的数量较多,如层次分析法、K-means算法、模糊数学、AHP 算法、BP 神经网络、矩阵理论等方面的研究较多。可见,当前教育评价领域比较重视实证研究,存在数据至上的评价思维,在一定程度上忽略了教育评价的人文性。有学者就此指出,教育评价领域对评价工具通用性的关注不够,工具设计面向的群体比较狭窄,因此要保证所有学习者无差别体验,避免数字化评价带来新一轮教育公平风险[14]。
教育评价是随着时代的更新和人们对教育功能认识的变化而不断演变的,本文对相关论文关键词进行突现分析(选取时间段为2010-2022 年,时间切片为2 年),可以了解该领域的发展路径和各阶段所出现的热点关键词。
在突现图谱中(如图3所示),CiteSpace 软件中默认了8 个突现词,从关键词突现强度来看,从强到弱的顺序是:大数据时代、教育评价、智慧教育、教育质量综合评价、发展性评价、改革、学习评价、教育信息化。在2010年首次出现“评价改革”这一关键词,说明在早期研究者就开始关注评价方式的改革,其热点一直持续到2017年。从2014年起,研究者们开始关注教育评价的理念创新,加强了对“发展性评价”“教育质量综合评价”等主题的探索和研究,是我国教育评价理念转变的一个转折点。从2018年开始,随着技术的不断发展,技术与教育评价的融合发展成为新兴研究方向,逐渐扩展到高等教育、基础教育、职业教育等领域。在“智慧教育”中的智慧评价是当前教育数字化转型中的重点问题,利用数字技术创新评价方式,已成为教育评价的大趋势。智慧评价可以围绕学习者特征,通过大数据技术开展教育质量监测,借助人工智能技术挖掘学生的学习潜能,动态监测与展示学习过程与结果,实现精准的智能测评与分析,从而为优化教学质量提供决策指导意见。
图3 8个突现关键词图谱
本文借助Citespace 软件可视化分析了教育数字化背景下数据驱动的教育评价研究的相关文献,主要有以下研究发现:第一,从发文量看,我国教育评价研究自2010 年来热度持续上升,于2021 年达到巅峰。在党和政府的领导下,各地积极探索义务教育质量评价改革,落实《深化新时代教育评价总体方案》,积累了大量有益经验,但评价方式方法还不够有效,单纯以升学率和分数评价学校与学生的倾向还没有得到根本扭转。第二,从研究作者与机构来看,有不少核心研究者和研究机构产出了很多优秀的研究成果,产生了较大的影响力,但作者之间的紧密性较差,呈独立分散状态分布,缺乏合作。第三,从关键词来看,我国教育评价研究离不开数据驱动和技术赋能,该领域的研究热点分布广泛、主题丰富,主要集中于新时代教育评价、评价理念、评价体系、评价主体、评价方法与工具等五个方面。大数据、人工智能、区块链等数字技术快速融入教育评价领域,为推动教育教学评价改革创新提供了条件,有助于推动评价方式的变革和评价内容的重构,为教育教学评价改革创新提供了可行途径。
1.未来更关注人才培养和能力素质评价
信息技术改变着人类的思维、工作和生活方式,各行各业对知识、能力和素质的要求也更高。因此,数字素养、协同交互思维、创新人际交往关系等问题是未来教育研究将会持续关注的热点。另外,传统的教育评价大多是关注对学生知识、成绩的测评,即对智力水平的评价,但在数字化时代,教育评价内容、模式、工具变得更完整和全面,评价方式更加多元,更多关注教师、学生的核心素养、信息化素养、综合素质、身心健康等方面的问题。
2.未来更关注机器人教育,探索增值评价
随着信息技术的快速发展,以机器学习、数据挖掘和学习分析为关键技术的智能技术也正深刻影响着人们的学习和生活方式。机器人教育是指利用工具,挖掘教育功能,通过机器人课程,开展一系列教育活动,激发学习者的兴趣[15]。比如,通过编程课程、机器人大赛等教学方式来培养学生的编程能力、团队合作能力、创新能力和动手实践能力,提升学生的信息素养。可见,机器人教育将成为未来教育的一种新趋势。然而,目前很多中小学校依然未将机器人教育设为一门独立课程,重视程度不够,缺乏系统性的规划和教学设计。同时,人工智能赋能的教育评价改革,要进一步探索增值评价,从关注结果评价过渡到聚焦关注教师教学全过程和学生学习生涯全过程,更加关注师生的思维能力成长过程,努力建立系统、科学的评价体系,促进人的全面发展。
3.未来更关注数据赋能的新发展价值研究
目前,数据技术不断赋能教育评价,摆脱了以往依赖主观经验和标准化测试来衡量和评价师生的传统方式,但技术不是完美的,在教育道德伦理、人机协同关系的处理、师生隐私与数据安全等方面也存在着一定的风险。以此展望,未来的研究可能更多需要关注人机关系的处理,要求研究者具备以人为本的人机协同思维,积极应对技术带来的正负面影响,构建和谐共生的新生态,促进教育评价的高效性和客观性。
数字化时代,大数据、人工智能等信息技术将进一步丰富教育评价的方法和手段,拓展教育评价的内容,让教师、学生、家长乃至全社会参与其中,对教与学的过程进行全方位实时监测,让评价变得更科学和客观。数据成了驱动教育数字化变革的基础,面对教育评价的发展趋势,研究者未来会更加关注如何利用教育大数据构建以核心素养为导向、促进学生德智体美劳全面发展的教育评价体系等方面的问题。可以预见,在未来社会,大数据与教育评价的深度融合将成为必然趋势,而其涉及的一系列安全问题、隐私保护问题、公平风险问题等也会成为未来研究者高度重视的研究方向。