基于大数据的多源多维综合素质评价模型的构建

2017-05-30 22:25张治戚业国
中国电化教育 2017年9期
关键词:综合素质评价学习分析评价模型

张治 戚业国

摘要:普通高中综合素质评价成为当下教育综合改革的突破口。传统的教育测评建立在以考试为核心的教学行为基础上,难以客观、公正地评估学生学习成效和发展潜质,大数据技术为全面记录学生的学习行为和结果数据提供了可能。结合数据分析技术和学习科学的发展,该文以上海市综合素质评价改革的行动为背景,尝试构建一个基于大数据技术的多源多维综合素质评价模型。该模型能综合考虑多源数据的汇聚与整合,试图将学生客观信息的采集范围扩大至课堂内外、正式和非正式学习环境、线下和线上学习、学习活动和生活表现等多个视角,获取能映射学生综合素质相关的数据,形成系统、完备的学生成长大数据。整合并标准化能够反映学生综合素质的多源数据,建立学习分析模型,开展大数据分析对学生综合素质进行多维度、全方位的评价,形成基于大数据的学生个体和群体的综合素质数字画像。模型在多个维度提供价值判断和结果输出,从而为学习改进和学习环境的改善,为学生发展和人才的分类遴选提供依据。该模型将为正在蓬勃开展的普通高中综合素质评价改革提供可资借鉴的解决思路。

关键词:大数据;综合素质评价;评价模型;学习分析;数字画像

中图分类号:G434 文献标识码:A

2014年9月,国务院发布《关于深化考试招生制度改革的实施意见》,提出了“两依据一参考”的高考改革基本方向。新一轮的高考改革聚焦综合素质评价,力图从评价环节全面落实素质教育,因此,普通高中综合素质评价成为当下教育综合改革最热的话题之一。全面实施综合素质评价,对促进学生的自我认知与生涯规划、对高中学校办学改进、对高等学校科学遴选和社会创新型人才培养体系的构建都至关重要。从“素质”到“综合素质”,对学生评价的研究一直在发展。如何运用学习科学和信息技术的最新发展成果,为学习者创造能充分反映学生生活和未来实际的评价体系,这是国内外教育系统面临的巨大挑战。教育与新技术的创新融合,提供了新的研究视角,基于大数据技术的评价系统不但是改进学习的关键,而且将为各类教育机构改革提供数据支持。在面对新生代学习者和以大数据技术为核心的信息社会背景下,学生的学习、生活环境和内容都发生了深刻变革,评价的内容和形式是否也需要变革?大数据如何用于学生综合素质评价?该做什么才能把綜评政策的理想转化成全体教育相关人的共同愿景?这是事关我国新时期教育综合改革成败的大事。本文将围绕模型建立的必要性与可行性、模型理论框架、技术实现路径等方面加以阐述。

一、大数据技术应用于综合素质评价的必要性与可行性分析

(一)必要性分析

1.技术带来教育的革命性变化。大数据具有海量、多源、异构、非结构化、连续性、实时性、网络结构、精准映射等特征,像是一个记录人类行为的数字写真,无限接近本真。新技术应用于教育方式变革,展现了当代教育的一个重要发展方向:从“用经验说话”转向“用数据说话”。未来的评价离不开现代信息技术,大数据技术将是未来教育评价的必然选择。

2.大数据技术为记录和分析教育教学中的表象信息提供了可能。一个人的素质通过多个表象呈现出来。大数据技术为记录和分析以往无法利用的信息提供了技术支持。高中综合素质评价需要从多个维度全程记录学生的成长数据,加之作为被评价对象的学生数量也十分庞大,普通高中综合素质评价是一个需要耗费大量人力、物力的系统工程。相较于通过人力进行纸本操作,基于大数据的综合素质评价能够充分发挥信息技术操作便捷、方便处理与传播等优势,降低成本,提高评价效率。此外,学生是互联网时代原住民,他们的生活与学习几乎离不开电脑、手机等电子设备,互联网上遗留下了他们学习与成长的足迹。借助大数据能够在较为真实的环境下采集学生信息,这些信息在学生自然状态下产生,未经加工,更加客观,基于这类信息的评价也有利于避免出现霍桑效应和晕轮效应,反映学生真实面貌。从综合素质评价的价值导向来看,其核心价值还是在于促进学生发展,用于高校遴选也是为了学生发展。综合素质评价要能让学生更了解自己,让学校更了解学生和自己的服务,让政府更了解学校和自己的管理。最后,大数据引入学生评价有利于打破学生信息孤岛,将数字变成数据,在促进学生发展方面发挥价值。长周期行为数据、大规模考试数据、师生面谈数据、阅读数据、位置信息数据、社交圈及关键词、检索行为数据、在学习平台上学习数据(如电子教科书、阅读平台、MOOC、APP应用、DIS数字化实验、每次作业表现)等,都可以让我们更好地了解学生,发现其潜质和不足,这既能服务学生成长,又能为教育评价学研究提供资源。大数据技术有望挖掘各类学生数据中蕴藏的价值,促使普通高中综合素质评价不再流于形式,真正服务于学生发展。

3.数字画像有利于更加直观地呈现评价结果,为个体学习早期干预和教育教学规律发现提供依据。大数据分析技术能够最终生成学生个体及群体数字画像,这是一种新的综合素质评价结果呈现方式,更加形象、全面、易懂,方便学生、教师以及教育管理者使用综合素质评价结果。个体数字画像帮助学生看清自己的成长状态同时帮助高校遴选,班级群体的数字画像帮助教师改进教学;学校群体数字画像帮助学校及其他教育管理部门的领导者开展教育治理。学生成长中必要的早期干预需要基于科学决策,学生成长规律的发现也要基于数据。数字画像为此提供了可能。

(二)可行性分析

我国教育信息化经过多年发展,特别是“三通两平台”的建设,已显现一批成果。教育大数据用于教育评价的案例不断涌现,为更大规模的数据挖掘分析指明了方向。“近年来,随着技术的发展,尤其是无线网络与物联网等技术的发展,伴随移动设备的普及化,教育数据系统有望采取到更多更全面的数据,不但可以让更多评价主体参与教育评价从而采集到更多维化的评价性数据,也可以采集教育过程中累积的过程性数据,大数据技术寻找关联性的思维模式契合了教育评价情境下对充实依据与有效证据的本真需求,让评价结果真正成为教育教学决策的重要依据”。

数据采集手段的不断革新,基础数据工程的持续积累,不同部门之间数据共享意识的提升,学生通过互联网学习行为持续增加,各级教育管理部门数据挖掘需求的不断强化,学校、教务、学生管理新范式显现,各类教学管理软件(批卷系统、网班上课平台、Moodle课程平台等)的使用,各种社交产品纷纷涌现、特别是手机APP应用的普及并持续利用等,这些数字校园的建设和信息技术产品的普及为学校打下教育信息化的良好基础,同时也是进一步研究教育大数据的前提。综合素质评价大数据挖掘与分析正是基于已有的信息化实践进行的再探索,是对教育大数据的一次集成,也是对教育大数据发展的一次驱动。

二、多源多维综评模型理论框架分析

学生在学习和生活中,所有的行为皆有数据,所有的数据都可以被采集。本模型试图将学生客观信息的采集范围扩大至课堂内和课堂外、正式学习环境和非正式学习环境、线下学习和线上学习,获取与学生综合素质相关的数据,形成系统、完备的学生大数据仓库,整合并标准化能够反映学生综合素质的多源数据与信息,建立数学模型,开展大数据分析,对学生综合素质进行多维度、全方位的评估,形成基于大数据的学生个体和群体的综合素质数字画像。评价结果不仅服务于高校招生,还服务于学生生涯规划、教师因材施教、学校服务改进、政府教育区域治理优化,旨在充分发挥客观数据的价值,有效加强对学生各维度素质与能力的认知与评价水平,调动学生、教师、高中、高校、政府等各方启用综合素质评价结果,充分发挥评价的导向功能,促进学生全面发展与健康成长。

结合数据挖掘的一般流程,笔者尝试构建一套较为完整的基于大数据的普通高中综合素质评价模型。数据挖掘(Data Mining)的一般流程是数据采集、目标数据、数据预处理、数据挖掘、结果呈现、反馈应用。数据采集往往是首要环节,通常大量的时间要花在采集和预处理上;数据采集后要根据业务需要,确立目标数据,才能进行数据预处理,形成大数据仓库,根据教育领域内在规则确立挖掘方法,开展数据挖掘,建立数据模型,从而呈现挖掘结果。有时候这个流程并非每个步骤都要做到,有时候某些步骤没有完成,需要返回重新执行。根据数据挖掘流程,构建了基于大数据的“多源多维综合素质评价模型”,其结构如下页图1所示,本模型的建构不关注其技术细节,主要聚焦于在常态化的情境中較为全面地获取学生综合评价信息,以此来获取对学生综合素质较为客观、完整的认识。

多源多维评价模型的核心模块包括以下几个部分:

(一)数据采集系统:大数据采集的“上帝之眼”

数据的采集强调多种来源的自然采集。采取多种形式、多种方法记录能映射学生综合素质发展状态的表象数据,数据的记录要强调全方位、全过程、全纳、全员和非干预的自然状态采集,数据要包括结构化和非结构化的数据,力求其大,不会造成结构性短缺。在这个模型中,把大数据采集系统比喻为“上帝之眼”,是因为它能洞悉一切,从行为到结果,从白天到黑夜,从外在到“灵魂”。把大数据比作“上帝之眼”的另外一个意思是数据的采集是非干预的、在自然状态下被采集的,而不是为了某种功利的目标被采集。本模型尝试在综合素质评价已有的客观数据之外,采集学生在实际情境中所遗留下来的过程性数据。对学生综合素质的评价要将学生放在其学习生活的环境中,这一环境包括了线上线下的多源多维数据获取,同时考虑到学生成长的动态发展规律。“多源多维数据可以从三个方面获取:一是对于线下学习中的人际交互关系,主要通过问卷调查、访谈等学习者自报告的方式进行数据采集;二是对于网络环境下的学习交互数据,例如,Coursera、网易公开课、可汗学院以及其他各院校研发的在线学习平台等,关系数据通常按照一定的格式存储在学习系统中;三是社交媒体上遗留的数据,比如:Twitter、YouTube、Facebook、微博、微信、QQ等社交平台都记录了大量学习者的交互数据可利用开发者提供的数据接口API或网页标签信息,利用相关程序进行自动爬取”。

(二)数据的清洗

大数据采集后,需要进行必要的清洗,剔除无关的变量,并经过一定的格式化处理,用元数据标准进行标签,这样才能更好被挖掘和分析。数据的清洗核心在于寻找评价目标与数据的关联、映射对应关系,排除“噪音数据”。

由于采集的原始数据中无意义的成分很多,数据来源结构复杂,不同的系统间也存在着不同的标准,加上系统设计的不合理性的存在,时常出现系统数据的重复、冗余和不完整导致的大量模糊信息的现象。而这阻碍了数据挖掘的针对性和准确性,影响数据挖掘的执行效率,不利于挖掘目标的达成。

通常而言,数据预处理一般按照以下四个步骤进行:数据选取、数据表属性一致化、数据清理、数据离散化(数据归约)。数据选取是在原始数据库中选取与任务相关的数据表项,通过对数据的筛选有效地利用资源。数据选取的方式一般通过事先编制好的程序来进行选择,在数据仓库的基础上进行选取会让操作更为便捷。数据表属性一致化是指根据挖掘的需求把不同呈现样式的数据用统一的标准重新的标识,方便数据挖掘人员对于挖掘对象有清晰的认识。数据清理是指填补空缺的数据、处理错误数据、消除噪声数据、去除孤立点,以此改善待挖掘数据的质量,提高挖掘的信度。数据离散化(数据归约)是指将待挖掘数据进行更深一步规模上的处理,在保留数据完整性的前提下缩小处理的规模,达到提高数据处理效率的效果,主要包括元组归约(连续属性离散化与概念分层)和属性的归约。

数据预处理的过程是基于大数据的学生综合素质评价模型的重要的一环,通过数据预处理,为数据挖掘的顺利进行开辟了道路,也是高效率的完成数据挖掘的前提和基础,关系到学生数据挖掘的成功与否。

(三)数据的挖掘分析模型

根据数据分析模型,进行数据分析挖掘,为学生个体和群体进行数字画像,从而客观分析学生综合素质发展状态,并透视其关联性、聚类性和因果性,通过学生数字画像,进一步为学校、教师、政府等进行画像。数据分析的模型建立是一个非常复杂的过程,价值观不同,模型会差异很大。但是模型根据适用对象的不同和算法的差异,可以分为不同的类型。

1.数据挖掘技术。收集、分析并解释数据,是统计学中最基本的数据挖掘技术。通过建立基于数学函数的统计模型,對目标进行汇总、描述以及预测,也能应用在验证数据挖掘的结果上。

2.聚类分析与模式识别。利用数学方法对数据样本进行差异性和相似性的区分,根据亲疏关系进行聚类,并从聚集的类别中发现在事物之间的规律和典型模式,是当代分类学与多元分析的结合,直观的呈现出分析结果。

3.决策树分类技术。决策树分类技术是由于分析决策或事件时会产生多个结果,这些分析形成的不同的结果如果绘制出来就像树的枝干一般,用树形的结构来呈现分类和决策的结果,并从中发现规律。

4.人工神经网络和遗传基因算法。人工神经网络和遗传基因算法通过计算机模拟人类大脑的特性,这种仿生学的研究在人工智能、计算机科学、认知科学等方面的应用中前景被看好,对于客观规律的定量描述和网络设计编码在数据挖掘中有帮助作用。

5.规则归纳。规则归纳即是指在数据挖掘过程中提取形式规则,搜索和挖掘以往未知的规律。可视化技术是数据挖掘结果的呈现方式,通过图片、图像、表格、动画等不同的形式便于挖掘结果的理解,指引后续的操作。

(四)数据分析结果的呈现和利用

在第一阶段,汇聚而来的数据可以作为综评的数据提供给使用的人,大学可以用来进行模型分析,可以分层、分类,可以挖掘特长生,中学和政府也可以进行相关的数据挖掘分析,为教学改进服务,学生本人可以发现自己的特长和不足。

这套模型也许看上去更为理想化,但是,其教育大数据不是仅仅采集学生的学籍信息、入学信息、各种考试的分数等静态数据,而是充分考虑到数据的多源采集、自然采集,注重数据的完整、全面,特别是注重学习行为数据和学习结果数据,注重结构化数据和非结构化数据的结合,从而使基于大数据的学习分析成为可能。该模型在数据清洗的基础上提供了系统化的学习数据分析方法,便于教师将学习行为数据、学习结果、学习资源及其他学习相关的数据进行分析和处理,便于学生、教师、学校、政府能一目了然地了解教育发生了什么、学生学习发展情况、学生综合素质评价结果,从而为教学行为改进指明了方向。下面对该模型在数据采集、分析处理等实施路径加以说明。

数据挖掘与分析后的结果一般通过数据可视化的方式呈现。通过可视化的方式,我们可以更直观地找出我们想要寻求的问题答案,找出隐藏在各种交叉的数据中的关系、趋势与偏差,发现数据中隐藏的知识与规律。可视化分析涉及意义建构、人机交互分析、分布式认知等认知理论,在大数据分析中扮演着尤为重要的角色,也尤其适用于复杂的数据挖掘领域。

应用在大数据分析的可视化技术主要包括文本的可视化、网络(图)的可视化、时空数据可视化、多维数据可视化等。已经面世的侧重于不同的可视化目的的软件工具数量众多,并朝着更好的用户体验发展。一般而言,我们常应用折线图、柱状图、饼图、气泡图、雷达图,这些图目标明确、清晰易懂。

(五)评价结果分类使用——学生、教师、高校、学校、政府

将基于大数据的综合素质评价结果及时用于个体生涯规划、学习改进、办学服务提升、高校分类遴选和持续跟踪培养、政府基于数据的治理等用途,从而实现综合素质评价的发展性诊断功能、学习成长导向功能、分类遴选功能、治理服务改进功能等,这是综合素质评价理想模型的潜在价值。

1.学生个体数字画像:服务于生涯规划和个性发展

学生是综合素质评价的评价对象。综评是对学生全面发展情况的观察、记录、分析,是发现和培育学生良好个性的重要手段。多源多维综合素质评价模型在大数据分析的基础上可以为个体进行数字画像。学生个体的数字画像对于学生自己、教师和高校都具有重要价值。学生可以更加了解自己,了解自己的能倾、爱好、特长和不足,知道自己的优势所在,为自己的学习以及生涯规划做出调整。教师根据数字画像,对学生进行分类培养,通过分析,发现学生的优势和薄弱环节,引导学生确定个人发展目标,支持个性化教学。当然,数字画像的诊断和激励功能,能激发学生的参号性,发挥正导向作用,从而引导学生更加积极参与到学习活动中来;个体的数字画像同样可以服务到高校,高校能通过申请学生的数字画像,遴选出符合自己要求的学生,从而决定该生适合学什么,并进一步决定在高等教育阶段如何服务该生的持续成长,而不是仅仅根据分数决定该生是否应该进入某专业学习。

2.群体数字画像——服务于学校办学改进和政府教育治理

大数据支持下的综合素质评价具有重要的服务功能。在个体数字画像的基础上,多源多维综合素质评价系统可以进行聚类分析,绘制群体数字画像,即为某校某门课程学习情况的群体画像(对比图)。学生学习群体的数字画像主要服务于学校和政府的宏观教育治理。学校可以把学生综合素质评价结果作为诊断和改进教育教学工作的重要依据。政府可以据此进行区域教育治理,提高政府服务水平,提高财政经费使用的边际效应。在群体数据画像的基础上,我们可以进一步发现教育教学和学生成长规律,从而为教育教学的科学化寻找理论支持。

三、多源多维综合素质评价模型实施的技术路径分析

本部分将从技术支撑体系到数据采集源、采集格式和数据分析模型等方面具体描述模型是如何运行的。

(一)技术支撑体系

“评价什么是教育评价的核心”,对学生进行综合素质评价是一个复杂的过程,需结合学生的过程性数据和结果性数据进行综合考虑。学校需要收集学生的学习过程性数据,而不仅仅是结果,特别是学生“问题解决、批判性思维、团队合作、创造性”等21世纪技能进行评价。基于技术的评价能够收集学习过程中的数据,驱动以“什么对每个学生最好”为依据的决策,为改善学习提供依据。

该模型以学生学籍数据作为基础数据支撑,多个应用系统作为支持,基于上海市统一身份认证系统,多个维度相互补充共同形成了一个学生在各个阶段的相对完整的学业结果性和学习过程性数据源。其中,结果性数据属于结构化数据的采集,过程性数据涉及到结构化和非结构性数据的采集。本研究从高中综合素质评价管理系统(结果性数据)、数字课堂(正式学习场景、过程性数据)和上海市高中名校慕课平台(非正式学习场景、过程性数据)等多个应用系统作为学生综合素质评价研究的切入点。项目的拓扑结构如图2所示。

(二)技术实现框架

整个系统是一个三层架构,自下而上分别为数据层、分析层和应用层(辅助功能,如任務调度和监控管理等未体现于上图2)。实现360度学生画像构建、可视化呈现以及分析报告输出是其核心所在。未来则可以逐步增加完善基于画像标签和挖掘模型库的各类场景落地与平台整合,具体如

(三)数据中心构建

1.学生综合素质评价的数据源分析

学生综合素质评价是一项系统工程,通过共享的学生基础数据,汇聚不同业务系统间学生数据。目前涉及到的基于统一身份认证系统已在运行使用的业务系统包括:研究性学习平台(MOOR)、上海市高中名校慕课平台(MOOC)等。同时,在此基础上,随着更多应用系统的接入,汇集更多维度的数据:(1)通过学籍系统,统一身份认证系统汇聚学生的基础数据;(2)通过互动课堂、在线学习平台汇聚学生课堂学习、在线学习的行为数据和结果数据;(3)通过综合素质评价系统汇聚评价数据、学业成绩数据;(4)通过MOOR汇聚研究性学习的行为数据和研究记录;(5)通过对接实验平台,阅读平台汇聚学生的实验行为数据和实验结果记录、学生阅读行为数据。数据源对照如表1所示。

2.数据采集格式

数据源中过程性数据采集使用了统一的数据格式,基本格式:用户+动作+对象+时间+关联的结果以及行为对应的结果数据+情境辅助信息。用户、动作、对象、时间是每一类行为的共性,关联的结果以及行为对应的结果数据、情境辅助信息依赖于特定的行为。基本格式的描述如下:

(1)用户——操作行为的发起者,学生是主要的用户;

(2)动作——用户所执行的具体操作;

(3)对象——是指行为所施加的对象、目标或受体,可以是构成支持学生学习的内容、工具、服务、平台等,用以承载一定的知识点、或是提供学习支持。对象的粒度不一,如“试卷”是一个对象,“试卷”中的某一道题也是一个对象;

(4)时间——用户作用于特定对象的发生时间;

(5)关联的结果以及这些行为对应的结果数据——根据所作用的对象特征,可以是对错、成绩、评语、文本、图片、语音、状态等;

(6)情境辅助信息——考虑到实际学习的复杂性,除以上其他几方面信息外,用以辅助完善行为数据的其他情境性信息。

3.数据采集的环境

本模型尝试在综合素质评价已有的客观数据之外,采集学生在实际情境中所遗留下来的过程性数据。对学生综合素质的评价要将学生放在其学习生活的环境中,这一环境包括了线上线下的多源多维数据获取,同时考虑到学生成长的动态发展规律。

(1)正式学习环境。在正式学习环境中,试图在不影响师生教学活动的情况下实时、持续地采集更多微观的教与学的过程性数据,比如学生的学习轨迹、在每道作业题上逗留的时间、教师课堂提问的次数等。不仅仅是常规的结构化数据,即学业结果数据(如成绩、违纪记录、出勤记录等),更注重非结构化数据,即学生学习行为数据(如图片、视频等学习资源的学习,计算器、画板等学习工具的学习及教学软件等)。

(2)非正式学习环境。对于高中生的综合素质考量应该基于对素质评估诉求,考虑到当前教育领域的主要经验成果和数据资源基础,融合多个渠道的信息,多方位采集学生在特定学习或生活场景下的某一方面数据,并对这些信息进行汇聚、综合、去冗、互补等,以形成对新生代学习者的持续性一贯性描述。基于对当前数据资源情况的理解,以及一级综合指标所规划的总体方向,综合素质指标构建的实现可以从数据内容类别视角进行。从结果类数据和行为类数据两个大类对标签进行构建实现。

本研究对学生综合素质评价的研究试图贯穿学生课堂内和课堂外、连通正式学习环境和非正式学习环境、整合线下学习和线上学习,对学生综合素质进行多维度、全方位的考察,通过实现对学生综合素质的大数据,对整个学生综合素质评价体系进行梳理、采集、分析,整合并标准化现有的反映学生综合素质的多方数据与信息,形成基于大数据的学生综合素质画像标签,充分发挥现有数据的价值,有效加强对学生各大维度素质与能力的认知与评价水平,切实促进学生全面发展与健康成长。学生数据源的确定是一个复杂的技术工作,随着数字终端和数据记录工具的普及,越来越多的学习过程和结果数据将被记载,其拓扑结构如图4所示。

4.数据采集标准与指标体系

本项目将综合素质评价本研究采集的数据界定为学业结果性数据和学习过程性数据,同时将学习过程性数据分为正式学习场景和非正式学习场景,根据这三方面的研究,形成了一系列数据采集的规范与标准,针对不同维度建立数据采集指标体系。

在上海市综合素质评价管理系统学业结果数据指标中,将综合素质记录按类型分为学习经历与成绩类、品德与公民素养类、身心健康与审美和其他记录四种,每一个维度根据其特点,梳理其需要收集的数据指标,建立数据指标体系,如图5所示。

5.学生综合素质评价数据分析维度

基于多源数据中心,构建了如下分析维度(如图6所示)。

(四)指标体系构建

1.指标构建架构

基于以上对学生综合素质评价体系的整体认识,形成了如下多源多维的综合素质评价三层架构模型,如下页图7所示。

所有的评价都要确立一定的目标。综合素质评价目标以教育部相关政策解读为核心,细化为一定目标体系。这些目标需要通过一定的标签导人系统,才能成为便于采集和分析的数据。目前,标签的生成方法一般分为三种:第一种是让普通注册的学生用户给自己或其他用户打上特征标签;第二种是让学校管理者或者内、外部专家给相关学生用户打上特征标签;最后一种是通过算法模型分析学生用户的各种行为数据而自动生成的用户标签,此方法原则上很少受到人为主观因素的干预。从中小学生综合素质评估的诉求来看,建立大数据标签的方法非常适用于实现这一目标,通过构建学生在多个特征维度上的标签指标,可以让学生、家长及老师快速地获取学生在对应素质或能力方面的实际表现情况,以及学生对于不同学习模式和知识技能的偏好,使其优缺点能够更快地被发现和理解,以便于学生自我认知,家长有的放矢,老师因材施教。基于对当前数据资源情况的理解,以及一级标签所规划的总体方向,标签构建的实现可以从数据内容类别视角进行,从结果类数据和行为类数据两个大类对标签进行构建实现。

2.二级指标间关联性的检验分析

新构建的评价指标,要使其发挥应有的高质量信息展示的功能,還需要更好地和当前的综合素质评价体系有效地结合起来。更具体来说,要能够充分地对综合素质评价中的客观结果进行有效补充,需要建立这些过程数据所提炼计算出的指标对于学生结果性指标的解释性和因果关联性。具体而言,我们可以认为结果型数据指标是用于表面直观评估学生素质的指标,而过程型数据指标则是一般意义上评估人很难直接获取的一些信息。举例来说,可以直接通过学生综合素质报告获取学生的在校成绩,包括语、数、外等核心课程,也包括物理、信息科技等辅助课程,但这些成绩并不能很好地反映出学生实际对于什么学科方向有更浓厚的兴趣,也很难了解学生是否在相应学科上有更好的基础积累。同时,对于学生取得的成绩,是否存在很多隐性指标能够预示学生的成功学习?这些规律不但有助于解释学生当前综合素质的构成,更能够给出学生将来的培养发展方向。可以借助于相关分析以及聚类分析算法及贝叶斯算法,挖掘分析学生各个学科成绩,以及在线MOOC相关学科成绩与学生线上访问时长、频度、课程选择数量、研究课题数之间的关联关系;也可以探测学生的时间管理模式与学生取得研究型课程成果间的相关性。当前主要考虑分析相关性的指标大致包括了:(1)学习成绩表现——学生行为风格、学习延续性、学习专注度……(2)艺术修养水平——学生行为风格、学习创新性、兴趣广泛度……(3)体育运动水平——学生行为风格、身体素质水平、学习专注度……

(五)构建学生综合素质评价体系

通过学生学习结果性数据和学习过程性数据的采集与分析,形成了对学生学习表现的评价体系,包含学生学习成效、思维品质、学习品质、创新精神与实践能力等方面。

1.学生思维品质与表现评价体系

思维品质的成分及其表现形式很多,结合林崇德教授关于思维的研究,基于学生在在线学习平台中的表现,从思维的深刻性、灵活性、独创性、批判性、敏捷性、辩证性、系统性等几个方面,考察学生在线交流研讨时所表现出来的思维品质。

2.学生在线学习品质与表现评价体系

基于所采集学生的学习数据和信息形成了学生在线学习品质的数据模型和评价指标。

围绕学生学习品质这一内容,主要从以下几个纬度和标准来评。(1)学习的坚持性:对于选择了的课程是否能够坚持学完。通过平台统计数据来呈现,如完成率高、退选率低、中断率低。(2)学习主动性:学习过程中是否积极主动,是否自觉,主要是通过平台呈现的数据来呈现,如报名课程数多、证书数多、发帖次数多、成果展示次数多。(3)学习认真度:平台打点提问的首次回答正确率高。(4)学习合作性:平台中给他人点赞数、回应他人次数等。(5)学习倾向性:主要是平台统计学生的选课门类与门数、收藏课程的门类与门数。

以上是多源多维综合素质评价模型的使用平台案例分析。当然,模型的使用在数据采集与分析时不可能仅仅限于这些平台,而是要兼容更多的平台、终端和系统,采取多种形式、多种方法记录能映射学生综合素质发展状态的表象数据,数据的记录要越全面、越详细就会越好。记录过程要在自然状态下,避免人为干预。数据的分析模型要与时俱进,不断创造教育评价模型,不断开发大数据挖掘的新模型,这样才能更加客观地为学生做数字画像。评价结果的应用要多维分析,多元使用,比如,用于个体生涯规划、学习改进、办学服务提升、高校分类遴选、政府基于数据的治理等等用途,从而实现综合素质评价的发展性诊断功能、学习成长导向功能、分类遴选功能、治理服务改进功能等,从而创造更多的价值。

四、多源多维综合素质评价模型实施建议

“道为术之灵,术为道之体;以道统术,以术得道。”基于大数据的高中综合素质评价研究反应了道术合一的辩证关系,“道”的实现离不开“术”的支持,大数据技术正是高中综评创新实践中的“术”。教育信息化创新应用与深度融合的转变之一是“教学评价从单纯的分数排队走向综合素质的大数据分析,不仅关注学生的学业成果,更关注学生的品质、修养、创新意识、合作能力等。技术支持下的教育变革,必然会对物理环境有着客观的要求。基于多维多源的高中生综合素质评价模型的应用需要以下基础条件。

1.建立统一身份认证,打破数据孤岛,实现多源系统之间的互联互通。以学籍数据作为权威的底层数据源,提供统一的用户管理、用户认证及安全保障等服务,用户经由统一身份认证系统登录,在完成身份认证后无再次登录就可以使用所有支持统一身份认证服务的其他信息服务系统提供的服务。

2.提供多源数据支持,构建数据中心。多源多维的综评模型是基于多个可用的数据应用平台而提出,对软硬件环境的配置及其应用量有一定的要求。

3.构建可用的数据标准,打通多源对接机制。数据标准所采用的各类代码标准和数据标准符合国家信息标准、教育行业标准等,既能满足当前多源数据的转换对接,同时也能兼容后续接入的应用。

4.形成大数据的交换共享机制。大数据分散在各个应用系统中,如腾讯公司掌握大量的社交数据,百度公司掌握大量的检索数据,阿里公司掌握着大量的购物数据,移动公司掌握大量的GIS地理位置信息数据,还有在各个学习网站、各大学习平台、各个学习终端上留下的各种学习数据,这些数据短时间都因为体制机制的障碍或法律的问题无法被共享。“多源多维综合素质评价模型”只是一个理想化的模型,数据的结构性短缺依然存在,这需要我们共同面对困难。为了学生的未来,我们需要从更加开放的胸襟面对这些数据资源,这也许是未来我们不断走向理想教育的前提。

猜你喜欢
综合素质评价学习分析评价模型
普通高中综合素质评价中“写实记录”的功能与操作
普通高中综合素质评价中“写实记录”的功能与操作
大数据思维下教学过程数据分析及应用研究
在线学习过程管理大数据的建设与应用
基于学业质量的增值性评价系统的分析与构建
简析小学劳动与技术教育的有效合作学习
基于产业集群的技术创新风险评价模型构建
基于熵权法的西安市外向型经济发展综合评价研究
浅析大数据在教育中的应用
中小学综合素质评价的价值取向和育人导向探析