基于大数据的学生成长质量评价体系构建研究

2019-01-11 11:39亓俊忠沈一民
山东商业职业技术学院学报 2018年6期
关键词:数据仓库日志数据库

亓俊忠,沈一民,石 静

(山东商业职业技术学院,山东 济南 250103)

2015年3月5日十二届全国人大三次会议上,李克强总理在政府工作报告中首次提出“互联网+”行动计划。李总理提出的“互联网+”实际上是创新2.0下新一代信息技术形态的形成与发展,重塑了物联网、云计算、社会计算、大数据等新一代信息技术的新形态,大数据、云计算等新一代信息技术成为互联网的延伸和发展,成为我国信息技术发展的方向。大数据是近几年随信息技术的发展而兴起的一种数据的专业化处理。具体来说,大规模、长期测量,记录、存储、统计,并对之进行分析,所获得的海量数据就是大数据(big data)。存储这些数据,经过严格统计、分析、检验,得出一些很有说服力的结论,可用于商业开发、科学研究、技术设计、查证、决策等目的。当今大数据分析已经开始渗透到每一个行业和业务职能领域,这为解决当前学生成长质量评价存在的问题提供了新的解决方向。基于大数据的学生成长质量评价体系的研究,是大数据分析这一先进技术手段在教育领域的尝试,是先进技术手段和“互联网思维”在教育领域的一次创新性的应用,具有极高的研究价值和应用推广价值。

一、研究背景

(一)国外教育大数据研究现状

美国在2012年就开始着手大数据分析,将各个小型数据集合后进行分析,可以得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等。这种带有趋势性和前瞻性的分析结果正是大数据研究迅速盛行的原因。

国际上对大数据在教育领域的应用也是近几年才兴起的一项新兴技术,少部分发达国家近几年开始研究大数据在教育领域的应用。国外对于教育数据挖掘研究进行分析,可归纳为5类教育数据挖掘方法:统计分析与可视化;聚类(聚类、离群点分析);预测(决策树、回归分析、时序分析);关系挖掘(关联规则挖掘、序列模式挖掘、相关挖掘);文本挖掘。另外,随着网络学习及相关学习管理系统的不断普及,数据挖掘方法在学习管理系统中得到应用,并开启了利用网络分析技术对学习者行为加以分析的研究和对学习平台的日志分析等。

作为教学管理的一种新模式,美国有部分大学利用“教育数据挖掘”模式进行学生学习行为的分析,即利用一套计算机和心理学手段来研究和理解学生是如何学习的。早期的教育数据挖掘主要是网站日志数据的挖掘。现在新的计算机技术支持的交互式学习方法和工具(智能辅导系统、仿真、游戏),为量化和收集学生行为数据带来了新的机会。特别是为更加集成、更加模块化和更加复杂化的在线学习系统提供了更多类型的数据。教育数据挖掘能发现这些数据中的模式和规律,探索建立预测模型,让学校可以重新发现和预测学生如何学习。现代“教育数据挖掘”理论通常强调分析碎片化学习,并用自适应软件来干预。预测模型在建立自适应学习系统中扮演一个关键角色。基于预测模型的适应和干预,能被用于改变学生下一次的学习体验,甚至用于推荐额外的学术服务,来支撑他们的学习。

(二)国内教育大数据研究现状

国内大数据研究紧跟世界步伐,取得了许多令人瞩目的成果,尤其是在电商、零售业、医疗卫生等行业,取得了显著的成果。大数据在教育领域的研究应用,国内尚处于起步阶段,在国内一些发达城市如北京、上海、广东等,开始尝试大数据在教育领域的应用,譬如慕课、在线课程、翻转课堂等,就应用了大量的大数据工具。但是,对于大数据勇于评价学生成长质量,未见相对成熟的理论和应用。随着我国“互联网+”热潮兴起,大数据在教育上的应用正越来越被重视。

二、存在问题分析

当前对学生成长质量评价主要是通过对学生的学习成绩给予评价而实施的,而对学生成长过程及其成长质量的评价关注度不够。目前以学生为本实施对学生成长质量评价中存在的问题主要集中在以下5个方面:

一是有关学生成长质量的数据多头多点分布,难以直接用于评价学生成长质量。目前,高职院校经过十几年的教育信息化建设,已经建成了许多教学管理和网络教学平台,产生的数据种类繁多,包括人才培养工作状态数据、专业评估数据、专业建设发展数据、教学管理系统数据、世界大学城云空间数据、图书借阅系统数据、校园一卡通数据等。但有关学生成长质量的数据多点分散在各类平台中,且分属于不同的职能部门管理,相对割裂,难以利用现有各种数据直接对学生成长质量进行评价。

二是学生成长质量的评价以阶段性结果评价为主,缺乏学生成长过程评价的手段。学生成长质量评价主要是以学年、学期为评价阶段实施终结性评价,难以及时有效地发现学生成长中的问题。

三是学生成长质量的评价缺乏个性化评价方式。对学生的成长质量评价方案主要基于大众普适性设计,以指标性评价为基本手段,在统一尺度下对所有的个体学生进行评价,难以实现对学生个体的个性化评价。

图1 体系框架图

四是缺乏基于“产出导向”的教学建设质量评价手段。现行的教学质量评价,都属于基于“投入导向”实施的对教学建设质量评价,导致学校建设与人才培养紧密度不够,对投入的应用效果和学生的受益程度并没有很好的评价办法。

五是对问题学生多采取事后管理模式。一旦发现问题学生,多采取“盯紧、严管”等事后手段,难以做到事前控制。

三、基于大数据的学生成长质量评价体系构建

基于大数据的学生成长质量评价体系构建,必须建立在学生成长大数据建立的基础上。因此,首先要做的是学生成长大数据中心的搭建,进而从关注学生个体的个性化发展入手,立足学生成长成才需要,将学生学习过程、学习成果和学习成效作为学生成长质量评价关键指标,借助大数据分析技术,建立一个基于大数据的“产出导向”的学生成长质量评价体系,针对学生的成长过程进行动态评价,建立大学生违纪即时预警系统和预警机制。这是对学生成长的全过程评价、个性评价,符合学生个性发展、潜能发挥,符合现代教育“人人出彩、特长发展”的理念,符合学生个性发展、自我实现的愿望,评价更加人本化,有利于职业教育的可持续发展。

(一)学生成长质量大数据的整合与分析

整合学校现有各类数据,建立教学信息收集系统,系统收集各类教学相关信息,攫取学生成长质量大数据(数据攫取,Data capture),以此为基础建立分类数据库,形成学生成长质量数据仓库(数据仓库,Data warehouse);综合运用多种数据分析方法,建立数据分析模型(数据分析,Data analysis),进而对学生成长质量实现可视化的数据分析结果(可视化结果呈现:Visualization),以Data Capture、Data Warehouse、Data Analysis、Visualization形成“CWAV”的数据分析路径对学生成长质量大数据进行分析。(详见图2)。

1.数据攫取(Data capture):建立教学信息收集系统,攫取学生成长质量大数据

建立教学信息收集系统,系统收集各类教学相关信息,并以此为基础建立分类数据库,包括:

(1)教学建设信息收集

数据来源包括:状态数据平台、专业评估平台、专业建设发展平台。数据范围:全部数据。

(2)网络教学信息收集

数据来源包括:世界大学城云空间数据、精品课程建设平台数据、精品视频共享课平台数据。数据范围:登录日志、上传下载课程资料日志、交互记录、浏览记录等。

(3)教学管理信息收集

数据来源包括:教学管理平台、教学管理APP。数据范围:学籍数据、成绩数据、课程及选课信息、问卷信息、测评信息、登录日志、查询日志等。

(4)图书借阅信息收集

数据来源包括:图书借阅信息。数据范围:图书借阅日志、进出图书馆及停留时间日志等。

(5)学生日常行为信息收集

数据来源包括:一卡通数据、门禁数据。数据范围:一卡通日志、消费日志、门禁日志。

目前上述数据分散存储在不同的管理部门的服务器中,仅仅实现了低级的统计分析和小范围的应用,数据没有得到整合和高效利用。我们所进行的数据攫取就是要从上述分散、独立的系统中对大量数据进行挖掘和整理,为开发数据模型、建立数据仓库提供数据准备。

图2 学生成长质量大数据分析实施路线图

数据攫取以学生成长成才为主要线索,以教育服务、学生生活服务、学生教育满意度为辅助线索,再以外部第三方的就业统计数据为补充,通过建立共享数据链、导入其他数据库数据、云端挖掘等手段攫取与学生全面发展和个性成长有关的全部数据。

2.搭建数据仓库(Data warehouse):建立学生成长质量大数据仓库

教育数据仓库,是学生全面成长成才数据的战略集合,是对所攫取数据的分类存储,在特定技术标准的框架下,由若干个共性数据库组成,出于分析性报告和决策支持目的而创建。

(1)数据仓库的搭建

数据仓库是提供用于决策支持的当前和历史数据。数据仓库技术是为了有效地把数据集成到统一的环境中以提供决策型数据访问,使分析者能够更快更方便查询所需要的信息,提供决策支持。

数据来源于不同的平台,把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,才能存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,应能生成COBOL程序、MVS作业控制语言(JCL)、UNIX脚本、SQL语句等,以访问不同的数据。数据需要进行转换,包括:删除对决策应用没有意义的数据段、转换到统一的数据名称和定义、计算统计和衍生数据、给缺值数据赋给缺省值、把不同的数据定义方式统一等。

(2)确定数据仓库的内容结构

在数据仓库的内容结构设计中,根据不同的数据来源、特点和用途,我们把数据仓库分为“一主四辅”的子数据库结构。把主数据库定义为“学生成长数据库”,主要以学生成长成才指标数据流为主;辅助数据库为“教学服务数据库”“教育服务满意度数据库”“生活服务满意度数据库”“外部数据库”,主要以学生成长成才的保障性和实证性指标数据流为主。具体研究内容为:

①学生成长数据库,其数据流为本课题研究的主数据流,覆盖学生入学、学习过程、学习结果直至毕业等成长成才各环节,观察点包括招生数据、学籍数据、课程数据、服务学习、学生社团、学生奖助贷、社会职务、学费缴纳情况、图书借阅数据、学业成绩及就业情况等。

②教学服务数据库,涵盖内容包括状态数据采集平台、专业评估发展平台等平台数据,以及师资数据、心理测评等教学服务数据。

③教育服务满意度数据库,包括学生评教数据和学期教学问卷调查数据。

④学生心理筛查数据库,包括历年学生心理筛查数据。

⑤生活服务数据库,包括学生校内生活消费数据、宿舍图书馆门禁数据和住宿数据。

⑥外部数据库,主要攫取第三方提供的数据,内容主要为第三方毕业生调查数据和社会问卷数据。

⑦社会因素数据库,包括影响学生成长成才的社会、家庭等因素。

3.数据分析(Data analysis):大数据的聚类分析

聚类分析是将数据集合分组为由类似的对象组成的多个类的分析过程。它是一种全新的数据观察方式,是本课题的重要分析手段。通过聚类分析,把攫取的数据分为以下三大类:

(1)系统日志类数据。记录各种系统中的操作痕迹的数据,包括系统登录时间、浏览内容、具体操作以及停留时长等信息,可以通过它来分析各类平台使用者的使用频率、浏览内容及个人偏好。如通过对网络教学平台日志的分析,可以得出哪些学生的学习积极性较高、主动学习的意识强,哪些教学资源受学生欢迎等。

(2)各系统数据。这类数据主要是指各个教学、教学管理平台系统的数据,如教学管理平台专业信息、课程信息、排课信息、学籍信息、成绩信息,网络教学平台的用户信息、分类课程资源信息,一卡通的门禁信息、消费信息、图书借阅信息,财务系统中的学生缴费信息等。通过对这些数据的分析,可以了解学生在校成长、生活的轨迹,绘制学生成长记录,查找异常,预防各类危机的发生。

(3)采集数据。这类数据主要指主动采集的各种数据,如状态数据采集平台数据、心理测评数据、问卷调查数据等。通过对这些数据的分析,可以有目的、有指向性地了解学生学习、教学管理、教学建设的现状以及存在的问题。

聚类分析可以为学校和学生本人提供多角度、多层次、高效率的数据探查方式,任意组合分析角度和分析目标观察其中的关联关系,发现规律,以便对学生进行合理引导。

4.可视化结果呈现(Visualization)

数据可视化呈现将学生成长成才信息以尽可能多的形式直观地展现出来,目的是使决策者通过图形、文本、表格等表现方式迅速获得信息中蕴藏的规律,如趋势、分布、密度等要素,例如平均学业成绩、平均生活消费等,在此基础上与个体数据进行对比,通过“红灯预警模式”发现异常点。它能代替部分人的经验、主观判断功能,应用结果更加科学、直观。

(二)构建学生成长评价指标

依据高等职业院校人才规格要求,及大数据分析统计的结果,首先制定出学生学业评价指标、身心健康评价指标、教学服务评价指标和生活服务评价指标,最终形成学生成长评价指标体系和“产出导向”的学校建设评价指标体系,以此作为判断学生成长状况健康与否的依据。

(三)构建学生成长质量评价体系

1.学生成长规律的研究

根据高等职业院校人才培养规格要求及大数据计算统计的结果,从德智体美劳及心理素质、个人行为等方面,对高职学生成长规律进行研究,把握学生成长的基本规律,形成指导学生成长成才的依据。

2.建立学校学生成长监控分析系统,预测学生的行为和兴趣,查找学生成长的“异常点”

以世界大学城云空间数据、精品课程建设平台数据、精品视频共享课平台数据为基础,通过分析登录日志、上传下载课程资料日志、交互记录、浏览记录等,从用户在线记录形成的海量数据,通过数据分析手段,从数据中推断出用户的背景、意图、兴趣、行为规律以及创建模型,来预测将来的行为和兴趣。

3.形成记录学生成长全过程的“学生成长曲线”

将每个学生的成长过程数据统计、分析结果,以图表的形式呈现出来,形成记录学生成长全过程的“学生成长曲线”,使每个学生清楚地看到自己的成长足迹,让教师、教学管理人员能够系统、完整地掌握每个学生的成长状况,判断成长质量。

4.建立学校教学质量监控分析系统,形成“以学生为中心”的教育服务体系

以状态数据平台、专业评估平台、专业建设平台数据为基础,引入学生评价,通过分析、统计、归纳,推算出学校教学建设与管理的基本状况,寻找学校教学建设与管理的“异常点”,并以此分析学校教学建设与管理成就与不足,并提出针对性解决策略,逐步形成“以学生为中心”的教育服务体系。

5.建立学校教学质量与学生成长监控异常点综合匹配分析系统

建立学校教学质量与学生成长监控异常点综合匹配分析系统,分析匹配“教学质量监控分析系统”与“学生成长监控分析系统”中的“异常点”,并对两类异常点的分布、成因进行分析,查找形成异常的内在的原因,最终建立基于智能预测模型的干预机制,将分析结果用于改进教学建设与教学管理,引导学生的学习,为每个学生提供高度个性化的学习服务,使学生享受到高度个性化的学习体验。

6.通过大数据分析,建立基于“教育产出”的学生成长质量评价系统

通过大数据分析,建立以学生学习过程、学习结果和学习成果为主要检测指标,辅以学校教育建设投入状况辅助指标的基于“教育产出”的学生成长质量监控体系,以学生成长成才、人人成才、个性发展为目标,以学生成长过程为主线,建立基于“教育产出”的“学生成长线评价系统”,实现学生学业评价的智能化、科学化。

(四)建立大学生危机即时预警系统和预警机制

通过对学生成长状况的智能化分析,形成学业预警为主的大学生危机即时预警系统,在学生有学业危机倾向时,及时向学生本人以及班主任、辅导员、任课教师发出预警,提醒学生本人注意,并提醒班主任、辅导员、任课教师即时关注该学生,制定有效的帮扶措施,避免出现学业危机。

猜你喜欢
数据仓库日志数据库
一名老党员的工作日志
扶贫日志
基于数据仓库的住房城乡建设信息系统整合研究
游学日志
数据库
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
数据库
数据库
数据库