罗 征,李 正,孙 雨
(西安欧亚学院 图文信息中心,西安 710065)
在当今大数据、云计算、物联网和移动互联网等新思路、新技术快速发展的又一历史时期,高等教育面临着前所未有的发展机遇,在经历了网络化、数字化、信息化管理阶段之后,“智慧校园”将是在“互联网+教育”趋势下最重要的发展思路。
随着计算机技术的不断发展,各种系统结构化和非结构化数据以前所未有的惊人速度迅猛增长,“大数据”时代已经到来。大数据是指数据结构比较复杂、数据规模大的数据集合。其数据量已经远远超出了一般数据管理工具可以承受的处理时间以及数据处理及存储管理能力。在当今大数据环境下,高校管理系统的数据结构及数据量发生了巨大的变化。在数据存储、数据管理、数据分析及数据挖掘等方面面临着巨大的机遇和挑战。为了有效地利用大数据为高校决策分析提供更好的服务,必须基于大数据建立相应的数据分析系统。
随着大数据的发展和教育信息化的不断深入,基于大数据开展的高校校园数据分析与应用逐步受到重视。
对大数据的定义始终没有形成统一的意见。维基百科对大数据(Big data)的定义是:所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。麦肯锡全球研究院将大数据定义为:无法在一定时间内使用传统数据库软件工具对其内容进行获取、管理和处理的数据集合。加特纳(Gartner)于2012年修改了对大数据的定义:大数据是大量、高速、多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与优化处理。
而在高校学生数据的分析应用方面,国内外高校均有开展相关的研究。纽约州波基普西市玛丽斯特学院(Marist College)与商业数据分析公司Pentaho合作发起开源学术分析计划,旨在一门新课程开始的两周内预测哪些学生可能会无法顺利完成课程,它基于商业分析平台开发了一个分析模型,通过收集分析学生的学习习惯,包括线上阅读材料、论坛发言、完成作业时长等数据信息,来预测学生的学业情况,及时干预帮助问题学生,从而提升毕业率。
上海财经大学基于校园信息化数据基础,开发了校务决策支持系统,面向人才培养、内部管理、科学研究和师生服务等方面开展决策分析;华东师范大学利用校园信息化基础数据,开展了校车人数与载客分布分析,提升了校车使用率;利用一卡通数据开展了贫困生的特征确定、潜在贫困生分析、后续跟踪验证,有效提升了帮困扶贫的工作效率。
结合西安欧亚学院信息化建设基础与海量的数据积累,建立“智慧校园”数据分析系统,通过此平台的建设和应用,运用数据挖掘和知识发现,从而在大数据中获取数据之间内在的相互联系,以及其中可能存在的某种规律,从而有效提升校园管理的决策效率,提升教学科研与管理服务的综合水平。
通过调查走访各部门,了解教师、学生与行政管理人员的相关需求。主要包括四个方面:一是教学数据分析需求。包括各分院、招生办、教务处等部门对于招生、学生学习行为、教学质量、学科建设与学生就业等方面的分析。二是生活服务数据分析需求。包括图书馆、后勤等部门对于学生的消费行为即图书借阅、网络行为、资源利用等项目的分析。三是财务、人事、宣传等部门对于全校的资产、师资力量、宣传效果等项目的分析。四是研究发展部门对于全校科研项目与成果完成情况的分析(见图1)。
图1 需求分析示意图
结合需求情况,开展系统的总体框架设计,初步将系统分为三大板块,包括数据监测、决策支持和查询定制(见图2)。
系统总体架构包括四个层次,分别是数据引擎、数据挖掘、数据库解决方案和交互平台。数据引擎部分将集成校园WIFI、固网、一卡通、教务系统等各类信息系统的数据,形成数据源,数据挖掘将通过分布式计算架构和数据分析平台对潜在数据进行分析与建模,通过数据库建立本系统的分析数据库,最终通过PC、手机等客户端向用户进行呈现(见图3)。
3.3.1 教学质量评估
教学质量评估属于高校定期必须完成的任务,教学评估的主要目的是更好地发掘出教学过程中存在的一些问题,从而及时地对教学方法进行调整,最终实现教学质量的提升。将大数据运用到高校教学评估系统之中,不但能够在很大程度上提高高校教学管理的科学性,同时还可以提高信息化教学的实用性。把基于大数据挖掘的算法运用在教学评估工作之中,找出教学效果、信息技术在教学中的应用、师生之间的沟通互动等因素之间的联系,从而给高校的教学部门带来非常科学的决策信息,同时让教师可以更加有效地开展教学工作,提高教学质量。
图2 系统板块与功能设计示意图
图3 “智慧校园”数据分析系统数据体系架构
3.3.2 教师教学能力分析
以往的教学缺乏大量数据支撑,教学的质量高低主要靠教师自我度的把握。现在,可以通过在线课堂等技术,搜集大量课堂情况信息,比如学生对知识点的理解程度、教师课堂测试的成绩、学生课堂纪律等。通过这些数据的分析,了解教师熟悉教案的程度、课堂氛围等,改善教学水平。也可以通过深度分析学生在教学过程中教师的课堂表现,从而发现课程的闪光点以及不足,从而让教师能够进一步地对课程教学进行改善,提升教学质量。
3.3.3 个性化课程分析
个性化学习是高校教学改革的目标,过去的班级制教学中无法很好达到这一点,通过把大数据挖掘技术和学习内容结合起来,指导学习者规划学习发展方向,制订学习规划,实现个性化学习功能。通过评估个人情况,根据分析结果推荐可能取得优秀成绩的课程方案。首先获取学生以往的学习表现,然后从已毕业学生的成绩库中找到与之成绩相似的学生信息,分析前期成绩和待选课程结果之间的相关性,结合专业要求和学生能力进行分析,预测学生选择的课程中可能取得的成绩,最后综合权衡预测学生成绩和各门课程的重要性,为学生推荐一份专业课程清单。
3.3.4 学习行为分析
通过一卡通门禁信息、网络信息、课程信息、在线教育系统等相关数据,可以把学生到课堂时间、上课表现、作业完成情况、自习情况等学习信息记录下来,进行变量分析。当一些与学习行为有关的因素(如旷课、纪律问题、课堂表现)发生变化时,对学生提示并进行分析。通过这种系统分析,可以很好地规划学生的学习时间,提高学习效率。
相比于传统常规环境下的数据获取渠道,大数据环境下,校园数据的获取更为广泛和准确。常规环境下的数据主要以经费收支、课程建设、问卷、访谈、课堂观察等来源,而在大数据环境下,通过对事件数据、舆情数据、一卡通、日志搜索等数据的抓取与分析,更能够准确地反映实际校情。
利用大数据分析的数据挖掘与可视化分析,能够直观地呈现大数据特点,同时能够非常容易被使用者所接受,就如同看图说话一样简单明了。智慧校园中,结合学生学习、生活消费的各类数据,通过系统分析与图表展现,让用户只管了解数据分析的结果。
本项目结合大数据发展趋势,充分利用数据挖掘、建模与可视化展示技术,系统存储数据主要是从校内外各种数据源中获得最原始数据,并对该部分数据进行整合形成数据层,然后将数据层中的数据经过抽取、清洗、转换、装载进入数据仓库从而形成支撑层,在支撑层的基础上,可以根据需求对数据进行挖掘分析,从而构建决策层。
系统将利用数据和模型,预测学习者在学习中的进步和表现,预测未来表现和发现潜在问题。如潜在心理问题学生的寻找,家庭困难学生认定,学期中期差生成绩预测等,不再是描述性分析报告的呈现,而是将构成一套综合决策分析模型,准确进行判别预警。