王军 孙蓓
摘 要:随着高职院校数字化建设的快速推进,校园一卡通系统成为高职基础数据建设的方向,也是搜集学生行为与消费状况的重要手段。当前多数学生利用校园一卡通服务平台,开展校内外的餐饮、出行或其他消费行为,从而完成大数据与学生行为管理之间的深度对接。本文以Hadoop开源平台架构为基础,建立高职学生行为分析及预警管理系统,对学生的日常消费行为进行预测与管理,以实现学生信息管理的数字化、安全化。
关键词:大数据;高职学生;行为分析;预警机制
中图分类号:TP393.18 文献标识码:A 文章编号:2096-4706(2019)08-0013-03
Abstract:With the rapid advancement of digital construction in higher vocational colleges,the campus card system has become the direction of the construction of high-level basic data,and is also an important means of collecting student behavior and consumption. At present,most students use the campus card service platform to carry out catering,travel or other consumer behaviors inside and outside the school,thus completing the deep connection between big data and student behavior management. Based on the Hadoop open source platform architecture,this paper establishes a behavioral analysis and early warning management system for vocational students to predict and manage students’ daily consumption behaviors,so as to realize the digitization and security of student information management.
Keywords:big data;vocational students;behavior analysis;early warning mechanism
0 引 言
大数据作为一项海量数据存储与计算技术,开始广泛应用于高职院校的教学与行政管理中,校园一卡通即为高职院校信息管理系统的组成部分。校园信息管理系统采用Hadoop分布式任务调度模式,从多个节点获取需要处理的数据内容,并将其分配到不同的虚拟机平台,来实现对海量数据的并行处理与存储。通过将Hadoop大数据框架管理模式,引入到一卡通管理系统中,能完成对学生日常行为与消费的安全管控。
1 高职学生日常行为的价值及大数据组织架构分析
1.1 高职学生行为及校园一卡通消费数据的价值
在我国高职院校智慧化校园建设的前提下,学校的日常教学活动、行政管理活动,都将与校园一卡通系统进行关联,并在短时间内生成大量的结构化数据。这些数据主要由教师、学生、教职工等的行为活动而产生,包括教学、学习、饮食、出行或其他消费数据,学校领导或教师等主体可以登录网络客户端,查询自身或其他人的参与教学、学习、公益活动等行为,还可以对自我的行为状态或工作价值进行评估。基于此可以看出,在高职院校校园一卡通系统建设的过程中,对学生的行为及消费数据进行搜集,可以充分掌握学生在某一时间段的学习、生活状况,并据此制定相应的学生管理策略。
學校领导可以通过“校园一卡通”终端管理系统,对教育基础设施数据、行政管理数据、教学与管理资源数据、教师学生的行为数据等,进行分层与分步骤管理。针对高职院校课程教学、日常生活等场景,构建学生行为分析模型,对学生的上课迟到、早退、旷课,以及学生宿舍出入、大门出入与消费状况进行记录,并上传至校园一卡通数据管理及预警系统。然后由校园管理者、辅导员等根据预警信息,对学生的学习、生活与消费情况作出评价,从而真正做到学生行为评价的数字化、公正化。
1.2 学生行为分析及预警系统的Hadoop平台架构
Hadoop分布式系统基础架构,是由Google公司开发的分布式文件处理与存储系统,其能够利用较为低廉的硬件,来完成海量数据的访问、处理与存储。当前高职院校使用的Hadoop平台组织架构,通常是以映射、归约的方式进行两组数据的映射操作,并将已经完成映射的数据进行归约操作。利用Apache Hadoop大数据框架,开展海量数据的任务调度与处理的过程中,分布式文件系统会将不同的数据内容,主动分配至不同的主节点、从节点,主节点会优先对提交的用户数据进行执行,从节点在数据处理过程中遵从“就近原则”,最终完成所有数据命令或指令的操作执行。利用Hadoop分布式系统进行数据计算,能够实现整个终端管理内部的负载均衡,并有效保证批量数据处理、存储与管理的高效率化。Apache Hadoop平台的基本组织架构如图1所示。
对于高职学生日常消费情况,以及学习、生活行为的分析与管理,可以借助于Hadoop分布式大数据系统,主动对学生日常行为的数据进行搜集,并据此作出行政事务、教育教学等方面管理模式的创新。通过将学生日常行为、学习情况的数据信息,上传至Apache Hadoop大数据分布式系统,能够完成对海量数据的分类与分析,并将最终的预测结果交由管理部门、教师等进行处理,然后制定出对学生心理辅导、网络消费行为管理的策略,从而有效防范学生日常学习、生活与消费的潜在风险。
2 大数据环境下高职学生行为分析的数据采集及预测模型
2.1 高职学生日常行为分析、消费状况的数据采集
当前高职学生校园行为、消费状况等数据的采集,主要通过校园一卡通系统、云化ETL工具、网络爬虫等,进行结构化数据、非结构化数据的搜集操作。以智慧校园系统为例,校园一卡通系统中的学生数据,包括学生在不同时间、不同地点的学习、生活或消费数据。从校园一卡通网络监控平台中,获取到存在关联性的海量数据后,要利用决策树、交叉表格等方式,对数据进行分类与预处理,将其存储到HDFS分布式系统之中,以保证原始数据、关系型数据库之间的灵活转换。之后使用Scala语言交互命令,对不同数据信息进行类似分组的聚类分析,最后运用Hadoop系统对数据进行分布式处理与存储。
而以云化ETL工具、网络爬虫等为主的数据采集,是针对那些碎片化的非结构数据,借助于多个网络数据采集平台,使用网络爬虫、云化ETL、流数据处理(FoxTable)等工具,进行网页数据信息的抓取与采集。因此可得出,多种校园信息系统对高职学生行为的分析,通常涵盖数据分类、特征分析、关联性分析与异常分析等,教师在掌握学生日常学习、生活状态的情况下,就能够对其后续的消费行为作出预测与管理。
2.2 高职学生行为分析、消费数据的预测模型
高职管理部门对学生校园行为、消费数据等的分析,需要根据搜集到的学生行为轨迹、学习情况、消费与课下活动数据,来对学生精神状况、心理健康等进行了解,从而实现学生个性喜好、心理状态与生活习惯的深入剖析。在高职学生行为分析预测模型建立的过程中,应先对不同系统模块的权重、分级指标进行设置,通常该预测模型包括数据感知层、分布式数据分析层、数据交互服务层、数据可视化层等层次,不同层级中存在着不同的功能与服务项目。
图2 高职学生行为分析、消费数据的预测模型
首先数据感知层为预测模型的最底层,主要负责对学生一卡通数据、上课考勤数据进行采集。其次,分布式数据分析层为数据处理、存储层,负责海量数据信息的分布式处理与存储。之后数据交互服务层,通常负责学生行为数据的分析与结果预测,包括对学生行为特征、学习与消费情况的预测,通过对学生学习状况、人际交往、行动轨迹与消费等数据的分析,能够作为后续学生行为管理的参考内容。而数据可视化层是将整理好的预测模型,由Web可视化展示平台进行展示,以方便管理人员动态掌握学生的行为数据,具体模型如图2所示。
3 大数据环境下高职学生行为分析的预警管理机制研究
高职学生行为分析的预警平台,是以大数据云计算为基础的数据管控系统,其主要包含数据资源层、数据处理层、应用层等三个层级,不同层次又涵盖一系列的硬件设备与软件,多种设备组件之间的关联作用,可以实现对半结构化、非结构化数据的搜集与处理。
第一,数据资源层作为预警平台的最底层,主要用于搜集校园一卡通、教务系统与网络文档等方面的数据,在学生学习、日常行为轨迹等数据批量化采集完成后,將这些数据交由数据处理与存储层进行管理。
第二,数据处理层中包含Hadoop平台、主数据仓库、分布式数据库等构件,不同组成部分分别负责数据的分类整理、处理与存储。
第三,应用层是包含一系列数据挖掘、分析组件的层级,是由FTP、SQL、API、WS、MDX等组件组成的预警平台,通常负责对海量数据的进行实时监测、智能预警,并将最终的数据预警结果在数据报表中公布,具体如图3所示。
根据以上学生校园行为管理系统可以看出,大数据校园管理系统是以基础大数据网络平台Hadoop为构架,搭建起的元数据资源管理模型。该模型中包含基础运行环境、数据采集模块、关联性数据运算与存储模块,以及数据分析挖掘模块、智能预警与调度管理模块,多个模块之间的共同作用,可以完成对校园一卡通数据、第三方数据的搜集与转化。之后将学生课堂考勤、学习成绩、校园网络接入、图书借阅或消费等数据,转化为元数据资源,交由数据存储平台进行数据明细的记录、汇总与存储,并上传至综合分析挖掘平台、智能预警平台,以完成对学生的日常行为、消费数据的分析与预警。最后,高职学生行为分析预警系统的应用层,负责将学生多方面行为数据进行挖掘与融合,整理出可视化的数据报表或模型,方便管理人员对相应指标的监测、预警与管理。通过在校园一卡通消费数据分析中,使用元数据管理、数据处理、综合分析与挖掘、安全预警与监控等管理流程,可以对学生未来行为的发展做出预判。
4 结 论
大数据云计算作为互联网前沿技术,可以广泛应用到智能网络生态系统的建设中,并实现对海量数据信息资源的安全处理与管理。高职学生校园行为分析与预警机制的建设,也要借助于Hadoop大数据网络框架,进行数据采集、处理与存储模块的构建,然后对得到的校园一卡通数据信息进行综合挖掘与分析,才能完成学生日常学习、生活及消费行为的智能预警,并提出相应的管理策略对其作出安全管理与控制。
参考文献:
[1] 刘少伟,赵长在,雷少飞.基于数据分析的学习者在线学习行为研究 [J].中国成人教育,2016(23):11-14.
[2] 李超,程罡,石磊.基于层次分析法的在线学习行为指标体系构建 [J].河北广播电视大学学报,2017,22(2):18-21.
[3] 李海洋,吴学琴.信息化背景下大学生网络学习行为实证研究 [J].重庆科技学院学报(社会科学版),2017(12):117-120+136.
[4] 姜强,赵蔚,王朋娇,等.基于大数据的个性化自适应在线学习分析模型及实现 [J].中国电化教育,2015(1):85-92.
作者简介:王军(1981-),男,汉族,江苏南通人,高级工程师,硕士,研究方向:大数据、网络;孙蓓(1983-),女,汉族,江苏南通人,助理研究员,硕士,研究方向:学生行为分析、学籍管理。