王莉莉
摘要:高校智慧校园建设的推进产生了教育大数据,为大学生校园行为分析与预警提供了有力的数据支持。针对当前高校大学生校园行为分析预警管理平台建设滞后问题,文章利用大数据分析关键技术,搭建集数据采集与存储、行为分析与挖掘、画像生成与预警、安全管控等多功能模块于一体的大学生校园行为分析预警管理平台,为加强学习行为安全预警与管控、促进学生管理水平的持续提升提供助力。
关键词:智慧校园;大数据;校园行为;分析预警管理平台
2015年8月31日,国务院发布了《促进大数据发展行动纲要》,强调大数据已成为国家经济发展与创新驱动的基础性、前瞻性技术。为了适应大数据时代发展,高校纷纷推进智慧校园建设,并积极推进教育大数据的收集、分析、应用、共享,充分发挥教育大数据对深化高等教育改革,提高人才培养质量的支撑作用。
学生行为大数据作为教育大数据的重要组成部分,内蕴学生的行为规律与个体特征。高校全面捕捉、深度挖掘和提取数据中的潜在信息进行学生画像,能及时洞察学生的不良行为并进行预警,对有效防范校园安全事件发生、精准把握学生思想动态、提高学生管理工作水平具有重要意义。
但是,当前大学生校园行为监管大多集中在宣传说教与定期排查方面,管理模式仍停留在事后定性分析层面,缺乏高效的技术支持,与智慧校园智能管控的要求有所差异。因此,高校需立足智慧校园建设背景,基于大数据技术推进大学生校园行为分析预警管理平台建设,建立健全预警决策机制,以此探索多维度、动态化、立体式的教育管理模式,对学生不良行为进行全面跟踪与警示教育,确保大学生成长成才。
一、大学生校园行为大数据的产生与价值
为了响应国家《教育信息化“十三五”规划》《教育信息化2.0行动计划》等政策的要求,高校纷纷推进智慧校园建设,并将其作为治校育人的“重器”,全面推进校园信息化建设,着力打造以大数据技术为手段、数据中心为核心、业务应用系统为支撑的智慧校园建设格局。
随着智慧校园建设的推进,通过教学活动和教育管理产生了大量的结构化与非结构化教育大数据,其中包括种类繁多的校园行为数据。校园行为大数据涉及学生上课考勤、实验室出入、寝室门禁等,全面记录了大学生迟到、早退、旷课、活动参与、各科成绩等信息。通过技术支持,高校能够结合不同教学场景进行分析建模,全程跟踪大学生校园行为,一旦不良行为累计数据超出阈值,便会自动向教育管理人员发送预警,以提高学生管理的针对性和实效性。
大学生校园行为数据异常复杂,不易精确整合和建立相互间的关联性。因此,传统浅表层面的大数据应用已无法满足大学生校园行为大数据的分析、整合与利用所需,亟须依托智慧校园各应用系统、人工智能、大数据等技术融合支持,经过数据抽取、洗涤和加工,抽象出全面反映大学生性格、态度、行为偏好等多维度行为特征画像,由此开展大学生全周期、全过程、全空间的跟踪监管,强化大学生校园行为的研判预测、引导干预,以此有针对性地引导大学生端正思想、规范行为,保障大学生健康发展。
二、大学生校园行为大数据分析的关键技术
传统大学生行为管理多依赖于经验,属于事后应对模式,而大数据技术的引入为事前研判、预测与监管提供了支持。从整体来看,大学生校园行为大数据分析涉及的技术很多,本文主要运用Hadoop大数据处理框架,配合Apache Kafka、Flume数据采集技术,HDFS数据存储技术,MapReduce数据运算分析等技术,实现对大学生多维轨迹及行为大数据的数据采集、清洗、建模、降维分析与可视化呈现。
具体而言,Hadoop大数据处理框架能够将一台计算机的计算能力无限次、高速率地复制到集群机上,赋予集群机强大的计算运行能力;HDFS数据存储技术提供海量数据的存储与管理功能,支持非结构化数据处理;MapReduce数据运算分析提供分布式并行计算,并支持动态的大学生校内行为轨迹地图与查询服务,其与HDFS数据存储技术的融合,赋予Hadoop大数据处理框架强大的存储与计算功能,使之能够有效存储和处理PB级大数据;Apache Kafka數据采集技术作为一个分布式消息队列系统,能提供高性能、高可靠性的数据传输与处理能力,支持实时数据处理与大数据场景;Flume数据采集技术提供海量日志的采集、聚合与传输,支持日志系统对各类数据的收集、定制与发送。此外,基于Echart、D3.Js的可视化呈现与SaaS交付形式,促进了学生画像的生成,打通了大学生校园行为监控、预警、根源分析的闭环管理路径,并以Html5技术进行预警信息定向推送,为智慧校园大学生行为管理提供了智能化技术手段支持。
三、大学生校园行为分析预警管理平台的开发与实现
(一)平台架构搭建
本文所开发的基于大数据的大学生校园行为分析预警平台,采用的是典型的大数据技术架构,包括数据源、运行数据、核心能力与场景应用四层结构,如图1所示。其中,数据源层依托云化ETL工具、流数据处理、网络爬虫、主数据仓库等,负责大学生校园多维轨迹及行为数据的采集与存储,包括“一卡通”系统、教务系统、门禁系统等自动采集,以及源自互联网与文档等学生历史数据,点击流,实时日志等结构化、非结构化及半结构化数据;核心能力层是依托Hadoop集群、云存储、分布式数据库等,对数据源层所采集的多维大数据进行运算处理;运行数据层是借助数据清洗、数据建模、多维分析等多元组件的支持,对计算后的数据进行清洗、建模与分析,实现信息的即时查询;场景应用层是利用数据网关、BI组件、可视化技术等,实现对数据的可视化呈现与预警发送。高校通过四层平台架构,可以实现大学生校园足迹、行为轨迹的实时监控及画像生成,提供预警反馈、预警信息推送等服务功能。
(二)功能模块设计
在大学生校园行为分析预警平台架构的基础上,利用Hadoop开源平台进行二次开发,是底层数据采集与存储模块的设计,负责各类结构化、非结构化与半结构化数据的采集与文本化存储,随后以主流架构及分析算法开发,实现行为分析与挖掘、画像生成与预警、系统安全运行管控等功能模块,进一步对各数据进行挖掘与分析,并对分析结果进行图形化直观呈现,帮助管理人员分析学生行为和心理问题,协助开展教学管理宏观决策,辅助校园安全管控,为智慧校园智能化管控提供支持。
1.数据采集与存储模块
数据采集与存储模块是在Apache Kafka、Flume数据采集技术的支持下,通过智慧校园数字化基建及物联网、云计算等平台,全面抓取和收集高校管理基础信息、大学生动静态特征属性等校园行为大数据,包括教务系统、一卡通系统、寝室门禁系统、图书馆借阅系统、校园网等关联数据,以及大学生身份信息、兴趣爱好等内容,并将多维大数据进行集成分类存储,生成大学生校园画像属性值,并将数据属性值样本进行清洗,利用曼哈顿函数对目标区域半径外的数据偏离距离进行计算,利用排序设定合理的阈值,将离群点偏离度展开对比,获取各属性值的异常度。
2.行为分析与挖掘模块
行为分析与挖掘模块借助HDFS、MapReduce技术的支持,通过分布式文件系统与并行计算,将上一模块采集到的大数据进行分析建模,并实现数据的深入挖掘和智能分析。具体而言,高校利用Hadoop大数据处理框架的支持,将采集的大学生校园行为数据属性特征分别贴上标签,在主成分分析法的支持下,利用降维思想及线性变换法,将所给定的一组相关变量转换为另一组不相关变量,转换后的新变量依循方差递减的顺次排列,据此生成协方差特征矩阵的对应特征值及行向量,获取关键特征值,并基于距离进行聚类分析,实现数据归一化处理,将高偏离度的异常信息提取出来,继而针对学生的异常行为状态进行研测。
3.画像生成与预警模块
画像生成与预警模块在Echart、D3.Js的支持下,使用“七观(人生观、政治观、道德观、学习观、消费观、 交际观、就业与发展观)”与“六维(思想政治行为、道德行为、学习行为、社交行为、经济行为、求职行为)”学生肖像法生成学生个人画像及班级、专业群体画像,并支持学生校内行为轨迹与即时查询服务,结合行为分析与挖掘模块分析结论,建立大学生学业、心理、思想、群体突发事件等影响学生行为养成因子的预警机制,实现对学生异常行为的自动化预警,同时制订有针对性的安全监督措施。管理人员通过预警信息,能够实时感知并监控在校学生的考试表现、上网行为、课堂表现、日常行为、活动参与、心理健康等方面的状态,挖掘学生异常数据,反馈学生异常行为,做好事前防范工作,避免异常事态恶化,实现对异常事件的可查、可控、可追溯,切实保障学生在校的安全、健康与学习效果。
4.系统安全运行管控模块
大学生校园行为大数据是高校重要的数据资产,为了保障学生信息及隐私的安全性,高校需要开发系统安全运行管控模块,在iPaas、Ldap和Kerberos等安全认证的支持下,做好大学生校园行为分析预警管理平台的数据监控与数据管理,从运维监控、调度管理、安全管理、数据质量、元数据管理等方面出发,切实保障高校数据资产的安全性和可控性。
四、结语
综上所述,智慧校园各类智能终端、传感设备可以实时、动态、全面获取大学生海量的活动轨迹及校园行为大数据,而基于大数据关键技术所开发和搭建的大学生校园行为分析预警管理平台,可以高效完成大学生校园行为大数据的收集与存储、关联分类与聚类分析,生成完整的学生画像。
参考文献:
[1]赵涛.基于智慧校园的高职学生行为数据采集与分析策略[J].襄阳职业技术学院学报,2022(6).
[2]喻宏伟.基于动态语义时空图卷积网络的大学生行为预测与分析[D].武汉:华中师范大学,2022.
[3]喻宏伟,周东波,徐雯慧,等.基于多片段语义时空图卷积网络的大学生校园日常行为预测[J].清华大学学报(自然科学版),2022(1).
[4]葛苏慧,万泉,白成杰.基于Hadoop的高校學生行为预警决策系统研究[J].计算机应用与软件,2021(1).
[5]杨光莹,杜敏,杨东梅,等.基于校园行为数据分析的学生画像系统初步构建研究[J].教育教学论坛,2020(41).
[6]施明毅,杨光莹,杜敏,等.基于校园行为大数据分析的学生画像系统构建探析[J].中国多媒体与网络教学学报(上旬刊),2020(4).
基金项目:2022年第一批教育部协同育人项目“突发公共事件下大学生网络心理服务平台建设研究”,项目编号:220602036230254。
(作者单位:江西宜春职业技术学院)