基于大数据的高校学生预警系统

2017-12-08 09:36徐博
科技资讯 2017年30期
关键词:大数据高校

徐博

DOI:10.16661/j.cnki.1672-3791.2017.30.017

摘 要:新的时期下如何更好地做好高校学生工作,是摆在高校教育工作者面前新的问题。同时,我们也应该可以看到,目前高校的信息化系统越来越完善,信息化水平越来越高,大量的学生行数据被学校的各个部门采集到,这些数据汇集在一起会对学生工作带来什么影响呢?本文利用大数据技术,结合学生工作的要求和特点,重点提出了学生预警系统建设的思路和方法。

关键词:大数据 高校 学生预警

中图分类号:G444 文献标识码:A 文章编号:1672-3791(2017)10(c)-0017-02

为了实现高校从信息化过渡到智慧化的目标,引入大数据的体系,是关键性的一步。以往的开发模式是以高校业务为导向,流程运转使得高效沉淀下来大量的业务数据。比如一卡通系统、教务系统、门禁系统、图书馆系统等。这些数据的特征鲜明,结构单一,是目前高校的核心数据资产,也是大数据实施的基础。这类数据的存储普遍采用传统的关系型数据库,比如Oracle、SqlServer等,以单个应用为主题进行设计,比如一卡通、教务、门禁等系统中都有记录学生相关的数据,只是记录的维度不一样,而要实施大数据的项目,则需将这些数据综合利用起来,从单维数据变为多维数据,以支持复杂的数据分析与调取。

但是数据本身而言,对于学校是宝贵的财富,我们要充分利用现有的数据,同时纳入更多的数据源,真正构建智慧化校园的生态圈。

目前高校的能够利用的数据一共分为三大块,业务数据、机器数据以及互联网数据。其中前面两块属于校内数据,后面的互联网数据属于校外。

当前大部分高校还在整合第一块的业务数据,通过建立传统的数据仓库/数据中心来将这些数据进行统一和集中的管理。这一步的建设,可以直接横向打通各个业务系统的壁垒,应该来说这个路是正确的。但是对于后面两块的数据,重视程度不够。机器数据实际上也是学校要实现智慧校园所不可获取的数据基础,广泛分布于学校的无线网、门禁、视频等,都属于这一类数据,机器数据不仅仅数量庞大,同时记录的信息也足够全,合理整合及利用机器数据,是智慧校园建设的重中之重。而互联网媒体数据则是存在于校园网之外,但是又跟学校紧密程度比较高的一类数据,在利用好业务数据和机器数据的同时,将互联网数据也纳入到整个学校的数据体系中,也是智慧校园建设的一个关键指标。

综上所述,为了智慧校园的建设目标,我们需要打通业务数据,开发利用现有的机器数据,同时再纳入互联网数据,构建一个符合要求的大数据平台。

1 架构设计

传统的数据中心和数据仓库的架构目标比较明确,但相对作用也很单一,就是针对学校各个业务系统所存储的结构化数据,并且由于其采用的集中式存储架构,对于PB级以上的数据规模处理起来已经十分吃力,同时对于非结构化数据,特别是软硬件设备所产生的海量日志无法处理,而我们选用的平台则实现了复杂的多平台异构环境下,校园数据的融合及海量数据的存储挖掘,是校园大数据应用的基础设施。

1.1 数据流转架构

数据是大数据存储交换平台核心处理对象,如何进行数据识别、抽取、存储、计算、调取、呈现,激活高校数据价值,释放高校沉淀数据红利,是平台数据流转架构必须要解决的问题。

1.1.1 数据源

數据源主要包含高校各种业务系统的数据、机器的日志数据以及外部互联网的数据。

(1)业务数据。

主要包含高校的一卡通系统、学工系统、门禁系统、教务系统、科研系统和图书馆系统等业务数据。主要是各个业务系统所对应的关系型数据库中存放的基础数据。

(2)机器数据。

主要包含高校无线上网日志、网络日志和URL日志,这里包括主流厂商如华为、华三、锐捷、Aruba、深信服等设备的日志。锐捷的SAM身份认证日志和无线AP的记录,记录了用户上网的身份认证信息以及各个无线AP设备所记录的用户连接信息。

(3)互联网数据。

主要包含各大门户网站、新闻、微博、社交、论坛以及贴吧等数据。针对这些数据可以利用爬虫引擎采集数据,经过清洗处理后存入大数据平台中。

1.1.2 数据采集

为了智慧校园的建设目标,我们需要打通业务数据,开发利用现有的机器数据,同时再纳入互联网数据,这里我们需要将各种数据进行采集,经过清洗合并后存入到大数据平台中。

针对高校的一卡通系统、学工系统、门禁系统、教务系统、科研系统和图书馆系统等业务数据通过ETL引擎定期推送到MySQL集群的大数据基础平台中。这里一般采用比较常用的ODI工具来进行推送。

针对高校无线上网日志、网络日志和URL日志,这里包括主流厂商如华为、华三、锐捷、Aruba、深信服等设备的日志,通过开源软件Flume去接收,并存放至NFS集群中。利用Ruby语言写一个程序实时从NFS集群中读取数据,经过清洗转换然后分别写入MySQL集群、Redis集群和Elasticsearch集群的大数据基础平台中。

但是从设备接收的日志中,不包括用户与用户设备的对应关系,这导致无法进行关联查询。高校上网认证系统有很多,常用的认证系统有SAM,SAM中包括了用户与用户设备的对应关系,所以这里通过Webservice接口从SAM系统中获取我们关注的信息然后清洗转换直接存放至MySQL集群中。

根据数据的规模和类别,对于数据计算分为离线的数据处理和在线实时数据处理。其中离线数据处理即采用传统的Hadoop的MapReduce计算方式,通过大量廉价的硬件服务器分解海量的数据到单个节点进行计算,之后将结果汇总给客户端。

1.2 业务应用类场景endprint

1.2.1 学生异常行为

随着外部社会环境的日益复杂,高校对于学生的学习、生活情况需要异常关注。依据调查分析,平均1名高校辅导员管理的学生有300人,在数据无法及时分析处理的情况下,辅导员遇到的问题越来越多。

(1)辅导员工作繁忙,还需要花大量的时间用巡查的方式了解学生状态。

(2)学生在跨越一段时间内的多个细微异常举动很容易被忽略,留下隱患。

(3)信息分散在各个业务系统中,了解学生的情况需要登录多个系统,耗时费力。

(4)大事发生,学校先知道,学院最后知道!小事发生,辅导员无从察觉,事态严重,学校才知道。

(5)学生办理事务,各层级掌握信息不同,一件事要多个层级确认。

(6)各院系,以及辅导员日常学生安全管理工作成效很难被量化。

学生安全行为管理系统专为这种场景所定制,汇集多业务系统数据,通过合理的数据建模方式,加强管理水平,确保校园安全,提高学生安全感。

平台价值如下。

(1)校领导:学生安全一目了然。通过报表、图形、态势图了解学生校内生活、学习情况。

(2)学工处:由被动管理转化为主动服务。落实“以人为本、服务为先、学生至上”的服务理念。

(3)辅导员:传统意义上的学生管理,每名辅导员少则管理200~300名学生、多则管理500~600名学生。辅导员几乎将全部的时间和精力放在学生安全管理上,无法为学生提供其他服务,同时也未必会取得良好的效果,在及时性和有效性方面都有所欠缺。

使用学生安全管理平台后,系统筛选出存在风险的问题学生,辅导员可以将精力放在重点的1~20名学生身上,在学生安全方面会减少约90%的工作量,便于辅导员将更多的时间和精力投入到为学生提供更优质的服务中去。

1.2.2 学生心理健康

学校心理健康中心的心理辅导专家,每天会接到很多辅导员和家长的电话咨询。由于缺少数据支撑,只能通过谈话沟通、问卷调查获取信息,信息缺失非常难以判断学生的心理波动。

(1)校领导。通过大数据建模分析手段,大大减少因为学生心理问题带来的极端事件从而对学校造成较大影响事件的概率。

(2)学工处。庞大而复杂的学生管理工作从以前的被动转变为主动,面对数以万计的在校学生,通过数据的综合分析获取普遍学生对于学校管理方式的反馈,及时修正管理措施,针对个别学生会出现的心理变化问题,及时捕捉、重点监管的范围缩小90%以上,同时对于已经确定的人群则可以进行实时重点关注。

(3)辅导员。利用数据资源,缩小异常表现学生的范围,提升辅导员监管效率和减轻工作量。

参考文献

[1] 范玉朋.基于高校公共数据中心的大学生预警平台设计研究[J].赤峰学院学报,2017(6):37-38.

[2] 李国俊,刘雪琳.高校应对学生突发事件的预警能力评价研究[J].高教学刊,2017(16).

[3] 张晶华,丁福兴,陈永静.大学生学业风险管理:预警评估与干预帮扶[J].牡丹江大学学报,2017(4):166-168.

[4] 贝虹.大学生心理问题及其预警干预机制研究[J].东方教育,2015(8).endprint

猜你喜欢
大数据高校
提升高校官方微信公众平台传播效果的几点思考
大数据环境下基于移动客户端的传统媒体转型思路
中日高校本科生导师制的比较
试论高校党建工作中的党史教育
学研产模式下的医药英语人才培养研究
高校创新型人才培养制度的建设与思考
高校科研创新团队建设存在的问题及对策研究
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索