大数据背景下高校学生行为分析系统的研究

2019-12-24 09:19王利祥
网络安全技术与应用 2019年7期
关键词:模块校园分析

◆王利祥



大数据背景下高校学生行为分析系统的研究

◆王利祥

(河南护理职业学院 河南 455000)

随着各大高校数字化校园建设工作的推进,大多数高校已经在数字化校园阶段积累了大量的数据,如何把这些数据进行整合为人们所用呢?这便是智慧校园需要推进的。本文在深入研究市场中多数智慧校园建设方案之后,结合高校工作实际,对学生行为分析系统需要完成的工作做了深入研究,为后期智慧校园建设做重要支撑。

大数据;数字校园;智慧校园;学生行为分析系统

1 研究背景和意义

随着互联网的飞速发展,信息技术不断进步,至今为止,大多数高校已经完成了对校园内部信息进行收集、优化处理以及传递应用,数字化校园实现了教育事业建设和管理的全面信息化,大幅度提高了校园管理的水平和效率。通过前期数字化校园阶段的建设,学校的各种资源信息以及师生行为信息大量的产生,并存储下来,如何将这些信息量大而且是异构数据源进行整合,为后期的分析系统提供数据支撑呢?这便是本研究的一个重要的用途。

2 大数据技术

人们在利用网络技术以及信息技术的同时,会产生大量的数据,人们对海量数据的存储、分析和处理,不断挖掘出日常生活中看似没有关系的数据便会为我们所用。大数据有如下4个特点,分别为:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),一般称之为4V。

(1)大量:社交网络(微博、推特、脸书)、移动网络、各种智能工具,服务工具等,都成为数据的来源。

(2)多样。广泛的数据来源,决定了大数据形式的多样性。

(3)高速。生活中每个人都离不开互联网,也就是说每天个人每天都在向大数据提供大量的资料。并且这些数据是需要及时处理的,对于一个平台而言,也许保存的数据只有过去几天或者一个月之内,再久远的数据也要及时清理,不然代价太大。基于这种情况,大数据对处理速度有非常严格的要求,服务器中大量的资源都用于处理和计算数据,很多平台都需要做到实时分析。

(4)价值。这也是大数据的核心特征。现实世界所产生的数据中,有价值的数据所占比例很小。相比于传统的小数据,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的目的。

3 系统总体架构

国内高校大多数已经完成了数字化校园的基础建设,因此可以利用现有的数据平台,进一步完善数据源,提高数据有效性,搭建起能够跨业务域和跨系统的数据分析和展示平台,并构建起适合不同主题不同导向的多类应用系统。在当前的大数据时代,学生的各种行为也在不断地产生各种类型的数据,因此可以利用这些数据对学生在校的各个方面进行量化测评,搭建高校学生行为管理系统。对系统的总体要求大致如下:

3.1 整合多方面数据,搭建数据平台

由于高校中机构设置比较多,学生的数据存放位置和维度也会有差异,因此需要将这些分散的、不同维度的信息进行整合。如学生处、教务处、图书馆等都有学生的相关数据信息,此时可以建立数据中心,将所有相关数据按照统一的格式进行整合并存放到数据中心中,打破因为业务域的不同而产生的数据界限,实现数据“1+1>2”的效果。

3.2 统计分析

在建立数据中心之后,对学生行为产生的历史数据与当前数据进行整合分析,并将分析结果以图形或图表的直观化形式展示出来,以便为我们工作增加辅助性工具,提高工作效率。如针对学生使用一卡通借书信息、出入操场信息以及每天的步行数等相关数据,综合评估学生心理问题和身体状况等。

3.3 尽量增加数据维度,综合判断学生情况

大数据技术最重要的价值在于从海量数据中挖掘出尽量多的类型的数据的相关性,而非单纯的人为去考虑事情之间的因果关系。自然界中万物均存在联系,挖掘出事物之间潜在的关系,为我们做出决策提供依据和参考,这才是大数据被提出的真正目的。

3.4 构建大数据处理平台

随着全国高校智慧校园建设的发展,学生的信息类型也在不断被发现和存储,如学生上网日志信息、微信微博信息及学生之间的交友信息等,再加上学生数量比较多,因此产生的数据量巨大。因此需要构建大数据处理平台,来作为大数据分析数据和存储数据的工具。

4 系统设计

系统的设计分为系统物理架构、系统功能设计和数据结构设计。系统物理架构一般是基于多台物理服务器的虚拟机实现,在此不做赘述。由于大数据平台中存放的大量的数据,这些数据有些是与分析系统没有关联,数据结构设计主要任务便是对数据平台中有用的数据进行读取和存储,通过分析系统将分析结果在前端界面设计中展示出来。此处我们重点介绍系统功能设计。

系统的功能架构主要有以下4层:支撑功能层、数据挖掘层、智能分析层和信息发布层。

(1)支撑功能层主要是对用户信息和权限管理以及对用户操作的日志进行管理。具体功能如下:

①支持对用户信息的增删改查功能以及批量操作。

②根据用户不同的需求设置不同的权限,如设置系统管理员账号,该账号具有系统操作的所有权限,并且可以对其他管理员以及用户信息进行操作,包括增删改查等基本功能。

③系统管理员账号可以根据系统维护的需要对其他管理员账号设置不同的权限。

④系统登录日志功能,系统要根据需要设定系统日志记录的信息,主要包括登录名、登录时间、是否登录成功、登录失败的次数等信息,并提供检索查询导出功能。

(2)数据挖掘层主要是对大数据平台中学生相关的海量数据信息,采用大数据技术构建数据挖掘模型,利用现有模型评测学生的行为。由于在校学生活动具有区域性的特点,因此可以将挖掘层分为以下5个模块进行实现:

①学生基本信息模块:该模块主要展示学生的一些基本信息,并对这些基本信息进行简单的分析。如学生总数、学生民族组成比例、宗教信仰、年龄段分布等。

②图书馆分析模块:该模块主要是对学生图书借阅信息、进出图书馆信息等进行分析。如学生借阅书籍的类别和名称、借阅的时间、借阅的数量等,可以作为分析学生学习情况、课外活动情况、学生心理情况等的参考。

③餐厅消费模块:这些数据大多数都会在数字化校园建设时使用的一卡通中有记录。根据学生使用一卡通消费情况,如消费金额、消费时间、消费品种等信息对学生情况进行判断,如早饭消费时间和消费种类可以用来做学生健康调查分析,消费金额可以作为判断贫困生的一个参考。

④学生宿舍分析模块,主要是对学生就寝时间、出入宿舍的次数等数据的分析。如学生晚上入寝时间可以作为学生晚归的分析依据,早上离开宿舍的时间可以作为学生身体健康以及学习情况的分析依据。

⑤综合分析模块,这是功能设计中的核心价值,也是能够根据用户需求实现自定义分析的功能。为了能够完成对海量数据的处理,项目采用Hadoop生态圈中的Hive子项目以及Spark平台中检索查询和统计分析功能。相对于关系数据库中的SQL语句,该方法执行速度更快。

(3)智能分析层主要是将上层所挖掘出来的数据进行深层次分析,其中包括学生历史特征信息以及当前信息。根据学生历史特征分析出正常数据正常的参数值,然后根据此参数值对学生进行筛选和匹配。

(4)信息发布层主要是将分析结果展示出来,方便人们阅读。可以采用周期性推送的方式,也可以采用被动查询分析的方式,一般都为两种方式相结合使用。

5 结论

当前阶段,大多数高校已经基本完成了数字化校园的建设,正处在智慧校园建设之中,本文在深入了解市场上已经存在的数据分析系统之后,结合学校工作中经常使用的分析结果,探讨了学生管理工作中行为分析系统的大致架构以及经常使用的辅助工具的搭建模型,为后期智慧校园建设提供了理论支撑。

[1]申华.基于大数据的高校学生综合测评系统设计与实现[D].北京:北京工业大学,2017.

[2]潘奇.基于Hadoop技术的高校学生行为分析系统研究与实现[D].北京:北京邮电大学,2014.

猜你喜欢
模块校园分析
28通道收发处理模块设计
“选修3—3”模块的复习备考
隐蔽失效适航要求符合性验证分析
分析:是谁要过节
校园的早晨
春满校园
电力系统及其自动化发展趋势分析
集成水空中冷器的进气模块