校园一卡通数据学生消费及学习行为的研究*

2017-01-18 05:57
山西青年 2017年3期
关键词:一卡通数据挖掘聚类

周 野 尹 建

吉林建筑大学电气与计算机学院,吉林 长春 130118



校园一卡通数据学生消费及学习行为的研究*

周 野 尹 建

吉林建筑大学电气与计算机学院,吉林 长春 130118

校园一卡通系统就是全面整合学校内的各种信息和资源,可以使信息与资源发挥最大的作用。在实现全面管理学生校园消费与学习活动时引入数据挖掘技术,第一,在利用数据预处理技术的基础上收集各种数据的特点。第二,利用K-means聚类算法总结出学生的消费习惯与消费特点,同时利用决策树算法确定聚类结果;第三,利用Apriori关联规则算法研究出学生日常行为习惯与学习的关系程度,在高校开展学生管理过程中全面利用上述所得各项结果。 关键词:数据挖掘;K-means

当前,高校广泛引入了数字化管理系统,校园一卡通就是其中的一种,同时也得到了广大师生的认可,同时也可以据此反映出高校信息化程度。高校管理对象的主体是学生,利用全面研究一卡通中的各项数据可以得出学生的行为规律,可以掌握存在于学生间的有价值信息,有利于帮助高校学生管理工作的不断提高,而且也使校园各种信息集中在一起。作为自大量纷繁复杂的信息中提炼有价值信息技术手段的数据挖掘技术,当前已经进入科学研究与商业各个领域当中。在高校人力资源管理当中应用数据挖掘技术,可以发挥有价值数据的作用,提高高校管理水平。

一、学生校园消费及学习行为分析

笔者针对某大学的一卡通系统进行了研究发现,其数据库主要应用了分布式处理和“客户端/服务器”,利用服务器数据库可以收集大量的学生信息,主要内容有学生消费、门禁、成绩等各个方面的数据,有着庞大的数据量。依据数据处理流程将收集到的学生消费、学工、图书馆等各种数据库中的数据全面应用数据挖掘技术进行整理,以求掌握学生消费习惯与学习行为规律。在oracle数据库中保存原始数据,自概念方面对其进行研究发现,其主要内容有商户与管理账户数据字典、全局设置数据字典,系统管理与运行环境设置数据字典、流水账户数据字典、报表部分数据字典等。所以必须对掌握的大量数据进行预处理,主要流程有清理、集成、转换、归约等五个部分,集中得到的全部结果成为一个小型数据库,以利于今后的各种研究。

(一)消费习惯分析

利用K-means聚类方法处理消费数据库中的各种数据,以求掌握学生的消费习惯,第一,先对数据库中的消费数据进行清理,输入属性应用K-means算法。这一算法包括二种初始参数:初始聚类中心与聚类数目K。笔者认为在初始聚类中心选择时可以应用一种较为先进的做法,主要就是利用改变初始聚类中心得到一种类内密集程度最高的情况,可以上升为研究结果,如果得到的类内密集程度较高,那么则表明类内点密集度较高,得到的结果最为有利。

(二)学习行为分析

利用Apriori算法全面研究消费数据、学工数据、图书馆数据,可以掌握学生各种学习行为间的联系,如学生在图书借阅中是否应用了奖学金,学生消费数量的多少是否与贫困生助学金有关。先清理数据库的各种有关数据,可以得到学生不同学习行为间的关联程度如何,以此掌握学生不同学习行为间的关系。

二、实验分析

本篇通过上文所述数据预处理技术将原始消费数据进行了一系列的转换与筛选,最终得到可供K-means算法输入的待测数据,由于初始数据不同属性显示男、女生消费情况略有差异,因此本文针对男生、女生分别进行分析,男生数据393组,女生数据111组。此外,为便于聚类分析,将输入数据离散化。根据直方图均衡化的无指导离散法将属性按值域划分出五个区间,即很高(2)、高(1)、中(0)、低(-1)、很低(-2)5种水平,转换为离散值,作为输入数据,便于分析。经实验,K=4,聚类结果最好,输入K,改变初始聚类中心参数,循环直到P值最小结束。在本文中改变随机初始聚类中心参数可以改变随机初始聚类中心,最终对应P最小的结果(类内密集程度最大)即为最优的聚类结果,P即所有数据样本的平方误差总和如表1、表2所示:

表1 聚类结果比较(男生数据)

表2 聚类结果比较(女生数据)

从表1得出,男生数据第一组结果最佳,迭代次数为6,所有样本数据的总方差P为最小值,因此,最终采用第一组聚类结果。从表2得出,女生数据第四组结果最好,迭代次数为6,方差之和P为最小值,因此,最终采用第四组聚类结果。

三、结论

为了全面研究高校信息化改革现状,本文全面研究了高校学生一卡通中各种数据,同时引用了数据挖掘技术,选择吉林建筑大学校园一卡通数据作为主要研究对象,对其中学生消费习惯与学习行为进行了研究。第一,在全面应用数据清理、集成、转换、归约等技术的基础上得到一个小型数据库。第二,利用K-means算法开展聚类研究,这一算法可以得到有效结果,利用分析类密集程度掌握最优聚类结果。依据结果可以对学生进行分类,同时研究各个类型的特点。第三,对得到的聚类结果应用决策树模型与十折交叉验证法进行研究,对学生各种学习行为规律应用Apriori关联规则算法进行分析,利用这一结果,学生管理人员可以实现对学生的轻松分类,同时有利于后勤管理部门提高服务水平,可以进一步提高高校学生管理水平。

[1]王永建,张鑫,赵志明,王海兵.智慧校园一卡通系统安全监管平台设计[J].电信快报,2016(09).

[2]刘新汉.校园一卡通系统的设计与安全性分析[J].中小企业管理与科技(中旬刊),2016(10).

*吉林建筑大学大学生创新创业训练计划项目资助(201610191040)。

TP

A

1006-0049-(2017)03-0043-01

猜你喜欢
一卡通数据挖掘聚类
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于“一卡通”开发的员工信息识别系统
公共交通一卡通TSM平台研究
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
向心加速度学习一卡通
一卡通为新农合基金加密