高校一卡通内潜在贫困生数据研究

2021-03-22 02:53章喻鑫吴开龙王荣远李志强成阳
电脑知识与技术 2021年4期
关键词:数据分析贫困生

章喻鑫 吴开龙 王荣远 李志强 成阳

摘要:目前,高校贫困生资助体系虽然已经建立,但贫困生的判定存在着短板和不足。高校一卡通内存在着大量宝贵的潜在数据,通过SQL Server數据库和Excel的结合,可以从高校一卡通里探寻有价值的数据信息,帮助评定潜在贫困生的程序更加完善。该文为学校管理人员提供一种可靠的数据分析途径。

关键词:高校一卡通;SQL Server数据库;Excel;贫困生;数据分析

中图分类号:TP392        文献标识码:A

文章编号:1009-3044(2021)04-0037-02

Abstract:Although the funding system for poor students in colleges and universities has been established, there are shortcomings and deficiencies in the determination of poor students. There are a lot of valuable potential data in the college card. Through the combination of SQL server database and Excel, valuable data can be explored from the college card, and the process of evaluating potential poor students can be improved. This article provides a reliable way of data analysis for school administrators.

Key words: the college card; SQL server database; Excel; poor students; data analysis

1 引言

作为高校必备的学生信息管理和消费的载体,一卡通系统是十分重要的。随着信息化的不断发展,大学校园数字化、网络化是不可阻挡的潮流趋势。高校一卡通被视为数字化校园建设的主要工程,实现了三大主要功能,作用于校园内的每个角落。目前来看,高校一卡通主要提供交易、信息管理、身份识别等三大功能[1]。其中交易代表了学生在校园内的主要消费,能够反映学生在校生活期间的总体消费情况。因此可以借助一卡通内的消费数据,进行分析学生的经济状况,从而可以起到辅助判定贫困生的目的。

高校一卡通内的数据会因校内活动变得异常复杂,如果高校在初建一卡通平台时未考虑后续数字化网络化的发展,没有特定的去优化一卡通系统,就会导致其中数据的杂乱无章,从而增加了数据处理的难度。一般来说,消费数据项目越多,越能精确的体现学生的消费水平和家庭状况,日常使用校园卡的频率越高,也就越能说明学生的消费主要是在校园内进行。这对于学校高层人员判定学生经济情况有极好的借鉴作用,为决策人员实施决策提供必要的事实依据[2],因此高校一卡通的数据的高效利用是非常有价值的。

2 搭建一卡通数据分析框架和流程

高校一卡通内数据经过简单分析处理,主要分成两大类,分别是交易数据类和行为数据类,其中交易数据类主要分为学校各食堂、校园内超市、洗浴、复印店以及图书馆书籍超期等消费信息,行为数据类型包含校园内的各种行动轨迹和宿舍等地点门禁信息。

在高校一卡通系统中,消费数据是有明显特征的,其大部分数据储以记录的方式存储于数据库中,我们将其按照学生卡号和消费的编号、时间、金额等数据重新组织记录,准备放入构建的数据仓库中。经过对数据进行抽取、转换、加载等相关处理,在构建好的数据仓库中,我们可以进一步地对消费数据进行分析。把与消费相关的(如时间、用户、金额和消费类型等)作为不同的维度来衡量学生的状况。在这里,我们将其分为四个表,分别为时间表,消费表,一卡通表和商户表。时间表中包含年、季度、月、日以及时间编号;消费表分为消费类型、商户编号、卡ID号、消费金额以及时间编号;一卡通表包括卡ID、持卡人的个人信息以及卡内余额;商户表分为商户序号、商户种别和其他详细信息。其中主要操作是对数据类型和缺失值的处理,可以将其分为两大独立的部分进行,数据类型归为一类,数据类型的不同可以转换为统一类型。缺失值归为另一类,针对缺失金额部分可采取平均值填入的方法。

本次实验采取模拟某高校的大量流水数据,通过抽样的方法,对其在有规律的一段时间内的数据抽取出,利用SQL Server的DTS方式把我们需要分析的数据导入到目标数据库中,DTS的用途是可以从不同的源将数据抽取、转换和整理到理想的目标位置[3]。用户可以通过DTS工具很容易地创建适合于特定的自定义移动解决方法。我们利用这些数据建立一个以消费为事例的数据仓库,通过该数据仓库,可以了解到我们处理的数据信息。在这里,我们以学生的消费具体时间段、不同学段的学生消费频率等内容进行分层次的分析。在得到的数据基础上可以利用OLAP Services建立数据立方体。步骤如下:(1)建立主量:利用Dimension Wizard选择时间表,建立时间维度;选择消费表,建立消费维度;选择商户表,建立商户维度[4];选择一卡通表,建立个人信息维度;(2)构建数据体:在OLAP菜单管理器上选择Cubes文件夹新建Cube向导。选择消费事实数据库中的消费表,该表里是学生的消费信息。在立方体测量时,应选消费金额;最后完成该立方体的构建;(3)通过引导创建MOLAP存储类型的集合[3]。MOLAP可以把OLAP分析的多维度的属性值将数据从物理层面上存储为高维数组的形式,形成立体的结构。维的数据属性值和多维数组的下标值或下标的范围形成相互对应的关系,总数据属性值变成多维数组的属性值,可以存储在数组中。

在此构建完成后利用Excel进行分析,我们可以选择菜单栏中的新建数据库查询选项,再次选择OLAP多维数据集中的新数据源目标,并为访问的数据库选择一个OLAP供应者中选择OLE OB for OLAP,按提示步骤完成对消费事实数据库的选择。

将立方体的数据调入Excel中,数据分析工作可以在此完成。通过加载Excel里的数据分析工具库选项,选择合适的分析工具库和规划求解加载项,数据分析中还有直方图、回归、抽样、描述统计、傅里叶分析等工具可以实现数据的不同角度的利用。我们还可以直接通過已经处理好的数据建立数据透视表,利用不同形式的图形进行简单直接的观察,得出我们所需要的结论。以下为我们实际操作中的部分数据直观图和数据表的处理。

在此,我们可以根据其学生总体消费水平的高低判断学生的贫困程度。以单位学年类同等水平的学生消费为基准,找出低于此水平的学生人群,即可判断为潜在贫困生。具体有如下特点:

(1)潜在贫困生每次消费的金额平均较少。

(2)潜在贫困生每日消费的金额比较少,并且刷卡消费的频率相对来说稳定。

(3)潜在贫困生消费的总金额在同一学年中相对较少。

(4)潜在贫困生使用高校一卡通交易的频率比较高。

基于此,从Excel中可以得到吻合上述特征的学生,甚至还可以通过调节立方体中粒度的大小,以便于实际的贫困生判定情况更加吻合,从而选出潜在贫困生。

3 结语

本文主要简单介绍了如何利用SQL Server和Excel配合构建分析框架,对高校一卡通里数据结果进行分析。关键点在于对一卡通内消费数据的界限的确定,在界限明显情况下,界限之下即为潜在贫困生的消费水平,同时也能够确定学生消费状况,其结果不仅够使学校为潜在贫困生提供更精准化的管理和补助金的发放,还能能够为辅导员辅助决策[5]、优化校园卡管理等提供了有力的数据支撑框架。在此建立和分析的过程中发现SQL Server和Excel能够处理高校一卡通内学生数据,但效率方面不够高,还需要根据事实确定合适的维度和粒度,可视化程度还欠缺,这也是将来应该改进的地方之一。

参考文献:

[1] 李志国,张彬,范佳伟.智慧校园一卡通数据的分析及利用[J].信息与电脑(理论版),2019(4):3-4.

[2] 丁蓉,孙晓辉,李智勇.基于校园一卡通的高校贫困生消费行为分析[J].电子测试,2016(18):78-79+99.

[3] 田永青,陈卫华,朱仲英.基于SQL Server的数据仓库的建立和分析[J].电子技术,2001(8):35-38.

[4] 丁洁,贾应炜,苏兴龙,郇林.校园一卡通数据挖掘分析设计与应用[J].自动化技术与应用,2020,39(2):132-137.

[5] 周皞,万里亚.基于校园卡数据挖掘的高校贫困生辅助判别研究[J].职教通讯,2012(35):59-61.

【通联编辑:王力】

猜你喜欢
数据分析贫困生
浅析大数据时代对企业营销模式的影响
“贫困生班主任”李金林
十年筹资千万元 资助八千贫困生
结对"百千万"情暖贫困生
克力朩倾心捐助贫困生