段菊
摘要:扶贫问题一直以来备受关注,随着大数据技术的发展,数据挖掘技术应用于高校精准扶贫中,但数据分析对象仅限于校园一卡通数据,存在一定的局限性。随着高校信息化建设的完善升级,移动支付已是遍地开花,因此,数据分析的对象还需要考虑移动支付产生的数据,提出移动支付背景下数据挖掘技术在高校扶贫中的应用研究。对移动支付和校园一卡通数据的综合分析与挖掘,在一定程度上提高了扶贫的精确度。
关键词:大数据;数据挖掘;移动支付;校园一卡通;精准扶贫
中图分类号:TP391.4 文献标识码:A 文章编号:1009-3044(2018)35-0015-02
Abstract:The issue of poverty alleviation has attracted much attention. With the development of big data technology, data mining technology is applied to the precise poverty alleviation of colleges and universities, but the data analysis object is limited to campus card data, which has certain limitations. With the improvement and upgrading of university Information construction, mobile payment has been everywhere. Therefore, the object of data analysis also needs to consider the data generated by mobile payment. This paper proposes the application of data mining technology in poverty alleviation in Colleges and Universities under the background of mobile payment. The comprehensive analysis of mobile payment and campus card data improves the accuracy of poverty alleviation.
Key words: big data;data mining technology;mobile payment;campus card; precise poverty alleviation
1 概述
確定扶贫对象的传统做法是通过调查走访、个人申请、学生评议等方式来确定,过程复杂、耗时耗财又耗力,不适合大面积推广使用,并且存在有些学生自尊心强不愿意自主申请,即使办理了资助在心理上也觉得自卑,如果可以“隐形资助”在一定程度上可以消除这些学生的顾虑,目前有些高校已经实现[1]。
这些高校无疑是通过借助数据挖掘技术[2],对校园一卡通的海量数据进行分析。数据挖掘[3](Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。校园卡作为学生在校园里的唯一身份认证凭证,记录了学生就餐、购物、借阅图书、洗浴等信息,提取校园卡中学生消费的信息、考勤信息等可以用来判定学生的贫困程度。文献[4]中通过挖掘学生的消费模式、学习模式和生活模式来判断该生是否为贫困生,再加以实际调研来确定;文献[5]对校园一卡通数据采用K-means聚类算法,将得到的聚类结果用于计算学生的贫困指数;文献[6-10]都是通过对一卡通中的数据进行分析,对学生进行贫困生的分类。
可见,通过数据挖掘技术对校园一卡通中的数据进行分析,辅助高校判定贫困生的技术已经相当成熟。随着学校信息化建设的发展,微信、支付宝支付已经逐渐渗透到学校,在校园内同时存在着一卡通支付、微信支付和支付宝支付,因此,只分析一卡通的数据来判定贫困生的做法,存在严重的局限性。
2 移动支付下数据挖掘技术在高校扶贫中的应用
2.1 移动支付在高校校园生活中的应用
目前,无论是微信还是支付宝都为高校免费提供电子一卡通产品,学生可以通过电子一卡通实现支付功能,并且可以用于借阅图书、门禁等身份验证。在这之前,学校餐厅仅提供刷卡机刷一卡通服务,学校商店不纳入学校财务管理范围,学生去校园商店购物支付现金或者扫码支付,但是付款二维码归商店所有,学生的消费记录不会出现在学校的统计范围内。随着生活条件的提高或四季天气的变化,有些学生不去或很少去餐厅就餐而是去商店购买零食,以笔者所在学校为例,商店里面有几家卖面食的,每次到吃饭的时候,都排很长的队伍,有些学生在夏天直接买点水果就回宿舍休息了,这些情况,如果仅仅通过对一卡通的数据进行判断来确定贫困生,就会产生误差,可能在分析一卡通信息的时候存在同学在餐厅消费金额很小,而导致误判其家境贫寒,实则是其不经常在餐厅就餐而是购买商店零食或水果等,代替了去餐厅就餐,为了减少这种情况的出现,需要拓宽采集数据来源的渠道。
随着移动校园的上线推广使用,移动支付也推广到了高校,微信、支付宝商家为高校设置校园账号,为餐厅、校园商店都提供扫码器,这样,学生就可以像使用校园一卡通一样使用电子一卡通实现电子支付,学生的所有消费记录都会在学校的总账户上有记录,这在一定程度上弥补了数据来源的局限性。
2.2 校园一卡通数据在高校扶贫中的应用
抽取校园一卡通数据库中某一时间段内的数据,对经过清洗后的数据进行聚类分析、关联挖掘,提取有用信息应用于贫困生的判定,可以有效地提高贫困生认定的精确度和相关人员的工作效率,图1就是数据挖掘技术在贫困生认定中的应用模型。
数据挖掘又称知识发现(KDD:Knowledge Discovery in Database),即“从数据中挖掘知识”,其基本步骤为:
(1) 数据清洗:清除噪音和删除不一致的数据;
(2) 数据集成:多种数据源组合在一起;
(3) 数据选择:从数据库中提取与分析任务相关的数据;
(4) 数据变换:通过汇总或聚集操作,把数据变成和统一成适合挖掘的形式;
(5) 数据挖掘:数据挖掘吸纳了诸多领域的大量技术,根据数据功能的类型和数据的特点选择相应的算法;
(6) 模式评估:根据某种兴趣度量值,识别代表知识的真正有趣的模式;
(7) 知识表示:使用可视化和知识表示技术,向用户提供挖掘的知识。
数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。步骤(1)~(4)又合称为数据预处理,在数据挖掘的过程中,要花费绝大部分的时间和精力在数据预处理部分。
2.2.1 學生消费数据挖掘分析
学生通过使用校园一卡通和电子校园一卡通,在校园内就餐、购物、打水、洗浴等,挖掘学生每学年的整体消费数据,统计分析学生一个学期内平均在校就餐次数和每餐平均消费金额;在校园超市内消费总额及购买物品的种类;打水、洗浴的消费记录也至关重要,一般家境贫寒的学生会比较节约用水。通过数据挖掘技术分析学生的家庭经济状况,可以作为确定贫困生认定的先决条件,也可以作为认定后的验证条件。
2.2.2 充值数据分析
通过对比分析充值的次数和每次充值金额,在一定程度上可以看出学生的经济状况,一般经济条件好的学生,每次充值金额会比较大,因为手上资金比较宽裕,不怕遇到意外情况;而经济条件比较差的学生,更倾向于少量多次的方式,因为一卡通只能充值不能提现,遇到意外情况,经济损失比较大。因此,通过分析充值数据,在一定程度上可以作为判定贫困的佐证条件。
2.2.3 学习和生活数据分析
贫困生评定的另外一个重要依据就是学生的学业情况,包括出勤率、学业成绩、图书借阅、宿舍门禁数据等,通过对学生学习及生活数据的挖掘分析,可以评定该生的贫困情况,一般家庭贫困的学生能够按时上课、按时回宿舍休息、成绩一般不会很差,如果是贫困生但是存在经常旷课、夜不归宿等情况,说明该生本身没有上进心,扶贫意义不大。
3 结论
对校园一卡通中海量数据的信息挖掘,可以为扶贫工作带来有实用价值的信息。本文提出的移动支付背景下数据挖掘技术在高校扶贫中的应用研究,在高校扶贫中增加对移动支付数据的挖掘,在一定程度上弥补了仅对传统校园一卡通数据分析的局限性,使贫困生的判定精确度在一定程度上得到了提高。
参考文献:
[1] 文明珠. 教育信息化背景下校园卡系统数据挖掘的研究与实现[J]. 电脑知识与技术, 2016, 12(5):5-6.
[2] 刘铭, 吕丹, 安永灿. 大数据时代下数据挖掘技术的应用[J]. 科技导报, 2018(9).
[3] 刘世平. 数据挖掘技术及应用[M]. 北京,高等教育出版社,2010,25-26.
[4] 樊搏, 吕艳芝, FanBo,等. 基于一卡通数据中心的贫困生辅助认定分析[J]. 科教文汇, 2015(31):122-123.
[5] 费小丹, 董新科, 张晖. 基于校园一卡通消费数据的高校贫困生分析[J]. 电脑知识与技术, 2014(20):4934-4936.
[6] 张玺, 呙森林, 孙宗良. 基于校园一卡通消费数据对高校贫困生分类的应用研究[J]. 数字技术与应用, 2016(8):100-100.
[7] 张红蕾. 数据挖掘在校园卡消费中的研究与应用[D]. 兰州交通大学, 2016.
[8] 吴卫东. 高校校园一卡通消费数据完整性及应用研究[J]. 华中师范大学学报:自科版, 2017(s1):130-133.
[9] 王亚楠. 大数据背景下数据挖掘技术在高校中的应用——以校园卡系统为例[J]. 华中师范大学学报:自科版, 2017(s1):9-12.
[10] 马洪维. 校园一卡通消费数据的挖掘与分析[D]. 山西师范大学, 2016.
[通联编辑:王力]