鲁鹏薇
(上海电机学院信息化办公室,上海 201306)
基于校园一卡通的数据分析与展示平台建设
鲁鹏薇
(上海电机学院信息化办公室,上海 201306)
校园一卡通系统通过对各种信息、资源的有效集成、整合和优化,能够实现对信息的有效配置和充分利用。多年运营下来,校园一卡通系统积累了很多数据,这些数据隐藏着很大的价值,如何挖掘出有用的信息成为一个重大的研究课题。高校依托一卡通业务系统的基础数据开展针对持卡用户的行为分析具有很大的意义。目前,大数据在教育领域的应用主要集中于教学领域,在学生管理领域则研究较少。分析校园一卡通所产生的数据,通过对数据进行抽取、转换和清洗,构建数据仓库,然后进行数据挖掘,最后采用前端工具进行数据分析,形成数据分析报表,建成上海电机学院数据分析与展示平台。该平台可以为领导层以及管理层提供决策支持服务,有着现实的重要意义和广泛的应用前景。
大数据;校园一卡通;数据分析;平台
近年来,大数据(Big Data)的受关注程度越来越高。如何对大数据流进行抽取转换成有用的信息并应用于各行各业变得越来越重要[1]。大数据处理与分析成为了全球性的问题,例如在2012年3月,美国政府[2]就率先发表了《大数据研究与发展计划》。如今的高校,建设有庞大的业务信息系统,多年来积累了大量的数据,包括学生的选课、考试成绩、图书借阅和吃饭刷卡等,还有老师的课件、研究项目等等。这些数据具有很高的教学与科研价值,能够改变教育领域的授课和学习模式。比方说:位于加拿大的湖首大学创建的学生行为分析系统[3]。国内的廖珣[4]给出的对高校就业形势的分析,主要结合K-means算法和CBR方法。叶炼[5]提出的对电信客户的行为分析,成为电信运营商增加收入和利润,提高客户满意度和忠诚度的有效工具。因此,上海电机学院建设的关于学校数据的分析平台是很有必要的,可以充分利用这些数据为师生提供高质量的信息服务,并为学校未来的发展方向和领导决策提供强有力的支撑。
校园一卡通系统在高校应用十分广泛,目前上海电机学院主要利用校园一卡通对校园中的各类消费、门禁、图书借阅、补助领取等进行统一管理。校园一卡通平台架构采用当前业界流行的三层系统架构,即用户层、中间层和数据层,整个系统具有良好的开放性和可扩展性,能够实现客户逻辑、业务逻辑和数据逻辑的有效分离和整合,一个健壮的、具有相当安全性的平台架构如图1所示。作为校园管理系统,在设计和实现的过程中,重点关注其应用功能的实现方面,对其所产生的大量数据的分析则很少考虑到。如果能够对这些数据进行有效分析和挖掘,发现其中存在的规律及问题,将会对今后的学校管理工作具有重要的指导意义并为之提供相应的决策支持。数据的有效整合,才能形成高质量的大数据[6]。本平台重点完成对数据的整合、分析和预警,它作为学校大数据平台的基础建设工作,为学校未来的发展方向和领导决策提供了强有力的支撑。
2.1 现有校园一卡通系统的问题
校园卡的功能非常强大,所谓“一卡在手,走到校园哪里都不怕”。它作为高校现代化管理的方式,全面构建了一个校园消费系统,如:就餐、购物、淋浴、洗衣、借阅等。但是校园卡系统内存在的统计分析模块,不能做为数据模型和相关数据分析手段,因而无法辅助校领导以及相关部门对学校管理做出有效的决策。
2.2 现有校园一卡通系统收集信息的难点
(1)餐饮消费系统
①校园卡系统中学生个人账单无法查询;②对于多天未消费人数及分布情况无法得知,从而也无法得知学生在校动态;③无法得知学校学生低消费人数及分布情况;④食堂、商铺每日消费信息无法直观展示;⑤食堂就餐高峰期无法直观显示,只能通过课表时间预估计;⑥无法对不同年级、专业、学院消费对比进行直观显示。
(2)图书借阅系统
①无法直观展现出借阅高峰,从而导致不能及时的做好相关学生服务工作;②无法得知学生及教师借阅情况,从而无法分析出不同人群的借阅习惯;③无法直观展现出相关热点图书具体借阅情况:按照年级、学院、专业、班级分类;④无法详细的展示出分年级、学院、专业、班级借阅情况,无法从各层面了解到学生借阅偏好及借阅动态;⑤无法直观展示出一段时间内馆藏图书的利用率以及无法快速查找图书的借阅量和相对应馆藏数量;⑥对于每年图书馆新购图书,无法知道实际的借阅量及使用率。
(3)利用现有门禁系统收集信息难点
①宿舍门禁只对学生进行身份识别、统计,仅作为安防需求,并没有对学生晚归进行统计;②图书馆门禁也只作为进出标志,并没有对学生进行在馆时间统计;③对进出图书馆的学生无法直观进行分学院统计人数并显示;④无法直观显示每小时进出图书馆学生人数。
3.1 系统总体架构图设计
该平台以数据仓库技术为核心,以联机分析处理技术和数据挖掘技术(结合统计数据和机器学习,使用数据库管理技术从大型数据集中提取有用信息和知识的技术[7])为手段,整合相关系统的核心业务数据,分析并挖掘数据隐藏关系,获取有利信息,为校领导提供决策支持。
本决策支持系统包含5个部分,分别是数据源、数据存储与管理、联机分析处理服务、前端工具与应用、决策支持应用。系统架构展示图如图2所示。数据清洗是令数据在一致性(Consistency)、最小性(Minimali⁃ty)、完整性(Completeness)和正确性(Correctness)四个指标满足上达到最优[8],然后按照主题进行重新组织,构建数据仓库。
图2 数据分析与展示平台总体架构图
联动处理,以预警的形式向相关管理人员和学生传递信息。例如,某学生申请了奖学金,但经过分析其各科成绩数据,挖掘出该学生某门课程并不符合相关条件,那么数据挖掘模型则向奖学金管理系统产生预警信让奖学金系统作相应处理。联动结构如图3所示。
3.2 平台搭建环境
(1)网络环境
校园一卡通系统在使用的过程中会产生大量的数据。此类信息要求极高的安全性,来防止信息外泄、信息丢失或非法访问[9]。为了安全考虑,需要在外网和内网之间架设防火墙,以保证系统服务器与外网访问之间的隔断,进而保护服务器的访问安全,并利用交换机来划分虚拟子网(VLAN)。
图3 数据挖掘与其他应用系统之间联动
上海电机学院数据共享平台核心网络架构拓扑图如图4所示。
图4 核心网络架构拓扑图
(2)实施环境
准备了两台服务器,一个用做数据库平台服务器,另一个用做应用平台服务器,如表1和表2所示。
3.3 项目实施工具
表3 实施工具详细版本
平台主要分为三大板块:预警系统、校园卡系统和图书系统。高校信息化从以管理信息化为核心的数字校园转型为以服务用户为核心的智慧校园已是大势所趋[10]。该数据分析平台的建设,不仅仅限于可以获取到大量的数据信息,更重要的是在于通过对这些数据的加工整理和聚类分析,提炼出很多有价值的信息[11]。利用这些信息既可实现高校的智能化管理,图书馆资源的优化和后勤服务质量的提升,又可促进学校未来的可持续发展[12]。最重要的是可以在发现知识的过程中进行很好的人机交互[13]。系统提供查询、统计、预警三个功能[14]。
整体展示如图5所示(日期为2017年3月15)。
图5 数据与分析平台总体展示
4.1 预警系统
消费预警(截止昨天连续10天未消费)、图书预警(近3个月无借阅记录)、pos预警(近3天无消费记录)、医务预警(昨天挂号人数)、低消费预警(近12个月消费低于平均水平的学生分布)、学生预警(按辅导员分类,截止昨天连续10天未消费)、学生晚归统计(晚上10点至第二天早上4点)。
表1 数据库平台环境
表2 应用平台环境
以学生预警为例,以图表直观显示,如图6所示。
图6 学生预警(按辅导员分类)
4.2 校园卡系统
以地图形式展示学生生源地分布信息,按年级、按学院分别统计学生一周、两周、一个月的早、中、晚餐以及夜宵消费信息展示,可以对四个年级的学生进行一周、两周、一个月的早、中、晚餐以及夜宵消费信息对比,各个食堂、窗口在一周、两周、一个月的消费次数、金额展示,可以看出哪个食堂最受欢迎,精确统计出食堂就餐高峰。
以一周前二食堂二楼午餐就餐高峰为例,如图7所示。
图7 一周前临港校区第二食堂二楼午餐消费人次/5分钟
3.3 图书系统
馆藏图书(按中图法)分类、馆藏图书(按类型)分类、超期未还图书(按中图法)分类、图书采购量(按年)分类、图书借阅量(按学院)分类(学生+教师)、图书借阅量(按年级)分类、临港校区、闵行校区过去24小时门禁出入人次(仅学生)、图书馆门禁出入人次(分学院)、在图书馆时间分布、图书借阅量分布(过去24小时)、各位馆员工作量统计(自助多,人工少)、分部门图书借阅(教师,一周、两周、一个月)、分学院图书借阅(学生,一周、两周、一个月)、统计热点图书(一周、两周、一个月)、分年级、班级、专业、学院借阅量(一周、两周、一个月)、班级借阅(月)统计、图书利用率分析(一周、两周、一个月,借阅次数比上在馆数量)、新购图书借阅。
以分专业借阅次数统计(一周)为例,对借阅次数进行统计,可以明显看出“机械”、“机电”、“电气”专业借阅量大,如图8所示。
图8 分专业借阅次数统计(一周)
通过对一卡通相关数据进行分析和挖掘,不仅使得原有数据更加准确,而且数据展示更加人性化、便捷化、直观化,有效提升了学校的信息化管理水平。建设信息系统应用体系、信息安全体系以及技术服务体系,实现与上级数据中心的无缝对接。建立大数据和小数据分析系统,提高学校的管理水平和决策支持水平。通过对一卡通数据进行数据挖掘,发现并掌握学生就餐、消费、图书借阅、出入宿舍的活动规律,可以帮助学校提升后勤、教务、图书馆等多个部门的管理水平。能够满足从业务处理,到中层管理的控制,最终达到为领导决策提供决策支持的目的。
[1]李志杰,李元香,王峰等.面向大数据分析分析的在线学习算法综述[J].计算机研究与发展,2015,52(8):1707-1721.
[2]Tom Kalil.Big Data is a Big Deal,March 29,2012.Available at:http://www.whitehouse.gov/blog/2012/03/09/big-data-big-deal.
[3]姜楠,许维胜.基于数据挖掘技术的学生校园消费行为分析[J].大众科技,2015,32(1):22-23.
[4]廖珣.基于K-means和CBR方法的高校就业预测模型应用研究[J].人力资源管理.,2010,3(3):79-80.
[5]叶炼.电信客户行为分析系统数据仓库的设计与实现[D].西安:西安电子科技大学,2009.
[6]刘敏思,陈少波.大数据时代高校智慧校园建设研究,软件导刊,2015,32(8):6-8.
[7]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013,23(4):168-172.
[8]金宗泽,冯亚丽,文必龙等.大数据分析流程框架的研究[J].计算机技术与发展.2014,24(8):117-120.
[9]赵震,任永昌.大数据时代基于云计算的电子政务平台研究[J].计算机技术与发展.2015,23(8):145-148.
[10]雷芸,涂庆华,宋俊飞等.大数据时代高校智慧校园服务平台建设与研究[J].通讯世界.2017,31(1):275-276.
[11]黄成兵.大数据环境下高校智慧校园建设应用探讨[J].智能计算机与应用.2017,7(1):131-133.
[12]汶向东.大数据时代“智慧校园”的应用研究[J].中山大学学报(社会科学版),2015,31(5):62-65.
[13]Fayyad U M,Djorgovski S G,WEIR N.From Digitized Image to Online Catalogs Data Mining a Sky Survey[J].AI Magazine,1996,17(2):51-66.
[14]李珊娜.基于校园一卡通平台的数据挖掘应用研究[J].计算机应用,2010,19(6):55-58.
Abstract:With effective integration and optimization to variety of resources,the campus card system makes efficient allocation and full use of campus information.Over the years,the campus card system has accumulated a lot of data which hide great value.How to dig out useful information from these data has become a major research topic.It is of great significance for colleges and universities to carry out the analysis of the be⁃havior of the card users based on the basic data of the card business system.At present,the application of big data in the field of education is mainly concentrated in the field of teaching,but the research in the field of student management is less.In this paper,by analyzing the data produced by the campus card,data analysis and display platform was built in Shanghai Dianji University.The processing was as fol⁃lows:First,through data extraction,transformation,cleaning,the data warehouse was built.Then,data mining was carried out.Finally,the data was analyzed by the formation of front-end tools and data analysis report.The platform can provide decision support services for the leadership and management,which has important practical significance and broad application prospects.
Keywords:Big Data;Campus Card;Data Analysis;Platform
Construction of Data Analysis and Display Platform Based on Campus Card
LU Peng-wei
(Informatization Office,Shanghai Dianji University,Shanghai 201306)
1007-1423(2017)25-0062-05
10.3969/j.issn.1007-1423.2017.25.016
鲁鹏薇(1989-),女,河南焦作人,硕士研究生,初级工程师,研究方向为数据挖掘、多媒体技术
2017-06-13
2017-08-25