施勇
(淮南师范学院网络信息中心,安徽 淮南 232038)
基于数据挖掘的高校数字化校园平台应用研究
施勇
(淮南师范学院网络信息中心,安徽 淮南 232038)
利用大数据的技术与思想,处理数据挖掘利用、数据质量等问题,能推动高校建立较为完备的数据采集体系、数据质量的规范管理、数据安全与隐私保护;分析高校数字化校园平台大数据,将助力提升高校的软实力,为学校的决策分析提供参考,提升广大师生数字化校园平台的高效服务体验。
大数据;数据挖掘;数字化校园;
目前国内高校正如火如荼地实施“十三五”信息化规划,从近十年的数字化校园平台的期刊文献研究,到上海复旦大学、南京理工大学、常熟理工学院等类似高校的实地访谈,调研数据表明信息化建设的主要工作已经转向高等院校“大数据挖掘”、“数据仓库”、“决策与分析”、“智慧校园”、“碎片化服务”①凌晓东:《SOA综述》,《计算机应用与软件》2007年第10期。的建设上来。而这些都是基于“数字化校园”概念发展而来,而审视国内高校信息化建设现状,文章指出信息化建设发展的方向在数字化校园平台建设的基础上,以数据挖掘为抓手②《高等院校大数据挖掘与决策分析体系的应用研究》,《现代教育技术》2016年第8期。,开展数字化校园平台的应用研究。
何为数字化校园平台?笔者认为,现有校园从宏观角度来看,应该包括实体校园和虚拟校园。③杨娇:《制约数字化校园建设发展的几个问题》,《电子技术与软件工程》2016年第9期。而虚拟校园的核心思想就是数字化的机房、数字化的软件、数字化的教师、数字化的课程平台、数字化的后勤设备等等,这些就构成了一个数字化的校园,而这个基础平台就是数字化校园平台,它依托现代计算机网络技术、物联网技术、数据挖掘技术④Azuaje F.Witten IH,Frank E:“Data Mining:Practical Machine Learning Tools and Techniques”. Biomedical Engineering Online,2006,Vol.5,pp.1-2.,实现的功能较多,把平时我们构想的和不敢想象的功能现实化,实现了高等院校围绕整个教育过程的全方位的信息化。
数字化校园是一个有机整体,它包括师生、各种网络设施、各种应用级别的系统、各种数据库、各种终端处理设备等多个元素;它所涉及的层面包括学校领导层、中间管理层、基础业务层;它用来促进高校教学管理、师生服务、智能化终端服务等。
高校进行数字校园建设有着自己的定位,数字化校园平台不应只涉及如上内容,还应包括高校至上而下的全体层面的信息化理念,学校的领导决策与办学定位,信息化发展规划设计,以及它所带来的具有信息化推动作用的周边辐射。⑤徐宗本,冯芷艳,郭迅华,等:《大数据驱动的管理与决策前沿课题》,《管理世界》2014年第11期。
当前高校大数据拥有着“海量”、“高增长率”、“多样化”等信息特点。面对学校数据的大幅膨胀和快速积累,高校如何更好地利用好校内数据信息,深入挖掘数据之间的关联性与交互性,大幅释放出数据空间与数据潜力①王铮:《基于Hadoop的分布式系统研究与应用》,吉林大学,2014年;刘同,真溱,汤珊红:《填补情报信息收集和分析之间的“鸿沟”》,《情报理论与实践》2016年第4期。,为高校提供更为强大的洞察力、决策力以及管理的流程、手段、效率等方面的优化能力,这将是高校信息化管理人员、业务部门管理人员和相关业务人员需要进一步研究的重点课题。
经调研,国内部分高校在2000年初就已初步实施数字化校园建设,历经十几年时间的沉淀积累,信息化建设取得了一定的成绩。基础平台及应用系统的建设尤为成熟,比如人事管理系统(基础数据平台、人事考核平台、薪酬管理平台)、学工管理系统(就业管理平台、学生管理平台、生涯测评管理系统)等,统一身份认证平台、统一的综合信息门户平台、共享数据中心平台等都陆续建立完善起来,这些构成了大数据平台的基础业务应用平台,为学校自身的教育信息化、教育智能化、教育个性化提供了便捷。②游慧:《数据挖掘在个性化学习系统中的运用》,《微机发展》2005年第6期。
为进一步深化高校教育信息化建设,建立高校的业务决策方案,提供中长期发展规划,当前高校的信息化建设必须重视以上内容,将涉及到的问题进行深入研究。
高校数字化校园平台中拥有海量的有待于进一步挖掘的数据。教师和学生从进入学校到离开学校形成了整个“全生命周期”,全校教师与学生在整个“全生命周期”内产生了大量的数据,这些构成了高校大数据的基础,包括教学数据、学习数据、奖惩助贷数据、团学信息、学生组织、竞赛等其他相关信息。所有这些综合起来的信息,需要对其基础数据进行存储、分析、挖掘,开展有效的管理,并加以充分利用,使它们为高校教学、管理、服务等环节服务。
(一)开展大数据主题查询
数据挖掘(Data mining)在处理海量数据集方面具有极大的优势,技术手段目前较为成熟。③江绵康:《“数字城市”的理论与实践》,华东师范大学硕士学位论文,2006年。采用数据挖掘技术,对高校基础数据建立不同的主题,同时为方便主题的管理,而对主题建立不同的类别④石丽梅:《基于SOA构建数字化校园主题数据库的研究与应用》,内蒙古工业大学,2009年。,以淮南师范学院数字化校园平台为例,具体包含的主题查询类别和子类别概括如下:
(1)校情类主题:包括组织机构信息查询、班级信息查询和专业信息查询,主要提供全校通用性质的公共信息查询。
(2)教工类主题:包括教职工基础数据查询、学历学位信息查询、专业技术职务查询、奖励情况查询、惩处情况查询、家庭成员情况查询、工作简历查询、岗位证书信息查询、国内进修情况查询等,主要提供教工视角的各类基本信息的查询。
(3)学生类主题:包括基础信息查询、学历学位查询、课程成绩查询、学生收费查询、奖学金助学金查询、助学贷款查询、勤工助学查询、学籍异动查询、困难补助查询、本专科录取查询,主要提供学生视角的各类基本信息的查询。
(4)教学类主题:包括所带课程基本信息查询、课程计划查询、教学规划查询、教师课表与学生课表查询、教工监考信息查询、学生考试情况查询等,主要提供教学相关的各类信息的查询。
(5)科研类主题:包括科研项目基本信息查询(纵向与横向)、科研项目支撑经费查询、科技著作信息查询、鉴定成果信息查询、专利成果信息查询等,主要提供与科研相关的各类信息的查询。
(6)图书类主题:包括教职工和学生图书借阅信息查询、图书违章信息查询、图书到期提醒查询、新到图书查询等,主要提供与图书相关的各类信息的查询。
(二)进行大数据统计分析
针对现有的高校数据信息,进行大数据统计分析,概括为:
(1)教职工情况分析:包括教职工人员概况、教职工情况详情、教师人员概况、教师情况详情、专任教师人员详情和专任教师情况详情,提供教职工相关的多种维度的统计分析图表展现。
(2)学生情况分析:包括专业人数统计、学生人员概况、学生情况明细和学生收费完成率分析,提供学生相关的多种维度的统计分析图表展现。
(3)学科专业统计分析:包括各二级学院(系)历年专业建设情况,对比情况,提供专业相关的多种维度的统计分析图表展现。(参见图1)
(4)科研情况分析:包括科研项目数量分析与项目趋势分析、科研发表成果数量分析、科研获奖数量分析、发表成果趋势分析,提供科研相关的多种维度的统计分析图表展现。
(5)图书情况分析:提供图书相关的多种维度的统计分析图表展现。支持多种展现形式,包括柱状图、饼状图、折线图等,用户也可自主选择展现的形式。
图1 专业建设统计分析图示
研究设计了高校主题数据一般报表生成流程图,如下:
图2 高校主题数据报表生成流程
(三)提供大数据驱动决策支撑
在高校的大数据中,包含了高校总体概况、高校基础校情到每一个师生图书借阅情况、每餐在校消费情况等数据,覆盖了从大层面到各个点的多个方面的数据。通过对这些数据的分析为发展规划等提供决策支持。①王连军,张宝东:《高校学生消费差异分析——基于基尼系数分解理论的实证研究》,《统计与信息论坛》2007年第2期。
1.以人为本的建立数据处理机制
高校信息化建设要实现以人为本,注重人文关怀和生态建设,围绕“人”来建立学校数据收集、应用机制②颜雪松,蔡之华:《一种基于Apriori的高效关联规则挖掘算法的研究》,《计算机工程与应用》2002年第10期。,依托师生产生的数据进行分析才能是有源之水,反哺可行。大数据驱动,需要建立信息化数据服务综合平台,整合跨部门、跨业务,统一数据源,将“前端界面”与“后端逻辑”进行分离,综合业务数据采集入口;抽取与师生相关的各类数据,还通过多个方面联系多个业务主管部门,如教务、学工、人事等,建立数据决策中心。
2.数据标准化、碎片化、流程化处理
数据共享库中的数据必须建立在一个统一的标准之上,这个是数字化校园建设初期和后期一直需要直面正视和处理的问题,这样对原有的应用系统和新建的应用系统来说就免去了数据多样化背后的数据清洗。③朱力纬,刘丽勤,王健:《高校基于大数据时代的数字化校园建设探讨》,《华东师范大学学报》(自然科学版)2015年第1期。碎片化有着自身的定位,碎片本身有着两个特点,一是细小的数据单元,二是多样性。信息化服务随着高校的发展而不断演化,碎片化服务在数据业务之间相互支撑,可以打破固定的业务逻辑关系,相互独立但是又可以相互整合,碎片化为业务流程梳理和重组打下基础,这些构建了大数据的基础处理单元,又为数字化校园平台的深入应用开拓新的发展方向。
3.数字化校园平台场景应用
数字化校园平台应用场景范围是广泛的,对高校中日常场景进行模拟分析,可以提炼出可供分析的、有价值的校园网用户个人行为数据,对这些用户行为大数据展开分析,将分析结果用于学校综合评估、发展指导使用。④廖姗姗:《校园网用户管理在大数据时代下的应用研究》,《数字技术与应用》2016年第1期。比如师生各校车时间与班次分析;生活贫困生评定分析;校内人员聚集分散安防分析等。校内综合应用存在的困惑、业务流程发展的趋势均可在充分应用数据挖掘技术的基础上找到相应的突破口、创新点,从而最终在整体上、全方位地实现高校各方面资源的优化管理与合理配置,持续提升学校数字化校园平台建设的效益。
综上所述,针对目前高校数字化校园建设实际情况,充分发掘和分析高校大数据的价值,能够更加全面地认识校内各类人员活动和物资配置,有效的提高数据管理质量,提升高校工作效率。采用大数据挖掘思想和技术,可以将学校信息化管理服务的水平和建设能力提高到一个新的台阶上。
Research on the application of digital campus platform based on Data Mining
SHI Yong
using the technology and the idea of big data,using the data processing quality,data mining, data acquisition and promote the establishment of a relatively complete system of colleges and universities, standardize the management of data quality,data security and privacy protection;analysis of university digital campus platform big data,will help enhance the soft power of colleges and universities,to provide reference for the decision-making of school analysis,enhance the efficient service digital campus platform of teachers and students experience.
big data;data mining;digital campus
G40-057
A
1009-9530(2017)01-0129-03
2016-10-13
安徽高校人文社会科学重点研究项目“高校校园网入侵防御及应急策略研究”(SK2016A0860)
施勇(1984-),男,淮南师范学院网络信息中心教师,教育技术学硕士研究生,主要从事高校信息化建设。