马小刚
[摘 要] 目前高校信息化建设初见成效,各类信息管理系统建设较为完善,信息采集较为完整,并且个性化培养和个性化管理已经成为高校育人的新方法、新途径,如何快速准确掌握学生的各项信息成为工作中的主要难点。本文提出了一种三方参与环境下基于数据挖掘技术的学工辅助系统,可以在一定程度上提高輔导员的工作效率和工作准确度。
[关键词] 数据挖掘;辅导员;高校;信息管理系统
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 17. 071
[中图分类号] G647;TP311 [文献标识码] A [文章编号] 1673 - 0194(2018)17- 0180- 03
1 前 言
随着计算机技术的飞速发展,结合国家信息化发展整体战略,高校信息化建设不断完善,高校管理向“无纸化”方向迈进[1-2]。目前,国内各大高校里存在的信息系统多种多样,例如,学工系统、教务管理系统、一卡通管理系统、资助管理系统等。高校建设的各种系统均完成了相应的管理功能,高校中的各级管理者也都适应了使用各类信息化系统开展管理工作,标志着高校信息化基础建设已经初见成效。
目前,高校各类信息化系统大多是对数据库中数据的简单展示,无法展示这些数据背后所能够代表的意义和结果。例如,高校辅导员想要得知一名学生的所有信息,就需要在所有系统中查询该生的数据,并人工对数据进行测算或计算,最后将所有系统中的数据结果进行汇总才能完整地表示出一名学生的信息。这使得工作量复杂且庞大,无法有效地帮助高校辅导员解决实际工作中的问题。因此设计一种能够打通学校各类系统,有效利用各系统中的数据,并将数据结果“可视化”的系统就显得尤为重要。
本文在高校现有的各类信息化管理系统场景下,设计出一个三方参与的高校学工辅助系统,该系统可以利用高校现有数据,对数据进行深度挖掘,并对挖掘结果进行“可视化”展示。一定程度上可以提高辅导员的工作效率和工作准确性。
2 学工辅助系统设计
2.1 系统应用场景
在高校目前的信息化环境下,辅导员、学工辅助系统和高校现存的各类信息管理系统分别对应了用户、中间件和数据提供方,如图1所示。
本系统整合了高校现存的各类信息系统,可以让辅导员通过统一的界面对各个信息系统中的数据进行查询,并对查询出的数据进行一定的加工,用以展示数据背后所具有的联系,从而提高辅导员的工作效率和工作精准度。
2.2 系统功能设计
系统分为用户模块、数据交换模块、数据处理模块和数据展示模块。其中,数据交换模块为系统的基础模块,数据处理模块为系统的核心模块,这两个模块一起构成了中间件服务。
用户模块负责对用户的信息进行维护、查询和修改。
数据交换模块负责对高校现存的各类信息管理系统中的数据进行预处理。目前,高校的各类信息系统由于建设时间不同、开发人员不同、业务需求不同等因素,各个系统中的数据存储方式、数据内容也不尽相同。因此在处理数据之前需要将各种系统中的数据尽可能地统一,并且尽可能地将同一名学生的数据进行整合。数据交换模块将各个系统中的数据库作为子模块,把子模块中的数据集中调度,形成一套完整的数据库,实现了学生在校园中所产生数据的统一存储和统一管理,屏蔽了数据处理时的数据异构问题。数据交换模块如图2所示。
图2中集中数据交换部分负责将异构的数据进行清洗、整理和统一化,并集中存储在数据库中;统一数据存储部分负责将数据调度中心处理好的数据进行存储,以备数据挖掘模块调用。
高校各类信息系统中的数据产生,从时间维度上来看可分为动态数据和周期数据。例如,学生每天在校园中通过一卡通随时随地进行消费,也可以随时到图书馆借阅书籍,这类数据即为动态数据,能够表示学生短时间内的需求;学生每个学期只有一次期末考试,期末考试成绩以学期为周期产生,这类数据即为周期数据,能够表示学生长时间的成长走向。由于数据产生的周期不同,数据挖掘模块不可能跟随着学生动态数据的产生而进行计算。一般情况下,数据挖掘模块会最小以天为单位进行计算。由于信息量较大,计算时间较长,而在这段时间内也有可能产生动态数据从而影响计算数据时间维度上的一致性,同时为了有效防止数据因不可抗力或其他人为因素造成的丢失,因此使用双数据库设计,这两个数据库互为备份,而数据挖掘模块每次仅对一个数据库进行计算并产生结果,在计算过程中到下次计算之前,另外一个数据库接管这段时间内的数据存储需求。
为更好地帮助辅导员准确了解学生,本系统引入“学生画像”概念来展示学生各方面的信息。数据挖掘模块负责对统一数据存储部分所存储的数据进行计算,通过数据挖掘算法在大量无关数据中挖掘数据潜在的隐性关系[3],生成标签数据,并利用标签数据生成“学生画像”[4-5]。其算法流程描述如下:
步骤1:根据数据类别对数据进行处理,并生成标签数据;
步骤2:对生成的数据标签进行关联分析,生成动态关联规则;
步骤3:对单一学生的所有数据进行分析并与数据库中已有的标签数据进行关联,生成“学生画像”;
步骤4:利用“学生画像”的标签数据为学生以后的行为进行预测。
数据展示模块负责将数据挖掘模块生成的标签数据与学生的基本信息以图表的形式进行展示,增加用户体验度和信息传递量,降低用户的使用难度,从一定程度上提高工作效率和工作准确度。
利用本文设计方案建设的学工辅助系统优势在于能够形成统一的数据存储,屏蔽了不同系统的数据异构性,同时高校内各个信息管理系统无须进行大规模业务调整,并具有一定程度上的容灾性。
3 学工辅助系统应用分析
3.1 贫困生身份鉴别
学生资助是高校辅导员每年的重要工作之一,这项工作的难点是如何准确地判断贫困学生。目前辅导员判定贫困学生主要依靠三级评定制度来完成,即班级贫困认定小组、专业贫困认定小组和年级贫困认定小组。由于有人工干预,不免会有影响判断的主观因素产生,最终会导致认定结果的不科學、不准确。学工辅助系统利用学生的一日消费数据、一周消费数据和一月消费数据对单一学生的消费能力生成用户画像,同时对学生所在班级、所在专业、所在学院学生的日、周、月平均消费能力进行计算生成群体画像。通过单一用户画像与群体画像的匹配,推测学生的贫困级别,从而完成贫困生身份的鉴别工作。
3.2 学业警示
学生来学校的主要目的是学习,而大学相比中小学的学习方式有很大的不同。很多学生在大学的环境中,往往由于过于“自由”而丧失学习动力和学习目标,家长对于学生在学校的情况又很难准确知晓,即便是辅导员想要准确了解每名学生的学习情况也很难做到。本系统可利用学生单一科目期末考试成绩、学科类别平均成绩、总体成绩平均绩点以及图书馆借阅数据等来生成学生的用户画像,同时将班级内同学的单一科目期末考试平均成绩、学科类别平均成绩、总体成绩平均绩点和图书馆借阅数据等生成群体画像,通过对比生成学生学业预警信息。辅导员可以通过学业预警信息及时与学生和家长展开谈话和沟通工作,助力学生的成长成才。
3.3 心理危机预警
近年来,大学生由于心理问题引发的突发状况频频发生,尤其是自杀伤人事件的发生率呈上升趋势,给学生本人及其家庭带来了极大的痛苦,同时给学生、学校和教学秩序造成了不良影响。目前,各高校都已初步形成了自己的心理危机预警体系,学校设置心理咨询中心,学院设置心理咨询分站,各个班级设置心理委员,目的就是及时发现可能存在心理危机的学生。即便是层层防控,还是有遗漏和疏忽的地方,这就需要有一个系统可以从学生的学业成绩、家庭经济情况、学校生活情况、校园社交等方面综合展示学生的各项状态,用以辅助发现可能有心理危机的学生。
学工辅助系统的应用不仅限于以上三点,同时服务对象也不仅为高校辅导员。由于系统连通学校各信息管理系统,学生也可以用真实数据来预测自己的未来发展和职业规划。因此,本系统是一个面向全校的开放性系统,允许高校其他管理信息系统接入,通过对不同数据的组合分析,可以让本系统具有更广泛、更丰富的使用面和应用场景。
4 学工辅助系统建设过程存在的问题
4.1 学工辅助系统与其他信息管理系统数据对接问题
学工辅助系统的建设基础是建立数据交换模块,建设数据交换模块的主要困难是如何与高校现有系统进行对接。高校内信息管理系统大多是不同开发者进行开发的,部分信息管理系统已经运行多年,数据量十分庞大并且运行效率低下,有些系统甚至早已失去官方维护服务。这种情况下建设数据交换模块需要对高校各个信息管理系统进行深入的了解,并将系统内的核心数据进行提取,对系统进行小规模的二次开发。
4.2 数据选择问题
在打通各个信息系统之后还需考虑数据去留和数据清洗问题。由于学生每天在学校产生的数据是多种多样的,有些数据具有实际意义,有些数据反而会对系统运行结果产生干扰。例如,利用消费数据进行贫困生身份识别,当贫困生补助发放至学生的一卡通时,学生在某个时间段内的消费能力可能会有提升,这将会对他下一季度的贫困生身份鉴定产生影响。如何对已知数据进行预处理,增加运行结果的可信度也是学工辅助系统建设过程中需要考虑的问题。
4.3 业务判定标准问题
在系统建设过程中还需考虑各个业务标准的建设。例如,学生一个学期不通过的课程在2门及以上就要进行学业预警;学生的消费能力低于全校平均水平的三分之二即可认定成为贫困生。每个新业务的增加都要考虑相对应的判定标准,这样在建设过程中才能够准确把握系统建设的科学性和准确性。
5 结 语
数据挖掘是一门较为成熟的学科,并在多个领域内发挥出重要作用。目前,高校的信息化建设已经初见成效,信息采集较为完整,信息数量非常庞大,人工已经无法准确处理每项数据。现在学生的思想较为开放,个性鲜明,一刀切的管理模式已经不再适应现在的大学校园。个性化培养、个性化管理模式已经进入高校人才培养的视野,在这种情况下,更需要准确把握每一名学生的各项信息,有针对性地开展工作,帮助学生成长成才,这就需要一个全新的系统来辅助决策。本文设计了一种基于数据挖掘的学工辅助系统,利用标签数据生成“学生画像”并利用学生画像来为学生进行一系列信息和行为的预警和预测,为高校辅导员提供了个性化管理和个性化培养的新途径。
主要参考文献
[1]丁亦喆, 魏刃佳, 刘博,等. 移动互联网中一种移动学习方案的设计与原型实现[J]. 计算机工程与科学,2015,37(2):288-293.
[2]王征. 试析高校管理中应用数据挖掘技术的途径[J]. 教育现代化, 2018(2).
[3]蔡秀娟, 蒋艳荣. 模糊数据挖掘在高校学生管理中的应用[J]. 华南农业大学学报:社会科学版,2006,5(3):143-147.
[4]赵国亮, 陈晓军, 李思奇,等. 基于数据分析高校学生自画像的初探[J]. 数字技术与应用, 2017(8):233-234.
[5]丁亦喆. 基于标签的个性化推荐方法研究[D].西安:陕西师范大学, 2014.