可佳欣,李瑞欣
(山西晋中理工学院,山西 晋中030600)
在党的十九大报告中针对高等教育发展,特别强调了要健全学生资助制度,全面推进高校精准化资助育人工作,“努力让每个孩子都能享有公平而有质量的教育”。同时提出了发展型资助育人的新理念,以促进学生全面健康发展为目的,为贫困生提供综合的资助解决方案,包括经济资助、心理辅导、能力培养等[1]。而高校资助育人的传统工作模式很难满足这一新的需求,因此借助数字化技术对贫困生进行精准行为分析,构建资助育人的信息化共享平台,以实现对学生的“按需资助”是十分必要的。
信息化共享平台是实现数据信息采集、预处理、数据分析和数据存储等功能的数字载体。构建信息化平台所采用的关键技术主要有:JQuery框架、PHP语言、B/S架构、MySQL数据库等。其中B/S架构是WEB服务开发中应用非常广泛和成熟的软件框架,前端采用浏览器作为处理终端,用于实现前端页面的事件交互和响应,事件又可分为数据处理和逻辑处理两类;后端服务器由应用程序服务、WEB服务、数据库服务等角色构成,用于实现各类数据的处理和存储。JQuery框架是以JavaScript语言为核心的API框架,集合了HTML文档转换、控制、处理三大功能,可以在HTML页面中实现动态的交互效果、页面间的数据传输、页面样式的统一布局等,大大简化了传统JavaScript语言的编程方式。PHP语言主要用于系统前端与后端的数据传输,预置了丰富的函数用于数据库通信,可以轻松实现对数据库的各类数据访问操作。
数据挖掘是针对大量非结构化、随机、模糊的数据信息进行过滤、分析和信息提取的一项技术。数据挖掘技术通过对数据隐含特征规律的发掘和重组,构建数据特征模型,并在此基础上实现对事件的分类、聚类、预测和关联[2]。数据挖掘的算法有很多,包括贝叶斯网络、判定树、聚类分析、人工神经网络等,这些都是机器学习中的基本算法。其中聚类分析算法主要用于解决聚类问题,就是通过构建、训练样本数据的特征模型,对随机事件进行分类,且类的划分是未知的,是依据提取的特征变量的相似度来进行分类的。聚类分析的算法也有很多,例如k-means算法、GMM高斯混合模型聚类算法、模糊C均值聚类算法和基于密度的DBSCAN聚类算法等。借助数据挖掘技术对学生的行为特性进行分析,从而精准推荐出需要帮扶的学生,是一个典型的聚类问题,因此本研究将主要采用聚类分析算法进行学生数据的挖掘与分析。
资助育人信息化共享平台架构设计采用分层式B/S架构,如图1所示。
图1 资助育人信息化共享平台设计架构
前端表示层采用JQuery框架实现页面的动态效果显示和控制,例如表单控件的输入合法性验证、交互安全性验证,以及一些动态内容的显示与隐藏控制等。JQuery框架的接入可以通过HTML标签语言实现,代码如下:
核心业务层用于实现平台的核心事件处理,主要包括数据交互事件与逻辑控制事件。事件处理主要采用PHP语言脚本,以标签方式嵌入在HTML页面中实现。PHP脚本预置有丰富的函数库,既可用于业务的逻辑控制,也可以用于数据交互。例如用户登录功能的验证逻辑实现,可以采用PHP的分支结构来实现;数据库的合法访问可以通过以下代码实现验证:
require_once(′Connections/siy.php′)
其中siy.php文件用于提交数据库合法访问的必要信息。
数据存储层,用于实现数据的存储,采用MySQL数据库管理工具提供结构化的数据存储和管理功能。通过PHP预置的数据库连接函数,即可对数据表进行安全的数据读取。
资助育人信息化共享平台包括用户基本信息采集、用户动态信息采集、用户信息管理、调查问卷四个模块,主要目的是实现对校内贫困生完整信息的采集和共享,并基于不同层次和维度对校内贫困生的数据进行统计,为高校发展型资助育人工作的精确化数据分析提供全面的数据支撑。如图2所示。
图2 资助育人信息化共享平台功能设计
用户基本信息模块用于采集贫困生的基本数据信息,包括贫困生的学籍信息、家庭信息、贫困生校内兼职信息、贫困生奖助贷信息等,该模块数据用于对贫困生的经济情况评估提供一定的数据分析基础。
用户动态信息采集模块用于采集贫困生在校内的日常动态信息,包括消费情况、接受心理辅导情况、参加社团活动情况、学生管理人员对其综合情况评价等。该模块用于提供贫困生心理健康分析、除经济外的其他潜在需求挖掘的数据分析基础。
用户信息管理模块提供多层次、多维度的可视化数据统计界面,以及数据的备份和下载接口,用于实现数据的综合管理。
调查问卷模块用于创建、发布调查问卷,已满足数据分析的动态采集需求。
依托信息化共享平台完成数据采集工作后,需要先对数据进行预处理,也就是将冗余的数据进行合并或清除,可以采用可视化数据分析工具Tableau快速完成数据清洗。接着构建特征模型,设有贫困生n人,单个贫困生具有i个特征属性,可以建立样本特征矩阵X如下:
.
根据特征矩阵计算样本之间的欧式距离,公式如下:
.
其中,dij表示样本di与dj之间的距离系数,依次求出所有样本之间的距离系数,构建距离矩阵,在距离矩阵中选择距离最小值的两个样本合并为一个新类,并更新距离矩阵,对上述操作经过多次迭代,当满足终止条件后,样本即可基于特征模型完成层次聚类。
经过聚类所形成的数据类都具有唯一标识,借助可视化数据分析工具,可以对数据类特征进行直观的分析,从而深入挖掘学生的潜在需求,并实现精准帮扶。
为了推进高校精准化、发展型资助育人工作的开展,借助数字化手段对高校贫困生信息进行管理和分析是十分必要的。因此本研究构建了资助育人信息化平台,以实现贫困生完整信息的采集与管理,再结合数据挖掘技术中的聚类分析算法对贫困生信息进行特征分类和聚类分析,实现对贫困生不同维度下的行为特征刻画,并从中解读贫困生的真正需求,以达到精准化帮扶、全面关爱学生的教育目的。