基于机器学习的高校资助管理系统设计

2022-11-21 02:27甘发旺
无线互联科技 2022年17期
关键词:贫困生资助精准

甘发旺,爨 莹

(西安石油大学,陕西 西安 710000)

0 引言

教育是阻断贫困代际传递、摆脱贫困的一种有效的手段。不断地完善贫困地区教育的基础设施,补齐教育发展的短板,完善各级各类资助手段,让贫困家庭孩子都能接受公平而有质量的教育,享受我国发展改革的红利,不仅是当前我国夯实脱贫攻坚的一项重要任务,也是促进社会公平和谐的重要手段。高等学校依照奖助贷免的政策在教育育人、阻断贫困代际传递的环节中充当了重要角色。然而,如何“精准”一度成为困扰高等教育扶贫顺利推进的关键,虽然全国各级各类学校在不同程度上都制定了贫困生认定方案、建立了监控保障制度,但是筛选出来的贫困生仍然受到其他师生的“质疑”。“假贫困生”“贫困生被遗漏”“评判标准不统一”“评判过程有瑕疵”等问题一时成为社会关注的焦点,备受国家、社会、家庭、学生的关注。近年来,兴起的机器学习、深度学习、大数据等信息技术,业已成为高等学校助力脱贫扶智,走向精准化甄别贫困生有效的重要手段之一,成为各高校学生管理工作提质增速、信息化建设的目标和方向。

1 高校资助管理工作的现状

高等学校教育精准扶贫研究或将成为未来教育扶贫的重点研究内容,在工作流程上要求更加规范化、精细化、精准化。在数据的分析管理、识别甄别、数据有效利用上提高质量,在数据的采集范围上尽可能涉及学校、教师、学生和家庭等多元化的数据。现有的学生管理系统或资助管理信息系统虽然在一定程度上使业务工作人员从大量的Excel表格或数据库的“数据扶贫”中解脱出来,但对分布的数据采集、收集、分类、统计分析,仍然通过手工操作。系统的主要功能聚焦于信息的登记、筛选、查询和存档等操作,缺乏智能分析统计、精细分类、辅助决策等功能。虽然部分省、自治区、直辖市甚至国家结合实际情况进行了相关系统的研发,教育部全国学生资助管理中心委托设计开发的全国学生资助管理系统(http://202.119.133.18/login_blue.html),涉及学前、义务、普高、中职、本专科和研究生各子系统及地方资助、学校资助、社会资助等项目功能模块。但在数据采集上,工作人员仍然采用手工Excel数据录入。该系统仅可作为一个数据查询系统。在农村贫困人员扶贫系统的开发方面,王斌等[1]构建了新疆扶贫信息管理平台,该平台拥有为贫困人口建档立卡、项目管理以及数据统计分析3个主要业务,该系统与智能贫困学生甄别建档业务并不吻合。虽然董圆圆等[2]构建了基于Web的学生资助管理系统,实现了助学贷款申请、助学贷款审核、学生贷款管理等功能,提高了资助管理人员、班主任、辅导员的工作效率,减少了学生信息的多次采集输入,错误纠查的时间成本,降低了工作的复杂性,为学生提供了信息快速查询的接口。但是此系统依然是一个基于工作流的业务办公系统,并不能提供智能的甄别筛选能力。具备贫困生甄别分类能力,业已成为构建此类系统的关键,结合了概率统计学、大数据科学和计算机科学的机器学习、深度学习已成为解决分类甄别问题的热点研究方向之一,是当今人工智能研究的重点和难点。

2 智能分类算法的研究

分类算法根据其学习器模型的数目,可以分为单一的分类算法和集成提升的分类算法。经典单一的分类算法有:ANN(神经网络)、NB(朴素贝叶斯)、KNN(K近邻分类)、DT(决策树)、SVM(支持向量机)。通过对ANN的研究表明:单个神经元不能够很好地执行逻辑功能,但是多层的隐藏层能够达到很好的数据拟合能力。根据分类给定的训练样本,不断调整神经网络的层数和神经元的个数,通过反向的误差传导,不断调整神经元参数,使网络输出接近于已知样本类标记,达到预测数据的目的。近年来,深度神经网络由于其优异的算法性能表现,逐渐成为了学术界的研究热点,衍生出许多在图像识别、文本语言处理方向优秀的模型,广泛应用于图像信息分析、图像理解、图像生成、语音判别、自动驾驶等领域。对于要分类的样本,依据概率原则提出的NB算法,根据先验概率,求出样本属于某一类的最大后验概率,作为该样本所属的类。该分类算法经常被用于机械故障诊断、网络入侵检测、垃圾邮件分类等。基于距离度量的最近邻KNN分类算法,事先不需要模型的训练,根据待确定分类样本与确定训练样本特征之间的欧式距离,找出与待分类样本距离最近的K个样本作为待分类样本的参考值。虽然该算法预测精度欠佳,但基于其改进的算法被广泛应用于工农业生产当中,如判别粮食作物隐蔽性虫害、作物的种类等。在实际的工程应用中,决策树(DT)分类算法一直是许多专家优先选择的算法,其根据信息增益理论将离散和连续的数据分离成树状结构,分类结果有很好的可解释性和可视化效果。该算法的改进版本运行效率也进一步完善。在国内,许多研究者[3]选择采集学校一卡通数据,利用K-means聚类算法将学生划分为不同的消费群体,总结出聚类的关键特征用于贫困生的分类鉴别。也有学者利用HMM隐马尔可夫模型进行高校家庭贫困生认定模型研究[4],他们认为学生的贫困状态或者经济状况是一个动态演变的过程,必须把研究学生在学校的日常消费行为和学习的表现引入到高校家庭经济困难学生认定工作中,估算学生经济处于不同状况的概率,挖掘学生经济的内在状况。

虽然上述的算法在分类领域取得了不错的成绩,然而教育扶贫的精准与否建立在已有贫困学生数据的高精准分类基础上,各类单一算法已经无法兼顾数据的不平衡,在集成学习不断发展的今天,集成学习[5]表现出了更好的算法准确性和鲁棒性。杨胜志[6]在分布式环境下利用 GBDT集成分类算法对贫困生进行分类,取得了不错的效果。因此,本研究拟采用学生在校期间所产生的大量可挖掘的数据,应用集成学习中的随机森林算法对贫困学生进行分类甄别。

3 系统的设计与研究

3.1 数据集的收集

数据采集于甘肃医学院学生管理系统的学生基本信息、教务处教学管理系统的学生成绩、一卡通中心的学生消费情况、教育部资助管理中心的部分资助数据。数据集共涉及学生性别、年龄、政治面貌、学制、年级、生源地、中央比对低保学生等18个字段。

3.2 系统设计

系统的主要设计思想为:系统采用CS与BS混合开发的方式,CS端采用Python为主要开发工具,利用Pandas,Numpy,Sklearn,TensorFlow开发训练贫困生甄别分类模型,用Pyqt开发菜单和界面。BS端利用Django框架搭建Web服务界面,方便院系和学生在PC端或移动端查看。

3.3 部分关键代码

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

from sklearn.ensemble import RandomForestClassifier

from sklearn.model_selection import GridSearchCV

from sklearn.model_selection import cross_val_score

from sklearn.utils import shuffle

from sklearn.model_selection import train_test_split,cross_val_score

from sklearn.preprocessing import OrdinalEncoder

df=pd.read_csv("样本集.csv",encoding="utf8")

df=shuffle(df)

x=df.iloc[:,3:-1]

y=df.iloc[:,-1:]

ordinal_encoder = OrdinalEncoder() #对文本信息进行编码

polynomial_svm_clf= Pipeline([

("poly_features",PolynomialFeatures(degree=3)),

("scaler",StandardScaler()),

("linear_svc",LinearSVC(C=1,loss="hinge")),

])

polynomial_svm_clf.fit(train_x,train_y)

y_pre2=polynomial_svm_clf.predict(test_x)

precision_score(test_y,y_pre2)

recall_score(test_y,y_pre2)

f1_score(test_y,y_pre2)

confusion_matrix(test_y,y_pre2)

数据的测试结果如表1所示。

表1 数据的测试结果

软件实现界面如图1—2所示。

图1 登录界面

4 结语

作者通过研究已有大量的机器学习分类算法,结合学校在贫困生鉴别工作中的实际流程,设计并开发出基于CS/BS的智能资助管理系统,在一定程度上提高了贫困生甄别的水平,辅助了教育精准扶贫这项关切学生切身利益和权利的工作向精准化迈进。目前,我国很少有研究人员针对贫困学生甄别问题进行更深入研究。利用学校已有业务系统产生的数据对学生实现高精准分类,提出一种能够高效识别贫困学生的算法是教育精准扶贫系统能否高效运转的又一课题。本研究采用Web技术和人工智能技术相结合的方式,辅助实施教育精准扶贫,设计开发出一种能够适合教育精准扶贫的智能信息化系统。这是帮助教育精准扶贫走向深入信息化的一次尝试。

图2 主界面

猜你喜欢
贫困生资助精准
高校资助育人成效的提升路径分析
“隐形资助”低调又暖心
精准防返贫,才能稳脱贫
精准的打铁
精准扶贫 齐奔小康
精准扶贫二首
美国防部资助研发能垂直起降的无人机
2600多名贫困学生得到资助
“贫困生班主任”李金林
十年筹资千万元 资助八千贫困生