赵 楠,聂子一,焦梦青,贾子纯
(1.河北地质大学研究生学院,河北石家庄 050031;2.河北地质大学信息工程学院,河北石家庄 050031;3.河北地质大学水资源与环境学院,河北石家庄 050031)
促进高校毕业生就业,特别是按照高层次人才培养的研究生就业,是实施“科技兴国、人才强国”战略的重要举措,也是全面建成小康社会的重要推力[1],当前促进高校毕业生的政策导向也十分鲜明[2].近年来,我国研究生招生人数在陆续增加,研究生及其家长对就业的关注点逐渐从“能否就业”转向“就业质量”,就业质量评价受到国家体制、经济发展水平、高校层次差异及个体能力等因素的影响,不同高校因其办学特色、学科布局及人才培养方案不同,就业质量评价体系也有所差异[3].一些高水平的综合类大学如中国人民大学、南开大学、西南大学等已逐步探索建立了本校的就业质量评价指标体系[4].一些具有一流学科的财经类、医药类、农林类高校也针对本校的就业质量评价制定了特色化的指标体系.
在就业质量评价体系指标研究方面,使用频度较高的指标为就业率、毕业生就业满意度、用人单位满意度、工作稳定性和社会认可度五项[5].张文锍[6]分别从大学生个体、学校、用人单位、家庭和社会五个维度构建指标体系,采取主客观相结合、定性定量相互补充、以及宏观微观相互交叉的方法评价就业质量.吕钦[7]在对国内外就业质量评价指标充分调研的基础上,将评价指标概括为五大类:薪酬状况、客观工作条件、工作与生活的平衡、工作满意度和发展情况.
在就业质量评价模型研究方面,张淼[8]以陕西省高校毕业生作为研究样本,制定了稳定与公平、安全与健康、报酬与提升3个一级指标,9个二级指标以及13个三级指标,通过结合层次分析法、实证调研法、专家打分法3种基本方法,确定了三级指标的不同权重,以及加权求和的计算公式.刘永平[9]、齐鹏等[10]、尹晓菲等[11]、刘敏等[12]在充分进行文献调研的基础上,基于满意度的视角下,构建涵盖工作单位满意度、就业指导满意度、个人满意度的就业评价指标体系,并采用模糊数学理论方法确定每个指标的模糊综合评价值.童娟[13]把毕业生就业质量划分为优、良、一般、差4个等级,建立神经网络模型,通过对就业数据的训练学习获得指标权重,避免人为规定权重的主观性.
智能预测就业质量模型属于非线性的评价技术,其预测结果明显优于层次分析法、模糊数学理论等传统方法.但是单一的智能算法在迭代寻求最优解时会有一个明显的问题,即传统BP神经网络算法应用于就业质量评价易陷入局部最优、泛化能力不足.为解决这一问题,本文提出基于粒子群改进神经网络的混合算法评价研究生就业质量,以期改善当前模型不足,提高评价精度,获得更可靠的评价效果.
对于研究生就业质量评价,存在大量不同指标的评价模型,也不可能将全部指标均纳入研究生就业质量评价体系.本文建立的研究生就业质量评价体系考虑以下特点:(1)针对性更强,研究生具有高层次人才的特性,筛选的评价指标更能突出研究生的特性,减少对于本科生、研究生均适用的普适标准;(2)主客观相结合,既反映就业者的主观感受,同时兼顾工作单位的客观满意度;(3)可操作性强,评价指标体系具有实用和可推广的特点.构建的研究生就业质量评价体系如表1所示.
表1 研究生就业质量评价指标体系
BP神经网络是一种前馈神经网络,即它的传播方向是从后向前反向传播,它通常具有三层拓扑结构,即输入层、隐含层和输出层,如图1所示.BP神经网络通过不断更新传播过程中的权值和阈值来逐步完善网络,最终达到实际输出值和期望输出值误差均方差最小的目的.
图1 BP神经网络拓扑结构
设第m个研究生就业质量评价样本的期望输出结果为Em,BP神经网络的实际输出结果记为Om,那么训练样本的结果应输出误差计算公式为:
式中n为训练样本数.
隐含层与输出层间的权重为Wxy、输入层与隐含层间的权重为Wyz,其中,y代表隐含层节点、x为输出层节点、z为输入层节点,权值的更新方式如下:
式中η为学习速度,E为真实值与预测值的误差.
BP神经网络的学习过程实际就是权值和阈值更新的过程,传统更新规则为梯度下降法,权重的初始值主要依据个人经验所得.权重初值的选取直接影响BP神经网络学习性能,进而影响模型的评价效果.因此,本文采用粒子群算法对神经网络的权重赋初始值.
粒子群算法用一种粒子来代表鸟群中的鸟,这种粒子是无质量的,仅具有两个属性:速度和位置.各粒子在空间中单独搜寻最优解,将其记为当前个体极值pbest,并将个体极值与整个粒子群的其他粒子共享,找到最佳的个体极值作为整个粒子群的当前全局最优解gbest.在每一次迭代中,粒子通过跟踪这两个极值更新自己的速度和位置,即:
式中:i表示粒子的数目,νi表示粒子的速度,rand()是介于(0,1)之间的随机数,xi是粒子当前的位置,c1、c2是学习因子,ω为权值系数.
传统BP神经网络算法容易陷入局部最优问题的原因是在更新过程中单纯利用误差反向传播调整权值和阈值.通过粒子群算法可拓展搜索权值、阈值的范围和深度,优化BP神经网络的权值和阈值,实现全局最优.具体实施步骤如下:
(1)根据表1的评价指标内容,采集历史数据,组成研究生就业质量评价样本集合;
(2)归一化处理的样本数据作为BP神经网络的输入向量,研究生就业质量评分值作为输出向量,确定算法的拓扑结构;
(3)设置种群规模,初始化种群位置和速度,并将研究生就业质量评价误差作为适应度函数值;
(4)计算粒子适应度函数,更新个体最优位置pbest和群体最优位置gbest;
(5)根据式(4)调整粒子速度和位置;
(6)产生(0,1)范围随机数,如果小于变异系数,则随机初始化种群,否则,获得最优Wxy和Wyz的初始值;
(7)根据最优的Wxy和Wyz初始值,进行研究生就业质量评价神经网络训练,并采用测试集对训练好的网络进行仿真测试.
通过粒子群改进BP神经网络模型的研究生就业质量评价流程如图2所示.
图2 粒子群改进BP神经网络算法流程
为了测试粒子群改进BP神经网络的研究生就业质量评价效果,采用Python 3.8作为开发工具编程实现研究生就业质量评价程序.研究生就业质量评价结果采用百分制进行描述,共收集2500条研究生就业质量评价数据.使用留出法将样本数据随机分为训练集(2000条)和测试集(500条),统计研究生就业质量评价精度.
为显示出优化后的算法的优势,将单一算法与粒子群优化后的算法进行对照.为了分析的准确性,本文从3个角度,即平均绝对误差(AAD)、平均绝对百分误差(RAAD)、均方根误差(RMSE),对仿真效果进行对比,预测结果如图3所示.
图3 预测结果对比
其中N表示测试样本数量.
从图3可以看出,无论是AAD、RAAD还是RMSE,粒子群改进的BP神经网络显示出的优势十分显著,改进后的算法预测误差均低于传统算法的预测误差.
为了改善研究生就业质量评价效果,本文引入了基于大数据挖掘技术的研究生就业质量评价模型,采用粒子群算法和BP神经网络建模对研究生就业质量进行评价.仿真结果表明,智能混合算法优化了BP神经网络权重、阈值的初始值,避免了传统BP神经网络算法陷入局部最优的情况,且精度更高,预测值更接近真实值,评价结果更可靠,为研究生就业质量评价提供了一种更好的方法.