李 翔,党晓楠,王清雯
(1.镇江高等专科学校 医药与化材学院,江苏 镇江 212028; 2. 镇江市功能化学重点实验室,江苏 镇江 212028; 3. 镇江出入境检验检疫局 法制与风险管理科,江苏 镇江 212003)
反向传播(Back Propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用广泛的神经网络模型之一[1]。该网络能处理复杂模糊映射关系,具有强大的自学能力,在统计学上具有很好的应用前景。BP神经网络模型具有重要的现实意义及理论价值,目前应用于大学生创业评价体系研究[2]、体质综合测评研究[3]、心理健康行为研究[4]、心理危机干预研究[5]、就业信心指数研究[6]等。近年来,BP神经网络模型更多地应用于大学生就业质量研究,为高校提供决策依据。如周亮利用模型分析了影响民办高校大学生就业的因素[7],佘其平等利用模型对大学生的就业率进行预判[8],陈立俊利用模型分析了影响上海高校毕业生就业的因素[9],童辉杰等利用Clementine数据挖掘软件构建大学毕业生就业质量的 BP神经网络模型,对大学生的就业质量进行预测,预测精度达到99.98%[1]。BP神经网络模型可对影响大学生就业质量的关键因素进行权重分配,以探讨影响就业质量的深层原因。目前,研究者关注的就业对象为高层次的本科、硕士甚至是博士群体,而利用该模型研究高职高专院校毕业生就业质量的却鲜见报道。
以镇江高等专科学校医药与化材学院毕业生为例,将影响大学生就业质量的因素进行量化处理,利用BP神经网络建立学生自身因素与就业质量的内在联系,探寻影响就业质量的关键性因素,以便在今后的教学及辅导中为学生提供建设性意见,提高就业质量。
相比其他预测模型,BP神经网络模型特点显著[10],具有较强的非线性映射能力、高度的自学习和自适应性能力、将已有学习成果应用于新知识的能力、较强的容错能力。该模型主要包括1个输入层及1个输出层,中间包含1个或者多个隐含层。每层具有一定数量的神经元,如输入层的神经元数目对应目标各因素的数目。隐含层的数目通过特定的计算公式获得[11],输出层神经元数目则对应预测目标的数目。层与层之间神经元存在权值和阈值,其具体计算公式参考文献[12]。
神经网络可以用于预测,是因为模型可以通过样本的学习(训练),不断改变其连接的权值及拓扑结构,以使网络的输出逐步接近所设定的目标输出,当模型经学习后达到了目标输出,则模型可用于后续的预测。
以医药与化材学院近3年的毕业生为调查对象,采取调查问卷形式,内容包含影响就业质量的知识因素及个人因素。知识因素主要有外语过级情况,专业知识、毕业生在校期间的班级排名等。个人因素包括自我实践能力评价、自我自觉性评价、自我表达能力评价、自我抗压能力评价、自我创新性评价等。将各因素量化,如“自我实践能力评价”的选项为“很强”“较强”“一般”“弱”,在建立数据库时设定的数值分别为0.99,0.75,0.5,0.25。将“目前工作的满意度及未来发展前景”作为大学生就业质量的评价标准,选项中“非常满意”“满意”“一般”“不满意”分别对应数值0.99,0.75,0.5,0.25。数值规律性的变化是建立数据库的基本要求,部分训练样本的数据如表1所示。10个样本的就业质量目标值量化后分别对应0.75,0.5,0.5,0.75,0.5,0.5,0.5,0.5,0.5,0.99。回收有效问卷85份,任意选择75份样本数据建立数据库以供模型训练,剩余10样本数据作为“验证组”,与模型的“预测组”进行比较,判断模型的预测精度。
表1 部分训练样本的各因素数据(10个)
2.2.1 传递函数及训练函数的确定
MATLAB提供了神经网络工具箱,网络设计者可根据自己的需求直接调用工具箱中有关神经网络的设计及训练程序,提高工作效率[13]。神经网络工具箱提供了建立神经网络的专用函数newff(),该函数的调用格式为
Net= newff(PR, [S1 S2…SN],
{TF1 TF2…TFN}, BTF, BLF, PF),
其中PR为输入向量的取值范围,Si为第i层的神经元数,总共N层,TFi为第i层的传递函数,可选择的传递函数有“tansig”“logsig”“purelin”等。BTF为训练函数,可供选择的训练函数为“traingd”“traingdm”“traingdx”“trainrp”“trainlm”“trainbr”等。每种训练函数各具特点,可根据任务选择合适的训练方法及函数。隐含层的传递函数设为“tansig”,输出层的传递函数设为“purelin”。训练函数选择“traingdm”,该函数采用了有动量的梯度下降法,提高了学习速度并增加了算法的可靠性。动量法降低了网络对于误差曲面局部细节的敏感性。
2.2.2 隐含层节点数的确定
隐含层节点数的确定采用高大启[14]提供的经验公式
(1)
式(1)中,m为输入层神经元数,n为输出层神经元数,S为隐含层神经元数,通过计算得隐含层神经元数为6。
2.2.3 学习率及其他训练参数的确定
学习率设定为0.1,精度设定为0.02,训练步数设定为100000,训练步长设定为1000。
2.2.4 MATLAB的主要程序
其主要的程序为
net=newff(minmax(P),[6,1],{‘tansig’,‘purelin’},‘traingdm’);
net.trainParam.lr=0.3;
net.trainParam.epochs=100000;
net.trainParam.goal=0.02;
net.trainParam.show=50;
net=train(net,P,T)
A=sim(net, Pn);
其中,P为用于训练的样本各因素量化后的数据库,T为用于训练的样本目标量化后的数据。
2.2.5 各因素权重贡献率计算方法
权重贡献率是用来分析研究输入神经元(样本各因素)权值分布的一种方法,在MATLAB中,输入层神经元权值的调用程序为net.IW{1,1}。
采用75个样本建立数据库训练BP神经网络,训练过程如图1所示。从图1可知,模型经过15 416步训练后达到预设的精度0.02。将10个样本数据用于模型性能预测,其预测结果如表2,表3所示。预测目标是大学生的就业质量,以“目前工作的满意度及未来发展前景”为评价标准。“非常满意”“满意”“一般”及“不满意”分别对应数值0.99,0.75,0.5,0.25。如果预测值接近4个数值中的某个值,则说明模型预测了该大学生对就业质量的满意度。例如,对于样本4而言,其实测值为0.5,而预测值为0.6142,似乎预测值与实测值相差较大。但相对于0.75,0.6142更接近0.5,说明预测结果的满意度为“一般”,与实测结果相同。又如样本8,其实测值为0.75,其预测值为0.6362,相对于0.5,该值更接近于0.75,同样可以认为预测结果与实测结果相同,即“比较满意”。
基于上述评判标准,可以看出,样本3的实测值为“比较满意”,预测值为“一般”,其余样本的实测值与预测值完全相符。可以看出BP神经网络的预测精度非常高,预测准确度达到90%。因此,该模型适用于医药与化材学院毕业生的就业质量预测。
图1 BP神经网络的训练过程.
表2 样本实测值与预测值比较
表3 实测满意度与预测满意度比较
BP神经网络的初始权值和阈值是任意设定的,因此在训练过程中,在设定相同参数的前提下,每次训练结束时各个因素的权值差别特别大。因此,先让网络模型进行30次训练,求得每次训练时各因素的权值贡献率,并将训练后各个因素的权值贡献率值排序,统计各因素权值贡献率为最大值时的次数,统计的结果如图2所示。
从图2可以看出,在模型训练时初始权值的随机变化对各因素最终的权值影响很大。某因素权值排在第一的次数越多,它对结果的影响程度越大,即贡献程度越高。从图2可看出,按照对结果贡献大小排序,则因素9>因素3>因素4>因素5(剩下因素暂不考虑)。这样就能了解影响大学生就业质量的关键因素是“在校期间是否多次获得证书”“是否担任过班干部”“是否具备很强的实践能力”“是否自觉”。在校期间,学校应鼓励学生担任班干部,提高领导能力,参与竞赛,培养自觉性和实践能力等。大学生的创新性对其就业质量的影响最小,这可能与他们从事的工作性质相关,无需很强的创新能力。
图2 各因素权值贡献率最大值时次数
采用BP神经网络对大学生的就业质量进行预测,预测精度达到90%,说明模型具备很强的适用性。同时对各因素的权值贡献进行确定,结果发现,影响大学生就业的重要因素有“在校期间是否多次获得证书”“是否担任过班干部”“是否具备很强的实践能力”“是否自觉”。学校需要更多关注上述几大因素,以提高学生的就业质量。
[1] 童辉杰,杨雅婕,吕航.应用神经网络模型对大学毕业生就业质量的预测[J].人类工效学,2012,18(3):20-22,86.
[2] 谭立章,王莹,高君.基于BP神经网络的大学生创业评价体系研究[J].浙江理工大学学报,2015,34(5):442-446.
[3] 王乃博,黄国梅,吴磊,等.基于BP神经网络模型的大学生体质综合测评[J].南昌大学学报,2016,40(5):506-510.
[4] 王丽.基于神经网络的研究生心理健康状况预测分析[D].西安:西安科技大学,2016:1-4.
[5] 袁磊.基于无监督学习神经网络的大学生心理危机干预研究[D].武汉:武汉理工大学,2012:1-8.
[6] 杨光军.灰色理论和BP神经网络在大学生就业信心指数预测中的应用[J].教学的实践与认识,2013,43(13):62-67.
[7] 周亮.民办高校大学生就业影响因子探析[J].重庆与世界,2014,31(4):100-103.
[8] 佘其平,邓娟,李庆.基于BP神经网络的大学生就业情况分析[J].现代商贸工业,2015(12):139-141.
[9] 陈立俊,王克强.基于人工神经网络方法的大学生就业问题探析:以上海高校毕业生为例[J].教育发展研究,2013:13-14.
[10] GUO D S, ZHANG Y N,XIAO Z L,et al. Common nature of learning between BP-type and Hopfield-type neural networks[J]. Neurocomputing,2015,167(1):578-586.
[11] YE S. RMB exchange rate forecast approach based on BP neural network[J]. Physics Procedia ,2012(33):287-293.
[12] Yu X H, XIONG S W, HE Y, et al.Research on campus traffic congestion detection using BP neural network and Markov model [J]. Journal of Information Security and Applications,2016,31(C):54-60.
[13] LIU X S, DENG Z, WANG T L. Real estate appraisal system based on GIS and BP neural network[J]. Transactions of Nonferrous Metals Society of China,2011,21(s3):626-630.
[14] 叶斌,雷燕. 关于BP网中隐含层层数及其节点数选取方法浅析[J].商丘职业技术学院学报,2004,3(6):52-53,60.