董秀英,柏小丽,汤铁群(.阜阳师范学院物理与电子工程学院,安徽阜阳36037;.四川省泸州电业局,四川泸州646000)
改进的BP神经网络预测高校毕业生就业能力
董秀英1,柏小丽2,汤铁群1
(1.阜阳师范学院物理与电子工程学院,安徽阜阳236037;2.四川省泸州电业局,四川泸州646000)
针对传统BP算法的神经网络收敛较慢的缺点,提出基于L-M(Levenberg-Marquard)算法的神经网络对影响高校毕业生就业能力的各项因素进行分析的模型,以预测高校毕业生的就业能力存在的不足.因素量化采用模糊数学中的格贴近度和专家打分的方法.仿真结果表明:系统模型缩短了训练时间,具有较高的准确性,预测值与实际值的误差很小,可以将此模型应用于对高校毕业生就业能力的预测.
L-M算法;BP神经网络;格贴近度;就业能力
Dong XY,BaiXL,Tang TQ.The Prediction of College Graduates Employ-Ability Based on the Improved BPNeural Network[J].Journalof Yibin University,2015,15(6):93-96.
随着我国高等教育进入大众化阶段,高校毕业生人数逐年激增,社会经济发展对不同专业人才的需求差异、就业区域不均衡,毕业生就业能力不足等都在不同程度上影响着高校毕业生的就业[1].根据上述情况需要用一种算法来分析预测毕业生就业能力在哪方面存在不足,以便在今后的教学和辅导工作中为学生提供建设性的意见.由于神经网络在处理非线性、不确定性或模糊关系方面具有独特的优势,而改进型的BP神经网络采用L-M优化算法,具有梯度下降法的全局特性和高斯—牛顿法的局部收敛性,是传统BP算法的改进算法,所以L-M算法对准确度和训练次数来说,明显优于变学习率法的BP算法,且比梯度法快,对于局部搜索能力而言,L-M优化算法强于BP算法.本文把改进的BP神经网络智能算法应用于毕业生就业能力的分析预测中,通过实例证明,改进的BP神经网络模型具有较高的预测精度和良好的泛化能力,能用来预测高校毕业生就业能力在哪些方面存在的不足.
BP神经网络[2]是一种误差反向传播的学习算法.它由输入层、中间层和输出层组成,其模型如图1所示,中间层也就是隐含层一般由一层或多层组成.BP神经网络的学习过程分为正向传输和反向传输.在正向传输时,主要用于对前向网络进行计算.如果输出层的输出得不到希望值,则转到反向传输,用于反向逐层传递误差,即修改神经元之间的链接权值,经过这种不断迭代,最后使得输出层的输出达到期望的误差要求.
图1 BP神经网络模型
BP神经网络学习算法的收敛速度慢,是一种梯度最速下降法,可能会出现局部最小的问题,即从表面上看,误差符合要求,但所得到的输出并不一定是期望输出.而L-M训练法能有效地抑制训练过程中陷入局部最小值,因为它能降低网络对误差曲面局部的敏感性.其主要的思想是在每次迭代时,允许误差沿着恶化的方向进行搜索,而不再沿着单一的负梯度方向,同时在高斯—牛顿法和梯度下降法之间自适应来调整和优化训练网络权值,使网络能够有效收敛[3-4].
2.1数据分析和处理
就业能力是指高校毕业生获得工作、维持工作且能应付工作中的变化和工作中成长进步所需各种能力的总和.对于没有就业经历和经验的应届高校毕业生,影响就业能力的因素可以为知识因素、技能因素、个人因素和求职因素.其中,知识因素主要包括专业知识和非专业知识;技能因素包括专业技能、社会技能和综合技能;个人因素包括个人特征,职业识别和态度;求职因素主要包括通过各种途径对就业信息的搜集与处理能力、准确的识别和判断就业信息的能力、自我展示自身才能的能力、语言的组织和表达能力、理解沟通和合作能力、洞察先机的能力和应对各种场合面试的能力等[5].
影响高校毕业生就业的主要因素有知识因素、技能因素、个人因素和求职因素.这些因素有的是可以进行直接量化的,如知识因素,它包括专业知识和非专业知识,其中非专业知识主要有外语、计算机过级情况、驾驶、社交礼仪等知识.专业知识以毕业生在校期间所修课程的平均成绩来分析,而非专业知识主要以计算机和外语过级分数来分析,总的知识因素指标是专业知识和非专业知识分数的平均.而有的因素是定性的,很难进行量化,如技能因素、个人因素、求职因素,因此运用模糊数学中的格贴近度评价[6]方法和专家打分的方法,首先对定性指标进行量化处理.下面分别介绍如何把引起高校毕业生就业能力的这些因素进行量化处理.
测定某人的个人因素需要考察:外在个人特征指标x1,内在个人特征指标x2,职业识别指标x3,态度指标x4等,这些因素构成了一个论域:
U={x1,x2,x3,x4}
评价集V为:
V={A1(优),A2(良),A3(中),A4(差),A5(很差)}
各个评语所对应的指标区间为:
优=[90,100],良=[80,90),中=[50,80),差=[30,50),很差=[0,30).
通过专家意见法设定与评语指标区间对应的四项指标的数值依次为:
A1=(1.00,0.95,1.00,0.90)
A2=(0.85,0.80,0.80,0.85)
A3=(0.55,0.65,0.70,0.60)
A4=(0.40,0.35,0.45,0.30)
A5=(0.05,0.20,0.25,0.15)
待识别的一组个人因素指标为:
B=(0.60,0.50,0.80,0.40)
计算B与A1,A2,A3,A4,A5的格贴近度:
(A1,B)=(A1⊙B)⋂(A1⊕B)C=0.10
(A2,B)=(A2⊙B)⋂(A2⊕B)C=0.20
(A3,B)=(A3⊙B)⋂(A3⊕B)C=0.40
(A4,B)=(A4⊙B)⋂(A4⊕B)C=0.45
(A5,B)=(A5⊙B)⋂(A5⊕B)C=0.25
根据择近原则,得出其个人因素指标为:
个人因素指标= (1×(90+100)/2+2×(80+90)/2+ 4×(50+60+70+80)/4+ 45×(50+40+30)/3+ 25×(10+20+30)/3)/100=75.5
以此类推可求出其他人的个人因素指标.
技能因素指标、求职因素指标跟上述方法类似.影响高校毕业生就业能力的各项信息数据如表1所示.
BP神经网络模型通常以sigmoid函数作为激励函数,该函数的值域为[0,1],而从表1可看出,毕业生的各项指标因素和对就业能力影响的数值都是大于1的整数.因此这些数值都需要将其转化为[0,1]之间的数据.根据归一化公式:
x(i)=(x(i)-min(x(i)))(max(x(i))-min(x(i)))
对表1数据进行归一化,通过matlab计算出归一化数值如表2所示.
表1 影响高校毕业生就业能力的各项信息数据
表2 对表1数据进行归一化后数值
2.2改进的BP神经网络的设计
对于一般的模式识别问题,采用三层的BP神经网络模型就能以任意精度逼近任意非线性关系.所以通过对毕业生就业能力的分析,采用三层的BP神经网络建立对高校毕业生就业能力的预测分析模型.从表1的分析中可以看出,应用BP神经网络可以找出引起高校毕业生就业能力的各项因素和对高校毕业生就业能力的影响的关系,以预测高校毕业生就业能力在哪些方面存在不足.改进型的BP神经网络的输入值为表2中的影响高校毕业生就业能力的各项指标因素的值,而改进型的BP神经网络的输出值为高校毕业生就业能力的值.本实例将从样本集中随机选取15个样本作为训练样本.
从上面的分析中知道,BP神经网络输入层的神经元为4个,输出层神经元为1个,但隐含层神经元个数的选取就比较复杂了,选择过小或过大都有可能产生很大的误差;通过对网络进行实际训练检验并不断调整,综合考虑网络的输出精度和收敛速度,选取隐含层的神经元个数为9[7],则网络的拓扑结构可表示为4×9×1.
用Matlab的专用newff函数确定传递函数,网络的结构和训练算法选用L-M算法,即选择trainlm,其调用形式为:
net=newff(minmax(p),[91],{'tansig','logsig'}, 'trainlm');
根据上面所述语法建立网络后,对网络的训练参数进行设置.Matlab程序如下:
net.trainParam.show=50;
net.trainparam.lr=0.05;
net.trainparam.mc=1.05;
net.trainParam.epochs=1000;
net.trainParam.goal=1e-3;
设置好网络参数后开始训练网络,达到网络收敛.matlab程序为:
[net,tr]=train(net,p,t)
从图2可以看出,通过5步训练后,网络的性能达到了要求.
图2 改进的BP神经网络收敛图
通过训练好的改进的BP神经网络,取某人的各项归一化指标0.9,0.5,0.4,0.6,则神经网络的输入参数A=[0.9,1,1,1;1,0.5,1,1;1,1,0.4,1;1,1,1,0.6],测试样本的选取是按照只有一种因素的情况下对高校毕业生就业能力的影响,则通过网络训练:
a=sim(net,test)
得到仿真结果如下:
a=0.92950.67470.84470.8056
从测试结果可以看出,该生的知识能力个人因素和求职因素都不错,但技能因素还有待加强.因此,今后的教学和辅导工作应重点对该生进行专业技能、社会技能和综合技能等方面的指导,从而提高该生的整体就业能力,以适应社会的需求.
BP神经网络模型可应用在各类普通高校的在校学生中,预测其就业能力,从而找到就业中存在的不足,明确自己改进的方向.本文通过改进的BP神经网络对高校毕业生就业能力的各种因素进行分析,首先由于在影响高校毕业生就业能力中有的是很难通过直接量化得到的指标,所以采用了模糊数学中的格贴近度评价方法和专家打分的方法对引起高校毕业生就业能力的各项数据进行量化.通过量化,归一化后的数据可以作为改进的BP神经网络的输入数据,然后利用matlab工具建立网络模型.通过编程测试,实际值与预测值误差值很小,可以把它作为一种工具对实际问题进行分析.
[1]刘新民,郭供波.影响大学生就业因素分析[J].思想政治教育研究,2007(3):19-21.
[2]尹朝庆.人工智能方法与应用[M].武汉:华中科技大学出版社, 2007.
[3]张长胜,欧阳丹彤,岳娜,等.一种基于遗传算法和LM算法的混合学习算法[J].吉林大学学报(理学版),2008,46(4):675-680.
[4]王钰,郭其一,李维刚.基于改进BP神经网络的预测模型及其应用[J].计算机测量与控制,2005,13(1):39-42.
[5]崔畅,林娅琪.大学生就业能力分析及对策建议[J].黑龙江对外经贸,2010(5):130-131.
[6]李安贵.模糊数学及应用[M].第2版.北京:冶金工业出版社, 2005.
[7]董秀英.便携式心血管监护系统的设计和实现[D].成都:西华大学,2011.
(编校:王露)
Prediction of College Graduates’Em ploy-Ability Based on the Improved BPNeuralNetwork
DONGXiuying1,BAIXiaoli2,TANGTiequn1
(1.SchoolofPhysicsand Electronic Engineering,Fuyang TeachersCollege,Fuyang,Anhui236037,China;2.Luzhou PowerSupply Bu⁃reau,Luzhou,Sichuan 646000,China)
An improved neural network model based on L-M(Levenberg-Marquard)algorithm neural network was ap⁃plied to analyze the factors influencing college graduates’employability.It can remedy the shortcoming of the slow con⁃vergence rate of traditional BP algorithm neural network.Thismodel can predict the deficiencies in employability of col⁃lege graduates.The lattice fuzzy close-degree assessmentand expert scoringmethod were adopted,which quantified the various data of the factors on the employability of college graduates.Simulation results indicate that thismodel can re⁃markably reduce the training time,with relatively high accuracy.With small errors in the predicted value and actual val⁃ue,thisnetworkmodel can be used to forecast theemployability of college graduates.
L-M algorithm;BPneuralnetwork;close-degree grid;employability
TP18
A
1671-5365(2015)06-0093-04
2014-12-19修回:2015-01-09
阜阳师范学院教学研究项目(2012JYXM91);阜阳师范学院硕士科研启动资金
董秀英(1984-),女,助教,硕士,研究方向为嵌入式系统应用及开发
网络出版时间:2015-01-12 12:59网络出版地址:http://www.cnki.net/kcms/detail/51.1630.Z.20150112.1259.001.html
引用格式:董秀英,柏小丽,汤铁群.改进的BP神经网络预测高校毕业生就业能力[J].宜宾学院学报,2015,15(6):93-96.