基于IAFSA-BP并行集成学习算法的大学生就业预测模型

2019-08-27 03:46蒋正婷
价值工程 2019年19期
关键词:BP神经网络

蒋正婷

摘要:随着我国高校毕业人数逐年增加,大学生“就业难”问题越发突出,其已然成为了社会广泛关注的热点之一。准确预测大学生的就业前景,提高当代大学生的就业率及就业质量引起了党中央和国家的高度重视。因此,本文通过将改进的人工鱼群算法优化BP神经网络的权值和阈值,提出了基于IAFSA-BP神经网络并行集成学习算法的大学生就业预测模型,并将整理的数据集在matlab中进行仿真实验时达到了极佳的预测效果,以期该模型能为推动大学生高质量就业提供参考意见。

Abstract: With the increasing number of college graduates in China, the problem of "difficult employment" for college students has become more and more prominent, and it has become one of the hotspots of widespread concern in society. Accurately predicting the employment prospects of college students and improving the employment rate and quality of employment of contemporary college students have attracted the attention of the Party Central Committee and the state. Therefore, this paper proposes an employment forecasting model based on IAFSA-BP neural network parallel integrated learning algorithm by optimizing the weight and threshold of BP neural network by improved artificial fish swarm algorithm, and compiling the data set in matlab. The experiment achieved excellent prediction results, in the hope that the model can provide reference for promoting high-quality employment of college students.

关键词:BP神经网络;人工鱼群算法;并行集成学习;大学生就业预测模型

Key words: BP neural network;artificial fish swarm algorithm;parallel integrated learning;college student employment prediction model

0  引言

近年來,随着我国高校教学改革全面深入开展,教育水平不断提高,大学生数量逐年增加,大学生就业难已然成为了一个社会热点问题。在当今严峻的就业形式下,各用人单位对应届毕业生的录用门槛越来越高,很多学生在大学期间,只重视书本上的内容,忽略了其自身综合素质的提升,造成毕业时不能满足现实对大学生的招聘要求。当然,也存在着应届毕业生对自身评价过高,对就业岗位期望过大,最终导致其不想就业,亦或对自己所从事的工作满意度较低。因此,要想改善多种形式的“就业难”问题,建立一个精准的大学生就业预测模型对高校教育方向具有一定的指导意义。现阶段国内外学者提出的大学生就业预测方法主要有:朴素贝叶斯算法[1]、数据挖掘技术[2]、最小二乘法[3]、多元统计分析法[4]、自然邻居分类算法[5]。朴素贝叶斯算法在属性个数较多或属性之间相关性较大时,分类结果较差;最小二乘法在解决实际问题时具有较大偏差性、非一致性;多元统计分析法虽然考虑了多个变量间的线性因果关系,但其命名清晰度较低;自然邻居算法中某一噪声点一旦远离数据集时,易出现算法搜索邻居的时间复杂度高等缺陷。

本文在目前分析方法不足的基础上,提出IAFSA-BP的并行集成学习算法。通过对人工鱼群算法视野范围和移动步长进行改进,将改进后的人工鱼群算法优化BP神经网络的初始权值和阈值,两种算法交叉并行,最终获得最佳权值和阈值,以构建出IAFSA-BP并行集成学习算法,再将该算法应用于大学生就业预测中,建立出基于IAFSA-BP并行集成学习算法的大学生就业预测模型。

1  影响大学生就业的因素分析

当今社会中,大学生是最富有生命力的就业群体,他们有梦想、有憧憬、有志气、有干劲,是社会主义的接棒人和建设者。近年来受国家政策、用人市场等社会环境的制约,大学生就业形式越发严峻,引发了广泛的社会关注度。

影响大学生就业的因素有很多。在我国当前的大学生就业问题研究当中,陈立俊等人[6]借助人工神经网络的方法,揭露了影响大学生就业的主要因素有地域偏向、盼望薪资、学校、就业履历、学历、生源地、故乡、专业种类、性别等。为了改善现今大学生“就业难”的局面,张清芳[7]应用Logit模型验证了大学生要想有效提高自身就业水平,必须从学生本人、学校、及社会三个方面共同发奋。

国外学者在大学生就业问题的研究中,Sulastri A[8]等选取二百零六名心理学专业毕业生参加了两波纵向研究,结果表明GPA、课外活动、外语技能和参与一般丰富课程与成功找到基于心理学的工作有显著的关系。大数据背景下,Menon M E[9]使用自我报告的数据来比较大学生的收入和就业期望,以及最近毕业生的实现的收入和就业路径。另外,Teichler U[10]调查的欧洲毕业生中,大学学习期间一直活动的毕业生国际能力较强的学生更有可能拥有更好的发展前景。

综合国内外学者研究的影响大学生就业因素以及结合我国招聘市场对人才需求的特点分析,本课题主要从奖学金数、党员、性别、四六级、挂科数、学科竞赛、社会实践等方面进行深入分析,其不仅可以有效确保指标的独立性及时效性,同时也更符合实际,从而构建出较为精确的大学生就业预测模型。

2  改进的人工鱼群算法与BP神经网络并行学习算法

2.1 人工鱼群算法及改进

人工鱼群算法[11]是李晓磊等人在2002年提出的一种新型群智能算法。该算法的原理是鱼类在一片水域中能自行或尾随其他鱼群找到食物,進而可以推断出鱼数目多的地方即是该片水域食物浓度最高的地方。根据这一特点,对鱼群中的模拟鱼进行编码,并对其感知半径和移动步长进行改进,经过不断迭代,即可形成解空间中的具体可行解。鱼类在寻找食物的过程类似实际问题中的寻优过程,即人工鱼通过觅食、聚群、追尾等行为找到食物浓度最高的地方,对应实际问题中的函数最优值。人工鱼群算法的三种主要行为描述为:

①觅食行为。水域中的鱼发现食物后,通常会朝着食物增多的方向移动,在解决实际中的寻优问题中表现为向最优值方向的迭代方式。人工鱼Xi在其视野范围内随机选择一条鱼Xj,对比两函数值,若Yj>Yi,则Xi向Xj移动一个步长;否则,Xi将继续在视野范围内寻找满足条件的Xj,直到达到最大迭代次数,若仍没有满足前进条件,则随机移动一步达到新位置。即

2.2 IAFSA-BP并行学习算法

实际问题应用中,BP神经网络的输入值与输出值都是确定的参数,唯有网络结构内部的权值和阈值是不确定的。BP神经网络在求解具体权值和阈值的过程中,收敛速率较慢,易陷入局部最优值。而人工鱼群算法收敛速率较快,常用于解决实时性较强的问题。因此,给人工鱼群算法中的模拟鱼进行编码,使其携带着该网路中的权值和阈值。计算鱼群的适应度函数,适当改变鱼群的感知半径和移动步长,通过不断迭代之后,得出最佳的适应度函数值,此时,将人工鱼携带的权值和阈值赋予到BP神经网络中,由此构建出IAFSA-BP并行学习算法。具体步骤如下。

步骤1:构建BP神经网络。将BP神经网络的权值和阈值编码到人工鱼个体。

步骤2:创建任意离散人工鱼群。随机生成N条人工鱼,设置人工鱼的可视域为visual,步长step,尝试次数t以及最大迭代次数Tmax。

步骤3:计算适应度函数值。计算鱼群适应度函数值,并根据该值更新鱼群的行为及状态。检查是否满足全局条件,如果满足,则输出其目标函数值并将人工鱼的解码值赋予BP神经网络中。反之,将继续迭代。

步骤4:训练网络。将训练集样本数据训练网络、测试集样本数据测试网络。

步骤5:误差分析。检查迭代次数和测试误差,如果网络测试误差大于设定范围,且未达到最大迭代次数,则返回步骤3;否则,输出结果,算法结束。具体流程如图1所示。

3  基于IAFSA-BP的大学生就业预测模型

3.1 数据预处理与模型构建

本课题从安徽财经大学收集到2016年-2018年205名毕业生的在校表现情况,具体包括:学生在校期间所获奖学金数、是否为党员、性别、四六级通过情况、挂科数、学科竞赛获奖数、社会实践经验等,并将其中的定性指标做量化处理,如表1所示。

通过线上及线下调查到这部分毕业生对自己工作的满意度情况,将其分为三个等级:满意、较满意、不满意,具体如表2所示。

从上述模型中,BP神经网络的输入层n1=7,隐含层n2=2n1+1=15, 输出层n3=3,神经元的节点有输入层7个,隐含层15个,输出层3个,7-15-3,由此得出权值个数为150(15n1+15n3),阈值个数为18(n2+n3)。因此,人工鱼群算法需优化的参数为168。

选用S型切线、S型对数函数作为神经网络隐含层神经元和输出层神经元的传递函数,IAFSA的相关参数设置为:种群规模N=50,视野范围Visual=Xmax/4,步长Step=Visual/8,Visualmin=0.001,Stepmin=0.000,最大迭代次数Tmax=50。

3.2 模型的检验及应用

为了检验该模型的有效性,本课题选用收集的205名毕业生的相关数据作为实验样本,其中的100条数据作为训练样本,另外105条数据作为测试样本,网络训练误差设置为:err=4.1179e-04,借助MATLAB分别对三种算法进行仿真模拟实验后得到如图2所示。

从图2可以直观的看出,改进的人工鱼群算法优化BP神经网路经过30次迭代后,收敛效果达到预测值。对比其他两种算法,其收敛速度大大加快,预测精度也显著提高,为大学生就业率及就业质量提供了具备现实意义的预测模型。

4  结语

4.1 结论

本文在梳理大量文献和了解了近年就业市场对人才的需求方向后,选取了七个实时性较高的大学生就业因素深入分析。通过构建改进的人工鱼群算法与BP神经网络并行集成学习算法,建立出基于此算法的大学生就业预测模型。算法的改进与结合克服了传统算法的诸多不足,达到了更为精确的目标函数值,构建出对提升大学生就业率及就业质量更具有实际意义的大学生就业预测模型。

4.2 推动大学生就业的相关建议

为了有针对性地解决大学生就业难问题,本文提出了相关参考意见。①学校应实时聘请出色的工作者对大学生进行就业指导,学生在与老师或同学的交流和分析中易评估自己的价值、发现自己的不足,进而能有效针对自己的缺点加以改正。②政府每年应多提供大学生就业实习岗位,给更多想要提升自我的学生提供平台。③大学生在校期间应时刻清楚自己的定位,积极参与学校组织的各项活动,注重自身全面发展。随着信息化时代的迅猛发展,掌握大学英语和计算机基础亦是当今提升就业的必备技能之一。因此,只有个人、学校,以及社会都精进不休,才能有效改善“就业难”问题,创造出一个美好的就业前景。

参考文献:

[1]Masethe M A, Masethe H D. Prediction of Work Integrated Learning Placement Using Data Mining Algorithms.[J] Proceedings of the World Congress on Engineering and Computer Science, 2014(05).

[2]Rahman N A A,Tan K L,Lim C K. Supervised and Unsupervised Learning in Data Mining for Employment Prediction of Fresh Graduate Students.[J] Journal of Telecommunication, Electronic and Computer Engineering, 2017(07).

[3]陈高波.基于自适应多分类最小二乘支持向量机的大学生就业预测[J].甘肃科技,2010(11).

[4]吴亚娟.基于因子-聚类分析的大学生就业满意度统计及预测[J].南京信息工程大学学报,2010(06).

[5]朱庆生,高璇.应用自然邻居分类算法的大学生就业预测模型[J].计算机系统应用,2017(08).

[6]陈立俊,王克强.基于人工神经网络方法的大学生就业问题探析——以上海高校毕业生为例[J].教育发展研究,2013(06).

[7]张清芳.影响大学生就业因素的Logit模型分析[J].湖南科技大学学报(社会科学版),2014(06).

[8]Sulastri A,Handoko M,Janssens J M A M. Grade point average and biographical data in personal resumes: predictors of finding employment. [J]International Journal of Adolescence and Youth,2015(02).

[9]Menon M E, Pashourtidou N, Polycarpou A, Pashardes P. Students expectations about earnings and employment and the experience of recent university graduates: Evidence from Cyprus[J]. International Journal of Educational Development, 2012(09).

[10]Teichler U. International Dimensions of Higher Education and Graduate Employment.[J] The Flexible Professional in the Knowledge Society, 2011(20).

[11]李曉磊.一种新型的智能优化方法-人工鱼群算法[J].浙江大学,2003(95).

猜你喜欢
BP神经网络
基于神经网络的北京市房价预测研究
提高BP神经网络学习速率的算法研究