基于人工神经网络的高校大学生就业情况分析

2023-11-10 01:19金保明
关键词:人工神经网络正确率辅导员

王 伟,金保明

(1.宁德师范学院信息与机电工程学院,福建宁德 352000;2.福州大学土木工程学院,福建福州 350116)

俗话说:“编筐编篓,贵在收口”。高校毕业生到了在校学习的最后一年,也到了学生们人生抉择的关键路口。对于国家而言,就业在“六保六稳”中居首要位置,做好就业工作是实现“六保六稳”的关键。对于学校来讲,毕业生就业水平是检验高校办学质量的一条重要标准。对于学生家长而言,孩子们能成功就业,就好业是他们翘首以盼的心愿。而对于辅导员来讲,学生的就业就像在大一时候埋下的一颗种子,四年用心培育,直至毕业时节开花、结果,最终长成参天大树。但是当前的就业大环境不景气,后疫情时期经济下行,辅导员就业指导不精准等一系列问题,给高校就业工作单位和高校毕业班辅导员带来了新的挑战。

1 当下高校大学生就业环境和就业观念

随着国家经济的发展,高等教育的普及,高等教育已经从“精英教育”向“大众教育”转变。2002 年全国大学生毕业人数不足142万人,2010年608.2万人,2020 年874 万人,年平均增长率高达27.12%,不到20年间大学生毕业人数已经翻了6倍之多[1]。高校毕业生就业情况不容乐观。2019年12月中国武汉地区新型冠状病毒爆发引起的肺炎疫情,迫使武汉这座历史悠久、大学生人数最多的城市一度采取封城的措施,全国各大城市也都受到了不同程度的影响[2]。2019 年底至今,各行各业处于后疫情时期的经济复苏阶段,全国乃至全世界都呈现出市场不景气,经济下行的现象。旅游业、航空业、运输业、餐饮业等更是受到了严重的打击,大量小微企业出现了倒闭、裁员的现象。但是大学生毕业人数却年复一年以较快的速度增长,后疫情阶段市场经济的衰退,工作岗位的减少,越发凸显了大学生就业的困难。

随着脱贫攻坚、全面建成小康社会工作巨大成果、乡村振兴工作的持续开展,全国人民的生活水平有了显著提高,“毕业了,工作慢慢找不着急,找份稳定离家近的工作”作为许多家长对孩子就业的普遍态度。并且大多数家长存在着“有编制就是铁饭碗”这个相对保守落后的就业理念,强迫自己的孩子一定要考取公务员、事业单位等。还有部分应届毕业生习惯了“校园”这把保护伞,不愿走出高校这个舒适区,到工作岗位上磨砺自己的意志、增长工作技能。在即将毕业之际幻想着从“校园”这把保护伞逃避到“考研”“考国家公务员”的另一把保护伞。

后疫情时期市场经济不景气、部分家庭就业观念相对滞后、学生自身就业意向不积极等诸多不利因素,导致高校就业指导工作困难重重。

2 辅导员对毕业生就业指导的困境

高校就业工作一般由高校就业指导中心部署,毕业班辅导员负责实施落实。毕业班辅导员作为高校就业工作的一线力量,直接指导和统计毕业生的就业工作情况,该项工作内容复杂多样并且直接影响着学校的就业水平。根据教育部公布《普通高等学校辅导员队伍建设规定》,高等学校师生比率不低于1∶200 设置高校专职辅导员。高校因为辅导员招聘、遴选、离职、转岗等各种原因,实际比率还要略低文件规定1∶200 的标准。辅导员日常工作千头万绪,包括思想政治教育、心理辅导、班级活动组织等形式多样的工作内容。1 名辅导员在面对200 多名学生的就业问题时,不可避免存在对学生就业指导不精准,就业一对一帮扶对象选择不精确等实际工作问题。

其中,2017 年最新颁布的《普通高等学校辅导员队伍建设规定》,各大高校响应文件要求,近两年公开招聘了数量较多的年轻辅导员,但新进辅导员在面对后疫情时期的就业大环境,就业工作开展就会更显得力不从心。在就业大环境不景气,辅导员精准就业指导存在力不能及的现象、就业一对一帮扶对象选择困难等情况。将通过收集分析高校大学生4 个学年的各种特征数据,构建BP 人工神经网络就业预测模型,对应届毕业生的就业情况进行预测。在确保就业预测模型具有较高准确性的前提下,根据模型预测的结果,将未能就业的学生列为需要精准帮扶或者一对一帮扶的对象,使得辅导员在开展就业工作的过程更有目标性、针对性、精确性,达到就业工作精细化的效果。

3 BP人工神经网络原理简介及作用

人工神经网络(Artificial Neural Networ),是通过模拟生物大脑神经网络的结构和功能,从而创建的一种分析和处理数据的物理数学模型[3-4]。该网络模型对于数据信息处理的概括、联想、类比等能力方面有比较明显的优势,并且有较强的鲁棒性和容错能力。

图1 为单个神经元人工神经网络基本结构示意图,输入向量Pi(i 为1,2,…,n)每一个元素均通过权值向量ϖi(i 为1,2,…,n)和神经元相连,输入向量Pi先乘以权值向量ϖi,加上阈值b形成净输入量n,最后利用传输函数f对净输入量n进行变换处理产生输出量a。这一过程可以用以下式子表示:

图1 单个神经元人工网络基本结构示意图

其中,BP 人工神经网络是按误差反向传播算法训练的多层前馈神经网络。该类型网络是所有人工神经网络中应用最广的一种[5-6]。BP神经网络的基本结构分为输入层、隐含层、输出层。隐含层一般为单层即可满足计算要求,故网络一般为3层结构。层与层之间全连接,而层内神经元相互未连接。设置合适的网络参数,迭代一定次数,网络收敛后,即可得到精度较高的结果。

BP 神经网络的算法主要可分为两个部分:一是原始数据经网络的输入层到隐含层最后传递到输出层,数据信号逐层正向传播;二是若通过正向传播获得的输出数据与理想数据的误差较大,不满足设置的误差界限。则将误差从输出层向隐含层最后到输入层逐层反向传播,并修改各层的连接权重,使误差在网络中不断训练,直至减小到满意的范围内,算法结束。至此经过这两个过程,BP 人工神经网络完成对输入数据的训练和学习。多层神经网络结构示意图如图2。

图2 多层神经网络结构示意图

4 实例分析

4.1 数据预处理

根据宁德师范学院信息与机电工程学院部分专业一共527 名学生各项特征数据与实际就业情况建立BP 人工神经网络模型。随机选取11/12 数据序列作为训练样本,剩下1/12 数据作为检验样本,验证模型预报的精度。收集的各类特征数据包括性别、学生4 个学年平均学分绩点、毕业设计成绩、非素质专业学分、志愿服务时长、就业情况。采用数据类型如表1。

表1 毕业生特征数据与就业情况(部分)

表1 中数据可以看出,原始数据中有部分数据属于文本类型,无法直接输入神经网络模型进行训练。有部分数据的范围属于(0,5)(0,100),数量级差异较大,若未进行处理直接输入模型可能导致网络学习速度变慢甚至不能收敛。因此,根据公式(2)将数据变换到[0,1]内,文本格式的数据用[0,1]表示,归一化后的数据见表2。

表2 归一化后的数据(部分)

式中,X为归一化处理后的输入值,x为实际输入数据数值,xmax为实际输入数据的最大值,xmin为实际输入数据的最小值。

4.2 人工神经网络模型建立

为提高模型结果的说服力、可信性,将527 名学生的特征数据随机分配为483 组训练样本数据和44 组检验样本数据。本次分析采用的BP 神经网络模型为3 层结构,其中输入层为5 个神经元节点,分别代表学生的性别、平均学分绩点、毕业设计成绩、非素质专业学分、志愿服务时长,输出层为1 个神经元节点,表示学生的就业情况,隐含层为单层。隐含层作为模型结构的中间层,在模型运算中起到承上启下的关键作用,但是输入层与隐含层之间链接的节点数的确定比较困难,目前尚没有一个理想的解析式可以用来确定合理的隐含层节点数,这也是实际应用中BP 神经网络的一个缺陷[7-8]。做法是先运用经验公式(3)确定隐含层节点数的大致范围,再运用“试错法”进行试算,通过Matlab 程序进行多次网络训练计算,最终确定最优的隐含层节点数。神经网络模型的层与层之间通过不同类型的激励函数进行连接,其中输入层与隐含层之间通过log-sigmoid函数连接,隐含层与输出层之间选择purelin 函数。一个S 型隐含层加上一个线性输出层的BP网络,能够逼近任何在闭区间内的一个连续非线性函数。

其中,M代表隐含层的节点数,n代表神经网络输入层神经元节点数,m代表神经网络输出层神经元节点数,a是2~6之间的常数。

4.3 神经网络模型计算结果分析

根据公式(3)大致确定隐含层节点数在[4,9]之间,再将隐含层节点数:4、5、6、7、8、9分别代入模型中运算判断。当隐含层节点数为4,5,6,7时,模型预测的正确率分别为40.90%,31.82%,22.73%,54.54%,正确率呈现低且波动较大的情况。当隐含层节点数为8时,就业预测模型的正确率为86.63%,而当隐含层节点数为9 时,就业预测模型的正确率为70.45%,相较为隐含层节点数8,预测正确率略有下降。考虑到论文的逻辑严谨性,虽然根据经验公式确定隐含层节点数的大致范围[4,9],但是无法明确在隐含层节点数超过9之后,是否会出现预测结果更优的情况。故将隐含层节点数为10、11 和12 等三种情况分别代入模型计算验证,得到的就业预测正确率分别为68.18%、52.77%和38.64%。绘制就业预测正确率与隐含层节点数趋势关系如图3。根据隐含层节点数与预测结果趋势关系分析并结合相关文献结果,认为隐含层节点数是模型实现非线性功能的系统元素,当隐含层节点数过少,无法产生足够的链接权重来满足样本的训练和学习,就会出现预测结果正确率偏低的情况,如本次就业预测中,隐含层节点数为4、5、6 和7 的情况。但当隐含层节点数过多时,在训练阶段神经网络模型训练效率高,拟合效果好,可是当加入检验样本或者测试样本时,拟合或者预测效果会有明显的下降,泛化或者延展效果差。如本次就业预测中,隐含层节点数为9、10、11和12的现象。

图3 就业预测正确率与隐含层节点数趋势关系图

结合上述结果,当隐含测节点数确定为8时,预测模型结果为最优。神经网络模型运行收敛情况如图4。结合图4可知,在神经网络模型训练阶段,经过141次迭代计算后,模型收敛并达到设定的误差要求,停止运算。模型收敛后根据Matlab 平台得到相应神经网络模型各层的权值和阈值见表3。本次检验样本系列一共44 组数据,就业预测模型正确预测了其中38名学生的就业情况,仅有6名学生的就业情况预测有误,模型预测结果精度为86.36%,具有较高的精确度,对高校就业工作和毕业班辅导员指导就业具有一定参考性和指导意义。

表3 神经网络模型各层权值和阈值

图4 模型收敛情况

辅导员可以利用神经网络模型中预测的结果,将未能成功就业的学生设置为重点关注对象或者精准帮扶对象,为他们制定更有针对性、个性化的就业方案。大四这一学年,提前介入,更多地关注这些学生的兴趣、性格、技能、价值观等各个方面,进而引导学生去了解、探索自身更适合从事什么样的职业,在什么样岗位上去实现自己的人生价值。

5 结论及建议

根据宁德师范学院2021届部分专业527名学生的就业情况,建立了BP人工神经网络模型对学生就业情况进行预测,预测结果的精度达到86.36%,具有较高的预测精度,可以对高校就业工作提供一定的指导。

收集到的学生就业数据量有限,毕业生特征数据类型不多,预测精度上还有提高空间。后续的研究可以从增加学生就业数据量和丰富学生特征数据类型去完善和改BP神经网络就业预测模型。在神经网络就业预测模型更加成熟后,可以将其集成至校园网页或者校园管理APP中,供毕业班辅导员参考。

在增加数据量和丰富数据类型的基础上,对输入数据在输入模型前进行预处理,运用专家打分、问卷调查、层次分析法等方法,计算各输入数据的权重值。将不同的特征数据按重要性不同,赋予不同的权重,或能够在更大程度上提升模型预测的正确率。

猜你喜欢
人工神经网络正确率辅导员
1+1我们这样学队章:我们的辅导员
门诊分诊服务态度与正确率对护患关系的影响
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
好辅导员这样炼成
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
基于声发射和人工神经网络的混凝土损伤程度识别
波信号的解调和人工神经网络的损伤识别算法