摘 要:根据大学生就业的历史数据创建就业模型并预测未来的就业变化及趋势,可以为学校管理者和人才培养方案制定者提供有价值的信息和参考依据。本文结合学者们针对高校毕业生就业预测的研究成果和研究脉络,从就业预测数据源、就业预测算法、就业预测要素及就业预测结论四个方面详细介绍相关研究成果及代表文献,为研究人员提供参考和借鉴。
关键词:高等学校;就业预测;算法分析
中图分类号:TP311.13 文献标识码:A 文章编号:2096-4706(2019)12-0086-03
Abstract:Based on the historical data of college studentsemployment,establishing employment model and predicting employment changes and trends in future,which can provide valuable information and reference for school administrators and personnel training program makers. Based on the research results and research veins of the employment prediction of college graduates,this paper makes an analysis from four aspects:the data source of employment prediction,the employment prediction algorithm,the elements of employment prediction and the conclusion of employment prediction,and introduces detailed the relevant research results and representative literatures,so as to provide reference for researchers.
Keywords:institutions of higher learning;employment prediction;algorithms analysis
0 引 言
高校畢业生的就业情况及相关数据在一定的程度上反映出高校的人才培养方案对接行业需求的吻合度、高校毕业生的工作能力满足企业发展的需要以及高校在服务地方经济发展与社会贡献方面的能力。为了较好地服务地方经济发展,提升高校的社会贡献度,依据区域经济特色、行业需求和企业需要,适时制定和修订专业人才培养方案,打造与培育技术能力强、职业素养高的高校毕业生是高校的办学使命。因此,有必要根据历年的就业数据创建就业模型来预测未来的就业变化和就业趋势,为高校管理者制定行业需要、企业满意、社会反馈良好的专业人才培养方案提供有价值的信息和参考。
为此,本文根据学者们针对高校毕业生就业预测的研究成果和研究脉络,对相关文献进行整理和分析,分别从就业预测数据源、就业预测算法、就业预测要素及就业预测结论四个方面进行,并详细介绍了四个方面的相关研究成果。
1 高校毕业生就业预测数据源分析
文献[1]以广西教育学院2012届毕业生就业分析样本数据集为研究样本,并将研究样本分为“毕业生就业方向为教师的样本数据集”“毕业生就业方向为企业单位的样本数据集”“毕业生就业方向为事业/机关单位的样本数据集”进行了就业预测分析。
文献[2]研究的数据源为南京工程高等职业学校的就业管理系统,数据跨度为2010至2012年,以4500名毕业生相关数据为研究样本,并将这将这些研究样本分为“学生基本信息数据”“学生成绩信息数据”“学生就业情况”等样本数据集。
文献[3]以福建省2006年至2011年招生计划数与毕业生人数为研究样本,依据学生就业单位的类型(国企、外企和私企),抽取相同数量的就业数据作为样本进行分析。
文献[4]从150所大学中选择100个大学生就业数据作为研究样本。
文献[5]采集了昆山市的两个乡镇中的100家企业提供的2006年至2009年的44条数据作为研究数据。
文献[6]从本校毕业生中抽取历年毕业生在校的一些信息作为研究样本,每条研究样本包括性别、英语水平、政治面貌、综合测评成绩、担任过学生干部、是否为“三好学生”、参与社会实践、就业的期望值、获得学位、毕业论文成绩、就业作为等项目。
文献[7]研究对象为某高校近三年的毕业生就业信息。
文献[8]以近三年的信息类专业毕业学生的就业数据为研究样本,创建了就业薪酬的预测模型。
……
从以上研究数据源来看,研究者使用的数据来源不同,范围上存在一定的差异,时间跨度也不尽相同,但数据上有一个共同的特点:研究的数据样本范围较窄,样本数量有限,这易造成研究结果的片面性。
2 高校毕业生就业预测算法分析
因为研究数据样本不同,高校毕业生就业预测算法的选择也各不相同。
文献[1]分析了毕业生就业数据中的关联规则,根据数据抽样组建了“毕业就业信息数据仓库”。又因毕业生的就业信息较多、数据复杂,且有不确定性的特点,选用了基于划分的Apriori优化算法来预测毕业生的就业状况。采用Apriori算法思想寻找每个数据划分因素的频繁项集,计算这些项集的支持度,挖掘出各项因素与就业方向之间的关联规则,并指出“专业成绩、英语等级、社会实践”在毕业生就业方向上影响较大。
文献[2]选用C4.5算法创建高职院校毕业决策树数据模型,重点关注研究样本数据的6个重要属性:基础课程成绩、专业课成绩、英语成绩、是否担当学生干部、入学成绩和期望就业单位属性(事业单位、国有企业和私营企业),然后选取决策属性,构造决策树,创建提取规则,得出专业课成绩仍然是影响学生就业的最主要的因素,而入学成绩与预测就业基本无关。
文献[3]选用最邻近(KNN)分类算法,从毕业生数据中提取特征数据,如:专业课成绩、是否担任班干部、英语水平、计算机水平、企业实习经历、实践课程成绩和获奖情况等,接着对这些数据进行数值化处理,将其转化为特征向量,通过KNN算法计算样本数据与所有样本之间的距离,进而预测出学生的就业方向。
文献[4]对收集的大学生就业数据进行归一化处理,考虑灰色模型和神经网络各自的特点,提出利用灰色模型和神经网络的组合方法对就业样本数据进行处理,并从不同角度根据大学生就业数据创建预测模型,从而在灰色模型和神经网络组合的情况下获得可靠的预测结果。
文献[6]采用聚类分析技术中基于模型的统计方法,使用COBWEB这种简单的增量概念聚类算法,使用分类效用CU来指导分类树的构建。将数据的10个属性值(性别、政治面貌、是否担任学生干部、是否是“三好学生”、英语水平、平均综合成绩、毕业论文成绩、社会实践、對就业的期望和是否取得学位)进行量化,建立数据库和分类树,从而建立模型进行评估和验证,得出英语水平高的毕业生就业能力强、就业率高。
文献[7]也利用C4.5算法进行就业信息的数据挖掘,通过决策树创建数据提取,进而创建毕业生的就业预测规则和模型。计算数据中的属性值(性别、综合成绩、计算机等级、外语水平、学生身份和城乡情况)之间的信息增益和信息增益比,组建17条分类规则。以267份样本数据作为测试样本对预测模型进行有效性验证,得出该预测模型预测的正确率大于81%,再次有效地证明了决策树模型在毕业生就业预测方面具有较高的可靠度与准确度。
文献[8]以影响毕业生就业的18个可观测量作为影响大学生就业薪酬高低的因子,建立基于因子分析法的毕业生模型,创建样本特征向量,利用自然邻居分类对毕业生薪酬期望等级进行预测,并用十折交叉验证的方法证明了该预测的精度和准确率,为大学毕业生建立合理的就业预期和就业薪酬计划具有一定的指导意义。
文献[9]通过分析劳动力就业市场的现状,以某生产公司的28个就业样本数据,采用BP神经网络创建就业预测模型。通过仿真实验得出,基于BP神经网络的就业预测模型能较为准确地预测各企业对短期用工的需求量,并建议企业可以根据订单的数量来确定招聘员工的数量。
文献[10]基于数据挖掘和机器学习中的分类算法,将决策树ID3算法运用到高职生就业的预测分析中,对数据集的特征属性值(考生类别、入学总分、考生地域、应往届一、年龄、性别、综合成绩、单位地址、专业相关度)进行量化处理,对学生是否能顺利毕业进行预测。实验证明,基于ID3算法生成的高职院校学生就业预测模型的预测准确度较高。
文献[5]基于AR模型对昆山区域的某企业公司的就业进行了预测和分析,文献[11]提出运用Kmeans聚类算法和CBR案例推理方法对高校学生就业趋向进行预测。
3 高校毕业生就业预测要素分析
在对高校毕业生就业进行预测的过程中,学者们以毕业生的相关属性为切入点,如性别、政治面貌、学生干部、获奖情况、外语水平(没有明确外语水平的考级情况)、专业成绩、综合表现成绩、参与社会实践、毕业论文(设计)、计算机水平(未明确计算机考证情况)、是否取得学位、对薪酬的期望、城乡情况(考生地域)、年龄、入学成绩、应往届生、单位地址等。这些属性中,使用频率较高的有性别、专业成绩、英语水平、计算机水平和薪酬期望等,使用较少的属性有入学成绩、应往届、城乡情况、单位地址等。
在上述列举的毕业生的相关属性中,性别、外语水平、参与社会实践和专业成绩对毕业生就业的影响较大,这些属性成为就业预测的关键要素。针对高职院校毕业生就业预测来说,专业成绩、参与社会实践、计算机水平这些属性对就业预测的准确度有较大的影响,或者可以说专业成绩好的、参与过社会实践的,以及掌握计算机操作技能的学生就业能力强、就业率高。针对本科院校毕业生就业预测来说,外语水平高的学生容易就业。就业预测过程中,性别、城乡情况、入学成绩、应往届生等属性对就业预测的影响较小。
4 结 论
通过对上述的研究结论进行分析,在一定程度上可以得知,大学生在学校所掌握的专业技能、外语水平与计算机水平直接影响其就业情况,高校在制定人才培养方案和培育高素质学生的同时,要因势利导,加强学生专业学习方面的培养和提高学生在社会实践活动方面的参与度,做好、做实学生实习、实训环节,在课程设置方面既要考虑学生的专业课程的学习,也要把计算机操作技能、外语技能融入课程体系中,注重专业知识的理论学习,强化操作技能的训练,与考证结合起来。高校毕业生就业预测为大学生指引了学习的方向,也让大学生在个人就业方向上有了更加明确的目标。
参考文献:
[1] 覃永贞,顾平.Apriori算法在高校毕业生就业预测中的应用分析 [J].轻工科技,2014,30(7):93-94+97.
[2] 王赛男.C4.5分类算法在高职就业预测中的应用 [J].现代计算机(专业版),2014(23):21-25.
[3] 吴静.KNN算法在就业预测模型中的应用 [J].莆田学院学报,2013,20(2):60-63.
[4] 李想.大学生就业的建模与预测研究 [J].现代电子技术,2017,40(21):109-111+116.
[5] 王灵均.基于AR模型的昆山就业预测及分析 [J].科学大众(科学教育),2009(10):126-127.
[6] 杨霞玲,聂永红.聚类分析在毕业生就业预测中的应用 [J].广西工学院学报,2005(4):82-84+91.
[7] 蔡丽艳,马弘伟.数据挖掘技术在高校就业预测分析中的应用 [J].微计算机信息,2012,28(8):101-103.
[8] 朱庆生,高璇.应用自然邻居分类算法的大学生就业预测模型 [J].计算机系统应用,2017,26(8):190-194.
[9] 吴振磊,刘孝赵.一种基于BP神经网络的就业分析预测模型 [J].轻工科技,2016,32(9):70-71+104.
[10] 孙晓璇,杨家娥,李雅峰.基于决策树ID3算法的高职生就业预测分析 [J].电脑编程技巧与维护,2015(2):15-16+35.
[11] 廖珣.基于Kmeans和CBR方法的高校就业预测模型应用研究 [J].人力资源管理,2010(3):79-80.
作者简介:陈君涛(1981-),男,汉族,湖北天门人,副教授,硕士,研究方向:计算机应用、职业教育。