牛丹丹 刘筠筠
摘 要:对河南省民办高校2015—2020年毕业学生的就业数据进行了收集,报告了河南省民办高校毕业生就业现状。采用随机森林算法,对影响就业的特征进行重要性评估,找出影响就业的主要特征和部分成因。实验结果显示,民办高校学生就业率与自身所学专业的热门程度最相关,分析影响就业的主要特征因素,给出了就业预警机制构建的相关对策。为民办高校毕业生就业提供更好的支持策略。
关键词:随机森林;民办高校;就业预警
中图分类号:TP181 文献标识码:A文章编号:2096-4706(2021)22-0101-03
Abstract: This paper collects the employment data of graduates of private colleges in Henan Province from 2015 to 2020, and reports the employment status of graduates of private colleges in Henan Province. Using random forest algorithm, the importance of the characteristics affecting employment is evaluated, and the main characteristics and some causes affecting employment are found out. The experimental results show that the employment rate of private college students is most related to the popularity of their majors. The main characteristic factors affecting employment are analyzed, and the relevant countermeasures for the construction of employment early warning mechanism are given. Which provide better support strategies for the employment of private college graduates.
Keywords: random forest; private college; employment early warning
0 引 言
截至2021年6月30日,我國高等院校达到3 005所,普通高等学校2 740所,其中本科高校1 258所、高职(专科)学校1 482所;成人高等学校265所。包含有民办高校773所。从数据上可见民办高校在我国高校中占有一席之地。但随着民办高校的招生规模的不断扩大,许多问题也逐渐显露出来:有一部分民办高校的毕业生总体就业率较低;但目前我国所需的较高层次、较高技能和复合型人才又十分短缺。为了降低民办高校盲目发展的风险,避免高校自身发展与社会对人才需求的脱节,需要尽快建立和完善民办高校毕业生就业动态监测机制,根据当前中国社会经济情况、产业结构、人才需求等对民办高校就业状态进行动态监测,本课题在此背景上创建,不仅为民办高校就业学生、用人单位提供相关的参考依据,而且对于我国政府及时掌握民办高校毕业生就业的真实状况、制定就业的相关政策、维护整个社会的稳定都有较大的意义。
1 研究现状
作为当前研究的热点话题,国内学者关于大学生就业、随机森林算法、大数据和就业预警有效衔接研究成果也十分丰富。陈践,王丹在以就业为导向的民办高校专业调整预警机制研究,在分析毕业生专业就业现状的基础上建立民办高校毕业生专业设置预警机制,并给出去运行机制。郭伟在民办本科高校毕业生就业指导教育探析中,针对民办本科高校学生毕业就业指导工作展开研究,分析当前阶段民办本科高校在就业指导方面存在的问题,总结相关工作经验,提出对应的解决办法,为同领域工作者提供合理化发展建议,促进我国民办本科高校毕业生就业工作顺利发展。黄建琼,郭文龙等以有效问卷调查数据作为样本数据,采用随机森林建立毕业生就业模型,分析学生的就业影响因素和就业方向之间的内在映射关系。通过调查数据表明,随机森林算法是可行的。毕瑶家,刘国柱等为了准确的评价高校的毕业生质量,本文基于某高校计算机类毕业生的历史数据,采用一种改进的随机森林算法构建人才培养质量评价模型。实践结果表明,该算法提高了人才培养质量评价的准确率和精确度,可以在高校人才培养方面起到指导作用。
随机森林算法是一种基于统计学习理论的组合分类器,将Bootstrap重抽样方法与决策树算法相结合,该算法的本质是构建一个树型分类器的集合,然后使用该集合通过投票进行分类和预测。随机森林算法具有抗噪能力强、预测准确率高、能处理高维数据的特点,现已成为数据挖掘领域的常用工具之一。该算法具有较高的精确度,对特征选择、优化参数等方面具有很大的优势。通过随机森林算法进行数据预测并预警,并提出有关就业能力提升对策的相关研究。
2 研究方法
2.1 数据及预处理
民办高校大学生的就业并不是某一个因素决定的,而是多种因素共同影响的。以观察、访谈、问卷调查等形式,向河南省内民办高校2015—2020年毕业的学生了解就业创业学生的情况,收集相关数据。毕业生在找工作时会产生很多数据,如学生所处的社会环境、毕业生数量、职位需求量;性别差异;家庭背景、父母职业、社会地位、经济收入、受教育水平;所学专业的热门程度;学生的课程考试成绩、专业课成绩、专业证书、在校表现;学生的人际交往能力,就业期间就业平台选择。上述数据均需要通过实际的走访、调查研究、实验对比、数据库建立等进行数据的收集,建立毕业生就业情况问卷调查系统,使得数据采集更有针对性和规范性。从各个方面寻找影响大学生就业的因素。
2.2 随机森林算法树模型
随机森林算法是一种集成学习方法,由多个小模型构建,各个小模型输出结果合成最终的输出结果,如图1所示。是一种典型的机器学习算法,主要应用于分类、回归。此算法是基于Bagging算法,针对每个分组训练获得决策树模型,所有决策数据分类结果的组合分析得到最终分类结果。
随机森林算法用于就业分析上具有很多优点:首先,该算法能够将弱分类项通过覆盖优化的方法进行综合,从而使分类系统的整体分析能力得到提升。其次,在生成决策树的过程中,每一棵决策树都互相独立且同时生成,大大提高了生成的效率。最后,随机选择的特征在选择样本和构建决策树的同时,使该算法的抗噪能力大大提高。
2.3 随机森林算法在学生就业上的应用
以河南省民办院校2015—2020级高校毕业生的毕业数据为对象进行分析,调查问卷共收回有效卷2 293份。表1统计了高校毕业生就业使用数据的属性及其含义。毕业生就业由8个因素组成:性别、本专业学习水平、所学专业热门程度、家庭背景、人际交往能力、专业证书水平、就业平台选择、创新创业能力。
对表1的8种主要因素采用随机森林算法将数据进行重要性评估。其中8种因素作为重要特征,学生的就业情况作为分类属性,使用该算法对分类属性进行特征重要性分析,分析出的结果如表2所示:表中重要特征的值越大,表示该因素对就业影响就越大。专业热门程度这一因素的特征重要性达到0.311 6,表明专业热门程度对学生就业有着最重要的作用,其次是专业学习水平,其特征重要性是0.262 4,再次就是性别,重要特征性是0.133 5。其他5种重要特征对学生能否顺利就业的指导作用相对较小。
下面对重要特性较高的三个因素进行分析。(1)从图2中可以看出民办高校的毕业生就业的专业热门程度与就业率总体呈正相关趋势,即专业越热门,就业率越高,较冷门的专业可能成为就业预警人员。(机械工程94.2%,建筑学92.84%,通信工程91.71%,工商管理90.27%,车辆工程93.6%,物流管理92.00%,临床医学89.46%,数学与应用数学88.55%,法学86.49%,计算机科学与技术91.28%),近年来较热门的软件工程,建筑学,通信工程等工学的本科毕业生就业率是所有门类中最高的,就业率较高,数学与应用数学、法学等专业就业率较低。(2)从图3中可以看出专业学习水平越高,其就业率就越大,专业水平较低就越成为就业预警人员(60分以下69.21%,60~69分79.82%,70~79分89.25%,80~89分96.63%,90分及以上95.33%)。(3)图4中,男生就业率92.33%,女生就业率89.12%,女性毕业生求职更为不易,求职时间远大于男性。女生懂的生活技能以及获取知识渠道比男生少,女生更偏向于文科,艺术类;而男生很多都已经具备“文武双全”职业素质。职场中,男生比女生能做的事情更多,相比之下,录取男生比较划算。国家的三孩儿生育政策也直接导致女性就业率的降低。
3 就业预警机制构建
通过随机森林算法对民办高校影响学生就业因素的数据进行分析,找出了影响学生就业的一些主要因素,为了提高民办高校就业率,需要建立起就业预警机制,并建立起相关的预警对策。
3.1 专业的调整
影响民办高校学生就业的最重要因素是专业的热门程度,高校在进行专业设置的时候要与市场相结合,平衡自身规模、学校效益、教学质量之间的关系,合理设置专业,根据市场进行动态调节。使学校的发展利益与社会需求相结合,提高学校的竞争力。
3.2 学习动力的提升
民辦高校在招生时,同等层次学生的分数普遍较低,学习动力也没有那么高,所有要激发学生的学习动力、社会责任感。学习动力的提升有两点,一个是内驱动力,一个是周围环境的影响。抓紧学生入学教育,帮助学生做好定位,提高自身驱动力。发挥校园文化的德育功能,营造热爱学习的良好氛围,通过周围的学习环境带动新生学习。
3.3 就业导向
民办高校更应打造较为完善的毕业生就业指导体系,针对民办高校就业生的特点,设定较为科学合理的咨询计划,设置专业化程度更高的就业咨询室,开设相应的课程为同学们指导就业。让同学们对自身的竞争力和能力有更深刻的了解,使学生为就业做更充分的准备,在就业时具备更从容、更理性、更平衡的心态,从而为自己就业奠定更好的自信心。
4 结 论
本文对河南省民办高校2015—2020年毕业学生的就业数据进行了收集,采用随机森林算法模型,对该数据进行了重要特性分析,找出了影响民办高校学生就业的一些主要影响因素,针对影响就业的这些主要因素,提出构建民办高校就业预警机制,为民办高校毕业生就业提出较好的建议措施,从而使民办高校就业有更好的支持策略。
参考文献:
[1] 郭伟.民办本科高校毕业生就业指导教育探析 [J].教育信息化论坛,2021(3):117-118.
[2] 吴志渊.民办高校大学生就业指导工作的探索与思考 [J].智库时代,2020(11):71-72.
[3] 陈践,王丹.以就业为导向的民办高校专业调整预警机制研究 [J].中国证券期货,2011(2):160.
[4] 张丹鹤.基于大数据视角下的民办本科高校就业指导课程研究与实践 [J].湖北开放职业学院学报,2020,33(5):121-122.
[5] 晋浩天.2020届高校毕业生将达874万人 [N].光明日报,2019-11-01(8).
[6] 彭正霞,陆根书,李丽洁.大学毕业生就业质量的影响因素及路径分析 [J].中国高教研究,2020(1):57-64.
[7] 刘云翔,陈斌,周子宜.一种基于随机森林的改进特征筛选算法 [J].现代电子技术,2019,42(12):117-121.
[8] 庄巧蕙.基于IRFC算法的学生课程成绩预测的研究与应用 [J].信息技术与信息化,2020(6):192-194.
[9] 吕莉,夏志红.基于随机森林的大学生学业预警成因分析及对策 [J].南昌工程学院学报,2020,39(6):81-86.
[10] 黄建琼,郭文龙,李秋缘.基于随机森林模型的高校毕业生就业影响因素研究 [J].江苏师范大学学报(自然科学版),2019. 37(4):55-58+74.
[11] 曹正凤.随机森林算法优化研究 [D].北京:首都经济贸易大学,2014.
[12] 蒋利平,彭立春.大数据时代高校毕业生就业质量预警机制建构研究 [J].中国大学生就业,2020(11),52-57.
[13] 毕瑶家,刘国柱,王华东,等.改进随机森林算法在人才培养质量评价中的应用 [J].计算机系统应用,2020,29(7):212-216.
[14] 田臣,周丽娟.基于带多数类权重的少数类过采样技术和随机森林的信用评估方法[J].计算机应用,2019,39(6):1707-1712.
作者简介:牛丹丹(1985—),女,汉族,河南周口人,讲师,毕业于重庆邮电大学,硕士研究生,研究方向:移动通信、MIMO通信。