杭州职业技术学院 吴功才 郑何敏
据中国政府官网统计数据显示,从2001年开始,我国普通高校毕业生人数持续增长,2018年全国普通高校毕业生为820万人,比2017年多出25万,就业形势非常严峻。一方面是每年数以百万的毕业生就业信息沉积于信息服务器之中,一方面是年复一年日益严峻的就业形势,为教育信息的管理提出了一个新的研究课题:大数据挖掘技术在高校毕业生就业中的应用。即利用挖掘技术对已有的往届毕业生就业信息加以数据挖掘、分析,挖掘出有价值的就业模型和就业规律,从而实现“精准”就业。教育部早在2016年3月就下发了《关于开展全国普通高校毕业生精准就业服务工作的通知》[1],所以研究数据挖掘在高校毕业生精准就业中的应用正合当前的就业形势和导向。
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘的主要技术流程为:数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示[2],如图1所示。
图1 数据挖掘的技术流程
数据挖掘在高校就业中的应用可以理解为:通过对高校毕业生就业信息的数据集特征进行分析研究,对数据采用合适的清理、集成、选择和变换等数据预处理技术,然后采用相应的适合毕业生就业信息数据集特征的数据挖掘算法对就业数据进行数据挖掘、分析,挖掘出有价值的就业模型和就业规律,从而为毕业生就业工作提供一定的参考、借鉴和指导作用。
数据挖掘主要可以通过对就业信息进行主成分分析、聚类分析、关联规则、决策树和回归分析等技术处理,实现高校就业工作有指导的招生、有方向的培养、精准的推荐、准确的就业预测,应用模型如图2所示。
图2 数据挖掘在精准就业中的应用模型
通过对毕业生的生源地、性格特征、入学成绩、入学英语成绩等学生属性和就业质量间进行关联规则数据挖掘,从而发现“毕业时可能最容易就业的”的新生。尤其是在具有自主招生权限的学校不一定非要遵循“高分录取”的单一招生政策,有良好的个性、有优良的英语基础的学生可能更值得录取。总之,通过对就业信息的数据挖掘形成一个“更具就业优势”的招生指导方针。
通过对毕业生信息和就业质量进行关联规则数据挖掘,从而发现“最难就业的那一类毕业生”的属性特征。通过对“最难就业的那一类毕业生”和“就业最理想的哪一类学生”进行对比,可以指导目前在校的“准毕业生”向“就业最理想的哪一类学生”的方向培养。通过有目的的培养“准毕业生”具有“就业最理想的哪一类学生”的属性特征,实现更高的毕业生就业率和更好的就业质量。
精准推荐主要体现在:向学生精准推荐招聘意向高的招聘单位、聘单位精准推荐满意度高的毕业生。
● 向学生精准推荐招聘意向高的招聘单位
通过对毕业生基于生源地、成绩、英语能力、计算机能力、政治面貌等相关属性进行聚类分析实现对学生的精准分类,然后通过“这类学生更合适、更愿意到那些单位就业”的统计分析,实现更好的、更准确的向毕业生推荐就业单位,或者为学生寻找就业单位提供参考和建议。虽然这种方式还处在比较简单的层次,但也可以得了非常好的效果。
● 向招聘单位精准推荐满意度高的毕业生
与上面类似,通过对招聘单位基于注册资本、企事业性质、企业涉及的行业、企业的历史年限等相关属性进行聚类分析实现对招聘单位精准聚类,实现向招聘单位推荐“这类单位很可能会满意”的毕业生。
随着学生数量、就业行业、影响就业因素的多元化和就业管理的提高,高校管理者对毕业生就业趋势的预测以及学生培养模式的改进越来越多的依赖于毕业生就业信息分析的结果。这其中最有效的信息分析的手段就是对就业信息进行有效的数据挖掘,利用决策树技术对影响大学生就业的多种因素进行多层次、多角度的分析和比较,挖掘这些数据中所蕴含的有价值的信息,最后形成准确的就业数据模型,从而准确的就业前景预测。
数据挖掘的操作对象是数据,没有足够、合适的数据对于数据挖掘技术而言就犹如“巧妇难为无米之炊”。数据挖掘在高校毕业生精准就业的应用中存在如下的几个问题:
● 数据采集和数据共享问题
毕业生就业信息来之于全国各大高校在每年的毕业季申报的就业数据以及单位的招聘信息。因此,就业数据和招聘信息的真实性、数据的格式、数据内容的取舍在很大程度上都依赖于企业、高校以及各地的教育主管部门。企业、高校和各地教育主管部门对就业数据的要求不一,会造成数据的格式、数据的内容多样化,严重降低数据的可挖掘性。同时,考虑到多种原因,高校和企业可能会在数据申报上隐瞒不报或漏报少报,造成数据挖掘的价值流失。
● 数据安全
在数据申报和数据挖掘的过程中,如何防止数据流失和数据安全是一个比较棘手的问题。这其中包括毕业生就业信息、就业单位信息的加密和安全保护等问题。
● 数据挖掘平台的建设问题
其中包括数据挖掘平台的主体归属、平台的建设经费来源数据挖掘成果的分配和共享以及数据挖掘平台的可持续运行等问题。
随着大数据挖掘、人工智能技术的普及和广泛应用,数据挖掘技术在高校毕业生就业工作的应用必定会越来越广泛。相信通过正确、合理的运用数据挖掘技术,高校就业工作一定可以实现有指导的招生、有方向的培养、精准的推荐、准确的就业预测。
[1]王美丽.大数据时代高校精准就业服务工作研究[J].思想理论教育,2016(6):84-88.
[2]Jiawei Han,Micheline Kamber,Jian Pei著.数据挖掘概念与技术[M].北京:机械工业出版社,2012:4-5.