高职院校毕业生就业推荐系统的研究与设计

2020-02-02 06:46刘西祥
电子技术与软件工程 2020年15期
关键词:毕业毕业生数据库

刘西祥

(永州职业技术学院 湖南省永州市 425100)

目前,全国共有高等职业院校1344 所,在校学生人数和毕业学生人数逐年大幅增长,国家就业形势异常严峻,高职学生的就业压力越来越大。

笔者发现,目前很多高职院校毕业生就业工作模式还比较简单,大部分还是以传统的现场招聘会形式为主,辅以微信公众号等互联网形式开展就业推荐工作,阻碍了毕业生就业工作的发展。本文通过对永州职业技术学院毕业生就业市场的调查分析,设计并开发了“高职院校毕业生就业推荐系统”,每一名应届毕业生可以使用电脑或手机登录该系统并完善自己的个人信息,系统通过推荐算法对应届毕业生学生数据库、往届毕业生学生数据库和用人单位数据库进行数据分析,从而为每一名应届毕业生提供一份比较可靠的就业推荐信息,节省了就业花费的时间和精力。

1 系统设计

高职院校毕业生就业推荐系统不同于一般的毕业生管理系统,它不仅提供了常规的就业管理功能,更重要的是实现了在线就业推荐功能。

1.1 系统整体框架

本系统从实际需求出发,功能上不仅实现了就业推荐功能,还能作为就业管理系统实现就业管理各方面的功能,主要包括用户登录模块、管理员模块、毕业生模块和用人单位模块。其整体框架如图1所示。

1.2 系统主要模块

1.2.1 系统登录模块

本系统采用同一界面进行登录,根据不同的用户类型跳转至不同的用户主页。用户登录时必须先选择用户类型,输入正确的用户名和登录密码并加入验证码才能登录成功。登录时输入验证码是为了增加系统登录安全性,防止自动批量注册、登录。

1.2.2 管理员模块

管理员模块的管理人员分为系统管理员和就业工作管理员。系统管理员主要负责系统维护、数据备份和就业工作管理员权限的分配和管理。就业工作管理员主要是指学校就业部门的工作人员以及各学院负责就业工作的相关人员,主要负责最新就业政策等新闻信息的发布以及对招聘信息、就业新闻、毕业生信息、求职信息、企业用户信息、在线咨询、查询统计、就业管理、档案管理等的统一管理,提高就业工作的效率,保证就业工作的顺利开展。

1.2.3 毕业生模块

毕业生模块主要功能包括个人信息管理、就业推荐、在线查询、在线咨询等功能,学生通过个人信息管理可以查询自己个人的基本信息,包括学习成绩、专业考证、职业素养、是否学生干部、获奖情况、综合评定、个人简历等,学生可以通过在线咨询向学校就业指导老师或企业了解就业相关信息和求职经验等。

1.2.4 用人单位模块

图1:高职院校毕业生就业推荐系统整体框架图

本模块主要有用人单位信息管理和毕业生搜索两大模块。用人单位信息管理主要包括企业基本信息管理、招聘信息发布、修改、更新等功能。毕业生搜索主要实现企业查询符合本单位招聘岗位需要的应届毕业生等功能,为招聘工作的开展提供一些参考和依据。

2 推荐算法

推荐算法是整个推荐系统中最核心、最关键的部分。由于高职院校不同于普通高校,学生素质和就业能力主要体现在专业技能、职业素养和适应环境等方面,毕业生就业专业比较对口,应届毕业生就业单位参照往届毕业生签约单位较多,而可选择的企业或公司职位也具有一定的代表性。基于这种情况,本系统关键推荐算法使用改进的基于内容和历史信息的组合推荐算法,保证了推荐的成功率。

2.1 就业推荐算法的设计思路

高职院校毕业生就业推荐系统主要功能是根据高职院校毕业学生就业的特定性和特殊性设计并使用一些改进推荐算法,其主要流程如下:

(1)根据收集的资料和应届毕业学生、用人单位登录系统完善相关信息两条途径构建学生数据库和企业数据库,其中学生数据库又分为应届毕业学生数据库和往届毕业学生数据库两个数据库;

(2)根据应届和往届毕业学生数据库中的数据获得应届毕业学生和往届毕业学生之间的相似度;

(3)根据企业数据库中的数据计算企业之间的相似度,得到往届毕业学生对应的签约企业与其他企业间的相似度;

(4)将(2)、(3)的结果相结合,根据应届毕业学生与往届毕业学生对相关企业间的关注程度,进行相关企业的推荐;

(5)在(4)已经得出的与该学生相似度最高的往届毕业学生对应的排名靠前的相关企业中,把推荐结果按降序排列,取排名靠前的Top-N 个企业按先后顺序推荐给该应届毕业生,即完成就业推荐功能。

2.2 基于学生的相似度计算

本模块的主要设计思路是针对“学生数据库”(包括应届和往届)中的任意两名应、往届学生,通过最合适的推荐算法计算出他们之间的相似度。高职院校不同于普通高校,学生组成更有针对性,学生素质和就业能力主要体现在专业技能、职业素养和适应环境等方面,影响他们之间的相似度主要有学生的专业名称、学习成绩、专业考证、职业素养、是否学生干部、综合评定和毕业时间等指标,这些指标都是文字内容或具体数值的形式,而目前对文本内容或具体数值进行特征提取的方法比较成熟,所以可以采用最简单有效的方法来计算应、往届毕业学生间的相似度。当然,学生特征的提取也有主次之分,对于一些直接影响就业企业和岗位的重要学生信息要重点考虑,加大权值,如专业名称、专业考证、职业素养、综合评定等指标。根据实际情况,本系统选择改进的基于内容的推荐算法,对应、往届毕业学生之间相似度的计算方法如公式(1)所示。

在公式(1)中,Simstu(x,y)表示应届毕业学生x 与往届毕业学生y 之间的相似度,fk(x1,y1)可认为是应届毕业学生x 与往届毕业学生y 之间第k 个特征(文本内容)属性的匹配度,如果两人的这一属性值相同,我们认为他们的这一属性完全相似,则fk(x1,y1)=1,反之则完全不相似,则fk(x1,y1)=0;则认为是应届毕业学生x 与往届毕业学生y 之间第i 个特征(具体数值)属性的匹配度,如果两人的这一属性值为1,我们认为这一属性完全相似,如果两人的这一属性值为0,我们认为这一属性完全不相似。由于各特征属性有主次之分,其影响二者之间相似度重要性不尽相同,公式中θk和θi表示第k 和i 个特征属性在相似度计算过程中所占的权重,实际取值时务必满足θk+θi=1。表示毕业时间影响应、往届毕业生相似度的权值,Yx代表应届毕业学生的毕业年份,Yy代表往届毕业学生的毕业年份,t 代表数据库中所有毕业生的届数,φ 表示毕业时间的影响因子。

2.3 基于企业的相似度计算

由于我们推荐给应届毕业学生的企业不能局限是一家企业,所以我们必须找出各企业间的关系,即计算出企业间的相似度。

通过调查发现,高职院校的毕业生就业专业对口且就业单位和岗位相对稳定,我们可以充分利用往年的就业信息来计算历年招聘企业间的相似度,除考虑企业固有的属性特征外,还同时重点考虑企业历年招聘学生的相关信息,故推荐算法选择基于历史信息的协同过滤推荐算法。

影响企业间相似度计算的因素主要有两种。一种是可以进行量化和比较的特征属性,如性别、专业课成绩、是否学生干部、综合评定等,这些特征属性的不同取值都代表一种不同的情况,所以与这些特征属性相关的企业相似度可以通过简单的欧几里德距离公式计算来实现。另一种是不可进行量化和比较的特征属性,如招聘专业,两个招聘专业之间的相似性是无法直接进行比较的。所以,为了更加科学、合理计算企业间的相似度,我们把企业间的相似度分成两部分来进行计算,一部分由可以进行量化和比较的特征属性来决定的,另一部分则是由不可以进行量化和比较的特征属性决定的。得到如下公式(2):

在以上公式(2)中,必须满足Px+Py=1,其中,sim(c1,c2)表示企业C1、C2 之间的相似度,而simx(c1,c2)表示由可以进行量化和比较的那部分特征属性决定的企业C1、C2 之间的相似度分量,simy(c1,c2)表示由不可以进行量化和比较的那部分特征属性来决定的企业C1、C2 之间的相似度分量,Px和Py分别表示这两部分相似度在总的相似度中所占的权重,而权重值是否合理分配将严重影响相似度结果的准确性。

由于权重值将直接影响相似度计算结果的准确性,所以我们在确定权值的时候一定要结合实际,多调查,多收集相关单位的建议和意见。以永州职业技术学院为例,我们通过分析认为我们学校的毕业生就业专业比较对口,近两年都在80%以上,而且就业专业对口率还在上升。这就表明专业因素这个分量对计算企业相似度的影响很大,而学生性别、专业成绩、是否考证、是否学生干部等因素对计算企业相似度的影响相对较小,所以这里我们权重和分别取值为0.2 和0.8。也就是说,在本系统计算招聘企业间相似度过程中,可进行量化和比较的特征属性对其影响较小,而不可进行量化和比较的特征属性,即专业因素对最终的推荐结果影响程度较大。

3 系统测试与评价

本系统采用永州职业技术学院近三年的毕业生数据和用人单位数据进行测试,共计一万多名学生,涉及各行各业的近五百家企业单位。测试过程中,选择推荐准确率和RMSE(均方根误差)作为评价系统的指标,其计算方法如公式(3)和公式(4)所示。

公式(3)中R(u) 表示学生在训练集上的行为给学生做出的推荐列表,T(u)为学生在测试集上的行为列表。

公式(4)中用rsc表示学生S 对企业C 的真实评分,r'sc表示学生S 对企业C 的预测评分。

通过测试结果分析,该系统为应届毕业生推荐的就业单位符合该生的实际潜在就业意向单位,缩小了学生了解招聘企业单位的范围,节省了就业的时间和经济成本,具有一定的实际应用价值。

4 结语

本文选择改进的基于内容的推荐算法和基于历史信息的协同过滤推荐算法来计算学生之间的相似度和企业之间的相似度,设计的公式中分别包括文本属性特征和数值属性特征的计算,考虑了学生毕业时间对相似度的影响,不同毕业时间设置不同的权值,同时重点考虑了就业历史信息对就业推荐算法的影响,保证了计算的准确性和结果的可靠性。当然,由于目前该就业推荐系统还不够成熟和完善,研究的算法还有待优化,测试的数据还不够全面,通用性还无法确定,系统的操作界面也还缺乏美观,需要再花大量的时间对它进行修改、调试和改进,希望能够通过自己的不懈努力,尽快完善系统的功能和算法,早日让该推荐系统得到应用和推广,为高职院校的毕业生就业工作贡献力量。

猜你喜欢
毕业毕业生数据库
9岁的高中毕业生
我们今天毕业了
一个没什么才能的北大毕业生
毕业季
毕业了,能否学以致用
最“叛逆”的毕业生
毕业歌