刘俊灼 柳炳祥 张军
摘要:Apriori算法是关联规则数据挖掘算法的一种,也是极具影响力的算法。Apriori 算法算法具有先验性质,Apriori 算法的用处是挖掘频繁项集的,频繁项集粗俗的理解就是找出经常出现的组合,然后根据这些组合最终推出关联规则。因此,将Apriori算法应用在高校就业分析中,能够帮助相关人员分析出高校学生的就业方向。
关键词:关联规则;Apriori算法;高校学生;就业分析;应用
引言
高校毕业生就业管理和就业指导工作是高校培养人才过程中的最后一个阶段,也是至关重要的一步,而就业分析是完成这一步的关键。在就业分析过程中,形成大量的、复杂的数据,统计和分析起来有很大的难度,而就业指导是影响毕业生就业走向的重要环节,如何从复杂的毕业生信息中挖掘出对就业指导有效的数据,是很多高校都在研究的问题。
使用数据挖掘技术做就业预测,可以为就业管理部门在毕业生就业指导过程中提供有效决策性数据依据,同时为毕业生在就业择业时提供有效的引导。
一、关联规则Apriori算法概述
(一)关联规则
关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间可能存在的关联或者联系。例如对商场里买东西的顾客进行调查发现,百分之三十的顾客会同时购买枕套和枕巾,而百分之八十购买枕套的人会购买床单,这其中就隐藏面临一条关联:床单~枕巾,也就是说大部分人会一起购买床单和枕巾,因此商场可以将枕巾和床单放在一个购物区。
(二)Apriori算法
Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情節的向下封闭检测两个阶段来挖掘频繁项集。
Apriori算法是一种逐层搜索的迭代式算法,其中k 项集用于挖掘(k+1)项集,这是依靠他的先验性质的:频繁项集的所有非空子集一定是也是频繁的。
通过这个性质可以对候选集进行剪枝。用k 项集如何生成(k+1)项集呢,这个是算法里面最难也是最核心的部分。
通过2 个步骤,第一个步骤是连接步,将频繁项自己与自己进行连接运算;第二个步骤是剪枝步,去除候选集项中的不符合要求的候选项,不符合要求指的是这个候选项的子集并非都是频繁项,要遵守上文提到的先验性质。最后,通过一、二步骤还不够,在后面还要根据支持度计数筛选掉不满足最小支持度数的候选集。
二、关联规则Apriori 算法在高校学生就业分析中的应用
(一)数据收集
数据挖掘要有明确的数据分析对象,所以,数据挖掘的第一步必须收集数据。在数据挖掘过程中,可以直接从高校数据库中提取数据,也可以通过调查得到所需数据。文章选择问卷调查的方式得到数据,问卷调查分为毕业生和在校生两种,针对已毕业学生主要的调查信息包括专业课成绩、对所学专业是否感兴趣、影响工作的因素、是否参加实习、就业方向是否与专业对口、就业单位是否是原实习单位、就业的主要途径等。针对在校学生的调查信息主要包括:专业课成绩情况、对专业课是否感兴趣、对就业前景的态度、希望学校提供的就业指导情况、预计在就业中遇到的问题等。
(二)Apriori算法优化
高校毕业生就业信息较为复杂,且不确定性较为突出,毕业生的专业成绩、社会实践情况、英语等级等因素在毕业生就业方向中存在重要影响,为了挖掘对毕业生有利的信息,文章采用基于划分的Apriori优化算法应用在毕业生就业分析中。主要思路是:将毕业生就业信息数据库中的事务,根据历届毕业生就业方向划分成不重叠的部分,划分后的每一部分均能够一次性的读入内存中。运用Apriori算法在每一部分的内部进行频繁项集的扫描,得到局部频繁项集,并计算每个频繁项集在整个数据中的实际支持度。由这些频繁项集构成整个数据库的候选项集,从而确定出全局候选项集。
(三)数据关联规则挖掘
使用学生就业数据挖掘出来的主要关联规则对学生的就业情况进行预测。从规则中可知,大数据科学应用专业的学生,不论是对专业是否感兴趣,还是专业是否优秀,百分之八十以上的人都愿意参加实习,尤其是男生,这说明,实习是加强专业技能有效手段,通过实习,学生择业的范围和机会都会增大。
总体来说,不论专业课成绩好坏、是否参加过实习、实习岗位是否与所学专业对口,大部分学生都希望学校能够安排实习,少数学生希望通过人才市场等方式实现就业。总的来说,大部分学生希望学校提供就业机会。
(四)建议
第一点,对在校生来说,实习是走上工作岗位的重要途径,建议在有机会的情况下参加毕业实习工作,也希望学校可以为学生联系较多的实习岗位;
第二点,学校应该加强对学生的管理,培养学生的兴趣,提高学生的素质结构和操作技能,解决学生就业难的问题。
第三点,学校应主动采取措施,积极满足学生的就业需求。同时,学生应该利用人才市场,网络等多种渠道来解决就业难的问题。
三、结语
综上所述,应用关联规则Apriori算法对高校毕业生进行就业分析是可行的,高校应根据分析结果,为学生提供更多的实习机会,同时在校期间,要积极鼓励学生自己找工作,不断满足学生的就业需求,解决就业难的问题,提升高校毕业生就业率,帮助学生找到适合自己的工作。
参考文献:
[1] 覃永贞,顾平.Apriori算法在高校毕业生就业预测中的应用分析[J].轻工科技,2014,30(07):93-94+97.
[2]黄文静.Apriori 算法在高校毕业生就业数据挖掘中的应用研究[J].电子技术与软件工程,2015(04):207-208.