林森
(江苏工程职业技术学院,南通 226007)
基于广义回归神经网络的职业性向分析
林森
(江苏工程职业技术学院,南通 226007)
对在校大学生进行霍兰德职业性向测评,利用模糊聚类对测评数据进行初步归类,应用广义回归神经网络(GRNN)迭代训练建立分类模型,将主客观测评数据对应的分类结果进行比对获取吻合率,为大学生的就业指导提供参考。
职业性向;广义回归神经网络;模糊聚类;Matlab应用
职业性向又名职业兴趣、职业性格,反映出的是就职者对不同职业的取向意愿和渴望程度。个人的性格和禀赋作为职业性向形成的重要因素,也对个人职业生涯规划和发展产生重要影响。职业性向不可被直接感知,但可以从行为模式中去观察推测或者利用问卷调查进行了解。美国著名职业指导专家霍兰德(John Holland)认为不同的职业性向适宜不同的职业选择,即兴趣与职业密切相关:两者相投则相互促进,两者相悖则互相阻碍。同时,霍兰德提出可将现实中的人分为现实型(Realistic)、研究型(Investigative)、艺术型(Artistic)、社会型(Social)、企业型(Enterprise)、传统型(Conventional)6种类型。利用一个正六边形,如图1所示,可以简单表述这6种类型之间的关系,正六边形的6个顶点代表6种类型,如果顶点间的连线距离越短,表明不同类型之间的相关性越大;顶点间的连线距离越长,表明不同类型之间的相关性越小。霍兰德据此编制出的职业性向测试题在全球各大企业人事录用和选拔人才的过程中发挥了重要作用。本文即是利用霍兰德职业性向测试,对在校大学生开展自我评估、职业了解和就业指导进行初步探索[1-2]。
图16 种类型间的关系图
广义回归神经网络[3](GRNN,Generalized Regression Neural
Network)由美国学者Donald F.Specht于1991年提出,是一种基于非线性回归理论的前馈式神经网络模型,是RBF神经网络的分支,通过激活神经元来逼近函数。广义回归神经网络结构如图2所示,包括输入层、模式层、求和层和输出层。输入层中的神经元数目等于学习样本中输入向量的维数,对应网络输入为输出层中的神经元数目等于学习样本中输出向量的维数,对应网络输出为模式层中的神经元数目等于学习样本的数目,各神经元对应不同的学习样本,模式层中神经元的传递函数为],其中X是网络输入变量,Xi是第i个神经元对应的学习样本,δ为平滑因子。求和层中使用两种类型的神经元进行,对应两类求和计算公式:一类是对模式层所有神经元的输出进行算术求和,传递函数为另一类则对模式层所有神经元的输出进行加权求和,传递函数为输出层中的神经元将求和层中的两个和值输出相除,得到估计结果
图2 广义回归神经网络结构图
本文使用的霍兰德职业性向测评问卷分为主、客观两部分。客观部分包含被测试者所感兴趣的活动、所擅长的活动和所喜欢的职业3个方面,每方面都对应霍兰德职业性向的6种不同类型的测评题各10题,共计60题,被测试者根据测评题中的陈述,将与自身情形相符的测评题勾选中,选中1题计1分,从而得到对应6种不同类型测评题的6个客观性得分。主观部分针对霍兰德职业性向的6种不同类型,被测试者进行自我评价,7分为最高分,0分为最低分,自我评价的得分高低,表明被测试者对于自身属于此种类型的主观认可度的强弱,从而得到对应6种不同类型自我评价的6个主观性得分。最后记录下主客观部分的各自分值。表1为客观性问卷,表2为主观性问卷。
依据主客观两部分的分值情况,利用模糊聚类与广义神经网络分别进行迭代聚类,从而得到依据客观性问卷得分和主观性问卷得分所对应的两组分类结果,并将这两组分类结果进行比对分析,获取两组分类结果的吻合率。算法流程如图3所示,算法流程中各个模块的作用为:①模糊聚类模块采用模糊均值聚类算法,将职业性向分析数据分为6类,并得到每类的聚类中心和个体模糊隶属度矩阵。②网络训练初始数据选择模块根据模糊聚类的结果,选择最靠近每类中心的20个样本作为广义回归神经网络聚类训练样本。首先求得每类的类内均值(中心值),然后求得每类中所有样本到中心值的距离矩阵,从距离矩阵中选择距离最小的20个样本作为一组,共6组120个,并设定其对应的网络输出。③广义回归神经网络训练模块利用训练数据训练广义神经网络。④广义回归神经网络预测模块利用训练好的网络预测所有输入样本数据的分类输出。⑤网络选择训练数据模块,根据预测输出把职业性向分析数据重新分类为6类,重复步骤②的操作,找出最靠近每类中心值的20个样本作为新的训练样本。⑥未达到20次的迭代次数就反复训练神经网络,达到20次的迭代次数后,根据输入的职业性向分析数据,输出所对应的分类结果。
表1 客观性问卷
在Matlab7.8环境下,所有数据均来源于南通纺织职业技术学院机电工程学院学生,共287个采集对象,分属于电子信息工程技术、电气自动化技术、机电一体化技术和机械设计与制造4个不同专业的二年级和三年级学生。针对主客观两方面的分值,利用广义回归神经网络分别进行训练分类,并将两者的分类结果进行比对,求取主客观分类结果相吻合的比率。由于本文采用的广义回归神经网络属于RBF神经网络的范畴,神经网络训练时其中的网络权值不断变化,从而导致每一次训练后的外推分类数据也不完全一致,具有一定的随机性,故本文随机运行程序10次,记录下分类结果吻合率的最高值与最低值。其中模糊聚类函数为调用Matlab函数[center,U,obj_fcn]=fcm(data,cluster_n),聚类数cluster_n设为6类;广义回归神经网络训练函数为调用Matlab函数net=newgrnn(P,T,spread),径向基函数的扩展速度spread设为0.1。表3为基于GRNN的职业性向分类结果吻合率。试验结果截屏示意图见图4和图5。截屏中的变量说明:sy7a2为主观性数据分类结果,sy8a2为客观性数据分类结果,r1、r2、r3和r4分别为电子信息专业、机电一体化专业、机械制造专业和电气自动化专业的主客观分类结果吻合率。随机试验两次,图4为第一次随机试验的结果,图5为第二次随机试验的结果。
从试验结果可以看到,经过模糊聚类的无监督分类与广义回归神经网络的有监督学习后,4个专业中学生主客观职业性向选择的最高吻合率为66.04%,出现在电气自动化专业;最低吻合率为34.67%,出现在机械制造专业,4个不同专业的学生主客观职业性向的吻合率偏低,说明学生主观的自我认识和自身评价与客观的能力爱好和从业意向还存在着一定的偏差,这会对学生步入社会时的职业选择带来不利影响,因此在今后的大学生就业指导工作中,应进一步加强引导适时纠正,让学生对自身有更为清晰的认识,使得学生能够迈好进入社会的第一步。
表2 主观性问卷
图3 基于GRNN的职业性向分析算法流程图
表3 基于GRNN的职业性向分类结果吻合率
图4 第一次随机试验的分类结果
本文对在校大学生进行霍兰德职业性向测评,利用模糊聚类和广义回归神经网络对测评问卷获得的数据进行分析,分析结果表明学生主客观职业性向选择的吻合率仍有待提高,对于在校大学生在职业定位、职业规划与职业选择方面的教育工作需要加强。此外,本研究也存在某些需要改进的方面,例如广义回归神经网络径向基函数扩展速度的确定,是通过主观人为设定,需在今后更深入地展开研究,以进一步提高算法的客观性。
[1]冼建英.霍兰德职业人格测试在就业指导工作中的应用[J].职业技术教育,2008(23):91-92.
[2]吕国富.霍兰德人格类型理论与大学生职业生涯辅导[J].贵州师范大学学报:社会科学版,2007(147):95-99.
[3]李刚.广义回归神经网络在大坝安全监测数据分析中的应用[D].武汉:武汉大学,2005.
(责任编辑:王晓燕)
Career Orientation Analysis Based on Generalized Regression Neural Network
LIN Sen
(Jiangsu College of Engineering and Technology,Nantong 226007,China)
Holland’s Vocational Preference Inventory is used to evaluate the career orientation of college students.The results are classified by means of fuzzy cluster,and a classifying model is then established by using Generalized Regression Neural Network(GRNN)iterative algorithm.Classified results of subjective and objective evaluation are compared to obtain the rate of agreement.The study provides references for the career guidance in college education.
career orientation;GRNN;fuzzy cluster;Matlab application
TP391
A
1671-6191(2014)02-0018-04
2013-12-12
林森(1981-),男,江苏镇江人,江苏工程职业技术学院机电工程学院讲师,研究方向为机电专业教学。