朱春楠,范 军,邹云龙
(1.东北师范大学 思想政治教育研究中心,吉林 长春130024;2.东北师范大学 马克思主义学院,吉林 长春130024)
基于多元统计分析的高校毕业生就业状况监测应用
朱春楠1,范 军2,邹云龙1
(1.东北师范大学 思想政治教育研究中心,吉林 长春130024;2.东北师范大学 马克思主义学院,吉林 长春130024)
高校毕业生就业状况监测体系是一项复杂的系统工程。本文在记实量化基础上,采用多元统计方法中的主成分分析、聚类分析、相关分析和因子分析等方法,即定量分析与定性评价相结合的方法,对高校毕业生就业状况监测进行了研究。旨在构建一种科学、有效的高校毕业生就业状况监测方法,提高高校毕业生就业状况监测的科学性与实效性。
高校毕业生就业状况;监测;多元统计分析
高校毕业生就业状况监测是一项复杂的系统工程,其科学性与准确性是至关重要的问题,直接关系到高校、政府、社会、家长等多方面能否掌握高校毕业生就业状况并作出科学决策。监测过程中正确选择与使用数据统计和分析方法,是确保监测结果的科学性和准确性的关键。
“高校毕业生就业状况监测”是对高校毕业生就业进行全面、动态、定量、定期和多次测定。我们认为,高校毕业生就业状况监测需监测不同时间、不同区域、不同类型、不同专业、不同学历、不同性别等多维动态的高校毕业生状况数据。要坚持全面性、独立性、可评性、可测性的原则[1]。对于如此多维、复杂的就业状况数据,仅用单一的某种统计方法已经无法实现科学统计与分析,更无从谈起对发展趋势的预测和危机的预警。只有综合运用多种统计方法,即采取多元统计分析模式,才能确保监测结果的权威性和全面性。基于多元统计分析的高校毕业生就业状况监测是综合运用几种统计分析方法,对高校毕业生就业状况数量维度和质量维度数据的监测。
多元统计分析方法是定量分析事物间复杂关系的一种综合统计分析,是数理统计学中迅速发展起来的一个分支,它具体涉及主成分分析、聚类分析、相关分析、因子分析等多种分析方法。主成分分析法是利用降维的思想,通过适当的数学变换,把多指标问题转化为较少的综合指标(即主成分)问题。综合指标是原来多个指标的线性组合,通过线性转换的手法将一组可能具有相关性的变量观测转化之后得到一组相互无关的变量值,且尽可能地反映原来指标信息(85%以上)[2]。聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同类的一种多元统计分析方法[3]。相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法[4]。因子分析是用少数几个因子F1,F2,…,Fm去描述许多变量之间的关系。被描述的变量x1,x2,…,xp是可以观测的随机变量,即显在变量。因子分析是通过变量的相关矩阵,找出能够控制所有变量的少数几个随机变量去描述多个变量之间的相关关系[5]。
多元统计分析方法能够监测高校毕业生就业状况复杂问题,具体表现在两个方面:一是海量的就业状况数量维度数据需要通过多元统计分析,挖掘数量间的关系,探究高校毕业生就业状况的变化规律。就业状况数量维度指标主要体现在就业率,具体包括总体就业率、专业就业率、初次就业率、年底就业率等多个维度;二是模糊的就业状况质量维度数据需要借助多元统计分析,实现模糊数据的标准化,最终完成就业状况的定量分析。就业状况质量维度指标主要体现在毕业生对就业分布指标、满意度指标、创业指标等多个维度。因此,这些就业状况数量维度和质量维度的描述要实现量化分析,就必须借助主成分分析、聚类分析、相关分析、因子分析等多种统计分析方法,通过多元统计分析,才能实现对就业状况数量和质量指标的科学表征和准确统计,从而得出准确、权威的高校毕业生就业状况监测结果。
高校毕业生就业状况监测包括指标的区域、指标的范围、指标的类型三个方面。在本研究中,选取高校毕业生就业状况监测中一个点位进行分析,具体应用多元统计分析方法,监测东北师范大学2011届数学与统计学院本科毕业生就业状况质量维度中就业过程满意度。在监测指标的区域方面,东北师范大学为部级即教育部直属高校;在监测指标的范围方面,东北师范大学根据学科门类划分为师范院校,2011届数学与统计学院毕业生,涉及学历层次为本科生,涉及专业包括数学与应用数学专业(师范专业)和统计学专业(非师范专业),涉及毕业生性别包括男生和女生;在监测指标的类型方面,监测毕业生就业过程满意度,其主要反映高校毕业生在搜索就业信息、投递简历、笔试、面试、签订就业协议等就业环节中的满意程度,主要包括求职成本、求职时间、求职渠道、需求情况和就业指导等五个方面。因此,我们选取监测东北师范大学2011届数学与统计学院本科毕业生就业状况质量维度中就业过程满意度具有可行性。
首先进行监测数据样本的采集,在2011届数学与统计学院本科毕业生中,随机选取30名,编号为XS01至XS30,汇总这些毕业生的就业过程满意度数据(见表1)。
我们综合运用主成分分析、聚类分析、相关分析、因子分析的方法对抽取的样本数据进行分析研究。首先,主成分分析可以将多变量简化为较少综合变量,对数据进行降维,降维后的变量是原来变量的线性组合,反映原变量的绝大多数信息,使信息的损失较小。也就是说主成分分析可以把原来多个指标减少到一个或几个综合指标,并且这些少量的综合指标能够反映原来多个指标所反映的绝大部分信息。指标的减少有利于进行下一步的计算、分析和评价。下面,我们通过使用DPS软件对上述数据进行分析。DPS软件可用来对高维大容量的数据进行多种统计分析及运算,使我们根据其输出结果对分析对象产生结论。
表2 主成分特征值和贡献率
表2是经过主成分分析计算出来的各个主成分的特征值和贡献率。方差贡献率的大小反映了各个主成分的重要程度,即方差贡献率大的说明该成分可以解释较多的原始变量数据。在统计学中普遍认为,主成分的累积贡献率达到85%以上即可,用少数几个主成分代表原来多个指标的绝大部分信息。由表2可见,前两个主成分的累积贡献率达到了88.12%,超过了85%,所以只选取前两个主成分即可保留原始指标的绝大部分信息,具有一定的代表性。
表3 各主成分载荷
由表3可见,第一主成分与每个原始指标都存在正相关,其是一个综合指标;第二主成分与“求职成本”有相对较大的正相关,与“求职时间”的关系相对较小,而与“求职渠道”、“需求情况”和“就业指导”存在一定的负相关。因此,我们认为根据第一主成分可以评价“毕业生就业过程满意度”整体满意程度的高低,根据第二主成分可以评价毕业生对“求职成本”的满意程度。
表4 毕业生就业过程满意度主成分、综合因子得分与排名
续表4
表4呈现的是各主成分与综合因子的得分,反映了毕业生就业过程满意程度,得分越高满意程度越高;同时反映了综合因子排名与第一主成分排名是一致的,而与第二主成分的排序相差较大。根据综合因子得分的高低,可以判断“毕业生就业过程满意度”整体满意程度高低。我们分析,毕业生XS01对就业过程整体满意程度最高,XS28、XS30次之,而毕业生XS16对就业过程整体满意程度最低;根据第二主成分得分我们分析,毕业生XS04对“求职成本”满意程度最高,毕业生XS05次之,而毕业生XS10对“求职成本”满意程度最低。
我们在主成分分析的基础上采用聚类分析对数据做进一步挖掘。聚类分析是将样本中的各项指标之间的“性质”进行直接比较,将性质较为相近的归为一类,性质差别较大的归为不同类。通过上述分析我们知道,第一主成分的贡献率没有超过85%,如果仅仅按照第一主成分得分来进行聚类分析,会因为信息量不够多,而存在一定片面性。因此,对前两个主成分得分进行系统聚类分析,采取较为广泛使用的欧式距离、离差平方和聚类法,具体结果如图1所示。
图1 聚类谱系
根据聚类图,并结合表4综合因子得分,可将随机抽取的30位毕业生对“就业过程满意度”分成4个等级,即毕业生XS01、XS28、XS30对“就业过程满意度”属于很高等级;毕业生XS02、XS04、XS05、XS13、XS14、XS17、XS18、XS19、XS20、XS21、XS25、XS26、XS29对“就业过程满意度”属于较高等级;毕业生XS03、XS06、XS08、XS09、XS10、XS23、XS27对“就业过程满意度”属于一般等级;毕业生XS07、XS11、XS12、XS15、XS16、XS22、XS24对“就业过程满意度”属于较差等级。每一类等级均包含了足够的样本,表明我们的分类具有一定的代表性。
接下来我们采用相关分析法探索数据变量间的相关性,见表5。
表5 相关系数矩阵
在表5中,r表示变量间的相关系数,从表中可以看到:在第二列,即求职成本(X(1))与其他四个因素X(2),…,X(5)的相关性数据,其中求职成本与求职时间存在较高的相关性(相关系数为0.8374),与求职渠道、需求情况、就业指导存在一般的正相关。因此,我们有理由初步认为求职成本和求职时间相结合综合表达了一定的信息,即毕业生在就业过程中,求职成本和求职时间二者是紧密相连。说明毕业生花费求职时间多,也将带来求职成本的增加;反之毕业生花费求职时间少,也将带来求职成本的减少。而毕业生求职渠道、需求情况、就业指导综合在一起表达了另外一部分信息,即毕业生在就业过程中,其求职渠道与需求情况和高校对毕业生的就业指导存在较大相互影响关系。
接下来,通过因子分析法进一步找到之前我们初步断定的变量之间的关联性。由于因子分析和主成分分析一样需要先求出各个变量的特征值及方差贡献率(见表6),根据方差累计贡献率超过85%的原则,我们选取前两个因子。表7是经过计算处理后的因子结构矩阵,从表7中我们可以看出:对于X(1)和X(2),由于因子2相对于因子1大,故在这两个因素中因子2发挥的作用占主导地位;而对于其他三个因素,因子1相对于因子2大,则因子1起主导作用。这里,我们可以给因子1定义为“主观因子”,给因子2定义为“客观因子”。“主观因子”表达毕业生在就业过程中的主观满意度;“客观因子”表达毕业生在就业过程中的客观满意度。
表6 因子方差贡献率
表7 因子结构矩阵
下面我们专门针对变量进行R型聚类来验证由上述因子分析得到的结论。由图2可以看出,系统建议我们所有的五个因素可分为两大类,即求职成本和求职时间归为一类,也就是求职成本与求职时间相关程度较高;求职渠道、需求情况、就业指导归为另一类,也就是求职渠道、需求情况、就业指导这三类相关程度较高。这与我们通过因子分析得到的结论相一致,并进一步说明了我们定义的“主观因子”和“客观因子”具有代表性。也就是“主观因子”表达毕业生在就业过程中的主观满意度,主要反映在毕业生受主观影响的求职成本和求职时间上;“客观因子”表达毕业生在就业过程中的客观满意度,主要反映在毕业生受客观影响的求职渠道、需求情况和就业指导上。因此,以上分析综合解释了原始数据的主要信息。
图2 R型聚类谱系
多元统计方法善于对多个因素同时进行分析,不易遗漏主要信息,便于控制干扰因素对结果造成的影响。因此,将多元统计分析应用于高校毕业生就业状况监测体系研究,有利于解决高校毕业生就业状况监测所涉及指标众多、类型复杂等诸多问题。本研究选取高校毕业生就业状况监测体系中一个点位即就业质量监测指标中的毕业生就业过程满意度进行分析,是一个例证研究。该例证研究联合应用了主成分分析、聚类分析、相关分析、因子分析等多元统计方法,其评价结果基本一致,说明研究是科学、合理、准确的。因此,通过本研究表明,应用多元统计分析可以进一步监测高校毕业生就业状况的其他维度指标,进而确保高校毕业生就业状况监测权威、全面。
[1]刘海滨,徐文.高校毕业生就业状况监测指标体系分析与建构[J].东北师大学报:哲学社会科学版,2011(2):170.
[2]薛冬梅,孙王杰.多元统计方法在辽宁省工业主要行业经济效益评价中的应用[J].吉林化工学院学报,2007(6):80.
[3]Richard A Johnson,Dean W Wichern.实用多元统计分析[M].陆璇,译.北京:清华大学出版社,2001:48.
[4]王成营.应用多元统计方法分析学生知识结构[J].孝感学院学报,2009:41.
[5]徐小万,罗少波,雷建军,李颖,王恒明.多变量统计方法及其在农作物环境胁迫研究中的应用[J].中国农学通报,2009(25):268.
Based on Multivariate Statistical Analysis to Monitor the Employment Situation of College Graduates in the Application
ZHU Chun-nan1,FAN jun2,ZOU Yun-long1
(1.Ideological and Political Education Research Center,Northeast Normal University,Changchun 130024,China;2.Institute of Marxism,Northeast Normal University,Changchun 130024,China)
Employment of college graduates condition monitoring system is complex system engineering.In this paper,which is based on quantitative,using cluster analysis,correlation analysis and factor analysis and other methods which are involved in multivariate statistical methods principal component analysis.In other words,it is the method combining quantitative analysis and qualitative evaluation,studying the employment situation for college graduates monitoring.It aims to build a scientific and effective method of monitoring the employment situation of college graduates,improving the scientific and timeliness of employment situation of college graduates.
Employment of college graduates condition;Monitor;Multivariate statistical analysis
G64
A
1001-6201(2012)01-0165-06
2011-10-20
教育部哲学社会科学研究重大课题攻关项目(09JZD0034-2);吉林省教育厅“十一五”社会科学研究项目(202209235)。
朱春楠(1971-),女,吉林长春人,东北师范大学思想政治教育研究中心讲师,东北师范大学马克思主义学院博士研究生;范军(1948-),男,吉林榆树人,东北师范大学马克思主义学院教授,博士生导师;邹云龙(1973-),男,吉林梅河口人,东北师范大学思想政治教育研究中心副教授,东北师范大学马克思主义学院博士研究生。
[责任编辑:何宏俭]