大学生就业研究的知识图谱分析

2021-03-25 02:46
山东高等教育 2021年1期
关键词:发文可视化聚类

(1.青岛大学 师范学院,山东 青岛266071;2.青岛大学 青岛教育发展研究院,山东 青岛266071)

我国高等教育招生规模的不断扩大,大学生毕业的人数日益增多,大学生就业难这一问题尤为突出。其一直被视为高等教育界关注的热点,可主要采用定性分析的方式,量化研究成果较少,不能对领域内的研究热点和未来发展形成直观了解。知识图谱是以科学知识为对象,综合运用科学计量学、信息可视化技术、应用数学、图形学等学科的理论和方法,来展示科学文献和引文路径的复杂交叉所反映出的科学交流及发展趋势。[1]7-10与传统的定性分析相比,知识图谱分析以文献计量为基础,借助定量数据可以直观形象地反映某个研究领域的热点和趋势。通过对1979—2019年40年间大学生就业研究的相关文章进行可视化分析,意在探求大学毕业生就业选择研究发展的热点,以期为未来深入研究提供参考和借鉴。

一、研究方法

基于CNKI中国学术期刊网络出版总库的文献数据库,以“主题=大学生”并含“主题=就业”为检索词,时间限定为1979—2019年,指定期刊类别为核心期刊、CSSCI来源期刊进行高级检索,检索时间为2020年5月25日,共得到6091篇相关文献。经过初次检索和对比筛选,对会议通知、出版物介绍、声明、年会综述等主题不相关的条目进行筛除,得到5130篇科研类相关文献,将文献数据以Refworks格式导出,每条数据由标题、作者、摘要、出版日期、期刊等信息构成。Citespace是一个挖掘文献数据的可视化分析软件,可进行文献的共引分析、分析引文空间的分布及聚类,同时可以分析作者、机构的合作共现图,是探讨研究演变过程、总结研究发展规律、关注研究热点的文献计量工具。通过Citespace软件对文献数据进行处理,对作者、机构、文献关键词聚类图谱以及时区图谱进行分析,探究大学生就业研究在国内的发展趋势。

二、研究结果分析

(一)发文数量的可视化分析

领域内隐藏性知识可通过可视化的方法进行挖掘,从而呈现出科学的知识结构和分布规律。发文量分析能够从宏观上把握特定时间段下大学生就业研究的详细情况及热度变化,也有助于分析其发展趋势。将1979年—2019年间与大学生就业有关的公开发表文献进行了筛选统计,结果如图1所示。第一篇研究性文献在1992年刊登,2001年前,我国大学生就业的相关研究处于缓慢发展的阶段,发表的文献数量变化不大,从2002年之后,尤其在2004年至2014年间,年发文数量明显上升。2006年至2014年间,年均发文数量均超过400篇,并在2009年达到顶峰,单年发文量达到1073篇。2014年至2019年发文量虽然有所下降,但每年的发文量均在100篇以上。

图1 年发文量折线图

(二)研究者的可视化分布

运行Citespace,时间跨度设置为1992-2019,每1年设置为一个时间切片,节点类型设置为作者,收集时间切片内频数在前50的数据。得到节点数为760,连线数为187,密度为0.0006的核心作者的可视化分布图,如图2所示。图中圆圈大小代表作者发表的文章数量,圆圈越大表示该作者发表的文章数量越多;连线代表作者之间的合作情况,连线的粗细表示作者间合作的强度,连线越粗表示合作关系越强。[2]表1为大学生就业领域发文量排名前13名的作者。综合可知,核心作者排名前五的是黄敬宝、岳昌君、罗建河、蒋承、王保义。学者间合作程度低,没有形成密切的合作网络,而且合作跨度较小,合作者相对固定,大多为师生关系。一些作者节点大,发文量多,但是没有连线情况,说明部分高产作者独立发表文章,没有合作发文,尚未形成体系化的合作网络。

图2 核心作者的可视化分布图

表1 发文数量前13名的作者

(三)研究机构的可视化分布

同上聚类得到节点数为650,连线数为76,密度为0.0004的机构可视化分布图,如图3所示。图中节点越大说明发表文献的数量越多,不同节点之间的连线表示机构与机构之间的合作数量与程度,连线越多说明机构间合作次数越多、合作程度越高。[3]可知主要研究机构中存在一定数量的跨机构合作,大多是北京大学和其他院校的合作发文,合作数量不多。尚未形成普遍的合作关系,图3没有对属于同一学校不同学院的发文情况进行合并,表2呈现了整合后的核心机构发文数量。发文量排名前五的是北京大学、北京师范大学、中国青年政治学院、中国人民大学、东北师范大学,大多数机构在21世纪初期进行了相关研究,其前10年出现了大量的研究成果,这一期间发文总量较大,之后发展较为平稳。若要推进研究的纵深发展,需要机构间进行一定程度的资源共享,畅通合作交流的渠道,发挥成果优势,以此更好地将大学生就业研究理论与实际需求相结合,以促进相关问题的有效解决。

图3 核心机构的可视化分布图

表2 核心研究机构发文数量表

(四)大学生就业研究关键词聚类分析

文献之间的内在联系可以通过关键词聚类分析来进行揭示,便于在短时间内对某一学科或领域有一个初步的认识,并进行客观评价,同时提高对研究热点的关注程度。借助Citespace的聚类功能,选择LLR算法对大学生就业研究领域的高频关键词进行聚类,以明确该领域的研究主题。如图4所示,此次聚类共生成940个节点,2753条连线,得到的模块值Modularity Q=0.504,平均轮廓值Mean Silhouette=0.3453的大学生就业关键词聚类图谱,模块值用于标记节点间是否适合聚类,取值范围为0.4-0.8;平均轮廓值则用来衡量节点内部的相似程度,取值范围为0-1。从取值来看,大学生就业关键词聚类图谱聚类效果较好,关键词内部的相似程度较高,是一次可信度较高聚类。聚类图中的十字架大小代表该关键词出现的频次,不同圆圈间的连线则是不同关键词间相关性的外化,连线数越多表明该关键词中心性越强,重要性越高。由图可知,大学毕业生、就业指导、就业能力、就业质量、大学生就业难等关键词出现的频次较高,这说明提高大学生的就业能力是为研究热点。此外,频次较高的关键词还包括“大学生就业创业”“大学生就业制度”等,说明国家政策对大学生就业领域有重要影响。

图4 大学生就业关键词聚类图谱

(五)高频关键词时序分布及突现性分析

关键词时序图可以用来反映研究热点随时间变化的宏观趋势。运行Citespace在关键词聚类图谱分析的基础上,生成关键词时序视图(图5)。从图5中,我们可以发现,90年代初,大学生就业研究更多关注“大学生就业难”、“大学生就业市场”、“用人单位”、“女大学生”等问题,研究内容多围绕大学生就业的现象进行讨论;而随着时间的推移,关键词更多的体现为“影响因素”“职业生涯规划”“就业质量”“就业能力”等,试图揭示大学生就业现象背后的深层问题。此外“创业教育”“大学生创业”“自主创业”等关键词开始出现,说明大学生就业形式趋向多元。

图5 关键词时序视图

关键词突现图从微观层面更为清晰地展示了大学生就业研究的发展脉络和研究趋势。运行Citespace,设置“Burstterms”参数,生成大学生就业关键词突现图(图6)。大致可以将1992—2019年间我国高校毕业生就业研究演变的热点分为“1992-2000”“2001-2010”“2011-2019”三个阶段。

图6 关键词突现统计图

1.1992—2000年,研究热点主要为市场经济、就业制度改革、女大学生就业以及择业观研究等。

市场经济体制下,自主择业使毕业生就业的权利发生了实质性的变化,政府不承担包毕业生就业的责任;[4]高等学校提供毕业生就业指导和服务,就业选择权掌握在大学生手中。这一时期重点从建立适应毕业生市场就业的工作机制来进行研究。大学毕业生分配制度是计划经济时期的产物,随着经济体制向社会主义市场经济的转变,高等学校毕业生分配制度正在稳步从统招统配向自主择业转轨。[5]

女大学生就业难的问题在研究初期就成为热点话题。方巍认为就业市场及其导向使得当代女大学生的职业观染上了强烈的经济色彩和功利色彩。[6]张建奇则认为男女大学生就业机会不平等是女大学生就业难的实质。[7]

这一时期,研究者借助大学生择业特点来探讨如何树立正确的价值观念。李帆从就业形势的宏观层面和SWOT决策分析法的微观层面对大学毕业生进行了求职分析,评判出就业的最大机会与最大威胁。[8]陈文新提到要强化道德意识、实现自我价值、增强责任感和使命感,树立起与市场经济体制相适应的价值观和人才观念。[9]

2.2001—2010年,主要热点为高校扩招、就业难、大学生创业等。

2002年是高校扩招后毕业生进入就业市场的第一年,这一阶段学者从不同视角探析高校扩招对大学生就业的影响,苗天慧等认为应从疏通拓展就业渠道、形成优化就业能力以及改革完善就业指导方面入手,搞好扩招后的大学生就业指导工作。[10]文东茅基于工资竞争理论、工作分层理和工作竞争理论,为解毕业生的就业问题提出了不同思路。[11]

“就业难”“就业压力”等关键词在1998年就已经出现,如从劳动力市场的建立和供求关系的角度探讨大学生就业难的原因,[12]提出缓解大学毕业生就业难的政策;从经济学角度对就业难形势下的高校毕业生就业率进行分析,对女大学生就业难现象剖析。涉及这些高频关键词的研究文献数量均在2009年达到高峰,同时针对不同地区、不同学科、不同院校层次的毕业生就业难的实证分析也大量出现,分析就业难的角度也变得更加具体、多元。

知识经济催生了大学生创业活动,知识经济的资源特征为大学生创业提供了独特的资源优势。在知识经济社会里,知识、信息取代原材料、资本、劳动力、汇率成为最重要的资源,使得受过高等教育的人群具有创业的资源优势。[13]罗良忠在研究中谈到随着各大高校“扩招”和人才竞争市场的日益激烈,越来越多的大学生开始倾向于自主创业并把它当作了一种重要的就业方式。[14]创业教育模式的探索、创业环境与政策以及大学生创业所面临的困境,都是这一时期的研究热点角度。

3.2011—2019年,主要热点为就业质量、就业能力、人力资本、影响因素等。

就业质量自2007年后就一直保持着极高的出现频次,劳动报酬、工作稳定性、工作时间等涉及就业质量的问题呈现出一些变化。研究者在关注大学生就业质量内涵的基础上,探索建立了高校毕业生就业质量评价指标。[15]他们认为评价指标的确定问题和各指标的权重分配及评价是该评价需要解决的问题。[16]除需要依据客观的就业率统计数据外,一所高校毕业生就业质量高低的指标还必须考虑毕业生的供需比、薪酬水平、就业结构、社会认可度等。这有利于在全面把握大学生就业质量的基础上,发展普通高等教育,合理配置大学生资源,促进我国经济社会的全面、协调、和谐发展。[17]

大学生就业能力是指大学生满足社会和用人单位对人才的需求并且可以成功就业的能力。知识经济和社会发展对人才提出了新的要求,用人单位不仅要求应聘者掌握专业知识,同时也会要求他们有一定的复合能力和个性特征。周奔波等人认为有效提升大学生的就业能力是破解大学生就业难题的关键。[18]学者们探讨怎么样培养大学生的就业能力。朱新秤对大学生就业能力的结构进行研究,提出能力培养的策略。[19]马绍壮等人从维度出发分析,将大学生就业能力维度分为社会交往能力、个人展示能力和就业求职能力三个维度,并绘制了测量量表,[20]为就业能力研究提供了一个新的视角。

从人力资本理论研究高校毕业生进入劳动力市场的表现是最具代表性的视角。马莉萍等人探讨人力资本和社会关系在毕业生工作找寻中所发挥的作用、变化趋势及二者之间的相互关系。[21]研究发现社会关系在工作找寻的过程中发挥了的重要作用日益突出,尤其是那些人力资本存量较低的毕业生,将社会关系视为对较低人力资本的补充。孟大虎等人利用Probit模型分析人力资本特征和社会资本特征对大学毕业生求职渠道选择的影响。[22]石红梅等人则具体考察人力资本和社会资本对毕业生的就业质量的影响,研究发现,相较于社会资本,人力资本对大学生就业质量的影响更显著。当代大学毕业生的就业质量取决于他们所拥有的人力资本的规模和数量。[23]

涉及到影响因素这一关键词,学者们从不同视角展开研究,如岳昌君等人对高校毕业生跨省流动的影响因素进行了实证分析,高校毕业生跨省流动类型和比例存在显著的性别、学历和学校类型差异;[24]张抗私等人对就业质量的影响因素进行分析。结果发现:收入水平仍是大学毕业生评价就业质量的首要标准;大学毕业生开始更多地关注非收入因素对就业质量的影响;保障性和稳定性是大学毕业生评判就业质量的重要指标。[25]

三、结论与展望

改革开放以来,中国大学生就业问题的研究在理论上不断丰富,取得了数量较多的文献成果。本文基于Citespace软件,通过知识图谱分析了CNKI中5130篇大学生就业的相关文献,明晰了当前的研究状况和研究重点的变化,未来发展趋势如下。

第一,基于时间分布的视角,研究展现出年均发文量呈阶段性特征。研究始于1992年,1992-2001年大学生就业研究处于起步阶段,相关文献数量较少。2002年后该领域研究进入快速发展阶段。2009年《关于加强普通高等学校毕业生就业工作的通知》的发布,文献数量达到了峰值,此阶段也出现了基层就业、“三支一扶”、特岗计划等研究。2009年后,年均发文量虽逐年减少,但仍然是学者持续关注的话题。2020年受新冠肺炎疫情的影响,大学生就业又将成为学界研究的热点,可以预测此后对大学生就业进行研究的文献将会大幅增长。

第二,基于空间分布的视角,在研究者、研究机构间分布不均衡。相对独立的研究群体间未能形成稳定的交流合作;主要集中在教育学领域,缺少一定的跨学科研究。研究机构间呈现明显的不均衡发展,成果产出上存有一定的差异。从研究者角度看,可视化图谱显示大学生就业研究领域缺乏成熟的研究学者合作团体,一定程度上束缚了持续深入发展,相关选题缺乏一定程度的持续性,缺少具有代表性和影响力的理论创见。

第三,基于关键词的视角,相关研究正在不断细化,形成了相对稳定的核心主题,如“高校毕业生”“就业制度”。同时具有一定的政策热度,分析突现词发现,突现时间较近的有基层就业、创新创业、就业满意度,与近几年相关就业政策出台时间吻合。研究的推进与现实情况的进展相吻合,[26]出现了一些新的前沿性主题,如“就业能力”“影响因素”“就业满意度”等,为大学生就业相关问题的顺利解决奠定了良好基础。加以就业政策的作用,大学生就业研究的将会向着方法科学化和内容细致化的方向逐渐发展。

猜你喜欢
发文可视化聚类
基于CiteSpace的足三里穴研究可视化分析
思维可视化
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于CGAL和OpenGL的海底地形三维可视化
基于K-means聚类的车-地无线通信场强研究
“融评”:党媒评论的可视化创新
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法