基于因子分析和聚类分析的各省市主要行业就业情况分析

2020-09-10 07:22:44何易珂
科教创新与实践 2020年34期
关键词:聚类分析因子分析

何易珂

摘要:我国作为一个人口大国,随着就业形势日益严峻,研究各行业就业情况必不可少。本文用SPSS软件以聚类分析和因子分析的方法分析全国31省市2018年的各行业城镇单位就业人员数量情况。通过分析当下国家行业就业情况以及各省市人口就业情况,从而了解各省市经济发展状况。本文认为,我国经济发展及就业不平衡,就业较好的地区主要在东南部沿海地区和某些直辖市,西部地区发展落后。

关键词:聚类分析;因子分析;行业就业情况

一、选题意义及目的

我国城镇化的不断发展涌现出行业呈现多样化发展。随着竞争压力的增大,出现就业难的问题。各省市地区间出现人口数量与就业岗位不匹配,劳动力就业情况和地区经济发展状况有很强烈的关系改革。开放40多年来,改革红利已逐渐消失,当今竞争性资源、竞争性消费、竞争性低成本劳动模式已难以继续(2015年)。研究各省市行业的就业人口数的分布和关系受到人们密切关注。

二、文献简述

我国学者张艺、余开朗(2017)从人口就业角度,采用因子分析和聚类分析对我国31各省市的就业进行了分析和评价,得出地理环境、经济发展情况和人的主观选择性对行业就业影响大。本文运用因子分析和聚类分析的方法对我国31省市主要行业的就业人数进行了评价分析。

三、基于因子分析和聚类分析的就业情况分析

本文针对样本数量过多的问题,采用因子分析方法提取公共因子,然后进行聚类分析。通过对原始数据进行标准化,计算样本数据X的均值和协方差并且计算主成分的贡献率及累计贡献率。

根据主成分的累计方差贡献率达到80%来选取因子。根据这一原则,这19项指标一共提取了3个公共因子(累计方差贡献率为87.11%),三个因子解释能力分别占所有变量总方差的62.951%、16.851%、7.308%。

通过建立因子载荷阵,进行方差最大正交旋转。根据旋转后的因子负荷矩阵命名公共因子:

1.公共因子F1在交通、仓储和邮政业(X6)、信息传输、软件和信息服务业(X7)、批发和零售业(X8)、住宿和餐饮业(X9)、金融业(X10)、房地产业(X11)、租赁和商务服务业(X12)、科学研究和技术服务业(13)、居民服务、修理和其他服务业(X15)、文化、体育和娱乐业(X18)上的载荷绝对值较大,方差贡献率为62.951%,可以将F1命名为服务与文娱主导型行业指标;

2.公共因子F2在制造业(X3)、电力、热力、燃气及水生产和供应业(X4)、建筑业(X5)、水利、环境和公共设施管理业(X14)、教育业(X16)、卫生和社会工作行业(X17)、公共管理、社会保障和社会组织行业(X19)上的载荷值较大,方差贡献率为16.851%,可以将F2命名为工业技术与公共管理主导型行业指标;

3.公共因子F3在农林牧渔业(X1)、采矿业(X2)上的载荷值较大,方差贡献率为7.308%,可以将F3命名为资源主导型行业指标。

在处理缺失值后的因子分析,在19个指标中成功提取出了3个主导功能因子,大大简化了指标。在没有损失太多信息的同时,获得相对完整的解释能力,更直观的地展现出了最可观的影响因素。

最后,将公共因子得分计算:F=0.62951*F1+0.16851*F2+0.07308*F3

以下用提取的3个公共因子取代19个指标,进行聚类分析。计算26个样品相互之间的欧式(Euclidean)距离,选用Ward离差平方和法对样品进行聚类。

由聚类树形图得出分类结果:

重新调整聚类距离类合并。由表5所示,从上往下作垂线,分成六类效果最好。

四、各省主要行业就业情况分析

1.聚类结果

(1)根据聚类谱系图将分类结果如下:

(2)通过Excel制作出类别与导功能因子均值之间的数据透视表:

2.结果分析

(1)第一类地区服务与文娱主导型行业、工业技术与公共管理主導型行业、资源主导型行业就业都比较差,这类地区包括天津市、海南省、西藏自治区、青海省、宁夏回族自治区。这说明这些地区的经济发展情况还不是很好,行业岗位和人才需求都比较少,各行业发展机会较少。而天津市属于特例。在因子分析的综合得很表中可以看出,天津市的服务与文娱主导型行业就业情况较好。本文推断天津市邻近北京市,政府和市场对人才吸引力不够,大部分人选择去北京工作,导致人才外流。

(2)第二类地区服务与文娱主导型行业、工业技术与公共管理主导型行业、资源主导型行业就业都比较差,这类地区包括内蒙古自治区、辽宁省、吉林省、安徽省、福建省、江西省、湖北省、湖南省、广西壮族自治区、重庆市、贵州省、云南省、陕西省、甘肃省、新疆维吾尔自治区。这类省市主要在内陆或者高纬度地区,经济发展没有很好的自然资源先天优势,且没有较为便利的交通枢纽。比起其他发达地区,成长起步较晚,因而各行业就业人数相对较少。

(3)第三类地区服务与文娱主导型行业、工业技术与公共管理主导型行业就业较差,资源主导型行业就业最好,这类地区包括山西省、黑龙江省。这些地区是资源密集型地区,黑龙江省矿产资源、能源丰富,山西煤炭资源和矿产资源丰富。这些先天良好的资源都促使着这类地区发展。

(4)第四类地区服务与文娱主导型行业就业较差,工业技术与公共管理主导型行业、资源主导型行业就业都比较好,这类地区包括河北省、山东省、河南省、四川省。这类地区经济发展较好,但是人口稠密,所以各行业发展差异较大。

(5)第五类地区服务与文娱主导型行业、工业技术与公共管理主导型行业就业较好,资源主导型行业就业较差,这类地区包括江苏省、浙江省、广东省。这类地区主要是南方沿海省,这类省份自然资源基础较差,但市场经济发展良好,第三产业发展较好,经济发展水平较高。

(6)第六类地区服务与文娱主导型行业、资源主导型行业就业较好,工业技术与公共管理主导型行业就业较差,这类地区包括北京市、上海市。这类城市属于中国经济发展水平最高的城市,地方寸土寸金,主要以发展因地制宜发展和第三产业发展为主。

五、结论

本文以国家统计局2018年发布的各行业就业人数为样本,首先对所有行业进行了主导功能因子提取,然后对样本进行聚类分析。本文得出了以下结论:

中国各省之间的就业状况差距很大。从分析中我们可以看出第一类和第二类的就业情况不是很好,而第五类和第六类的就业情况良好,地区之间差距较大。各省市要发掘优势行业,优化产业结构,创造本省就业优势。

政策对就业的发展有较大的影响。通过分析我们得知,就业较好的地区主要为东南沿海城市和一些直辖市。受改革开放和对外经济开放的影响,这类地区具有一定的政策先天优势。人们的发展观念意识在政策指导下开放,新兴产业和经济发展犹如雨后春笋。

人口基数对就业有很大的影响。从分析中我们可以看出,第四类地区各行业发展是不平衡的。人口大省应该利用人口优势,培养优秀人才,提高劳动者素质和技能。平衡发展各项行业,促进服务类新兴产业发展,推动时代发展。

引进人才是作为大部分省市的行业就业措施。像第一类和第二类地区,在本身没有太多先天优势的情况下,要善于利用人力资源,引进优秀人才促进本省市发展。

参考文献:

[1]王淑芬主编.应用统计学[M].北京大学出版社:北京,2017:290.

[2]郭璇碹.区域创新效率影响因素实证研究[J].商业经济研究,2015(10).

[3]张艺,余开朝.基于因子分析的各省主要行业就业情况评价分析[J].价值工程,2017,36(32):13-15.

天津外国语大学求索荣誉学院

猜你喜欢
聚类分析因子分析
基于聚类分析研究贵州省各地区经济发展综合评价
商情(2016年39期)2016-11-21 08:45:54
新媒体用户行为模式分析
农村居民家庭人均生活消费支出分析
大经贸(2016年9期)2016-11-16 16:16:46
基于因子分析法的二胎概念股投资价值分析
中国市场(2016年38期)2016-11-15 23:35:01
基于主导产业视角的战略性新兴产业识别以及实证研究
企业导报(2016年20期)2016-11-05 18:54:42
基于省会城市经济发展程度的实证分析
中国市场(2016年33期)2016-10-18 12:16:58
山东省县域经济发展评价研究
商(2016年27期)2016-10-17 07:17:42
实证分析会计信息对股价的影响
商(2016年27期)2016-10-17 05:39:59
基于聚类分析的互联网广告投放研究
科技视界(2016年20期)2016-09-29 12:32:48
“县级供电企业生产经营统计一套”表辅助决策模式研究
企业导报(2016年9期)2016-05-26 21:08:14