蔡晗昀、王冠生、郭丽莉
(国家统计局上海调查总队,上海 200003)
基于聚类分析的企业人才结构与经济效益研究——以非公有制企业为例
蔡晗昀、王冠生、郭丽莉
(国家统计局上海调查总队,上海200003)
当前,构建合理的人才结构已成为实现产业结构调整战略的重要课题。在经济新常态的大背景下,研究企业人才结构与企业经营发展各维度的关系,对于揭示人才效应、促进人才引进、优化产业布局有着重要的意义。本文以非公有制企业为例,运用创新性的统计量化分析方法进行描述和研究,挖掘人才结构与企业经营情况之间隐藏的数据关系,运用聚类分析探索为不同产业带来高贡献率的人才结构特征,并开展比较分析。
人力资本结构;企业经济效益;非公有制企业
近年来,非公有制经济发展迅速,在国民经济发展中的作用越来越突出。至2015年底,上海市非公有制经济增加值12919.43亿元,占全市生产总值的51.8%。非公有制领域从业人员855.39万人,其中人才353.67万人,成为推动经济社会发展的重要力量。
对于非公有制企业而言,缺乏公有制企业在资金、技术、垄断等方面的先天优势,人才在推动企业发展、技术创新、管理创新的积极作用更为明显。在经济新常态的大背景下,研究非公企业人力资本结构与企业经营发展各维度的关系,探索不同产业中人力资本结构对企业效益的影响,对于进一步揭示人才效应、促进人才引进、优化产业布局有着重要的意义。
国内外学者对人力资本结构进行过大量的研究,主要集中在三方面:一是人力资本结构与经济增长、经济转型的关系研究。二是某产业或上市企业的人力资本结构与产业/企业发展关系研究。三是企业人力资本配置研究。
从众多学者的研究内容可以看出,对人力资本结构与企业发展的探索或集中在某几个因素的研究上、缺乏综合考虑,或以定性分析为主、缺少统计模型的有力支撑,尤其是专门研究企业人力资本结构与经济效益的定量分析几乎没有。
针对上述问题,本文采用2013年上海市第三次经济普查数据及2013年上海市非公人才抽样调查数据对非公企业的人才结构运用创新性的统计量化分析方法进行描述和研究,挖掘人才结构与企业经营情况之间隐藏的数据关系。通过聚类分析探索为不同产业带来高贡献率的人才结构特征,并开展比较分析。
本文采用的原始记录数据是2013年上海市第三次经济普查中“非四上”非公企业数据(以下简称“三经普数据”)及2013年上海市非公人才抽样调查数据(以下简称“非公人才数据”)。
将三经普数据与非公人才数据通过企业的组织机构代码进行匹配,并清理不属于研究范围的记录之后,得到建模的基础数据库,共计2845条企业记录。涵盖非公有制“非四上”企业的经营情况和人才结构约360个维度的变量。
(一)预处理
为聚焦研究对象,将一部分需要重点研究的行业单独列出,如C制造业、I信息传输、软件和信息技术服务业、J金融业和K房地产业等;而将其他具有共性的行业门类进行归类,如将E建筑业,G交通运输、仓储和邮政业,L租赁和商务服务业和M科学研究和技术服务业归类为生产性服务业,将F批发和零售业,H住宿和餐饮业,O居民服务、修理和其他服务业,P教育,Q卫生和社会工作和R文化、体育和娱乐业归类为生活性服务业,将A农、林、牧、渔业,D电力、热力、燃气及水生产和供应业和N水利、环境和公共设施管理业归类为其他行业等。重新归类后行业分布情况如表1。
表1 重新归类行业分布表
(二)变量选择与降维
本文采取的变量筛选与降维方法主要分为三个方面:一是从人才调查专业经验的角度对变量进行筛选,关注变量对于企业经营情况和人才结构特征的解释能力,剔除了对研究目的帮助不大的变量。二是从精简变量的角度考虑,剔除了部分包含信息有一定重复的字段和过于细分的字段。三是对初步筛选后的企业经营情况变量和人才结构变量分别进行因子分析,通过将相同本质的变量归入一个因子的方法减少变量的数目,并检验变量间关系的假设。
1.企业经营情况评价。首先需要建立起统一的企业经营情况评价体系。经过初步筛选和精简后,获得了反映企业经营状况的基础变量:资产总计、营业收入、营业利润、和从业人员期末人数共四个变量。由于上述变量均为绝对量指标,难以反映企业真实的盈利能力和效益水平,需通过计算一系列相对指标来缩小企业规模的影响,并得到如下几类评价指标(表2)。
表2 企业经营情况评价指标
考虑到行业特征的差异,因子分析采取分行业的方式进行。此处以制造业“非四上”非公企业数据为例,运用SPSS version22软件,采取主成分法的因子分析结果如下:
(1)特征值和累积贡献率。当选到第4个因子时,累积贡献率达到75.19%,即选取4个即可解释原始变量的75.19%的信息,一定程度上达到了降维的效果。
(2)共同度。9个变量中有6个提取了80%以上的信息,包括营业收入、营业利润、从业人员期末人数、人均营业收入、总资产报酬率和总资产使用率等。
(3)旋转后载荷矩阵。由于原始载荷矩阵因子意义不十分明显,因此采用方差最大正交旋转,以达到每个因子具有明确的含义。旋转后的因子载荷矩阵见表3。
表3 旋转之后的因子载荷矩阵
(4)进一步精简变量并进行因子分析。考虑到4个因子对后续分析研究仍然维度过多,需进一步精简变量,将评价维度聚焦在对企业发展规模和盈利能力两个关键方面。经过多次筛选和调整变量、进行因子分析、观察因子提取结果之后,将企业经营情况的评价指标精简为如下几个变量:
表4 精简后的企业经营情况的评价指标
仍以制造业“非四上”非公企业数据为例,对精简后的五个变量采取主成分法的因子分析,并采用方差最大正交旋转,旋转后的因子载荷矩阵如下:
表5 旋转之后的因子载荷矩阵
从表5中可见,因子1在从业人数(cyrs)、营业收入(yysr)上的载荷均在0.9左右,在资产总计(zczj)上的载荷接近0.6,可以将因子1定义为“企业规模因子”;因子2在总资产报酬率(zzcbcl)和营业利润率(yylrl)上的载荷均在0.7左右,可以将因子2定义为“企业效益因子”。
因子分析的结果较为符合一般经验判断的结果,也能够简洁清晰地描述企业经营的总体状况。经过对各行业分别进行因子分析后发现,“企业规模因子”和“企业效益因子”均能够得到适用。
2.人才结构评价。对于企业中的人才结构,同样需要建立起综合评价体系,充分反映各类人才的情况。由于人才结构数据维度较高,在经过初步筛选和精简后,仍然有多达29个变量,过多的变量、过细的分类不利于对提取出的因子进行解释,因此需要进一步对变量进行精简,主要采取两种方法。一是将过于细分的人才合并归类;二是删减过多的分类类别。最后得到如下几类评价指标。
表6 调整后的人才结构指标
因子分析仍然采取分行业的方式进行。以制造业“非四上”非公企业数据为例,采取主成分法的因子分析结果如下:
(1)特征值和累积贡献率。当选到第3个因子时,累积贡献率达到84.95%,即选取3个即可解释原始变量的84.95%的信息,达到降维的效果。
(2)共同度。14个变量中有11个提取了80%以上的信息,包括劳务派遣人员、中共党员、使用的外省市劳动力、使用的国(境)外劳动力、技能人员、高学历、低学历、较高年龄、中等年龄和较低年龄等。
(3)旋转后载荷矩阵。采用方差最大正交旋转,旋转后的因子载荷矩阵见表7。
表7 旋转之后的因子载荷矩阵
从表7中可见,因子1在较低年龄(nl_d)、中等年龄(nl_z)、学历低(xl_d)、劳务派遣(w04)、外省市人员(d05)、技能人员(d14)上的载荷均在0.8以上,可以将因子1定义为“较初级人才因子”;因子2在学历高(xl_g)、经营管理人员(d07)、国(境)外人员(d06)、党员(n04)上的载荷均在0.8以上,在专业技术人员(d08)上的载荷在0.6以上,可以将因子2定义为“较高端管理型人才因子”;因子3在较高年龄(nl_g)、管理岗位上的专业技术人员(d09)上的载荷均在0.8以上,在高级技能人员(d14g)上的载荷在0.6以上,可以将因子3定义为“较高端技术型人才因子”。
即对制造业“非四上”非公企业而言,人才结构特征可以通过“较初级人才因子”、“较高端管理型人才因子”、“较高端技术型人才因子”三项因子加以描述。
(4)各行业人才结构因子分析比较。与企业经营情况评价因子对各行业普遍适用不同,行业间人才结构差异较为明显,提取的因子数量、结构均有所不同,较难使用一套完全一致的评价体系。为了充分反映每个行业的人才结构的特征,本文对每个行业的人才结构使用其自身适用的评价标准。各行业人才结构因子见表8。
表8 各行业人才结构因子
从上表可见,各行业提取的人才结构因子基本符合行业的特征,如信息传输、软件和信息技术服务业中的“专业技术型人才因子”、金融业中的“较高端中青年人才因子”、生活性服务业中的“高技能青年人才因子”等,均在一定程度上反映出该行业与其他行业人才结构的差异之处。值得一提的是房地产业的人才结构因子提取结果不甚理想,因子1涵盖了大部分的人才结构指标,因此定义为“综合人才因子”。考虑到房地产业是高度资本密集的行业,人才的影响因素相对较小,可能因此导致人才结构未能体现出明显的特征。
(一)建模准备
为了更简明清晰地描述企业经营情况和人才结构特征,避免评价层次过多造成标准混乱,统一将企业经营情况评价因子和人才结构评价因子处理为二分变量,即因子较低的一半赋值为1,较高的一半赋值为2。例如“企业规模因子”数值较低的一半即代表“规模小”,较高的一半即代表“规模大”;“企业效益因子”数值较低的一半即代表“效益小”,较高的一半即代表“效益大”。同理对人才结构评价因子进行处理。
(二)聚类分析
从研究目的来考虑,本文或者期望能够将具有相似经营情况的企业分别聚类,以便观察相应的人才结构;或者期望能够将具有相似人才结构的企业分别聚类,以便观察相应的企业经营情况。依然以制造业“非四上”非公企业数据为例,由于企业经营情况评价有2个评价因子,各有2个评价层次,因此可以聚为4类;而人才结构评价有3个评价因子,各有2个评价层次,因此可以聚为8类。综合考虑,合理的丛集个数应当在4-8个之间。
综合K取值为4-8的全部聚类结果来看,每个K均能反映4类经营情况的企业及对应的人才结构。但是当K值偏小时,可能存在部分企业特征被掩盖。当K取值变大时,能够对被掩盖的人才结构特征进行进一步细分。但是也并非K取值越大越好,由于本文的研究目的更关注能够为企业带来高贡献率的人才结构,即企业效益因子取值2时对应的人才结构,而对于规模小效益小的企业的人才结构进行过度的细分并没有太大意义。综合考虑,K=5的聚类结果最为合理。
表9 K=5的最终丛集中心
对于K等于5的聚类结果,5个丛集中心的企业经营情况因子能够充分反映4类经营情况的企业。从人才结构因子来看,5个丛集均具有显著特征。相比K=4,K取值5后,有相当数量的观测值从规模大效益大的企业丛集中被分离出来,可见K=4时有一部分企业未能得到合理分类。而当K取值6及以上时,可以发现得到进一步细分的主要是规模小效益小的企业,而这对于本文的研究目的没有明显帮助,而效益好的两类企业基本较为稳定,因此认为K=5是较为合理的聚类丛集取值。
(三)各行业聚类结果比较
依照同样的方法对各行业进行聚类后,可以得出每个行业的分析结果(限于篇幅,此处仅举例说明,原文备索)。
(1)对于制造业“非四上”非公企业而言,K=5的聚类结果最为合理。规模大效益也大的企业主要是三类人才因子水平都较高的企业;规模小而效益大的企业可能主要是较高端技术型人才因子水平较高的企业,较初级人才和较高端管理型人才的作用较少;规模大而效益小的企业可能正好相反,较初级人才和较高端管理型人才因子水平较高,而较高端技术型人才作用较少。
表10 制造业较合理的聚类丛集(K=5)
(2)对于信息传输、软件和信息技术服务业“非四上”非公企业而言,K=4的聚类结果最为合理。规模大效益也大的企业,主要是较初级技能型人才因子水平较高的企业,其他人才作用相对较少;规模小而效益大的企业,主要是较初级技能型人才和专业技术性人才因子水平较高的企业,或有部分其他人才因素的企业,较高端管理型人才的作用相对较少;规模大而效益小的企业,主要是较高端管理型人才和专业技术型人才因子水平较高的企业,较初级技能型人才作用较少。
表11 信息技术服务业较合理的聚类丛集(K=4)
(四)模型的不足
模型建立的企业数据来自第三次经济普查和非公人才调查数据,两类数据源各有局限性:首先是第三次经济普查数据中可得的企业规模和效益指标只包括“非四上”企业,缺乏传统统计意义上关注更多的“四上”企业,导致模型结果更适用于较小规模企业;其次是非公人才调查数据仅包括非公有制领域企业和民办非企业单位,缺乏占上海经济总量半数以上的国有和集体企业;第三是两项调查结果的交叉仅涵盖非公有制“非四上”企业的经济效益和人才数据,无法反映人才和企业经济效益的整体关系。
(一)人才结构差异与经济效益差异间具有较明显的关系。聚类分析的主要结果显示,人才结构对经济效益具有较明显的作用。同一行业内、同等规模的非公企业,人才结构配置的不同,企业的经济效益也会在一定程度上产生高低差异。具备行业人才要求的企业,其经济效益也有明显优势。
(二)行业间人才结构差异明显,对不同行业的产生高贡献度的人才结构也不同。从规模小效益高的非公有制企业聚类结果看,制造业企业受益于较高端技术型人才,信息技术服务业受益于较初级技能型人才和专业技术性人才,金融业企业受益于国境外人才。服务业企业的高贡献度人才与具体行业相关,其中劳务派遣人才、高技能青年人才、技术型人才和国(境)外人才的贡献度较高。
(三)为实现高效益,不同行业的人才结构调整策略不同。具体来看,制造业企业应尽量提高较高端技术型人才比重;信息传输、软件和信息技术服务业企业应提高专业技术型人才和较初级技能型人才比重;金融业企业应提高较初级技能型人才和国(境)外人才比重;房地产业企业应提高投资规模,减少高端人才的成本支出;生产性服务业企业应提高较高端管理型人才和低成本劳务派遣人员的比重;生活性服务业企业应提高高技能青年人才比重,其他行业企业应提高较初级人才比重,降低总用工成本。
(四)中小型非公企业的人才配置不应一味追求高端。由于企业性质和发展阶段的不同,中小型非公企业的人才结构配置应避免错位。具体而言,信息技术服务业企业应避免过多重视较高端管理型人才,金融业企业应避免过多重视较高端中青年人才,生产性服务业不应追求国(境)外人才比重,房地产业企业应减少高端人才的成本支出。
(责任编辑:曹家乐)