黄冰洁, 张同斌
(东北财经大学 经济学院,辽宁 大连 116025)
自2010年开始,中国制造业在世界中的占比超过美国,产出规模位居世界首位并一直持续至今。然而,中国制造业由于缺乏核心竞争力导致其增加值率和绩效水平偏低的状况仍然十分突出。除了整体绩效水平偏低之外,中国制造业内部企业绩效分化的特征也十分明显。据测算,2013年中国制造业企业总资产报酬率中位数为8.46%,而25%分位数和75%分位数分别为2.99%和22.73%。在当前中国经济增速减缓、制造业的全面开放和供给侧结构性改革的不断深化的背景下,部分制造业企业绩效水平呈现“断崖式”下跌,一些制造企业绩效则呈现“稳中有升”,企业之间绩效水平的差异或分布的离散程度会进一步扩大。
现有文献对于企业绩效的研究已经较为全面,但是关于绩效分化或绩效异质性问题的分析较少,本文通过整理可将企业绩效分化的影响因素分为三类:第一类是创新因素,Chun等、郑伟华指出企业绩效的增长主要是依靠技术驱动,强化创造性破坏和信息技术的应用会引致企业绩效出现更大幅度的波动[1,2];第二类是企业的业务类型或商业模式,Houthoofd等研究发现业务范围或领域的差异是企业间绩效分化的主要原因[3],这一因素可以解释绩效分化的6.8%~9.7%,Storbacka和Nenonen、程虹等指出投资模式、盈利模式、企业与消费者的关系等是企业绩效异质性产生的主要原因[4,5];第三类是单位效应,与第二类因素不同,Chaddad和Mondelli认为与发展模式和行业特征相比,个体特征特别是企业规模、研发强度、资本强度等在解释企业绩效差异方面更有效[6]。
绩效影响因素研究中需要考虑的调节变量太多[7],如果在传统计量模型中加入过多的变量,不仅会产生高度的多重共线性问题,而且估计系数的增多也降低了统计检验的精确度,这使得模型预测精度和解释力度均有欠缺[8]。如何在高维度和多特征中选择重要的变量以分析制造业企业绩效分化背后的内在原因,大数据分析和机器学习方法的进展提供了新的梳理方法和有效的分析工具[9]。在部分外文文献中,已经出现了运用大数据与机器学习方法对企业绩效或绩效分化影响因素的相关研究。Song等采用支持向量机系列方法检验了财务比率指标在企业绩效预测中的效果,研究发现不同行业的预测结果存在显著差别[10];Jin等采用机器学习方法分析了知识源的广度和深度与企业创新绩效的多维度和非线性关系,认为知识源广度和深度的二元平衡可大幅提高创新绩效[11]。
本文基于前沿的大数据与机器学习方法,不再关注于单一变量对制造业企业绩效分化的影响,而是采用LASSO和岭回归方法,从多变量和大数据出发,遴选出影响制造业企业绩效分化的关键因素,并对其重要性进行排序。岭回归和LASSO方法弥补了传统方法在高维数据中估计量稳定性较差且不一致的缺陷,并且能够处理高度共线性数据、降低模型异方差和缓解过拟合问题等。随后,构建贝叶斯网络,确定关键因素与绩效分化之间的传导路径,实现对制造业企业绩效分化及影响因素之间因果关系链的图解和推理。通过明确制造业绩效分化的驱动因素、厘清各因素对绩效分化的传导渠道,不仅直接有助于实现制造业行业整体和企业内部资源的优化配置,定向、精准增强制造业企业的竞争优势,而且间接有利于维持宏观经济的稳定,以及培育中国经济增长的新优势和新动能。
以简单的线性模型为例,如式(1)所示。
Yi=β0+β1x1i+…+βpxpi+ui
(1)
其中,Yi为中国制造业企业的绩效分化变量,Xi为绩效分化的影响因素变量,p为自变量个数,i为个体的标识(i=1,2,…,N),β为待估参数,ui为随机扰动项。
在机器学习中通过正则化即在残差平方和(RSS)最小化的过程中加入新的一项即收缩惩罚项,其中包含调优参数λ(λ≥0)和规范化的系数估计值两部分。在不同的机器学习方法中规范化方法却不尽相同,具体而言:
在岭回归中,规范化项是所有系数的平方和,其目标函数如式(2)所示。
(2)
与岭回归不同,LASSO方法中规范化项是所有系数绝对值之和,即:
(3)
本文采用两种方法共同筛选出对目标变量重要性程度较大的变量集合,既考虑了岭回归方法在高维环境下估计稳健性的优点,又包含了LASSO方法使得估计参数具有稀疏的性质,从而达到良好的筛选效果,提高了变量的解释能力。但其存在的一个典型缺点是放弃了参数估计量的无偏性,是降低估计精度的有偏估计方法。为更加清晰地描述制造业企业绩效分化影响因素的传导路径,本文进一步采用贝叶斯网络这一图形模型,对各变量影响绩效分化的网络特征和传导路径进行识别,研究方法也成为了岭回归+LASSO+贝叶斯网络的组合模型。
贝叶斯网络方法的基本思想是根据一组随机变量之间的概率依赖关系建立一个有向无环图,节点和有向弧是网络的两类主要构成元素,记有向无环图为G=(V,A),V是网络中的节点,A为连接节点之间的有向弧。其中,网络中的每个节点均与一个变量相关联,连接各节点的弧代表直接概率依赖关系,位于有向弧尾部的节点是父节点,而处于有向弧头部的节点为子节点。
本文参考Heckerman等、Tsamardinos等的方法构建贝叶斯网络[12,13]。假定中国制造业企业绩效分化的影响因素变量及绩效分化变量组成变量集X={X1,X2,…,Xp,Xp+1},其中,Y记为Xp+1。在贝叶斯网络的建立过程中,模型选择和参数估计分别称为结构学习、参数学习。假定基于一个数据集D构建贝叶斯网络B,B=(G,X)。设变量集合X全局分布的参数为Θ,贝叶斯网络学习的定义如式(4)所示。
(4)
贝叶斯网络的结构学习算法可以分为基于约束的、基于分数的和混合算法三类。本文采用基于分数的算法,其基本思想是为每个候选的贝叶斯网络计算一个反映其拟合优度的网络得分如贝叶斯信息准则(Bayesian Information Criterion,BIC),从一个没有弧的网络结构出发进行空间搜索,每次添加、删除或反转一个弧,直到得分无法提高时终止。BIC是可分解的且只依赖于似然函数,其值越大表示结构学习越充分,计算公式如式(5)所示。
(5)
其中,ΠXk是Xk的父节点集合,ΘXk为与Xk对应的参数集,N为样本数量。
在进行贝叶斯网络的结构学习之后,就可以进行参数学习,采用极大似然估计等方法估计X全局分布的参数Θ。建立贝叶斯网络之后可以分析变量之间的传导路径以及紧密程度,变量之间依赖关系的强度或紧密程度通过计算弧强度值进行表示。弧强度值计算的基本方法为,在一个构建完成的贝叶斯网络中,去除特定的弧,分析网络得分如BIC值的减少量,以测量每条弧对应变量间的依赖关系强度。移出特定弧后,网络得分值下降越大的弧表示子节点与父节点之间的关系越紧密,反之依赖程度较低。贝叶斯网络从数据出发,即避免了主观人为选择的盲目性和局限性,又能够有效地将多元信息进行融合与表达。
本文中选取了中国工业企业数据库2013年制造业企业截面大数据进行分析。在数据处理中,首先按照国家统计局公布的《国民经济行业分类》(GB/T4754-2011)选取制造业行业分类下的所有企业,然后进行数据清洗,最后得到实际有效样本共244418个。
本文绩效指标采用的是总资产报酬率(ROA)指标,其计算方法为:总资产报酬率=(利润总额+利息支出)/平均资产总额×100%。在计算得到每个企业的绩效变量后,再按照《国民经济行业分类》(GB/T4754-2011)中的三位数产业即中类代码求得每个行业的绩效均值,然后中类行业中每个企业的绩效减去该行业的绩效均值即得到绩效分化变量(DROA),即为本文的研究对象。
对于绩效分化的影响因素,本文从企业属性特征、要素结构、成本收益和企业外部环境方面,在兼顾指标完整性和数据可得性的基础上,计算得到了19个变量,如表1所示。
表1 中国制造业企业绩效分化的影响因素变量表
由于行业特征及其所处的外部环境存在差异,本文将制造业划分为三大类行业:原材料工业、装备制造业、消费品工业,分别包含了72068、89409和82941个样本。本文分全部制造业企业、三大类制造业企业四个样本集分别进行绩效分化的关键影响因素筛选,以及主要影响因素对绩效分化影响的传导路径分析。
为便于系数之间的对比和排序,本文将除虚拟变量之外的其他变量均进行标准化处理,然后采用岭回归和LASSO方法进行了重要性排序。进一步选取了整体制造业中最重要的12个变量及其对绩效分化的影响系数值进行深入分析,如表2所示。需要说明的是,岭回归和LASSO方法的计算结果中仅报告系数值,不进行统计推断,因此不包含统计值和概率值等。
根据表2中的结果可得,中国制造业企业绩效分化的最重要影响因素为资本生产率(KP),经计算得到该变量对绩效分化的影响系数值明显大于其他变量的影响系数。这在一定程度上表明,制造业整体上还遵循“资本效率驱动型”的绩效增长模式,资本要素的单位产出能力决定了制造业企业绩效高于行业平均绩效的幅度。进一步地,对比表2中劳动生产率变量(LP)对制造企业绩效分化的影响程度,表明相对于劳动力要素或其他要素和资本要素对于中国制造业而言还是相对重要的,资本的边际收益仍处于上升阶段,资本作用效率的增进将有效提升制造业企业的绩效水平。在资本劳动比(KLr)对制造业企业绩效分化具有负向影响,重要程度位于策略。资本劳动比是资本密集程度的代表变量,其影响系数为负说明,相对于资本的数量而言,资本的利用效率对于制造业企业绩效分化的影响更为突出。在资本要素对中国制造业绩效的两种驱动力即投入增长和效率改善中,更应注重资本使用效率的提高。
表2 中国制造业绩效分化影响因素的重要性排序结果
除了资本生产率之外,杠杆率(LR)、资产有形性(PFA)在重要性排序中位于第2位和第3位,对于中国制造业绩效分化的影响程度也很高。其中,杠杆率为制造业企业总资产中负债的比例,即可用于衡量企业运用债务资本进行生产经营的能力,又可表示企业的运营风险。由于其对绩效分化的影响系数为负值,表明高杠杆率导致的风险上升损失超过了债务资本运营的收益,将对制造业企业绩效产生不利影响。资产有形性即固定资产在总资产中所占的比重,代表了企业生产条件和设备质量,固定资产占比越高的企业,其生产能力越强,能够抵御外在冲击进而实现企业绩效的稳定增长。
出口变量(Export)和出口强度(ES)对于中国制造业企业绩效分化呈现出相反的影响效果。其中,出口变量的影响系数为正,表示可以通过多种途径实现对制造业企业绩效的推动,例如通过出口连接国外市场拓宽了企业的发展机会和资源空间,以解决国内市场需求不足和要素配置扭曲等问题。然而,当出口强度较高时,即出口交货值占工业销售产值的比重上升时,国外市场需求将超过内需,成为制造业企业绩效的牵制因素,大宗商品价格、汇率冲击不仅会引发企业销售波动,而且会增大企业绩效的不确定性。
与出口强度变量的作用效果类似,补贴变量(Subsidy)对制造业企业的绩效分化也产生了负向影响,一种可能的解释是接受政府补贴的制造业企业往往具有“自选择效应”,即一些绩效低于行业平均水平或者处于初创期未实现充分盈利的企业倾向于获得或接受政府补贴。此外,这一结果的出现,也可能是接受补贴的企业易于形成对政府的依赖,进而未能实现资源的优化配置或出现了资源冗余导致的。
在外部环境变量中,除了出口和补贴之外,市场势力(Power)对于企业绩效分化也具有重要影响。表2中岭回归和LASSO方法的计算结果显示,市场势力对制造业企业绩效分化的影响分别位于第7位和第6位。根据经济学原理可知,市场势力越大的企业,其控制或支配市场价格的能力就越强,因而能以更高的价格进行其产品的销售,以实现更多的成本加成、获取超额利润,进而可以直接推动其绩效的提升,促使其绩效高于行业平均水平。在变量重要性排序结果中,与市场势力高度相关的企业规模变量(Scale)紧随其后。对于规模越大的制造业企业而言,其更容易实现规模经济,在规模经济或规模报酬递增形成的过程中,企业的长期平均成本会呈现下降的趋势,成本下降将对其绩效提升起到直接推动作用。
与表2中整体制造业的排序结果类似,本文根据岭回归和LASSO方法的排序结果,选取了原材料工业、装备制造业、消费品工业绩效分化中最重要的12个影响因素,列于表3。
对比表3和表2可得,原材料工业、装备制造业、消费品工业中企业绩效分化影响因素的重要性排序结果与整体制造业的排序结果具有高度的相似性,同时也存在一些变量的排序发生明显变动的情形,体现出了不同类型制造行业内企业绩效分化影响因素的异质性特征。
对于原材料工业而言,企业绩效分化影响因素中杠杆率(LR)排在第5位,低于整体制造业中杠杆率第2位的排序,这表明对于该行业而言,通过借债筹资进行生产运营的风险相对较低,对于绩效分化的影响较小。劳动收入份额(SLI)、营销成本(MC)成为了影响原材料工业中企业绩效分化的重要因素,这是该行业产品生产中的要素结构和市场特征所决定的。原材料工业主要对采掘产品进行加工制造,其中间投入较多,相对而言资本密集型特征并不十分突出,劳动力的成本即工资在增加值中占比较高。并且,由于原材料行业处于整个制造业的上游生产环节,其产品在流向中下游的过程中,必须进行一定的营销支出以新建、扩展营销渠道或打破销售壁垒,实现产业的市场价值以提升企业绩效。
与原材料工业明显不同,如表3所示,在装备制造业企业绩效分化的影响因素重要性排序表中,资金成本(FC)和资产流动性(PLA)分别位于第3位和第4位。规模大、资本密集是装备制造业企业的典型特征,其在生产过程中对资本的依赖程度很高,融资对于装备制造业企业规模优势的形成进而对其绩效增进有着至关重要的作用。因此,在生产类型和生产规模的影响下,装备制造业企业产品的成本结构中资金成本占据了相当比例。在装备制造业中“融资难、贷款贵”还通过信号传递功能导致“信贷歧视”现象的出现,进一步制约企业的发展并成为企业绩效提升的“瓶颈”。
消费品工业大多是制造食品、纺织品等生活资料的民生行业,处于产业链的下游、离最终需求最近。由于其具有规模小、进入门槛低的特征,导致消费品生产市场上企业数量众多、竞争程度高,企业的成本加成率和利润率低,因此政府需要对经营困难的消费品生产企业进行补贴,以保证民生类产品的市场供给,接受政府补贴在一定程度上也成为了体现消费品生产企业经营状况的指示器。表3中的结果显示,补贴变量(Subsidy)与绩效分化之间呈现负向影响关系,且居于绩效分化影响因素列表中的第3位。另一方面,由于消费品工业企业的利润率低,如果流动资产占比高不仅说明原材料和半成品等存货积压严重,而且表明资产的盈利性低,进而将拉低其绩效水平。在表3中,岭回归方法、LASSO方法计算得到流动比率(CR)对绩效分化的影响系数均为-0.016,分别排在重要影响因素的第9位和第10位。
本文根据表2岭回归和LASSO方法的排序结果中重合的变量,进一步构建了中国制造业绩效分化及其主要影响因素的贝叶斯网络,如图1所示。
基于图1,本文列出了各变量对绩效分化影响距离最近的传导路径即最短传导路径,包括直接传导路径与两阶段间接传导路径,列于表4。需要说明的是,表4中的弧强度即为在贝叶斯网络中去除对应的弧即传导路径后,网络得分值的减少量,其绝对值越大表示子节点对父节点的依赖关系越强。
表4 中国制造业绩效分化影响因素的传导路径及弧强度
根据表4可得,资本生产率(KP)等6个因素与制造业企业绩效分化(DROA)之间存在直接传导路径,其中,制造业企业绩效分化对资本生产率(KP)具有高度的依赖性,这再一次验证了资本生产率在中国制造业企业绩效分化中的首要地位和决定性作用。由杠杆率、资产有形性至绩效分化的直接路径,即“LR→DROA”、“PFA→DROA”的弧强度绝对值也较大,与LR和PFA在变量重要性排序表2中第2位和第3位的排序是一致的,维持适度的资产负债率、提高资产构成中固定资产的比重将对制造业企业绩效提升发挥重要作用。与上述因素相比,出口(Export)、企业规模(Scale)和劳动生产率(LP)对制造业企业绩效分化的直接传导效应明显偏低,与资本生产率对绩效分化的传导效应形成了鲜明对照。
资本劳动比(KLr)和补贴变量(Subsidy)对制造业企业绩效分化具有间接传导效应,其中资本劳动比以出口为中介与绩效分化实现连接,其传导路径为“KLr→Export→DROA”。资本劳动比代表的要素结构是制造业企业中基本的生产要素配置,是由生产技术所决定的。中国制造业企业根据自身的要素禀赋和要素结构等比较优势参与全球价值链及国际分工,因而成为了出口的动因之一,但要素结构通过出口对制造业企业绩效分化的间接传导效应十分有限,KLr→Export的弧强度绝对值仅为1.77。不同于资本劳动比,补贴既可以通过出口,又可以通过杠杆率实现对制造业企业绩效分化的传导,即 “Subsidy→Export→DROA”和“Subsidy→LR→DROA”,且对比表4中补贴变量、资本劳动比对绩效分化的传导路径可知,补贴的间接传导路径更多、传导效应更大,这与表2制造业绩效分化影响因素重要性排序中补贴变量的重要性高于资本劳动比的结果是相符合的。
本文采用原材料工业、装备制造业、消费品工业岭回归和LASSO方法排序结果中重合的变量,构建了三类行业绩效分化及其重要影响因素的贝叶斯网络,表5呈现出分行业绩效分化影响因素的传导路径和弧强度。
表5 分行业绩效分化影响因素的传导路径和弧强度
对原材料工业而言,其企业绩效分化直接依赖于资本生产率(KP)、资产有形性(PFA)和杠杆率(LR),资本生产率对绩效分化的直接传导效应最大,弧强度绝对值高达16939.75,而杠杆率对绩效分化的传导路径“LR→DROA”的弧强度绝对值仅为4.65,验证了表3中杠杆率在原材料工业绩效分化影响因素重要性排序中地位相对较低的结果。资产负债率对于原材料工业企业绩效的影响虽然较为直接,但是程度较低,这与原材料工业中企业生产经营的风险低有关。由于原材料工业是联系采掘业与制造业的纽带,处于工业产业链的上游环节,易于形成垄断竞争市场特征,行业发展的稳定性强。以资本生产率、资产有形性和杠杆率为中间节点,企业规模(Scale)能够对原材料工业企业绩效分化产生间接影响。由于企业规模是经营稳健性和抗风险能力的代理变量,因而也确认了原材料工业企业的规模特征在维持其绩效稳定中的重要作用。
装备制造业范围广、门类多、产品杂,是制造业的核心部分。根据表5计算可得,存在7条从资本生产率等变量到企业绩效分化变量的直接传导路径,其中“KP→DROA”、“LR→DROA”和“PLA→DROA”三条路径的传导效应较大。装备制造业中机器设备投资额高、企业生产过程复杂,对资本要素的需求量大、效率要求高,使得资本生产率、杠杆率和资产流动性成为了影响装备制造业的直接、重要影响因素。在广泛引入资本的同时,更加注重吸收先进技术和设备维修改造,实现资本使用效率增进和资本结构优化的装备制造业企业,其绩效水平越会高于同行业企业平均水平。出口强度(ES)和市场势力(Power)对装备制造业企业绩效分化产生了相对微弱的直接传导效应,出口强度还作为中介,建立了出口变量(Export)与装备制造业企业绩效分化的联系。与资本生产率、资产负债率和资产流动性等资本特征对比可得,装备制造业绩效的决定因素在于其自身的资本特征,出口和市场势力属于装备制造业企业发展中的外部环境变量,对于装备制造业企业绩效分化的影响路径复杂但作用程度有限。
消费品工业位于工业产业链的下游环节,由于我国工业产业链中存在“上游垄断,下游竞争”的非对称市场结构,消费品竞争市场中生产企业的异质性程度更高。根据表5中的结果可知,各变量对消费品工业企业绩效分化的影响路径中包括6条直接路径和7条间接路径,各因素对企业绩效的影响路径也更为多元化和复杂化。在直接路径中,资本生产率、资产有形性和杠杆率等资本特征变量对消费品工业企业绩效分化的传导效应较大,市场势力、补贴变量和出口变量等外部环境变量的直接影响效应相对较小。在间接路径中,企业规模变量(Scale)和劳动生产率变量(LP)为影响消费品工业绩效分化的两类主要因素,两者在表3消费品工业绩效分化影响因素重要性排序中均位于前10位。特别是企业规模对消费品工业企业的影响是全方位的,仅从企业规模到绩效分化就存在5条间接传导路径,企业规模不仅作用于资本生产率和资产有形性,而且市场势力、补贴变量和出口变量都对企业规模存在一定的依赖性,这进一步表明通过规模扩张形成规模经济是消费品工业企业实现绩效高于行业平均水平的有效途径。
本文基于岭回归和LASSO等机器学习方法,从中国制造业企业特征变量中筛选出影响绩效分化的主要因素并对其重要性进行排序,然后构建贝叶斯网络确定关键因素与绩效分化之间的传导路径,实现对中国制造业企业绩效分化及影响因素之间因果关系链的精确描述,得到主要研究结论为:
中国制造业企业绩效分化的最重要影响因素为资本生产率,其次为杠杆率、资产有形性等资本相关变量。相对于资本的数量而言,资本的利用效率对于制造业企业绩效分化的影响更为突出。这表明,中国制造业整体上遵循“资本效率驱动型”而非“资本数量驱动型”的绩效增长模式。在外部环境相关变量中,出口、补贴和市场势力等对于中国制造业企业绩效分化也具有重要影响。
原材料工业、装备制造业和消费品工业中企业绩效分化影响因素的重要性结果与整体制造业的结果具有高度的相似性,同时也体现了异质性特征。对于原材料工业而言,企业绩效分化影响因素中杠杆率的重要度较低;在装备制造业企业绩效分化的影响因素中资金成本和资产流动性的重要程度很高,这是由其资本密集型的特点所决定的;对于消费品工业企业而言,外部的补贴强度以及能否实现规模经济或范围经济是影响其绩效水平高低的重要因素。
基于本文的研究可得,中国制造业中企业绩效分化的最主要动因是资本生产率,除了进行必要的投资制度改革以解决资本要素配置扭曲问题之外,技术进步是提高资本生产率的关键途径。当前中国制造业发展过程中仍存在着典型的“大而不强”问题,关键技术受制于人的问题没有得到根本解决,应着重在具有传统优势或领先优势的制造业领域加大长期而稳定的基础研究投入,以实现核心技术突破与资本生产率提高。
此外,还应根据不同行业产品的生产模式与市场结构有针对性地制定企业绩效水平提升路径,如增大原材料工业企业中固定资产在总资产中的比重,为装备制造业企业提供优惠贷款缓解其资金压力,促使消费品制造企业联合形成规模优势,都会对企业绩效增进起到促进作用。最后,政府补贴的对象应由绩效差的制造业企业转向具有竞争优势的企业,避免低绩效企业形成对补贴过度依赖的同时,促使落后企业加快退出市场、实现资源的优化配置,提高制造业经济效益和宏观经济增长质量。