研发投入、企业规模与人工智能企业的生产效率
——基于三阶段DEA模型与Tobit模型的二阶段分析

2022-07-23 06:18
财贸研究 2022年5期
关键词:环境因素变量规模

刘 晨 崔 鹏

(1.北京大学,北京 100871;2.中国银行,北京 100818;3.青岛科技大学,山东 青岛 266100)

一、引言和相关文献综述

“人工智能”概念最早起源自1956年的达特茅斯会议,经过互联网、物联网、算力算法技术的前期技术积累,人工智能技术成为当前推动第四次工业革命的关键性通用目的技术。无论是第一次、第二次工业革命的蒸汽机、电气化技术,还是第三次工业革命的互联网技术,作为通用目的技术都具有广泛的应用前景,不仅大幅提升了社会生产力,同时也促进了生产方式和社会运行产生结构性变革。当前,人工智能已经成为引领新一轮经济发展的重要引擎(Furman et al.,2018;Bolton et al.,2018)。

对于我国而言,庞大市场规模实时产生的海量数据、加速迭代形成的人工智能技术和不断丰富的应用环境,为发展人工智能产业奠定了良好基础。2017年7月,国务院发布《新一代人工智能发展规划》,人工智能正式进入战略发展阶段。此后,国家、地方政府先后出台大量人工智能相关政策。在政策红利下,国内一系列人工智能企业快速发展,研发创新活动十分活跃。

在此背景下,部分学者开始针对新一代人工智能企业的绩效评价展开研究。宋子杰等(2018)从单案例分析的角度采用事件分析法分析了科大讯飞2017年股权激励计划的市场效应。覃姗姗等(2017)利用层次分析法(AHP)构建企业智慧专业化评价模型,并对33家上市人工智能企业进行评级和影响因素分析。

对新兴产业的绩效评价依赖于生产效率的测算,但是目前仅有极少数学者进行了相关研究(侯志杰 等,2018)。生产效率的计算方式包括参数法的随机前沿分析(Stochastic Frontier Analysis,SFA)和非参数法的数据包络分析(Data Envelopment Analysis,DEA)。其中,SFA的优势在于有经济理论作为支撑(台航 等,2017),但需建立生产函数;DEA的优势在于可以处理多产出模型(冯伟,2015),无需建立生产函数。DEA最早由Charnes et al.(1978)提出,此后众多学者利用截断回归模型对企业效率的影响因素进行分析,形成DEA-Tobit二阶段模型。

虽然DEA能够有效测算企业生产效率,但是其原始分析结果中不仅没有剔除环境因素的影响,而且随机干扰也会对生产效率造成影响。因此,Fried et al.(2002)提出了三阶段DEA模型,该模型在第一阶段对决策单元的投入产出直接进行生产效率测度;第二阶段利用SFA消除环境因素与随机干扰的影响;第三阶段在控制环境因素与随机干扰一致后,对研究对象的生产效率再次进行比较。三阶段DEA保证了各样本决策单元的环境一致性,在罗登跃(2012)、陈巍巍等(2014)等学者引入我国并进一步推广与发展后,众多学者采用三阶段DEA对生产效率进行分析(杜金岷 等,2016;季凯文 等,2014;蓝虹 等,2014;刘子飞 等,2015;刘满凤 等,2016;刘广斌 等,2017)。同时,也有学者将三阶段DEA与二阶段DEA-Tobit模型进行融合,在进行三阶段DEA方法测算后,采用二阶段Tobit模型测度环境因素对第一阶段测算结果的影响(黄珂 等,2014)。

综上,现有的研究在测度人工智能企业生产效率时没有消除企业自身所处环境的影响,比较企业生产效率时未考虑企业所处客观条件差异。同时,目前对企业生产效率提升路径的相关研究仍然不足。因此,本文沿用黄珂等(2014)的方式,采用三阶段DEA对人工智能企业的生产效率进行研究,在此基础上使用DEA-Tobit二阶段法探讨企业生产效率的提升路径。此类做法的优势在于既能进行排除环境因素后的效率比较,又能通过二阶段回归分析比较影响因素对生产效率的作用大小(童纪新 等,2019)。但不同之处在于,第一,将DEA-Tobit二阶段分析得到的生产效率再次拆分成纯技术效率与规模效率进行回归,分析不同影响因素具体通过何种路径来影响生产效率;第二,将影响企业生产效率的外部环境因素分为企业可控因素和企业不可控因素,在三阶段分析过程中剔除掉企业不可控的环境因素,从而排除回归分析中客观环境因素导致的内生性问题。

二、研究设计与理论假设

本文在设计研究过程中考虑了以下几点:第一,采用DEA测算的企业生产效率为两种生产效率的乘积,一是企业使用既有生产要素所能达到的纯技术效率,二是企业达到最优生产规模时所获得的规模效率;第二,仅仅将所有环境变量在第二阶段剔除将无法直观检测各因素如何影响企业的具体生产效率,即在讨论影响因素的作用时,如果把企业无法改变的外部环境因素纳入多元回归分析缺乏实际价值。

因此,本文采用三阶段DEA与二阶段Tobit同时分析的方式,第一步采用三阶段DEA剔除其他环境因素后分析比较企业的生产效率,并观测人工智能企业处于生产规模报酬的何种阶段。第二步剔除企业无法改变的外部环境因素,将消除环境因素后的人工智能企业生产效率、纯技术效率以及规模效率作为下一步实证研究的因变量,企业可控的影响因素作为自变量,进行生产效率提升路径的研究。

作为高新技术产业的代表,人工智能企业往往被认为是技术密集型企业,较高的研发投入会提高人工智能企业的生产效率。但是,新一代人工智能技术的创新应用尚未成熟,技术创新在基础阶段呈边际报酬递减(刘伟 等,2008)。前人的研究并没有对人工智能企业的该项特征进行实证分析。我们同样认为,企业在相关领域的科技研发投入可能造成大量的沉没成本,导致生产效率随科技投入的增加在最初有所提升,但是此后由于科技攻关的困难性将呈现边际报酬递减。据此,提出第一个假设:

H1

研发投入对生产效率的提高作用呈边际报酬递减。

规模经济是影响企业生产效率的重要途径。Cockburn et al.(2018)认为,人工智能作为通用目的技术必须与产业应用部门融合才能支持产业发展。因此,目前人工智能企业既包括具备核心技术的中小型AI科技企业,也包括利用AI技术转型的传统大型企业。那么人工智能企业的规模大小如何影响企业的生产效率?是企业规模过大引起了规模报酬递减还是企业规模太小可以进一步提高规模效率?研究企业规模对生产效率的影响具有一定的实际意义。据此,本文引入第二个假设:

H2

企业规模的改变会影响企业的规模效率并最终影响企业生产效率。

刘张发等(2017)认为高资产负债率会通过减少可支配现金流的途径增加管理者约束,提高生产效率。然而鉴于国内的实际情况,企业的债务融资以银行贷款为主,对于大企业而言,规模优势和拥有充足的抵押物使其容易获得更多的银行贷款(张璇 等,2017)。负债率的提高表明该企业更受银行“青睐”,可以获得更多资金支持。因此,负债率较高的企业可能忽视要素的集约使用而转向粗放的行为方式,导致纯技术效率下降。为了检验这两种相反效应的作用效果,提出第三个假设:

H3

负债率的提高会通过影响企业的纯技术效率并最终影响企业生产效率。

三、生产效率测度与分析

1.变量说明

由于Wind数据库对“人工智能”概念有着较为明确的界定(侯志杰 等,2018),因而本文选取Wind数据库中属于“人工智能”概念的34家上市公司作为研究对象。企业变量相关数据来源于Wind数据库,其他变量数据来源于历年《国家统计年鉴》。研究的年限为2016—2018年。

(1)投入产出变量

在生产效率的测度上,借鉴大部分研究者的做法选取样本企业当年的固定资产投入和员工人数作为衡量资本与劳动的两大投入变量(季凯文 等,2014;陈海强 等,2015;李宪印 等,2016;崔鹏,2017)。

关于产出变量的选取,本文认为人工智能企业对于人工智能技术的应用不仅体现在将其应用于生产环节从而出售产品获利,同样也会将其应用于日常管理与其他业务的生产经营上,因此本文选取营业总收入作为产出变量。

(2)客观环境变量

在第二阶段的分析中,需要将所有企业的外部环境因素进行剔除从而在第三阶段对生产效率进行分析。根据本文的研究目的,选取了以下三个环境变量:

其一为上市年份。借鉴季凯文等(2014)的研究观点,上市年份会影响企业的生产效率。基于我国证券市场的制度环境,上市企业一般不会面临较大的退市威胁,因此上市年份越久的公司易产生“惰性”,导致对要素投入约束的重视程度不及上市初期。从某种程度上来说,这种上市时间越久生产效率越不断降低的特征是由我国目前的证券市场制度环境所决定,难以受企业主观意志转移。因此在比较企业生产效率时,有必要尝试将这一环境因素剔除。

其二为区域人均GDP。鉴于我国地区之间发展差距较大,不同地区的经济发展情况会对企业的营业收入与经营状况等造成一定影响,这种地区经济发展的影响完全不受企业自身所控制,因此应予以剔除。多数研究也在二阶段的分析中将地区经济发展情况进行剔除,但进行企业的生产效率三阶段分析一般不再剔除其它地区环境变量(沈忱,2017)。

其三为行业类型。34个人工智能上市企业的行业类型包括制造业和信息传输、软件和信息技术服务业两种,分别可视为硬件行业与软件行业。不同行业生产经营特点和企业文化通常存在差异,这种行业特征的差异同样会导致生产效率的差异,而这种差异无法通过改善管理水平与技术投入等主观行为而改变。同样,不同行业可能获得国家级别的政策支持也不相同。因此,本文认为有必要将企业的行业特征因素消除。

2.第一阶段DEA结果分析

第一阶段DEA结果为原始结果,其中当年固定资产投入与当年员工人数为投入变量,营业总收入为产出变量。具体结果见表1。值得注意的是,DEA所测算的生产效率只是样本企业间生产效率相对大小的比较,其中相对效率最高的企业(即决策单元)生产效率结果为1,即处于生产有效的前沿面。若规模效率不为1,则未处于最优生产规模,处于规模报酬递增(irs)或规模报酬递减(drs)阶段。

表1 不同企业第一阶段DEA结果(2018年)(2) 受限于篇幅,第一阶段DEA结果仅保留2018年,且一阶段与三阶段结果均只保留部分企业,其余年份与企业结果可向作者索取。

仅从第一阶段的DEA结果可以看出,在2018年,只有浪潮集团、昆仑万维、佳都科技三家企业位于生产效率的前沿面。从生产效率来看,其它企业与这三家企业相差较大。而相差较大的主要原因是样本企业的纯技术效率相差较大,除上述三家处于生产效率前沿面的企业外,仅北京君正、海康威视处于纯技术效率的前沿面。从规模报酬的阶段来看,三家处于总生产效率前沿面的企业位于最优生产规模阶段,而东华软件与海康威视处于规模报酬递减阶段,即这两家企业规模相对偏大,且在2017年就已经出现了规模报酬递减。其余所有企业全部处于规模报酬递增阶段,即企业规模相对偏小。从年份来看,所有样本的综合生产效率考察期间整体呈增长趋势,但纯技术效率与规模效率分别在2017年与2018年有所下降。

3.二阶段SFA对环境因素的分析结果

由于环境因素会影响企业实际的投入与产出,因而在第二阶段分析中,将剔除企业自身所无法改变的环境变量。在第一阶段的分析中,本文计算出资本与人力投入的冗余变量,并将其作为被解释变量,同时将上市年份、宏观经济发展、行业类型等企业自身难以改变的环境变量作为解释变量。

将第一阶段得到的固定资产净值冗余与从业人员冗余作为被解释变量,将上市年份、区域人均GDP、行业类型作为解释变量建立多元回归模型进行随机前沿生产函数分析。其中,上市年份变量为2019年与企业上市年份之间的差额;人均GDP为企业所在省份当年的人均GDP,代表企业所在地的经济发展情况;行业类型采用虚拟变量,制造业为1,信息传输、软件和信息技术服务业为0。利用极大似然法进行估计,所得结果见表2。

表2 随机前沿回归分析结果

回归结果显示,两个模型的单边LR值较高,均在1%的水平上显著,表明环境变量选取合理。实际上两个模型中三个环境变量均在1%的水平上显著,说明所选择的环境变量确实影响到了样本企业的要素投入冗余。同时,两个模型的γ值全部接近于1,表示随机扰动对要素的投入冗余影响极小。

从表中结果来看,首先,上市年份越久,企业由于约束降低导致在固定资产投入与人员投入都出现了明显冗余。即伴随上市年份增加,公司不必担心退市威胁,因此缺乏监督而忽视自身生产效率,再次验证了季凯文等(2014)的观点。

其次,区域人均GDP越高,生产要素的冗余越低。即地区的发展程度存在环境效应,处在发达地区的企业可能受到环境发展的影响提高要素的使用效率。

最后,行业类型对固定资产净值冗余与从业人员冗余造成的影响相反。即制造业更容易出现固定资产投入冗余,而信息传输、软件和信息技术服务业更容易出现从业人员的冗余。一种可能的解释是制造业的生产以机器生产为主,企业往往会加大对机器的投入来精简人员;而软件和信息技术服务业所代表的软件业生产以软件工程师为主力,这种类型的企业也更倾向于招募更多从业人员作为人力资本的投资。

4.第三阶段DEA结果分析

利用二阶段SFA剔除环境因素影响后的固定资产投入与从业人员数量作为投入变量,企业营业总收入作为产出变量,对样本企业进行第三阶段的DEA分析,结果如表3所示。

表中结果显示,只有浪潮信息在2018年达到了生产有效的前沿面,其他企业距离生产有效前沿面较远。纯技术效率中,除浪潮信息外,紫光国微、川大智胜、海康威视等企业也达到了生产有效的前沿面,同时其他企业的纯技术效率距离生产有效的前沿面较近。而在规模效率中,只有浪潮信息达到了生产有效的前沿面,其他企业均未达到且距离较远。除海康威视在2018年处于规模报酬递减阶段外,其他企业在考察期内全部处于规模报酬递增阶段。

表3 不同企业第三阶段DEA回归结果

由于DEA测算的是相对效率,即每家企业距离效率最高企业(生产前沿面)的差距,因此不易将两个阶段下各企业的效率进行直接比较。但两个阶段中2018年的浪潮集团均处于生产前沿面,剔除环境因素的调整后发现,几乎所有企业都距离生产前沿面更远,表现为所有企业的规模效率大幅降低,但是纯技术效率却相对提高。

5.第一、第三阶段DEA结果比较

由于第三阶段DEA结果为第一阶段DEA剔除企业外部环境之后所得结果,因此,将不同年份、不同规模、不同行业的两个阶段DEA结果进行平均值的横向比较,可以看出环境因素究竟如何影响了企业之间生产效率的差距。均值越小代表大部分企业的生产效率距离有效前沿面越远。结果如表4所示。

表4 剔除环境因素前后生产效率比较

通过对比发现,无论是否剔除环境因素的影响,生产效率均呈逐年提高的状态。未调整环境因素时生产效率的提高来自于纯技术效率的进步(即资源配置、管理等因素),调整环境因素后生产效率的提高来自于规模效率的提高。进一步将所有样本按上市类型(主板、中小企业板、创业板)与按行业(制造业、信息服务业)进行分类发现结果仍然未变。

一方面,环境因素的纳入使得人工智能企业整体的纯技术效率距离有效前沿面更远,而规模效率整体距离有效前沿面更近。一种可能的解释是,众多企业自身利用生产要素的能力与效率相差不大,但是外部环境导致这种差距拉大。具体表现为,有些企业上市年份久从而导致管理僵化或位于不发达地区而受到区域经济的不利影响。企业间规模效率本身差距很大,但一些企业具备初创或者位于发达地区(典型的比如聚集在一线城市的初创科技型中小企业)等外部环境优势缩小了这一差距。

另一方面,在剔除环境因素后,不同上市类型企业的纯技术效率几乎相同,三者的差距全部呈现在规模效率上。其中,主板上市企业规模效率最高,中小企业板次之,创业板上市企业最低。从行业类型来看,不同行业生产效率基本一致。剔除环境因素前信息服务业相对于制造业规模效率较高,剔除环境因素后信息服务业的纯技术生产效率较高。由于行业特征对两种投入要素的冗余呈反方向的影响,因此调整前后行业整体的三种效率差别并不明显。

四、生产效率影响因素分析

1.数据来源、变量选取与模型建立

本部分数据为上文所选取的34家样本企业2016—2018年的相关财务数据,数据来源于Wind数据库。其中,因变量采用前文DEA第三阶段所得的调整环境因素后的三组生产效率,分别为生产效率以及将其拆分得到的纯技术效率与规模效率。根据前文所提假设,第一个关键自变量为研发投入,采用企业当年研发支出;第二个关键自变量为资产规模,采用企业总资产,包括流动资产与固定资产总额,实际处理取自然对数,以代表企业的总体规模;第三个关键自变量为企业的资产负债率。所设置的三个自变量分别用于证明前文所提出的三个假设。

需要特别指出,使用三个因变量,是因为生产效率本身是纯技术效率与规模效率的乘积,将三个变量与生产效率、纯技术效率、规模效率分别进行回归,可以看出自变量影响生产效率的具体路径。考虑到上文第二阶段的SFA分析中已经将其他控制变量所代表的环境因素予以剔除,此时模型中的因变量已经剔除了其他控制变量的影响,因此不再设置其他控制变量。同时,为检验研发投入的边际递减效应,在三个因变量的基础上,分别再选择是否加入研发投入的二次项。因此,本文设置六个模型,具体表示如下:

(1)

(2)

(3)

crste=σ+σres+σln(asset)+ σlev+V+ε

(4)

vrste=β+βres+βln(asset)+βlev+V+ε

(5)

scale=γ+γres+γln(asset)+ γlev+V+ε

(6)

其中:下标i表示不同企业;t代表不同年份;模型(1)、(4)中被解释变量crste为企业的生产效率,模型(2)、(5)中被解释变量vrste为企业的纯技术效率,模型(3)、(6)中被解释变量scale为企业的规模效率;res为企业的研发投入;ln(asset)为企业总资产的自然对数;lev为企业的资产负债率;V代表企业的个体效应。由于考察年份较短,故没有设置年份效应。

由于被解释变量为归并数据(上限为1),因此采用面板Tobit模型进行回归。由于企业的自身因素可能存在影响,需采用个体效应进行估计。但是个体固定效应中的Tobit模型无法得到个体异质性的充分估计量,而混合Tobit回归中使用LSDV法的固定效应估计量存在不一致问题,因此采用有个体效应的随机效应模型。

2.描述性统计

样本企业相关变量描述性统计结果如表5所示。总资产最高企业为6348435万元,最低为33418.16万元,平均值为663964.20万元。企业研发支出最高达到448278.10万元,最低仅为1376.55万元,平均研发支出为36843.78万元。平均资产负债率为32.47%。统计结果显示,样本企业中头部企业的总资产规模和研发支出均显著超过其他企业。

表5 变量描述性统计

3.回归结果分析

通过面板Tobit模型进行回归,结果如表6所示。首先,考察企业研发投入与生产效率之间的关系。模型(1)和(4)的回归结果显示,企业生产效率与研发投入显著正相关,研发投入的提高对生产效率呈正向促进作用。加入研发投入的二次项后,企业生产效率对研发投入的正向促进作用显著性增强,企业生产效率与研发投入的二次项呈显著负相关。此外,加入二次项的线性模型拟合程度提高。因此,研发投入的提高对生产效率起促进作用,但存在边际报酬递减趋势。模型(2)和(5)的回归结果显示,纯技术效率与研发投入及其二次项均显著正相关,即研发投入的提高可能带来纯技术效率的指数型提高。模型(3)和(6)的回归结果显示,规模效率与研发投入显著正相关,与其二次项显著负相关,即研发投入的提高对规模效率起促进作用但呈边际递减,且研发投入对规模效率的边际递减效应大于对纯技术效率的边际递增效应,最终反应在生产效率中呈现出研发投入对生产效率的促进作用呈边际递减状态。由此可以看出,假设1得证。

表6 Tobit二阶段回归结果

其次,考察企业规模与生产效率之间的关系。模型(1)和(4)中,不考虑研发投入的边际递减效应时,企业资产规模显著促进了生产效率提升。模型(2)和(5)中,企业纯技术效率与资产规模显著负相关,即企业规模的扩大会降低纯技术效率。模型(3)和(6)中,企业规模效率与资产规模显著正相关,即企业规模的扩大会提高规模效率,前文DEA三阶段的考察中几乎所有企业都处于规模报酬递增阶段也证实了这一点。由此可知,假设2得证。

最后,考察企业负债率与生产效率之间的关系。模型(1)和(4)中,不考虑研发投入的边际递减效应时,企业负债率显著促进了生产效率提升。模型(3)和(6)中,企业规模效率与负债率显著正相关,即企业负债率对生产效率提升主要由规模效率提高引起,与原假设不符。可能原因在于融资能力较强的企业融资目的主要在于扩大企业规模,由此带动规模效率提升。由此可以看出,假设3未通过验证。

4.进一步检验

从回归结果可以看出,研发投入、企业规模、负债率均通过影响规模效率进而影响生产效率。同时,由于原数据中只有浪潮集团在2018年达到了规模效率和生产效率的前沿面,可以认为生产效率与规模效率数据一定程度上不存在“归并”。因此,本文尝试使用非归并回归的固定效应模型和混合效应模型再次检验研发投入、负债率、企业规模对生产效率与规模效率的影响,即采用面板固定效应模型与面板混合效应模型分别对模型(1)(被解释变量为生产效率)、(3)(被解释变量为规模效率)进行检验,结果如表7所示。

表7 进一步检验回归结果

采用个体固定效应估计发现,系数与显著性均与基于个体随机效应的Tobit模型的估计结果基本一致,原假设进一步得到验证。

五、研究结论及建议

相对于以往三阶段DEA的研究,本文的边际贡献在于将第二阶段需要剔除的环境因素分为企业可控与企业不可控因素。对于企业不可控的环境因素,在第二阶段予以剔除;而对于企业可控的环境因素在第二阶段不予以剔除,并基于第三阶段的DEA结果进行Tobit模型的二阶段分析,来研究企业可控因素对生产效率造成的影响。

首先,通过研发投入对生产效率影响的实证研究发现,研发投入对生产效率有显著促进作用,且呈边际报酬递减。将生产效率拆分为纯技术效率与规模效率进行回归发现,研发投入对规模效率的促进作用呈边际递减,但对纯技术效率的促进作用呈边际递增。因此,研发投入对规模效率提高的边际递减效应导致了研发投入对企业生产效率提高的边际递减效应。研发投入存在边际递减效应主要表现为研发投入资金有效利用不足所造成的投入冗余。一方面,企业本身管理依然存在缺陷;另一方面,我国当前在人工智能领域基础研究仍有进一步提升空间。

政府相关部门需要加大对人工智能技术领域的支持力度,特别是要进一步加强基础理论和关键技术的研发,强化应用示范、伦理治理,促进我国人工智能健康发展。企业自身也应提高科研资源的管理水平,提高科研经费使用效率,强化关键环节核心人才培养和引进。

其次,不考虑环境因素的生产效率测算具有“误导”作用,导致严重低估规模效率对人工智能企业生产效率的决定作用。事实上,绝大部分人工智能企业的纯技术效率都与生产有效前沿面距离较近,导致生产效率不高的原因在于生产规模偏低。在测算结果中,除个别大型企业位于生产有效前沿面外,绝大部分企业均由于规模较小而处于规模报酬递增阶段。通过二阶段Tobit回归可以发现,扩大企业规模能够显著提高规模效率,再次证明了目前绝大部分企业处于规模报酬递增阶段。同时,企业负债率的提高可以通过企业规模效率影响人工智能企业的全要素生产率来实现。考虑到规模无效率的企业往往规模较小,因此资产负债率对生产效率的提高作用可能更多是通过提升融资能力的途径来提高规模效率。

应当加快布局人工智能产业,着力形成涵盖核心技术、关键系统、支撑平台和智能应用的完备产业链和高端产业群,开拓重点领域应用示范场景,引育区域型龙头企业。同时,推动人工智能领域中小企业加快发展,持续拓宽中小型人工智能企业融资渠道,助力企业规模提升,提高规模经济水平。

猜你喜欢
环境因素变量规模
外储4月站稳3万亿
2016年年末净值规模低于5000万元的分级基金
城市物流配送系统的环境因素影响评估
造成数学学困生的原因
浅谈会计目标定位
分离变量法:常见的通性通法
不可忽视变量的离散与连续
轻松把握变量之间的关系
变中抓“不变量”等7则