基于大数据算法的企业研发投资影响因素分析

2018-03-13 03:34副教授博士
财会月刊 2018年6期
关键词:关联规则强度

(副教授),(博士)

一、引言

在经济发展新常态下,实施创新驱动战略、实现经济增长方式转变已成为我国经济健康发展的重要举措。企业作为重要创新主体之一,其研发投资是实现技术创新的重要途径。据统计,2013年以色列、韩国和日本企业研发投资占工业增值税的比重分别为5.92%、4.72%、4.09%,同期我国仅为2.03%,企业研发投资水平较低。激励企业进行研发投资以促进技术创新成为我国宏观调控政策的重要目标,财政补贴、税收优惠作为政策激励企业研发投资的重要手段,是影响企业研发投资的制度驱动。然而,制度驱动仅仅是企业进行研发投资的外部动因。Peneder、Woerter(2014)认为,企业进行研发投资的目的是提高技术创新能力,最终增强其在市场中的竞争力。因此,制度驱动应在企业本身具有投资意愿的基础上发挥效应。根据产业组织理论,融资约束是造成企业研发投资不足的主要原因。而根据企业行为理论,企业行为变量如所拥有的组织冗余、面临的破产风险等,亦会影响企业的研发投资决策。因此,企业研发投资会受到制度驱动、融资约束以及企业行为等多种因素的影响。那么,目前我国企业研发投资的主要影响因素是什么?各影响因素对企业研发投资的影响程度如何?作为政府激励研发投资主要手段的所得税优惠政策能否有效发挥其对企业研发投资的激励效应?本文从大数据的理念出发,选用代表最新技术水平及与我国实际相结合的相关性算法,对以上问题进行了系统的研究,得出了有一定可靠性的结论,为促进企业研发投资以及企业进行研发投资决策提供了政策借鉴和技术支撑。

二、文献综述

有关企业研发投资影响因素的现有文献主要分为以下三个方面:

其一,财政补贴与税收优惠作为研发投资的主要制度驱动,是影响企业研发投资的重要因素。大量文献利用不同的评价方法对我国研发投资的财政补贴和税收优惠的政策效应进行了实证检验,结果表明我国的财税激励政策有利于促进企业研发投资(戴晨、刘怡,2008;卜祥来,2014)。然而,亦有研究得出相反的结论,如夏杰长、尚铁力(2006)提出,由于我国所得税优惠政策设计存在缺陷,企业研发投入增长变化率与企业所得税变化率之间的关系并不显著;李永等(2015)基于省际面板数据进行实证检验后指出,由于制度约束,目前我国的政府补助对企业研发投资会产生挤出效应。陆攀、朱和平(2016)从企业面临的财务危机视角出发,研究了政府财政补贴对研发投资强度的影响。

其二,企业面临的融资约束影响企业研发投资。根据产业组织理论,在内源资金不足而外源融资获取困难的情况下,企业容易面临研发投资的融资约束,造成研发投资不足。卢馨等(2013)以2007~2009年披露研发投资的高新技术企业为样本,检验了融资约束的存在及其对企业研发投资的影响,证实研发投资与现金持有量之间存在正相关关系。曹献飞(2014)以中国工业企业数据库2005~2007年规模以上工业企业统计数据为研究样本,进一步对企业研发投资对内源和外源融资的依赖程度进行了实证检验。

其三,基于企业行为理论,组织冗余、风险等影响企业研发投资决策。目前国内学者主要针对组织冗余与研发绩效的相关性进行研究,而对组织冗余与研发投资的关系研究并不多见,且得出的结果并不统一,如连军(2013)提出不同类别的组织冗余对研发投资的影响不同,或存在促进作用或存在挤出效应。少数国内学者针对研发投资与风险相关性也进行了研究,如张信东、姜小丽(2008)验证了企业研发投资与系统风险的相关性;黄曼行等(2014)则以国外研究中用于衡量破产风险的Z指数为被解释变量,检验了企业研发投资对企业财务风险的影响。

现有文献主要从产业组织理论、企业行为理论等视角,采用“理论分析或者提出假设——建立模型——实证检验”的思路,对影响研发投资的因素进行研究。然而在相同的假设前提下,若使用的数据或选取的变量不同,很可能得出截然相反的结论。研究若限于单一视角,难以综合厘清企业研发投资的影响因素并对各因素的影响程度进行比较。本文在借鉴相关研究的基础上,基于大数据的理念,以我国2010~2014年创业板上市公司数据为研究样本,运用相关性分析中经典的关联规则算法对企业研发投资强度的影响因素及影响程度进行比较分析,结果表明,影响企业研发投资的因素很多,但应重点关注营运资金、流动比率、管理费用、破产风险、资产负债率等对企业研发投资决策的影响,而制度驱动对企业研发投资决策的影响则远小于其他因素。

三、研究设计

(一)样本数据

在创业板上市公司的年度报告中,公司能够全面、规范地披露其年度研发支出信息,并且年度报告已经过注册会计师审计,数据具有可靠性。因此,本文以2010~2014年创业板上市公司为样本对企业研发投资影响因子进行研究。上市公司财务数据来源于国泰安经济金融研究数据库,公司年度研发投资数据根据巨潮资讯网公布的上市公司年度报告整理。因后期需根据Apriori算法要求对数据进行离散化处理,因此,仅对缺失数据进行数据清理,为保证数据的准确性,由于数据的缺失值较少,采用技术方法填充缺失值。

(二)变量描述

1.目标变量。研发投资强度,用“企业研发投资/营业收入”衡量。

2.自变量。选择可利用冗余、可开发冗余、破产风险、税收补贴、自由现金流作为核心解释变量,具体如下:

组织冗余:将组织冗余分为可利用冗余与可开发冗余。其中:可利用冗余是指若出现闲置可考虑将其用于研发投资的资金,如流动资产、流动负债;可开发冗余是指已被吸收利用但可恢复到正常成本中的资源,如管理费用。借鉴Chen、Miller(2007),用营运资金收入比(营运资金/营业收入)与流动比率(流动资产/流动负债)衡量可利用冗余变量,取管理费用的自然对数衡量可开发冗余变量。

风险变量:用滞后一期修正Z指数(Altman,2000)衡量破产风险,Z指数越小,企业面临的破产风险越大。

税收补贴:所得税优惠相当于给予企业的额外补贴,因此称为税收补贴。以名义税率25%乘以税前利润,再减去当期所得税费用,然后取其自然对数,用以衡量企业得到的税收补贴。

自由现金流:(经营活动产生的现金流量净额-分配股利、利润或偿付利息支付的现金)/年末总资产。

除以上自变量外,还可选取行业、资产回报率、资产负债率、资产负债率的平方项等作为解释研发投资影响因子的其他变量。处理后的数据情况见表1。

表1 样本数据情况

(三)模型构建

在大数据相关性分析中,Apriori算法是一种比较成熟的算法。该算法是从一个大型的数据集(Dataset)中发现相关(Correlation)关系,即从数据集中识别出频繁出现的属性值集(Sets of Attribute-Values),也称为频繁项集(Frequent Item sets,简称“频繁集”),然后再利用这些频繁集创建关联规则的过程。数学描述如下:

设I={i1,i2,…,im}是m个不同项目的集合,每个ik(k=1,2,…,m)为数据项(Item),数据项的集合I成为数据项集(Item set),其中的元素个数为数据项集的长度,长度为k的数据项集称为k-项集(k-Itemset)。事务T(Transaction)是数据项集I上的一个子集,即T⊂I,每个事务均有一个唯一的标识符TID与之相联,不同事务的全体构成了全体事务集D(即事务数据库)。设X⊂I为数据项集,B为事务集D中包含X的事务的数量,A为事务集D中包含的所有事务的数量。在关联分析中,所产生的规则(Association Rule)可以表示为:R:X⇒Y,其中:X⊂I,Y⊂I,并且X∩Y=Ф,它表示如果项集X在某一事务中出现,则必然会导致项目集Y也会在同一事务中出现,其中X称为规则的先决条件,Y为规则的结果。在产生的规则中,通常用支持度、置信度和提升度来描述有效性。其中,支持度定义为:Support(X)=B/A,项集X的支持度Support(X)描述了项集X的重要性。置信度定义为:Confidence(R)=SupportX∪Y/SupportX,置信度描述了规则的可靠程度。提升度定义为:lift(R)=conf(X->Y)/supp(Y)=conf(Y->X)/supp(X)=P(XandY)/(P(X)P(Y)),表示事件XY在X约束下出现的概率相对XY自由出现的比(一般来讲,Lift>1,规则就是有效的)。从以上算法介绍中可以看出,关联规则可以穷举k-Itemset,挖掘出意想不到的信息,完全由数据推导出结果而不受理论假设的制约,适合进行数据分析。

由以上算法介绍得知,关联规则所分析的对象为数据项集的元素,而样本数据中诸多变量为数值变量,即连续变量。所以必须对样本数据进行离散化预处理,从而将其转化为可供分析的项集。运用经离散化处理的数据可使后期模型分析结果更加稳定,使自变量和目标变量之间的关系变得更加清晰。在此将数据变量统一按照数值大小划分为5个区间(不包括小于等于0的数值统一划分为“<=0”的元素),如表2所示。

进行数据预处理之后,生成可供分析数据集,按照关联规则算法的原理,运算之前应该做必要的参数设置。如何做合理的参数设置则需要结合专家判断和输出结果质量。基于多次试验结果,最终确定支持度>=0.01、置信度>=0.5、K∈[3,5],设置Y为研发强度=5/5:[0.0898,0.9839],以此来找出与研发强度“高”与项集X之间的相关性,运行过程如下:

表2 样本数据离散化处理之后的情况

基于以上所设置的条件,运行过程在数秒内生成了272条规则,信息量很大,但对成本资源的耗费并不多。值得注意的是,关联分析所产生的诸多规则容易造成信息冗余、降低规则的可利用率。本文先后以主观和客观两种方法对关联规则中的冗余信息进行修剪。首先从主观方法入手,将缺少经济学意义解释的冗余规则去除。在此基础上,运用ADRR算法对冗余规则进行修剪。

四、结果输出与解析

(一)结果输出

研发强度作为目标变量,以营运资金、流动比率、管理费用、破产风险、资产收益率、资产负债率、税收补贴等为影响因子,运用Apriori算法推导影响企业研发强度的因子,输出的关联规则如表3所示。

表3是基于支持度>=0.01、置信度>=0.8,按照提升度降序排列的关联规则前10名的结果。关联规则实际为数据推导的过程,即验证了哪些影响因子影响企业的研发投资强度,以及这些影响因子影响过程的可信程度。不同于其他的实证研究,本文运用关联规则算法在研究假设的基础上验证了研发投资强度与其影响因子的相关性。表3所列示的关联规则可提供的信息分别为:营运资金充足、管理费用较高而资产负债率较低的企业研发强度较高;营运资金充足、流动比率较高且管理费用较高的企业研发投资强度强高;资产收益率越高,破产风险越小,企业的研发投资强度越高,然而资产收益率对研发投资强度的影响受到企业所处行业的影响。

表3 关联规则

输出结果产生有效关联规则272条,说明影响企业研发投资的有效因素很多,从所列举的前10条规则看,营运资金、流动比率、管理费用、破产风险、资产负债率等为影响我国创业板上市公司研发投资的主要影响因子。在大数据分析方法中,数据的可视化也是重要的表现形态,数据的可视化可以提高结论的可读性和逻辑性。现选取提升度较高(>=89%)的关联规则,如图所示。图的上半部分为有向图,可直观地体现影响因子、置信度、提升度,以及最终的结论,其中起点为影响因子,圆圈表示各影响因子的共同指向(圆圈的大小表示置信度,置信度较高则圆圈较大;圆圈的颜色深浅表示提升度,颜色深则提升度高),共同指向的下一步指向为结论。其中,管理费用、资产收益率、资产负债率、营运资金、表示破产风险的滞后一期的Z指数等共同指向了研发强度。图的下半部分为平行坐标图,箭头最终指向最终结论,所输出的平行坐标图仍能体现营运资金、资产负债率、流动比率、管理费用、资产收益率等为企业研发投资最重要的影响因子。

(二)结果解析

在大数据分析中,对结果的有效解析是不容忽视的环节,由以上输出结果可得出如下结论:

第一,可利用冗余(营运资金、流动比率)、可开发冗余(管理费用)、破产风险(滞后一期的Z指数)均体现出与企业研发投资强度显著的正相关性。以往研究表明,不同类别的组织冗余对企业研发投资的影响不同,根据本文中Apriori算法所显示的关联规则,可开发冗余与可利用冗余水平高的企业,其研发投资积极性和研发投资强度较高。企业拥有的组织冗余可以促进企业研发投资。亦从另一个角度证明企业研发投资资金来源的首选为内源资金,若内源资金充裕,则企业更愿意进行研发投资。破产风险与研发投资强度呈负相关关系,企业面临的破产风险影响了企业的研发投资决策,破产风险较小时,企业的研发投资积极性较高。

第二,所处行业不同的企业,其资产收益率对研发投资强度的影响不同。可能的解释是,不同行业对风险的偏好会有不同,风险偏好型企业的资产收益率较低时,企业倾向于增加研发投资,以增加资产收益率提高的机会;而对于风险厌恶型企业,当资产收益率较低时,企业不愿过多地进行高风险与高不确定性的研发投资,因此研发投资水平较低。

关联规则图

第三,资产负债率对企业研发投资强度产生了重要的影响。资产负债率较低时,企业财务风险较小,其研发投资积极性较高。可能的解释是,创业板上市公司或由于风险规避意识而不愿负债进行研发投资,或由于金融市场失灵而难以获得外源融资进行研发投资。

五、结论与政策建议

本文基于大数据理念的关联规则算法,推导出企业研发投资的主要影响因子及各影响因子的影响程度。研究结果表明:我国创业板上市公司研发投资主要倾向于运用内源融资,不同行业风险偏好不同,企业收益水平对研发投资的影响不同。在内源融资充足而负债较少、财务风险较低的情况下,企业具有较大的研发动力。当然,从大数据的角度来讲,本文所采用的数据量偏小,所得出的结论存在局限性,在数据可得的情况下,笔者会进一步推进相关研究。

从现状来看,我国政策激励研发投资的主要手段——企业所得税优惠对企业研发投资产生了一定的影响,但影响程度较低,这说明企业对优惠的敏感度并不高,难以有效发挥其政策效应。鉴于此,本文提出如下政策建议:

1.国家宏观层面的研发投资促进政策。①重视企业的主体地位,充分评估政策的有效性。政策激励企业研发投资的效应,不仅仅取决于政策制度本身的设计,还取决于企业对政策制度的敏感性,脱离企业实际情况的激励会由于缺乏着力点而失去政策本身的效应。②加大财税政策激励研发投资的力度。目前我国激励企业进行研发投资的财税政策尚存在诸多不完善之处,激励效果有限。因此,应在对企业进行调研的基础上提出切实可行的税收优惠政策,使税收优惠落到实处。

2.企业微观层面的研发投资促进建议。①提高企业冗余资源的利用效率。企业组织冗余作为研发投资潜在的、可利用的资源,为企业研发投资提供了资金缓冲。而关键的问题是企业应对冗余资源进行计划、监督,适时将冗余资源转化为研发投资资本,提高冗余资源的利用效率。②科学预测企业风险,加强内部控制。企业面对的风险是企业研发投资的重要影响因子,加强内部控制以及对风险的衡量和预测,有助于提高企业研发投资决策的精准度。③优化研发投资决策流程。企业研发投资决策一方面需要考虑投资项目的资本来源、风险、收益,以及企业整体面临的财务风险,另一方面也需要充分利用国家财税优惠政策,提高企业投资税后收益。

Peneder M.,Worter M..Competition,R&D and innovation:Testing the inverted-U in a simultaneous system[J].Journal of Evolutionary Economics,2014(3).

戴晨,刘怡.税收优惠与财政补贴对企业R&D影响的比较分析[J].经济科学,2008(3).

卜祥来.财税激励政策影响企业R&D支出的实证研究[J].税务研究,2014(3).

夏杰长,尚铁力.自主创新与税收政策:理论分析、实证研究与对策建议[J].税务研究,2006(6).

李永,王砚萍,马宇.制度约束下政府R&D资助挤出效应与创新效率[J].科研管理,2015(10).

陆攀,朱和平.政府研发补助、公司治理因素与R&D投资强度的关系检验——基于江浙中小民营企业的经验数据[J].财会月刊,2016(10).

卢馨,郑阳飞,李建明.融资约束对企业R&D投资的影响研究——来自中国高新技术上市公司的经验证据[J].会计研究,2013(5).

曹献飞.融资约束与企业研发投资——基于企业层面数据的实证研究[J].软科学,2014(12).

连军.组织冗余、政治联系与民营企业R&D投资[J].科学学与科学技术管理,2013(1).

张信东,姜小丽.企业R&D投资与系统风险研究[J].研究与发展管理,2008(3).

黄曼行,任家华,严娱.我国中小企业R&D投资与企业财务风险——基于分位数回归方法[J].科技管理研究,2014(14).

Chen,Wei-Ru,Kent D.Miller.Situational and institutionaldeterminantsoffirms'R&D search intensity[J].Strategic Management Journal,2007(4).

Altman,Edward I..Predicting financial distress of companies:Revisiting the Z-score and ZETA models[J].Journal Administrasi Bisnis,2000(9).

孙存一,赵瑜.基于大数据算法的纳税遵从风险识别以及影响因子分析[J].现代财经,2015(11).

猜你喜欢
关联规则强度
撑竿跳规则的制定
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
低强度自密实混凝土在房建中的应用
数独的规则和演变
“一带一路”递进,关联民生更紧
Vortex Rossby Waves in Asymmetric Basic Flow of Typhoons
奇趣搭配
让规则不规则
智趣
TPP反腐败规则对我国的启示