江苏省中低技术企业创新驱动因素研究

2018-03-20 07:20可,左
统计与信息论坛 2018年3期
关键词:技术产业驱动分类

张 可,左 媛

(1.河海大学 a.商学院,b.项目管理研究所,c.国际河流研究中心,江苏 南京 211100;2.江苏省“世界水谷”与水生态文明协同创新中心,江苏 南京 211100)

一、引 言

创新被普遍认为是国家、区域和企业竞争优势的来源。在党的十八届五中全会上,习近平明确指出,要把创新摆在国家发展全局的核心位置。目前中国正处于经济发展方式转变和经济结构调整的重要阶段,人口红利和要素驱动能力趋缓,进一步强化创新成为新常态下中国经济增长的重要动力[1]。从发达国家来看,中低技术产业依然对经济发展和就业具有不可替代的作用[2]。中国正处于工业化中期,中低技术产业将在一定时期内占据国民经济主导地位。因此,提高中低技术产业创新能力,对于促进中低技术产业转型升级、优化经济结构具有重要意义。

目前,国内外对中低技术企业的研究大多聚焦于创新效率、创新模式、创新机制及创新转型升级等方面。由于数据采集困难,已有研究多采用实证方法检验中低技术企业创新的相关理论,虽然取得了不少研究成果,但也存在一定局限性。一方面,因为中低技术企业的创新主要依赖非研发活动,而非研发活动的评价指标相对广泛,导致传统方法难以全面揭示影响中低技术企业创新的主要因素;另一方面,由于中低技术企业创新的数据获取较为困难,以往研究多采用抽样调查或宏观统计数据。从2014年开始,国家统计局建立了全国企业创新调查统计制度,对规模以上工业企业创新数据实行全数采集,数据集涵盖了组织创新、营销创新、信息化情况、企业基本情况、R&D人员情况等上百项指标。针对众多指标及庞大数据量,传统研究方法已难以适用于大数据集的知识发现问题。

在此背景下,本文尝试采用大数据研究思路和挖掘工具对中低技术企业创新驱动问题进行研究。大数据研究思路是指不事先假设影响中低技术企业创新的因素,而是以企业创新的全量数据为核心,通过对相关数据进行连接整合、去重去噪、特征提取等预处理后,形成以中低技术企业创新为主题的数据集;然后,将中低技术企业创新驱动因素识别问题转化为分类问题,以是否创新作为分类变量,将数据集中研发活动等指标作为属性进行建模;进而通过模型检验选择最优模型,并根据最优模型中各属性的重要度对中低技术企业创新驱动关键因素进行识别。

二、文献回顾

(一)中低技术企业创新研究现状

目前,国外对中低技术企业创新的研究在创新源泉、创新规律、创新模式、创新效率以及内部创新转型等方面都有一定成果。例如:欧盟委员会资助的“欧洲中低技术产业政策与创新”(PILOT)项目,以11个OECD 成员国中的43家中低技术企业为对象展开研究,结果显示:创新实现能力是中低技术企业的创新源泉,包括将外部知识转换为内部具有独特实用性知识的能力以及将各种知识、参与者、行为主体或人工制品进行再组合的能力[3-4]。Heidenreich基于第四次欧盟委员会(CIS4)创新调查相关数据发现,中低技术企业的创新以生产过程、组织和营销创新为主,并且强烈依赖机器、设备和软件的外部供应[5]。Kaplinsky等人认为,中低技术企业更倾向于将有限的创新资源投入到市场或工艺流程创新,从提高劳动生产率、产品质量等方面获取竞争优势[6]。Ortega等利用欧洲顶尖投资者组成的数据库研究发现,R&D活动对劳动生产率有显著的正向影响[7]。Ghosal等人认为,尽管中低技术企业个体创新片段很小,但积累得到的可观报酬有助于持续创新型企业获取显著的竞争优势[8]。此外,Freddi还从技术角度探讨了中低技术企业的内部创新问题,研究表明,中低技术企业通过创造新的技术整合规则的方式来促进企业的内部转型[9]。

长期以来,国内创新政策研究者和制定者一直重点关注高技术企业创新,而对R&D投入强度较低的中低技术企业创新关注较少。然而,2015年的统计数据表明,高技术企业在规模以上工业企业中的占比仅为7.73%[10]471,这说明中低技术企业仍旧是国民经济的主体。同时在提供就业岗位和总产值所占比重来看,中低技术企业对促进就业、拉动经济增长具有不可忽视的影响。当前对中低技术企业创新的研究主要集中在创新效率[11-13]、创新特征[14]、创新机制[15]、创新模式[16]以及中低技术企业创新升级相关理论[17-18];对于企业创新驱动因素的研究,大多以传统的统计和计量方法为主[19-20]。

在全球信息化快速发展和企业竞争越来越激烈的背景下,数据已经成为企业重要的基础性战略资源,科学进步越来越多地由创新来推动。利用大数据分析,能够总结经验,发现规律,预测趋势,辅助决策,充分释放和利用海量数据资源中蕴含的巨大价值。据国家统计局发布的数据,截至2015年底,中国规模以上工业企业共有383 148家[10]290,国家统计的企业研发活动和创新活动指标多达上百个,加上企业生产经营等基本活动指标,每年产生的数据量十分可观。与高技术企业科技经费投入多、创新产出高等特点不同,中低技术企业的研发经费投入较少,创新更多依赖非R&D活动,这就造成了影响中低技术企业创新的因素较多,研究的数据量较大,而大数据分析方法为中低技术企业创新驱动问题研究提供了一种新的思路。

(二)中低技术企业界定

学术界对中低技术企业的划分有多种标准,最普遍的划分还是依据1986年《奥斯陆手册》中提出的产业划分标准,即依据R&D投入强度(R&D投入/生产总值)不同,将企业划分为高技术产业、中技术产业和低技术产业三类。随着学术界对产业划分认识的改进,该分类从三类发展为四类,即高、中高、中低、低技术产业[2]。《奥斯陆手册》将R&D投入强度小于1%的企业划分为低技术产业;将R&D投入强度在1%到3%之间的企业划分为中低技术产业;将R&D投入强度在3%到5%之间的企业划分为中高技术产业;将R&D投入强度大于5%的企业划分为中高技术产业。

本研究基于《奥斯陆手册》产业划分标准,参照以往学者对技术产业的划分[16],将中低技术产业和低技术产业合并称为“中低技术产业”,即选取R&D投入强度小于3%的企业作为本文的研究对象。

三、研究方法及数据说明

(一)研究方法

中低技术企业创新具有机理复杂、数据量较大的特征。以2014年江苏省企业创新调查数据为例,数据主要包括开展产品创新、工艺创新、组织创新和营销创新的基本情况、创新活动类型情况、企业研发活动情况等上百项指标。在此背景下,难以建立较为完整的理论体系,并无法采用传统方法处理指标众多、数据量庞大的数据集。为此,尝试将中低技术企业创新驱动因素识别问题转换为分类问题,以企业是否创新作为分类变量,以企业信息化情况、创新情况、研发活动等指标作为属性,通过随机森林、决策树、KNN等6种分类算法的训练、测试、精度对比与竞争,选择分类准确率最高的算法作为最优模型,再根据最优分类模型中各属性对分类变量的贡献程度识别创新驱动因素,从而在大量数据和指标中探索中低技术企业创新的新规律。

以随机森林算法为例,该算法首先构建多棵小规模决策树,分别描述属性与分类变量之间的复杂非线性关系,然后通过投票法集成结果,最终构建分类模型。在随机森林模型结果中,平均精度下降(Mean Decrease Accuracy,MDA)和平均基尼系数下降(Mean Decrease Gini,MDG)是两个表征属性重要度的评价指标,前者根据属性影响随机森林准确率的降低程度来表示其重要性,后者通过树变量分隔节点的纯度来表示属性的重要性。而各属性指标在MDA和MDG中的贡献度排名能反映各属性对分类变量的重要程度,即创新驱动因素对中低技术企业创新的重要程度,以此为依据即可识别出中低技术企业创新的关键驱动因素。

(二) 数据来源及预处理

本文数据来源于2014年江苏省规模以上工业企业创新调查,调查对象共计48 708家单位,其中中低技术企业42 159家,占全样本的86.6%。数据集中包含了规模以上工业企业的所有企业法人,涵盖了企业开展产品创新、工艺创新、营销创新、组织创新、企业基本情况、信息化情况等107项属性。

对于数据集中的大量属性,采用特征值选择和提取方法进行处理,其中包括属性的归类合并,删除与创新无关的特征值,删除关联性强的特征值等,例如对于引进国外技术经费支出、引进技术的消化吸收支出、购买国内技术经费支出和技术改造支出4个属性,用技术获取和技术改造支出1个属性来表示。对于企业基本情况,删除了单位地址、邮政编码、电话号码、行政区域化代码等与中低技术企业创新无相关关系的15个属性。对于R&D人员情况,选择了最能凸显R&D实际人员情况的R&D人员折合全时当量合计表示等等,最终得到了32个影响中低技术企业创新的分类属性。然后,对数据集进行异常点检测、缺失值处理、数据离散化等预处理操作,共删除数据59条,过滤异常值数据108条,同时采用ChiMerge算法对主营业务收入、利润总额、资产总计等15项连续型数据属性进行了离散化。

(三) 数据描述

经过以上处理后,得到研究数据共41 992条,其中有创新的企业数量为18 225家,约占样本总量的43.4%,无创新的企业数量为23 767家,约占样本总量的56.6%,类别的分布较为均衡。数据的基本情况以及说明具体见表1。

表1 数据的字段说明

四、中低技术企业创新驱动因素识别

(一)模型构建

各算法的最优参数通过模型准确率的变化情况确定。以随机森林算法的参数选择为例,生成树的个数(ntree)和节点数(mtry)是影响模型准确率的两个重要参数。在选择ntree时,将数据集随机分为训练集(75%)和测试集(25%),根据1~500棵树之间分类错误率的变化情况选取最优树。结果如图1所示,ntree超过100时,有创新企业和无创新企业的分类错误率最低且趋向平稳,因此选取ntree=500为最优生成树的个数。

图1 随机森林模型参数选择

对于节点数的选择,在1~25之间对随机森林算法分类错误率进行计算,选择分类错误率最低的节点,同时依据树的节点数不大于自变量平方根的原则,选取mtry=5建立模型。具体见图1。类似地,表2列出了各分类算法参数的优选结果。

表2 模型参数选择及重要参数

为保证模型精度的稳定性,采用十折交叉验证选择最优分类模型,即将数据平均分成10份,每次取出1份作为测试集,其余9份作为训练集,最后将10次的平均结果作为预测误差的估计,以预测误差最小的模型最优。最终得到的结果见表3。

从表3中可以看出,随机森林的总体分类准确率为92.2%,有创新的中低技术企业分类准确率为88.6%,且各样本分类准确率的分布较为平均,模型较为稳定。无论是从模型总体分类准确率,还是从各样本准确率的分布来看,随机森林模型的分类效果最佳。为此,本文以随机森林算法的结果作为识别中低技术企业创新驱动因素的依据。

(二)结果及分析

随机森林分类模型中各属性的重要程度如图2所示。其中,平均精度下降(MDA)表示把一个创新影响因素变成随机数时,随机森林预测准确率的降低程度,该值越大表示该因素对于区分企业创新能力的贡献越大。平均基尼系数下降(MDG)表示所有树的属性分割节点纯度的平均降低程度,该值越大表示该因素的重要度越大。

表3 各模型十折交叉验证结果

图2 随机森林分类模型中各属性重要程度

首先,图2中排在前两位的创新影响因素是人员培训(STT)和设备、软件、机器、土地、建筑等的获取(FEQ),并且这两个因素与排名第三的因素距离较远,可以认为STT和FEQ是驱动中低技术企业创新的关健因素。这一结果说明,中低技术企业创新受土地、资本投入影响较大,与中低技术企业服从道格拉斯生产函数的特征一致。相比高新技术企业通过R&D投入提升产品附加值,中低技术企业更多依赖于现有研究成果进行应用开发,且相对而言中低技术企业大多为传统企业,劳动力是主要成本,往往通过价格而非质量获取竞争优势,因此先进设备和机器对于提升劳动生产率和企业技术创新能力有至关重要的作用。此外,人员培训对于中低技术企业创新影响显著,这是由于中低技术企业人才吸引力较弱,创新主要依靠内部人员的素质提升,因此,人才驱动背后比拼的是各企业的培训能力和水平。企业为员工投资培训可以促进人力资本积累,提高员工知识运用能力,开发员工潜力,贯彻企业创新理念,从而支持企业创新活动,提高企业创新能力。

其次,实现创新有关的可行性研究等其他创新活动(EFA)、对新产品进行外观或包装方面的设计(DFNP)、市场调研和广告宣传等活动(MPRE)、专利、版权、技术诀窍、非专利发明和其他类型技术的获取(FKN)对中低技术企业创新也有显著影响。这一结果表明,非研发创新活动对中低技术企业创新具有重要影响。与高技术企业主要通过研发活动进行颠覆式创新不同,中低技术企业主要通过引入外部技术、知识和采用外部可用资源实行创造性的重组进行创新,且多为连续的渐进性创新。渐进性创新主要基于企业现有资源和能力,侧重于原有技术的改进和应用,且在产品创新中往往包含市场评估、财务分析、广告宣传等内容。这些活动本质上是对不同功能要素的重组。对新产品进行外观设计实质上是技术和用户体验的集成,同时,设计可以通过创造新的产品语言和意义影响消费者需求,最终推动创新的产生。由于中低技术企业研发投入强度较低,创新受高技术企业创新成果转移和扩散的影响,因此,中低技术企业需要从企业外部购买或引进新技术和新知识,不断产生新知识流以积累和更新知识存量,提高企业技术能力,使其较其他竞争者保持相对差异化的技术优势,进而通过技术创新在市场中获得一定的竞争地位。

从图2中各属性在MDA和MDG中的重要度排名可以看出,驱动中低技术企业创新的关键属性大致相同,但对使用政府提供的科技活动资金(FGV)、R&D经费内部支出合计(RDI)、研究开发费用加计扣除减免税(RDTA)和R&D人员折合全时当量合计(TRDeq)重要程度的识别存在明显差异。因此,本文从各属性变化对分类变量的影响程度方面对这4个属性进行了进一步分析。根据得出的结果*由于篇幅限制,随机森林模型中各属性变化对中低技术企业创新影响的图不在文中列出,需要了解的读者可以联系作者。,这4个属性对中低技术企业创新影响的重要度差别不大,但各属性变化对中低技术企业创新的影响存在差异。首先,研究开发费用加计扣除减免税(RDTA)越多,中低技术企业创新趋向性越强。由于RDTA中包含了用于研发活动的设备租赁费、折旧费等,根据中低技术企业主要通过外部设备、技术等获取进行创新的特点,可以推断出RDTA的增长能通过一定程度上增强企业外部资源获取促进中低技术企业创新。其次,当R&D经费内部支出合计(RDI)、使用政府提供的科技活动资金(FGV)和R&D人员折合全时当量合计(TRDeq)超过一个较低的区间时,这3个属性对中低技术企业创新没有明显驱动。这说明中低技术企业的创新投入对创新产出的影响虽然较为显著,但存在边际递减效应。这一结果与现有研究不完全一致。已有研究认为研发活动对中低技术企业创新的影响并不显著,而本文通过数据分析后认为,在一个较低区间内,内部研发投入对中低技术企业创新有一定促进作用。这是因为虽然中低技术企业研发投入强度低,但并不意味着技术含量低,中低技术企业能用一定程度的研发投入在“干中学”和“用中学”中不断采纳和吸收新技术,并在特定领域进行专业化开发和改进。当然,中低技术企业更多的是通过组织创新、技术获取等更广泛的非研发活动进行创新,这也使其创新投入成本较低,边际递减效应显现较早。

①② 由于篇幅限制,所涉及的图省略,需要了解的读者可以联系作者。

同时,对比图2中两个重要度衡量属性可以看出,企业使用的计算机数量(CPN)、企业单位规模(size)、是否在经营模式方面有组织创新(NMOP)对中低技术企业创新也有一定影响。从CPN变化对分类变量的影响程度得出结论①,企业使用的计算机数量越多,企业越趋向于创新。计算机数量在一定程度上反映了信息化水平,企业信息化的发展能直接影响技术创新的方式、方法、效益及效率,促进技术创新向智能化、多样化发展,使技术创新更高效,协作更广泛,创新能力更持续。同时,企业信息化还能通过影响企业信息获取、交流、共享、产生及物化能力,间接影响企业创新。对比图2中企业管理信息化(IML)重要度不高,说明企业更多将计算机运用在对信息获取、产生,以及信息技术在工业中的应用,这一定程度上反映了获取信息资源和运用信息技术的能力对中低技术企业创新更为重要。

最后,从企业规模(size)变化对分类变量的影响程度来看②,与高新技术企业规模与企业创新有负相关关系不同,大中型企业是中低技术企业创新的主力军。一方面,因为中低技术企业创新主要依赖非研发活动,而大中型企业的人才培养、市场调研等机制更加完善,更易获得先进技术、设备等,有足够的创新资源和能力在创新中领先;另一方面,因为中低技术企业在创新活动的各阶段有显著的规模报酬递增效应,企业规模越大,报酬越高,企业开展创新活动的意愿更强。

五、结论与建议

本文利用2014年江苏省规模以上工业企业创新调查数据,对中低技术企业创新驱动因素进行了深入研究。通过将研究问题的转换和模型对比、测试,建立了基于随机森林的中低技术企业创新驱动模型,最后利用模型结果对创新驱动关键因素进行了识别、分析。研究表明:(1)非研发活动对中低技术企业创新有重要影响,其中设备、软件、机器、土地、建筑等的获取和人员培训是驱动中低技术企业创新的关键因素;(2)知识技术的获取、新产品外观设计以及可行性研究、市场调研等创新准备活动对中低技术企业创新有重要影响;(3)研发开发费用加计扣除减免税的增长能通过增强企业外部资源获取促进中低技术企业创新,而内部研发投入只有在一个较低区间内对驱动中低技术企业创新有明显作用;(4)获取信息资源和运用信息技术的能力对中低技术企业创新有显著影响;(5)大中型企业是中低技术企业创新的主力军。

为促进中低技术企业创新,本文提出以下建议:第一,针对在职人员构建专业化的培训体系,加大对人员培训的投入。尽管中国已经通过法律形式要求企业按照一定的比例计提“职工教育培训费”,但是在职培训的投入远远低于发达国家的水平。政府和企业应广泛拓展职业培训的经费来源,鼓励政府财政拨款、企业事业单位自筹、社会资助、接受捐赠等多渠道筹集资金开展人员培训。第二,重视非研发活动,加大对中低技术企业非研发创新活动的投入。目前产业创新政策一直重点聚焦于研发投入促进创新,而对非研发创新活动驱动中低技术企业创新的认识不够。政府在关注研发投入对技术创新的基础上,应新增非研发活动对企业创新的考量,同时对中低技术企业开展非研发创新活动给予资金和政策上的支持,鼓励企业总结和推广成功的非研发创新经验,奖励在非研发创新领域有突出贡献的人才。第三,加快企业信息化发展。信息化可以提高企业获取信息资源的能力,加强信息技术在工业中的应用。政府可以通过政策和资金支持、政策引导、立法建立标准、开展试点企业等多种形式促进中低技术企业信息化发展。第四,重点关注大中型中低技术企业,以大中型企业创新为主,带动整个中低技术产业转型升级。

[1] 余斌,平新乔,张占斌,等.“十三五”期间的中国经济增长——改革传媒发行人、编辑总监王佳宁对话九位经济学者[J].改革,2015(1).

[2] 王瑛.LMT产业技术创新规律及政策启示[J].科学管理研究,2012(5).

[3] 白玲,邓玮.科技创新在中低技术产业中为什么同样重要?[J].社会科学战线,2008(6).

[4] Hirsch-Kreinsen H."Low-Technology":A Forgotten Sector in Innovation Policy[J].Journal of Technology Management & Innovation,2008(3).

[5] Heidenreich M.Innovation Patterns and Location of European Low-and Medium-Technology Industries[J].Research Policy,2009,38(3).

[6] Kaplinsky R,Readman J.Globalization and Upgrading:What Can (and Can not) be Learnt from International Trade Statistics in the Wood Furniture Sector ?[J].Industrial and Corporate Change,2005,14(4).

[7] Ortega Argiles R,Potters L,Vivarelli M.R&D and Productivity:Testing Sectoral Peculiarities Using Micro Data[J].Empirical Economics,2011,41(3).

[8] Ghosal V,Nair-Reichert U.Investments in Modernization,Innovation and Gains in Productivity:Evidence from Firms in the Global Paper Industry[J].Research Policy,2009,38(3).

[9] Freddi D.The Integration of Old and New Technological Paradigms in Low-and Medium-Tech Sectors:The Case of Mechatronics[J].Research Policy,2009,38(3).

[10] 中华人民共和国国家统计局.中国统计年鉴2016[M].北京:中国统计出版社,2016.

[11] 陈宁.我国低技术中小企业创新效率提升研究——“一体化漏斗”服务模型构建[J].科技进步与对策,2013(15).

[12] 郭兵.中低技术制造业技术创新效率的行业比较研究[J].科学学与科学技术管理,2014(5).

[13] 池仁勇,刘娟芳,张宓之,等.中低技术产业创新效率研究——基于我国大中型工业企业面板数据的实证[J].科技进步与对策,2014(16).

[14] 王燕玲.基于专利分析的我国低技术制造业技术创新特征研究[J].统计研究,2011(4).

[15] 何晓清.创新网络演化视角下的区域创新机制研究——以高技术产业和中低技术产业为例[J].研究与发展管理,2017(1).

[16] 秦佩恒,赵兰香,万劲波.中低技术企业创新模式与创新绩效研究——基于中国制造业创新调查的实证分析[J].科研管理,2016(11).

[17] 孙理军.低技术制造业企业的内向型开放创新研究综述[J].中国地质大学学报:社会科学版,2011(4).

[18] 孙理军.从全球价值链到开放式创新:低技术制造企业升级的理论基础探讨[J].中国地质大学学报:社会科学版,2012(6).

[19] 李廉水,张芊芊,王常凯.中国制造业科技创新能力驱动因素研究[J].科研管理,2015(10).

[20] 冯军政.企业突破性创新和破坏性创新的驱动因素研究——环境动态性和敌对性的视角[J].科学学研究,2013(9).

猜你喜欢
技术产业驱动分类
基于模糊PI控制的驱动防滑仿真系统分析
分类算一算
屈宏斌:未来五年,双轮驱动,砥砺前行
浅谈新时期企业劳动竞赛的实践与创新
轨旁ATC系统门控柜接收/驱动板改造
在808DA上使用WIFI进行驱动数据同步
分类讨论求坐标
数据分析中的分类讨论
电子信息工程技术的发展应用研究
电子信息工程技术的发展应用研究