地区工业企业创新能力评价模型

2019-10-08 07:45陈艺曦于博骏
软件 2019年1期
关键词:资金投入成果创新能力

陈艺曦 于博骏

摘  要: 基于第三次全国经济普查年鉴数据,运用机器学习算法和多元统计方法进行建模分析,构建了地区工业企业创新能力评价模型。首先利用K-means算法对31个省市自治区进行聚类,得到三个不同水平的分类;采用随机森林算法筛选影响类别划分的重要指标,其次运用因子分析方法提取影响地区工业企业创新能力的三个公因子,即资金投入、人力投入和创新成果;最后对各地区工业企业创新能力水平进行了综合分析,并对未来各地区工业企业创新发展提出建议。

关键词: 地区差异;工业企业;创新能力;K-means;随机森林;因子分析

中图分类号: O212.1;TP181    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2019.01.025

【Abstract】: On the basis of the third national economic census yearbook, this paper uses machine learning algorithm and multivariate statistical method to carry out modeling analysis, conducting an evaluation model of innovation ability for regional industrial enterprise. Firstly, we use K-means algorithm to classify 31 regions into three different levels; then random forest algorithm is used to screen the important indicators that affect classification greatly. In addition, we use factor analysis method to extract the three common factors of the industrial enterprises' innovation ability, namely, capital investment, human input and innovation results. Finally, the author conducts comprehensive analysis of industrial enterprises innovation ability in various regions, and puts forward suggestions for the future development of industrial enterprises.

【Key words】: Regional differences; Industrial enterprise; Innovation ability; K-means; Random forest; Factor analysis

0  引言

党的十九大报告指出,“创新是引领发展的第一动力,是建设现代化经济体系的战略支撑”。在经济发展新常态的背景下,实施创新驱动发展战略,发挥科技创新的引领作用,全面提高创新能力,是“十三五”时期乃至更长时期内国家的重要发展方向。工业企业,特别是规模以上工业企业(以下简称工业企业)是实现国家创新驱动发展战略的主导力量,是带动工业企业转型升级的排头兵,是促进地区经济持续发展的中坚力量。

工业企业的科技创新情况是《第三次全国经济普查年鉴》[1]的一个普查大项,是近年来国家大力倡导工业企业结构调整和产业结构升级的重要体现,是实现以企业为主体的技术创新体系建设新进展的客观反映。而工业企业创新能力的地区差异是当前工业企业推动结构调整、推进转型升级、提升核心竞争力和实现持续发展所面临的重要问题。如何客观有效的反映和评价各地区工业企业创新能力是目前专家学者研究的热点问题。目前研究工业企业创新能力地区差异的方法主要有:描述性统计分析[2]、锡尔熵法[3]、时序加权平均法[4]、熵权法[3,4]、因子分析[5-7]、层次分析[8,9]等。本文采用机器学习算法和多元统计分析方法,充分挖掘《第三次全国经济普查年鉴》中工业企业创新能力的数据信息,从而建立宏观角度的地区工业企业创新能力评价模型。本文的创新之处在于跳出传统的思维模式,通过“零散的数据”挖掘整合出核心评价指标,最大程度地避免主观因素的影响,实现了科学性、客观性和可操作性的协调统一。

1  数据来源

本文以国家统计局调研整理的《第三次全国经济普查年鉴》中工业企业科技创新情况的数据,包括R&D基本情况、R&D人员情况、R&D经费情况、R&D项目情况、企业办研发机构情况、新产品开发与生产情况、自主知识產权情况、政府相关政策落实情况技术获取、技术改造情况等九个方面,选取了31个省市自治区(除港澳台地区)的53个原始指标变量,作为反映地区工业企业创新能力的指标样本集。(见表1)。

2  K-means聚类

本文首先从样本数据集出发探究地区差异性,对各地区工业企业的创新能力实现相似地区聚类,这属于典型的无监督学习问题。K-means算法是目前比较流行的聚类算法,其主要原理是将样本集划分为几个不相交的组,需同时满足组与组之间的距离尽可能大,而组内的距离尽可能小[10]。本文利用R软件(版本3.4.1)对数据进行预处理并编程实现K-means算法[11],旨在对31个地区的工业企业创新能力样本数据集进行聚类分析。

对于K取2,3,…,10,分别计算聚类后的组内平方误差和,如图1。可以发现组内平方误差和随着K的取值的增大呈现下降趋势。不难发现,当K取3的时候组内平方误差和下降得最快,故选取K为3。因此,本文将地区工业企业的创新能力评价指标样本数据集划分成3个组,即将31个省市自治区(除港澳台地区)分为三个类,如表2所示。

3  随机森林算法的重要性评分

3.1  随机森林算法原理

随机森林算法是通过bootstrap的方法有放回抽样出n个指标集,并为每个指标集建立一棵分类树,通过n棵分类树的投票结果决定最优分类[11],如图2。通过计算每个指标在随机森林中n分类树上的平均贡献来衡量该指标的重要性评分,通常可以用Gini指数来评估指标的贡献大小。

3.2  筛选的重要指标

本文利用R语言编程实现随机森林算法,根据重要性评分原理,获取指标变量的重要性评分。本文选取重要性评分>0.4的指标变量作为地区工业企业创新能力评价的重要指标,如表3所示。

4  因子分析

4.1  标准化和相关性检验

为了消除数量级和量纲差异的影响,先对筛选出的15个指标进行标准化处理,再运用SPSS 25.0对标准化后的指标进行相关性检验[12]。由表4,KMO值为0.816,且巴特利特球形度检验的显著性小于0.05,根据KMO检验和巴特利特球形度检验的判别标准,各指标之间的信息重叠度较高,适合进行因子分析。

4.2  因子提取

由表5,旋转后的前三个成分的累计方差贡献

5  综合分析与建议

5.1  综合分析

通过因子分析,本文提取了影响31个地区工业企业创新能力水平的重要因素。从因子综合排名并结合聚类结果来看,各地区工业企业创新能力按从强到弱的层次排序为:第一类地区、第二类地区、第三类地区。各因子得分和综合得分的分值相差大,可以看出地区间的工业企业创新能力的差异较大,同一层次的地区间工业企业创新能力的参差不齐,各地区在资金投入、人力投入和创新成果这三个方面的优劣势分明。

工业企业创新能力处于第一层次的北京、天津、上海的因子综合得分位列前三。北京的工业企业资金投入力度大、人才资源多、研发能力强、产出的创新成果也是名列第一,故北京的工业企业创新能力的综合实力最强。天津虽然在资金投入因子上的得分最高,对于新产品开发的投入资金多,但由于人才资源、科研环境、技术水平等不如北京,其创新成果的产出量相对较低。上海也非常重视研发资金的投入,但缺乏科研人员的技术能力转化,导致创新产出成果也相对较少。

工业企业创新能力处于第二层次的地区综合得分也相距甚远。如广东、江苏、海南等东部沿海地区排名较靠前。广东、江苏的工业企业在科研活动中大力投入资金、引进人才,资源的合理配置决定了其创新能力的巨大潜力。海南作为唯一的省级经济特区,坚持改革发展,勇于突破传统经济体制束缚,在工业企业的科技创新产出上取得了骄人的成绩。西部地区如陕西、重庆等老工业基地得益于党中央的西部大开发政策、西部人才引进和科研资金支持,率先进行内部改革,从而实现了自身的创新能力和科研水平的快速提升。而甘肃、宁夏由于自然环境恶劣、工业基础薄弱、缺乏科研人才,此两省区的工业企业创新能力综合实力仍然低于全国平均水平。

工业企业创新能力处于第三层次的地区只有湖北和山东的综合实力高于全国平均水平,但它们在创新成果上的得分非常低,科研投入和产出不成正比。辽宁、吉林等地区响应国家振兴东北老工业基地的口号,在原有的工业基础上实现了一定的企业技术改造和技术进步。辽宁在的资金投入上得分较高,吉林的科研技术创新成果转化率较高,但产业结构的调整还需时日,其创新能力还有待进一步提升。西部偏远地区如云南、新疆、西藏,受到资源环境、科研条件、技术落后等原因的限制,工业企业基础薄弱,导致创新能力也较弱。

5.2  结论与建议

根据各地区工业企业在资金投入、人力投入和创新成果上的因子得分与全国平均水平的比较结果,我们得到如下结论:海南、宁夏两省的工业企业在人力投入和创新成果上的得分高于全国平均水平,但仍需加大资金投入;上海、重庆两市的工业企业在资金投入和创新成果上的得分位居全国前列,在人力投入方面却稍显不足,未来应着眼于科研人才的引进和培养;广东、山西、湖北和内蒙古地区的工业企业在人力投入和资金投入方面都处于全国上游,但创新成果产出量较低,未来应重视科研技术的转化和新产品的研发。而河北、江西、广西、云南和西藏地区的工业企业在资金投入、人力投入和创新成果上的得分均低于全国平均水平,因此增加科研资金、引进科技人才、重视技术的改造和产品的创新,是未来地区工业企业创新能力的必要条件。

综上,各地区工业企业应该充分发挥优势弥补劣势,重视开展科技创新研究,加大科研经费投入,

加强科技创新人才培养,促进技术升级和创新成果转化,从而提升创新能力和综合实力,推进地区  工业产业结构转型升级,带动区域经济持续健康  发展。

参考文献

[1] 国务院第三次全国经济普查领导小组办公室. 中国经济普查年鉴2013[CD]. 中国统计出版社, 2015.

[2] 卢方元, 范云菲. 我国大中型工业企业自主创新能力的区域差异比较[J]. 科技进步与对策, 2011, 28(16): 15-20.

[3] 桂黄宝. 我国大中型工业企业创新能力地区差距及变迁——基于1999—2010年面板数据的分析[J]. 财经论丛, 2013, 174(5): 3-8.

[4] 齐秀辉, 武志勇. 创新驱动视角下大中型工业企业创新能力动态综合评价[J]. 科技进步与对策, 2015(21): 114-119.

[5] 谷炜, 杜秀亭, 衛李蓉. 基于因子分析法的中国规模以上工业企业技术创新能力评价研究[J]. 科学管理研究, 2015(1): 84-87.

[6] 梁志兵. 区域规模以上工业企业创新能力评价——基于因子分析法[J]. 经济视角, 2015(9): 32-35.

[7] 苏杨, 罗万有. 工业企业自主创新能力评价研究[J]. 江苏科技信息, 2017(2): 23-26.

[8] 孙冰,吴勇. 地区自主创新能力评价指标体系的构建——以大中型工业企业为实例的研究[J]. 科技与经济, 2006, (4): 17-19.

[9] 马钦. 制造企业科技创新指数的构建与运用[J]. 产业与科技论坛, 2018(14): 80-82.

[10] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016. 197-204.

[11] Sebastian Raschka. Python Machine Learning[M]. Packt Publishing, 2015. 80-92.

[12] 张文彤, 董伟, SPSS 统计分析高级教程[M]. 北京: 高等教育出版, 2004: 195-199.

猜你喜欢
资金投入成果创新能力
高中数学课堂教学中创新能力的培养
创新能力培养视角下的无机化学教学研究
工大成果
加大项目建设资金投入,推动老区经济快速发展
“走出去”成果斐然
“健康照明”成果聚焦
基于创新能力培养的高职音乐教育改革探讨
“三医联动”扩大医改成果
欠发达地区农村资金投入与经济增长效应实证研究——以甘肃省为例
驻马店市水利资金投入现状及思考