李旭洋
摘 要:数字经济的蓬勃兴起为提升区域创新能力带来新的机遇。然而基于历史数据的实证研究虽已定量验证数字经济对区域创新能力的赋能作用,但鲜有研究实现中国区域创新能力预测。在此背景下,本文基于2004-2020年9个国家中心城市的样本数据,运用双向长短期记忆网络模型,实现了对中国区域创新能力的预测。研究表明:东部地区创新能力增速高于中西部地区,区域创新能力将进一步扩大;金融支持、人才聚集、基础设施分别是限制东部、中部、西部地区的首要因素。
关键词:数字经济;区域创新能力;深度学习;双向长短期记忆网络
中图分类号:F2 文献标识码:A doi:10.19311/j.cnki.16723198.2023.01.007
0 引言
随着我国进入新发展阶段,提升区域创新能力成为提高国家竞争力的核心战略。发展数字经济是实施国家创新驱动发展战略的重要路径。然而数字经济对区域创新能力的促进作用存在区域异质性,东部地区创新能力获得的红利高于中西部地区,对于区域协调发展起到了一定的阻碍作用。因此,预测中国区域创新能力发展趋势、识别数字经济对区域创新能力的主要影响方式,能够为制定有针对性的数字经济发展政策提供参考,对加快区域创新能力协调发展具有重要的理论与实践价值。
现有研究主要从城市或企业的层面,研究数字经济驱动创新能力发展的作用机理。在城市层面上,数字经济能够改善在人才环境、资金环境、市场环境、创业环境、竞争与合作环境等五个维度改善城市创新环境、提高城市创新效率;同时,数字经济会不断提升城市数字基础设施建设水平,为创新活动提供支撑。在企业层面上,数字经济能够引领企业创新发展,主要表现为培育新动能和传统产业提质升级两条路径;并且数字经济能够在一定程度上打破创新资源地域约束,企业能够跨区域整合数据、资本、人才和技术等生产要素,提高资源配置效率,减少交易成本。在数字经济的评价方面,现有研究主要基于基础设施建设、人才聚集度、金融支持、创新投入四个方面构建评级体系。其中,基础设施是数字经济发展的重要支撑,可分为固定网络基础和移动网络基础两类;人才集聚是数字创新的基础和先决条件,是创新活动中关键的稀缺资源;金融发展能够通过缓解融资约束、改善信息不对称以及传统金融向数字金融转型三个方面优化创新活动的融资环境,正向调节数字经济与城市创新能力之间的关系;创新投入是企业竞争的结果,在数字经济扩张下,企业面临信息透明和竞争加剧的压力,必须通过加大创新投入来促进新产品开发,进而促成了区域创新能力的提高。
多数学者在研究数字经济对区域创新能力的促进作用时,较多采用统计学方法,利用历史面板数据进行实证分析,鲜有预测区域创新能力变化趋势的相关研究,难以有效识别区域未来创新能力变化趋势,无法解决基于历史数据评价的区域创新政策调整滞后的问题。此外,虽然已有研究认为数字经济对区域创新能力的促进作用存在空间异质性,但未能识别数字经济背景下各区域创新能力的首要影响因素,对制定差异化区域创新策略的参考价值较小。近年来,深度学习模型被广泛应用于预测研究中,但该方法在预测区域创新能力上的有效性尚未得到验证。在此背景下,本研究参考现有数字经济评价指标体系,采用深度学习中的双向长短期记忆网络模型预测数字经济背景下中国区域创新能力,并通过设置对照实验探究各区域创新能力的主要限制因素。相较于已有研究,本研究主要完成以下三点贡献:第一,结合中国数字经济发展背景,采用深度学习方法构建了数字经济与区域创新能力间的定量分析模型,并实现了对中国未来五年内区域创新能力的预测,揭示了未来中国区域创新能力呈扩大趋势的现象;第二,通过设置对比实验,探讨了中国各区域创新能力的主要影响因素;第三,结合研究结论,提出了各区域应如何差异化利用数字经济赋能创新能力,实现区域创新能力的协调发展。
1 研究设计
1.1 研究方法
双向长短期记忆神经网络(Bi-LSTM)是深度学习模型的一種,是在长短期记忆网络(LSTM)模型的基础上增加双反向LSTM层,使得过去和未来的隐藏层的状态均可得到递归反馈,具有进一步挖掘当前负荷数据同过去及未来时刻负荷数据的内在联系、提升模型预测精度和特征数据利用率的能力。因此,本文应用双向长短期记忆网络模型(Bi-LSTM)对区域创新能力进行预测。Bi-LSTM模型结构如图1所示。
1.2 指标选取与数据来源
现有数字经济驱动创新能力发展的理论研究聚焦于数字基础设施建设、科研人才聚集度、金融支持、创新投入四个方面,本文参考现有研究中构建的评价体系,从以上四个维度选取输入指标。选取互联网宽带接入用户数和移动电话年末用户数作为基础设施建设评价指标,选取科学研究、技术服务和地质勘探业从业人数以及信息传输、计算机服务和软件业从业人数作为人才聚集度评价指标,选取年末金融机构人民币各项存款余额和年末金融机构人民币各项贷款余额作为金融发展水平的测度指标,选取R&D内部经费支出作为创新投入的评价指标,选取专利授权量衡量创新力。
本研究选取北京、天津、上海、广州、重庆、成都、武汉、郑州、西安等9个国家中心城市作为研究对象,根据地理位置划分为东部、中部、西部三个区域,输入指标及输出指标数据来源于2003-2020年《中国城市统计年鉴》及各城市统计年鉴。80%的数据用于计算机通过Bi-LSTM模型自主学习,20%数据用于检验Bi-LSTM模型的学习结果。本文采用平均绝对百分误差(MAPE)作为模型精度的衡量指标。
2 实验结果与讨论
2.1 预测模型有效性分析
经过模型测试,西部地区模型精度为42%,中部地区模型精度为65%,东部地区模型精度为71%,三个地区预测模型精度均小于10%,说明该Bi-LSTM模型能够有效预测中国区域创新能力。为了检验选取的Bi-LSTM模型的预测精度与适用情况,将其与当前较为成熟的门控循环单元模型(Gated recurrent neural network,GRU)、长短期记忆网络模型(Long short-term memory,LSTM)、支持向量回归模型(Support vector regression,SVR)、多元线性回归分析模型(Multiple regression,MLR)进行了区域创新能力预测对比,结果见图2。
图2直观展示了5种预测模型的实验结果,可以看出Bi-LSTM模型在三个区域的预测结果上都更贴近于实际值,特别是在近两年的预测中,Bi-LSTM模型预测准确度较高,而同为深度学习的GRU和LSTM模型在测试数据的预测中出现较大程度的偏离,这说明Bi-LSTM在增加后向LSTM后能够完整利用过去和未来的时间序列信息,在整体预测精度和极端值拟合上表现更好、泛化能力更强;此外多元线性回归分析模型在预测精度上同样不及Bi-LSTM模型,说明Bi-LSTM模型与常见的预测模型相比更够有效应用于区域创新能力的量化体系构建,实现区域创新能力的预测。
2.2 中国区域创新能力预测结果
本文运用Bi-LSTM模型对中国区域创新能力进行预测,预测周期为“十四五”时期,即2021-2025年,其预测结果如表1所示。
整体而言,我国各区域创新能力总体呈上升趋势。其中,西部地区创新能力逐步提升,专利授权量增速逐年加快,2025年将达到12.83万件;西部地区创新能力波动较大,2021年增速较慢,2022年出现负增长,2023年扭转至2025年保持高速增长,2025年将达到10.38万件;东部地区创新能力提升较快,专利授权量增速保持在13%左右,2025年将达到49.79万件。值得注意的是,我国东部地区与中西部地区创新能力间的差距逐年扩大,且增速虽呈震荡下降趋势,但将依然高于14%。
值得注意的是,我国东部地区与中西部地区创新能力间创新能力的差距逐年扩大,增速保持在14%以上,表明数字经济不仅在过去数年对区域创新能力的协调发展产生不利影响,还将在未来五年持续产生影响。区域创新能力能够促进区域经济高质量发展,区域创新能力的差异将转化为区域经济差异,加剧我国发展不均衡的问题。
2.3 中国区域创新能力影响因素分析
识别各区域创新能力的影响因素是破解中国区域创新能力发展不平衡的关键,为了探究输入指标对各区域创新能力的影响程度,本研究设置三组对比实验,通过减少依次输入指标后模型精度的变化表征输入指标对输出指标的影响程度。T1实验组旨在探究西部地区创新能力的影响因素,具体实验设计如下:(1)T1(a)删除输入指标中的互联网接入户数;(2)T1(b)删除输入指标中的移动互联网用户数;(3)T1(c)删除输入指标中的R&D内部经费支出;(4)T1(d)删除输入指标中的科学研究和技术服务业就业人数;(5)T1(e)删除输入指标中的信息传输、计算机服务和软件业从业人数;(6)T1(f)删除输入指标中的年末金融机构人民币各项存款余额;(7)T1(g)删除输入指标中的年末金融机构人民币各项贷款余额。T2、T3实验组按照同样思路分别探究中部和东部地区创新能力的影响因素。实验结果如表2所示。
T1(c)和T1(g)实验分别剔除R&D内部经费支出和年末金融机构人民币各项贷款余额两个输入指标对于模型精度的影响最大MAPE分别达到了1218%和1014%,说明对于西部地区而言科研投入和金融支持是影响区域创新能力的首要因素。这二者可能存在内生性,由于数字创新活动具有投入大、周期长的特征导致研发投入面临较高的资金要求,导致创新主体对金融支持的需求较高。然而,西部地区数字金融在覆盖广度、使用深度上与东部地区还有一定差距,企业创新投入受限,阻碍了西部地区创新能力的提升。因此,“十四五”期间西部地区应以数字金融和科研投入为抓手,加强企业创新支持。
T2(d)和T2(e)实验分别剔除科学研究和技术服务业就业人数和信息传输、计算机服务和软件业从业人数两个输入指标对于模型精度的影响最大,MAPE分别达到了1245%和1146%,说明对于中部地区而言人才聚集度是区域创新能力的首要影响因素。我国数字化人才储备难以满足数字产业发展的需要,并且中国数字人才的分布与数字经济的发达程度表现出高度的一致性,数字人才集中于上海、北京、深圳、广州、杭州、苏州等东部城市,导致中部地区数字人才稀缺。中部地区除加强人才引进外,还应内部人才培养,依托高校资源,培育特色化数字人才。T3(g)和T3(d)实验分别剔除年末金融机构人民币各项贷款余额和科学研究和技术服务业就业人数两个输入指标对于模型精度的影响最大,说明东部地区而言金融支持和人才聚集是区域创新能力的首要影响因素。金融发展和人才聚集是东部地区创新能力发展的主要限制因素。虽然东部地区在金融和人力资源上较为聚集,但由于东部地区数字经济产业较为发达,所需资源也相对较多,故依然需要一定的资金和人才资源投入。
3 結论
本研究通过构建双向长短期记忆网络模型,实现了对中国区域创新能力的预测,并通过对比实验识别数字经济背景下各区域创新能力的首要影响因素,得到如下结论:第一,基于双向长短期记忆神经网络的区域创新能力预测模型预测误差小,能较好地解决机器学习模型拟合度欠佳的问题,是一种适合的区域创新能力预测方法。第二,数字经济对城市创新能力具有显著的积极影响,在数字经济背景下,“十四五”期间我国区域创新能力稳步提升,其中东部地区创新能力增速将保持在13%左右;中部地区波动较大,2022年可能出现负增长;西部地区增速稳步提升,发展潜力较大。第三,东部地区与中西部地区创新能力间创新能力的差距逐年扩大。第四,科研投入和金融支持是影响西部地区创新能力的首要因素,人才聚集度是中部地区创新能力的首要影响因素,金融支持和人才聚集是东部创新能力的首要影响因素。
参考文献
[1]
刘华军,曲惠敏.中国城市创新力的空间格局及其演变[J].财贸研究,2021,32(01):1425.
[2]夏杰长,姚战琪,徐紫嫣.数字经济对中国区域创新产出的影响[J].社会科学战线,2021,312(6):6778.
[3]韩璐,陈松,梁玲玲.数字经济、创新环境与城市创新能力[J].科研管理,2021,42(04):3545.
[4]魏亚飞,李言.网络基础设施与数字经济产业化——来自“宽带中国”政策的准自然实验[J].云南财经大学学报,2021,37(07):114.
[5]焦帅涛,孙秋碧.我国数字经济发展对产业结构升级的影响研究[J].工业技术经济,2021,40(5):146154.
[6]杨文溥.数字经济与区域经济增长:后发优势还是后发劣势?[J].上海财经大学学报,2021,23(03):1931+94.
[7]陶浪平,厉雨捷,王刚贞,等.数字普惠金融、城乡收入差距与区域异质性[J].青海师范大学学报(哲学社会科学版),2021,43(1):111.
[8]徐斌,罗文.价值链视角下科技人才分布对区域创新系统效率的影响[J].科技进步与对策,2020,37(3):5261.
[9]孙凯.中国区域创新能力影响因素灵敏度分析[J].数理统计与管理,2021,40(03):417428.
[10]陈婕.政府支持、企业R&D投入与技术创新绩效关系研究[J].预测,2021,40(02):4046.
[11]谢小瑜,周俊煌,张勇军,等.基于WBiLSTM的可再生能源超短期发电功率预测方法[J].电力系统自动化,2021,45(8):175184.