基于LSTM 神经网络的创新创业发展预测与区域发展比较
——以陕西与四川为对象

2021-11-11 12:03
科技管理研究 2021年19期
关键词:预测模型发展

查 博

(西安财经大学商学院,陕西西安 710100)

创新是社会发展进步的灵魂,创业是促进经济与社会实现快速发展、改善民生水平的重要途径,创新和创业其实是连为一体、共生共存的关系。2018 年印发的《国务院关于推动创新创业高质量发展打造“双创”升级版的意见》(国发[2018]32 号),明确指出切实促进大众创业、万众创新的目标发展,是我国创新驱动发展战略得以实施的重要支持,是深入推进供给侧结构性改革的重要路径。打造“双创”的升级版,推进创新创业实现高质量快速度的发展,有利于促进并增强以创业带动就业的能力,有利于提升科技的创新水平和产业的发展活力,有利于创造并提供优质资源供给和扩大有效的市场需求,对我国经济实现快速良性的发展,具有重要的内生动力意义。

在国家和政府对创新创业事业的大力扶持下,我国创新创业的发展水平不断的提升,这关系到国家创新创业总体方针与相应政策能否得到落实并是否获得成功的重要反应和持续性结果。而创新创业未来的发展特点及趋势如何,直接影响着我国创新型国家建设以及以创业推动就业水平提升的目标与号召。因此有必要对创新创业的发展水平及其趋势进行科学的预测,并以预测结果与展现出的发展特点为基准来制定未来创新创业的发展目标和保障政策。

国内学者在相关研究领域有着一些研究成果。宋傅天[1]认为在实践中,大学生双创规模发展潜力巨大、创业成功率不断提高、区域分布逐渐优化,但存在技术创新能力不足、商业模式尚不完善、融资方案的设计经验不足等显著问题。针对这些问题及其各自的成因,政府、学校与学生等实施主体应该尽职尽责,激励相融,大力营造良好的政策环境、加强“双创”教育、提高自身能力,努力推进大学投身于创新创业事业中来。韩立[2]认为我国高校创新创业教育发展中还面临一些问题和不足,采取切实有效的相关措施,不断改进与完善大学生创新创业课程体系,明确创新创业人才培养目标,对改善高校创新创业教育现状、提高人才培养质量具有重要的意义。张秀峰等[3]通过对北京市31 所高校大学生创新创业教育相关课程、课外实践活动现状进行实证调查后发现:大学生创新创业教育存在创业教育课程未能很好地融入教学体系、创新创业实践教学环节同质化严重、创业环境不够完善、创新创业的兴趣还需进一步激发等问题。雷朝滋[4]认为做好创新创业工作是落实国家战略的重要举措。大力推进创新创业工作是我国高等教育自身改革发展的根本需要。加强创新创业教育是减轻高等学校毕业生就业压力问题的一剂良方。王伟忠[5]构建了大学生创业指导服务“三维联动”的工作机制和“要素协同”的运行模式,切实发挥政府、高校、市场(社会)等主体和多要素在大学生创业指导服务中的引导、培育和支持功能,有利于推动和提升大学生创业指导服务的能力建设,促进大学生创新创业进程实现可持续发展,提高大学生创新创业的成功率和发展质量。赵军等[6]在对“互联网+”与创新创业国家战略的实施背景进行研究的基础上,阐述了“互联网+”的含义和本质,分析了“互联网+”环境下大学生创新创业信息平台构建的必要性,运用专家访谈和问卷调查的方法,分析了“互联网+”环境下大学生创新创业的需求和平台的设计功能,最后提出了基于“云平台”的三层架构。查博等[7]从创业投资角度探讨了分阶段投资中创业企业面对不完全资本市场和创投公司面对道德风险及不确定性时的模型,分析了分阶段投资在模型中作用。在对比初期一次性投资和分阶段投资后,结合再谈判行为的特性,发现了一些有意义的结论。

外文文献在相关研究领域有着一些研究成果。Satish Nambisan 等[8]认为强大的数字技术、数字平台和数字基础设施的出现,在很大程度上改变了创新和创业。数字技术不仅为创新者和企业家提供了新的机遇,还对价值创造和价值获取具有更广泛的影响。Lei Cheng 等[9]试图调和政治关系对企业创新的混合效应。利用中国雇主—雇员调查(CEES),发现政治联系有助于那些有创新企业家的企业开展创新活动,但阻碍了那些没有创新企业家的企业开展创新活动。Erasmia Leonidou 等[10]认为利益相关者参与创新管理和后续创业发展的先行作用是相互关联的。通过系统的方法回顾和框架开发,可以更全面、更深入地了解企业家与各利益相关者之间的互动关系,从而促进创新管理和创业发展。Chirantan Chatterjee 等[11]认为尽管印度的创新、创业和科技活动越来越多地由女性主导,但在实现男女平等之前,仍然存在着巨大的差距。Giuseppe 等[12]以文化创新理论为基础,以一家新近成立的消费者创业企业为例,分析了该企业在本土竞争中所追求的文化定位。历时两年的纵向案例研究将纵向案例分析与积极的研究结合起来,得出了一些发现,这些发现揭示了消费者如何认识到文化机会的存在,如何制定文化战略,以及如何构建一家公司来从商业上利用这一机会。AdrianTantau 等[13]旨在评估通过投资可再生能源而扩大活动领域的公司的创新特征,并确定哪些组织支持因素对这些特征的影响最大。该分析基于对30 家遵循企业创业战略投资于可再生能源的公司的研究。结果表明,管理层对企业创业和工作自主性的支持是支持这些多元化企业创新的组织因素。Chih-WenWu 等[14]以独到的视角和先进的知识探讨全球创业创新。企业家精神在创造价值、创造财富和就业方面发挥着关键作用。企业创业是一个日益增长的研究领域,在过去的几十年中受到越来越多的关注。在全球经济寻求保持和提高竞争优势的过程中,创新非常重要。企业家和创新者都将新发明引入生产活动中。Mónica Edwards 等[15]提出了社会认知理论和社会建构主义的充分性论点来解释创造力、创新和创业(CIE)作为一种元能力的发展。实证结果表明,大多数学生认为自己是有创造力的人,并认为创造力与创新和创业精神密切相关,在企业家能力中创造力的相关性方面,美国学生比西班牙学生更相信这一点。Domingo 等[16]认为创新被认为是创业的一种具体手段。创业是创新发展到一定程度必然出现的结果,两者是不可分离的。Mihai Talmaciu[17]探讨促进一种发展模式的可能性,这种模式能够利用罗马尼亚各区域,特别是东北区域的能力作为推动因素,通过创新、发展领先技术和刺激企业家精神来获得竞争优势和可持续发展。

过去的研究,基本上是从创新创业教育、创新创业影响作用、创新创业与企业家精神和如何促进其发展的角度来进行研究与分析的,而对于创新创业发展水平及趋势的预测与分析,目前少有学者进行研究。对创新创业发展水平的合理预测,才能为其日后的发展提供具有前瞻性及合理性的决策,并为创新创业未来的发展打下良好的定量研究基础。因此本文提出建立基于LSTM 神经网络的创新创业发展预测模型,在对比传统回归预测模型和传统神经网络预测模型的基础上,探究LSTM 模型在反应创新创业发展水平指标预测研究中的先进性和前瞻性。这有助于反应创新创业在其发展中体现的特点,进而有助于国家相关部门制定更加科学合理的决策。通过对比同处中国西部的两个重要省份(陕西省和四川省)的创新创业发展情况,能够得出其各自发展过程中表现的特点如何,进而对其发展原因有所探究。通过分析发展原因,给出相应的政策建议,为促进区域创新创业的发展打下良好的研究基础。

1 创新创业发展影响因素和指标选取

1.1 创新创业发展影响因素及数据

创新创业的发展过程,受很多因素的影响,本文通过分析创新创业的基本流程,来确定影响区域创新创业发展水平的诸多因素,具体如下图1 所示。创新创业需要相当大的投资作为支撑动力,双创人员在得到了投资后,会做出研发的行为,通过研发行为,进而实现相应科学技术上的提升,而这些新的创新型科学技术,最终都会导致区域社会生产力的增长,比如人的购买力、人均生产水平和就业率等。而生产力的增长,反过来又会促进从投资到研发,从研发进而产生科学技术飞跃的整个过程。

图1 创新创业发展流程

因此创新创业的发展,其实就是一个较为典型的闭环式投入产出系统,在流程上应该包含4 个阶段,即:投资——研发——提升科学技术——转化生产力。

在能够收集到数据的前提下,尽可能多地考虑影响创新创业发展的相关数据。本文使用的数据指标包括:用R&D 经费内部支出、R&D 人员、R&D项目数、科技研发机构数、专业技术人才来衡量研发水平;用专利项目授权量、全省地方登记的科技成果、各类技术合同数、各类技术合同成交额来衡量科学技术水平;用全社会固定资产投资来衡量投资水平;用就业率、国内生产总值、人均国内生产总值、人均可支配收入来衡量生产力水平。所使用数据来自于陕西省统计局及四川省统计局1999—2019 年的数据。创新创业发展指数是通过邀请20 位创新创业研究领域的专家打分得来。

1.2 创新创业预测指标

创新创业发展水平的衡量指标,一般包括投资、研发、科学技术和生产力转化四项。出于数据的准确度考虑,创新创业发展指数由行业专家打分来决定,具体评分等级如表1 所示,通过专家打分并加权得出的创新创业发展指数,通过归一化处理后,其可靠性较高,具有良好的适应性。所以本文仅使用创新创业发展指数作为创新创业发展水平的评估和预测指标。创新创业发展指数的评价等级如下表1 所示。

表1 创新创业发展指数的评价等级

1.3 性能评价指标

为了反映模型预测的偏离水平,使用误差率与均方根误差来表示。为了说明模型拟合水平,选用均方根对数误差与决定系数来表示。

误差率E 和均方根误差RMSE 的运算为:

1.4 变量关联分析

如果数据中相关信息有噪声或不相关,则预测所得数据可能会受到某种程度的影响。比较每一组变量的卡方值和相关系数,可以用来优化和筛选变量。这样可以达到优化预测结果的目标。卡方值的计算公式如下:

卡方检验能计算并表示样本之间的偏离程度,卡方检验的值越大,表示存在的关联就越明显。皮尔森相关系数能够粗略地表达变量之间的关联程度如何。卡方值与相关系数越大,说明相关性越高。

根据下表2,本文最终使用14 个相关的自变量和区域创新创业发展指数作为输入变量,共15 个变量。

表2 卡方值和皮尔森系数值

表2(续)

2 创新创业发展预测的LSTM 模型——基于陕西数据

LSTM 模型是递归神经网络的一个变型[18-19]。它搭建了特殊的记忆存储型单元,通过时间逆向传播算法对已知数据进行反复的训练[20],这可以解决递归神经网络所产生并存在的梯度消失及无长期依赖的问题。

2.1 归一化处理

本文用以下方法对原始数据做归一化处理,通过线性转化可以使得结果能够落到[0,1]区间,转换公式如下:

上式(7)中,min 与max 分别为样本数据特征值的最小值与最大值。x与X分别为原始数据及归一化后的数据。

2.2 隐藏层节点个数

隐藏层中的节点个数,学术界到目前为止并没有明确的理论来进行规定。通常情况下使用下列公式来确定节点个数:

上式中,N是隐藏节点数,n是输入节点数,m是输出节点数,a为1~10 之间的常数。

根据本文所选变量的个数,可以知道输入节点为15,输出节点为1,由上式(8)可知隐藏节点为5 至14。运用1 层LSTM 模型,试验并确定从5 至14 个节点所对应的误差率及误差平方和,并以此来判断模型的偏离程度。进而选取合适的隐藏层节点个数。

实验结果可以得出使用11 个隐藏节点的LSTM模型,其对应的RMSE 值最小,因此这样的预测效果最好。测试集的误差率与均方根误差结果如下表3 所示。

表3 不同隐藏节点的创新创业发展预测

表3(续)

2.3 模型深度

本文所选的年份仅有21 条数据记录,用1 至5层的模型,每层仍包括11 个隐藏单元,以此来做一对比。通过实验计算出的RMSLE 与R2来判断哪一层模型的拟合能力最佳。RMSLE 值越小,R2值越接近1,说明模型的拟合能力越强。

具体拟合效果如下表4 所示。根据下表4 中的结果可知,2 层LSTM 模型的数据拟合能力为最佳。

表4 不同层数模型均方根对数误差和决定系数

2.4 网络结构

通过以上的实验分析,可以知道拥有2 个隐藏层并且每个隐藏层中拥有11 个隐藏节点的LSTM 模型,是本文要选取的最优LSTM 模型。数据集包含14 个输入型变量和1 个输出型变量。学习率设置成0.02,权重W*、U*与偏移向量b*,以上参数全部实现初始化随机应用。为了更新权重与偏差度,需要不断的训练序列来实现。选用平均绝对误差(mae)来表示所用LSTM 模型中损失函数的修正误差,并使用Adam优化器,促使网络实现最优化学习。

3 实验对比分析——基于陕西数据

3.1 实验环境

本例实验环境为LENOVO 台式机,CPU:AMD 3600@3.60GHz,内存为16GB,操作系统为Windows10 企业版,开发环境为使用python3.5 语言的PyCharm 集成开发工具,使用LSTM 等神经网络模型。

3.2 实验设计及结果分析

本文设计包括传统的回归模型与神经网络模型的三组实验,实验项分别为多元非线性回归(MUL)、BP 神经网络模型以及长短期记忆神经网络模型(LSTM)。分别将1999—2015 年的17 条数据以及2016—2019 年的4 条数据作为训练集和测试集。用前一年的数据做输入样本,预测未来一年的创新创业发展指数。图2 为1999—2019 年实际创新创业发展指数的趋势图。

图2 1999—2019 年陕西创新创业发展指数

经过实验训练,LSTM 模型、MUL 模型以及BP模型在测试集中的预测结果如表5 所示。

表5 测试集预测结果

测试集中的预测结果显示,BP 神经网络和MUL回归模型无明显的规律,预测精度也不高。而LSTM在2016、2017、2018 年和2019 年的准确率较高。分析图3 中的创新创业发展指数的趋势可得到,LSTM 对趋势的预测效果较佳。同时也证明出LSTM模型确实学习到了数据中的时间依赖信息。

图3 1999—2019 年陕西创新创业发展指数和各模型的拟合效果

根据1.3 节所提到的性能评价指标,对各模型拟合所有数据的效果进行测评,在此基础上加入模型的训练耗时指标进行对比,各模型的性能指标如表6 所示。

表6 各模型的性能指标

表6 中不同模型的性能指标显示,LSTM 模型的RMSLE 值最小,R-square 值最接近1,模型拟合效果最好。在训练时间方面,LSTM 的训练时间最慢,但其与BP 训练时间的差距要远小于BP 与MUL 之间训练时间的差距。所以综合看来LSTM 模型的性能最好。

运用LSTM 神经网络预测2020—2024 年的陕西创新创业发展指数,并将其输入创新创业发展模型,得出2020—2024 年陕西创新创业发展指数,结果见表7。

表7 陕西创新创业发展影响因素及创新创业发展指数的预测

根据预测结果,将2020—2024 年的陕西创新创业发展指数及各分指标与往年情况对比可知:R&D人员数、R&D 项目数及专利项目授权量没有了之前年份呈现出的较大波动性,转为平稳的增涨态势;全省各类技术合同数没有了之前跨越式的增涨方式,呈现出平稳提升的发展状态;就业率与全省地方登记的科技成果数从原来持续低迷的发展态势中恢复过来,转变为缓慢上升的发展趋势;专业技术人才数量呈现出平稳上升的发展态势;R&D 经费内部支出、科技研发机构数、各类技术合同成交额、全社会固定资产投资、国内生产总值、人均国内生产总值和人均可支配收入稳步提高。从2020 年到2024 年,陕西创新创业发展指数预测值逐步提升,达到了良好的评价等级(等级划分标准参看表1),朝着优秀的标准逐步迈进。这一对比结果说明了我国大众创业万众创新的目标和措施初见成效。预计经过“第十四个五年规划”,陕西创新创业水平会实现平稳且良好的上升态势。

3.3 鲁棒性分析

创新创业的发展,所受到的影响因素众多,各种条件状态的表现十分复杂。预测模型如果能够较为稳定精确地对复杂多变的状况进行合理的预测,就能说明模型具备良好的鲁棒性。分析本实验中模型的鲁棒性时,应着重考虑两个方面的情况:第一,内部影响因素,模型训练所用的数据是否存在异常性波动。第二,外部影响因素,社会层面上出现的政策调控,会对预测数据产生促进或抑制的影响作用。无论内部影响因素还是外部影响因素,重点都在数据上。针对模型训练数据来讲,最难以控制的就是外部影响因素。外部影响因素的作用仍然是间接影响训练所需数据的主要因素,在预测效果上就可以得到体现。

本文采用以下方法来进行鲁棒性分析。第一,对异常数据应当进行可视化研究,观测每一个变量的均匀程度,并对显示不均匀的数据进行相应处理,例如:使用lg 对数函数进行相应的处理。第二,对存在异常波动的变量采取分类处理的策略,待完成相关性分析后,分别建立若干个相应模型来训练预测。最后将对应若干个模型的预测结果进行叠加。模型针对特定数据的分类训练,也能够提高预测的精准度,从而提高该预测模型的鲁棒性。

4 区域创新创业发展的比较分析——基于陕西与四川的数据

4.1 陕西与四川创新创业发展各指标的数据比较

陕西与四川创新创业发展各指标的数据对比如下图4 所示。

图4 1999-2019 年陕西与四川创新创业发展各指标的数据比较

4.2 比较结果与原因分析

如上图4 所示,对比陕西与四川创新创业发展的14 项分指标后发现,四川省近些年在影响创新创业发展的指标(R&D 经费内部支出、R&D 人员、科技研发机构数、专业技术人才、全社会固定资产投资、国内生产总值、人均可支配收入)的数值上,要比陕西省创新创业发展指标对应的数据要高。陕西省近些年在创新创业发展的影响指标(R&D 研发项目数、专利项目授权量、全省地方登记的科技成果、各类技术合同数、各类技术合同成交额、人均国内生产总值)对应的数据上,要比四川省创新创业发展指标高。初始年份时各指标的相差并不大,最近几年两个省份在创新创业方面的投入和产出分别领先对方(如表8 所示),这样的差距似乎有不断加大的趋势。在就业率指标上,两者的差距并不明显。总体上来讲四川与陕西各有其发展的优势。在创新创业的发展指数反映上,四川省的创新创业发展指数略高于陕西省,可这种差距并不明显,说明在目前中国“大众创业万众创新”的大环境下,陕西省与四川省各个评价指标在数量大小上互有胜负,但同处于中国西部的两个大省却有着较为相近的创新创业总体发展水平。

表8 陕西省与四川省综合近五年创新创业发展领先指标

从具体衡量指标上来看,陕西省和四川省各自创新创业发展的侧重点是不同的。四川省拥有着丰厚的技术人才与研发人员,科研机构也比较多,截止2019 年7 月,世界500 强中有超过一半的企业集团入驻了四川省[21],其高科技的研发支出与固定资产投资也相对较多,这能为创新创业的发展奠定良好的人力物力基础。陕西省在以上几个方面不如四川省,但其在创新技术的成果数量和成交额上却获得领先。陕西省在国内生产总值方面不如四川省,人均生产总值却更多,这能为陕西创新创业的发展提供更大的推动力,说明陕西创新创业发展的效率要比四川强大,较高的效率弥补了人力物力在投入数量上的不足。

近些年来,四川凭借着西部振兴计划的深入实施、国家对社会发展的大力投入和自身坚持不懈的努力,成功带动了更多的人进行创新创业,国内生产总值的基数与增速不断加大,只是由于其人口基数更大,因此人均生产总值不如陕西省。在2015 年国家提出大力发展双创经济的大背景下,四川省就业率在目前中国经济正在实现逐步转型的时期,仍出现上升的势头。陕西省作为西北五省发展的龙头省份,凭借着其悠久璀璨的历史文化优势,加上深厚的军事工业科技基础与强大的高校科研能力,为陕西创新创业的发展提供了源源不断的推动力。

因此可以看出,四川在创新创业的发展中拥有着更好的基础性投入,陕西在创新创业的发展中拥有着更强的技术产出,综合来讲两者有着相近的创新创业总体发展水平,但具体发展细节与侧重点则各有不同。

5 结论与建议

本文建立了基于LSTM 神经网络的创新创业发展预测模型,通过与传统的回归模型与BP 神经网络模型对比后,认为LSTM 神经网络模型对创新创业发展水平的趋势具有更好的预测能力,能为政府部门提供更为准确的预测指标数值,从而使有关部门能制定更加科学准确的促进方案,对我国创新创业的发展评价亦有一定的指导意义。

在比较1999 至2019 年陕西省和四川省创新创业发展影响指标的数值后发现,虽然两个省份有着相近的创新创业总体发展水平,但具体发展细节与侧重点则各有不同。四川在创新创业的发展中拥有着更好更大的基础性投入,而陕西在创新创业的发展中拥有着更高更强的技术产出水平,可以看出陕西创新创业发展的效率要比四川强大,较高的效率弥补了人力物力在投入数量上的不足。

结合以上对陕西省与四川省创新创业发展的比较分析,本文对创新创业发展的建议如下:

(1)认清自身创新创业的发展现状和特点,突出其发展优势。应该准确把握其经济发展的优势环节,重点关注其在军事工业,农商领域,科技与民生产业,教育事业以及服务型行业等领域创新创业的发展水平,将自身发展优势充分得到利用,以各自的产业优势带动创新创业的发展,发挥产业优势的指向性作用,为创新创业的发展提供强有力的基础性支撑。

(2)弥补自身创新创业发展中的不足,实现其均衡稳定发展。在实现优势产业带动创新创业的同时,也要关注并不断解决自身在创新创业发展中的不足之处,通过与自身对比,与产业发展互补型兄弟省市的对比,汲取其他省市在创新创业发展中所遇到的问题、获得的宝贵经验以及成长的性质特点等经验,认识和改善自身在创新创业发展中的不足,实现创新创业的稳定均衡发展。

(3)深入贯彻国家双创精神,提升国家创新创业政策的落实水平。充分抓住国家对创新创业的政策扶持机会,在贯彻国家双创相关精神思想的同时,享用国家对创新创业培育与支持所带来的红利,并且制定符合各省实际情况的创新创业政策,将落实国家及各省创新创业政策的任务放在发展创新创业的首要位置,以政策驱动、实际发展和总结经验为阶段来促进创新创业事业实现快速良好的发展。

猜你喜欢
预测模型发展
无可预测
适用于BDS-3 PPP的随机模型
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
自制空间站模型
迈上十四五发展“新跑道”,打好可持续发展的“未来牌”
砥砺奋进 共享发展
模型小览(二)
改性沥青的应用与发展