基于灰色BP神经网络的我国工业增加值预测研究*

2022-06-25 08:23:46任倩计春雷
科技促进发展 2022年1期
关键词:原始数据增加值残差

■ 任倩 计春雷

1.上海海洋大学信息学院 上海 201306

2.上海电机学院大数据挖掘重点实验室 上海 201306

0 引言

随着我国的经济实力和综合国力不断提高,我国的宏观经济数据备受关注,且工业作为国民经济中一个十分重要的物质生产部门,占有国民生产总值的最大份额,在社会经济活动中有着重要的地位。工业增加值意为企业在进行工业生产中以货币形式新增加的价值,其可以衡量一个国家工业发展的速度,是判断我们国家工业发展水平是否提高的重要指标。工业增加值对企业实现经济增长起到了决定性作用,对工业增加值进行预测可以帮助其提高生产经营和管理能力,有利于企业对未来发展方向进行判断和规划。政府部门和企业在制定工业发展政策时,通常将其作为的重要标准,对工业增加值的变化准确预测对于政府部门和企业的发展具有重要意义。

在目前已有的工业增加值预测研究方法中,主要有传统预测和机器学习两类方法。传统预测方法主要有线性回归,灰色预测以及时间序列分析等。刘静思等[1]采用线性回归方程对单一模型进行组合,并在中长期工业增加值预测中取得了较好效果,然而此方法只考虑数据间存在的线性关系,忽略了数据间的非线性关系。何川[2]利用时间序列分析的理论预测我国工业增加值的历史数据,预测结果表明,时间序列方法是进行模型模拟和短期预测有效的方法。 高宇等[3]结合ARMA 模型与博克斯詹金斯的“航空数据模型”对工业增加值进行拟合,拟合后的残差不存在相关性。由于时间序列分析法强调忽略外界因素影响,所以模型的预测误差难以把控,当外界产生较大改变时,预测结果会出现较大偏差。机器学习方法主要包含支持向量机,神经网络等。徐智勇等[4]利用支持向量机方法并结合微分进化理论(Dif‐ference Evolution, DE)对工业增加值进行预测,该类方法能够降低计算复杂性,但受参数和核函数的影响,只适用于小样本训练集。上述方法为研究工业增加值奠定了基础,然而其存在应用场景单一、迁移学习能力弱等缺点,难以在企业工业增加值估计中得到广泛应用。

由于影响我国工业增加值变化的因素繁杂多样,各个因素影响工业增加值变化的程度均不同,部分影响因素还存有灰色性,并且它们之间还具有复杂的非线性关系,而在处理不确定和非线性的问题上灰色模型和BP神经网络具有明显的优势。综上所述,本文结合灰色模型与BP 神经网络模型,发展了一种基于灰色BP 神经网络[5-10]的工业增加值预测方法。首先运用灰色模型对工业增加值的数据序列进行拟合,然后采用BP 神经网络对灰色模型实际值和预测值的残差序列进行修正;最后结合BP 神经网络修正的残差值与灰色模型预测值得到最终的工业增加值预测结果。

1 灰色BP神经网络预测模型

由于我国工业增加值变化有很强的季节波动性[11],其季节波动兼有平滑转换形式的结构时变与非线性特征,仅采用灰色或者BP 神经网络单一模型不能得到很好的预测效果。所以本文发展了一种基于灰色BP 神经网络的工业增加值预测方法,其主要流程如图1所示。

图1 模型预测流程

首先将原始数据进行预处理,考虑到工业增加值具有季节波动性,将数据分为一、二、三、四个季度分别输入到灰色模型中,运用灰色模型对工业增加值数据序列进行拟合,然后建立神经网络残差修正模型,最后将残差对灰色拟合值进行修正,即将灰色模型的预测值与对应的BP神经网络修正的残差值叠加,输出最终预测值。

1.1 灰色模型

GM(1,1)是根据灰色系统理论[12]建立的灰色模型。该模型不依赖大量样本和典型分布,能够根据少量不完整的信息建立数学模型,从而对未来的发展趋势进行预测。当原始数据序列为高增长序列或者序列数据变化较快时,GM(1,1)模型则会出现预测精度偏低[13]的缺点。其建模步骤主要如下:

(1)原始数据序列为x(0),一阶累加处理得到生成序列x(1),如公式1。

计算累加序列x(1)的均值生成数列z(1),如公式2。

(2)建立灰色微分方程,即:

其中,a为发展系数,b为灰作用量。

(3)利用最小二乘法求解灰色微分方程的系数列:

其中,

求解灰色微分方程得:

则x(1)的灰色预测模型为:

(4)做一阶累减得出原始数据的预测序列,得到原始数据序列的灰色模型为:

1.2 BP神经网络

BP 神经网络是一种被广泛应用的采用误差逆传播算法训练得到的多层前馈网络[14]。它由输入层、隐含层和输出层3个部分构成。该网络训练的实质是利用误差反向传播算法对各个权值和偏置值进行修正,从而使网络达到收敛的状态[15]。图2 为BP 神经网络的拓扑结构图。

图2 BP神经网络的拓扑结构图

如图所示,xn为输入值,ym是网络输出值,wij和wjk为网络权值,从图中可以看出,BP 神经网络反映了xn到ym的函数映射关系,是一个非线性函数,而影响预测的因素众多,工业增加值数据序列之间存在非线性关系,因此使用BP 神经网络来预测工业增加值具有很好的适用性。

BP神经网络训练过程如下:

(1)隐含层输出计算,如公式10 所示。其中,f为隐含层传递函数,a为隐含层阈值。

(2)将隐含层输出H,连接权值wjk和输出层阈值b代入公式11,得到预测输出O:

(3)将预测输出O和期望输出Y作差,计算得到预测误差e。

(4)利用误差e 更新网络连接权值wij,wjk。其中,η为学习速率。

(5)利用误差e更新网络节点阈值a,b。

1.3 灰色BP神经网络

灰色模型的优点是根据少量的实测数据就可得出未来短期内较为精确的预测数值,采用微分方程来挖掘系统的本质,可以将无规律的原始数据转化为规律性较强的生成序列。但其相比BP 神经网络而言,明显的缺点是在模型建立时预测误差不可控制,若在进行中长期预测时精度较低。BP 神经网络具有自适应学习能力强解决非线性问题灵敏的优势,将两种模型优势结合,就可以实现在实验数据样本较小的情况下,预测结果可以保持较高的精度并且误差也在可以控制在一定的范围内。

首先,设原始数据序列{x(0)(i)},i=1,2,...,n,用GM(1,1)模型对原始数据序列拟合得(i),i=1,2,...,n,时刻T的残差记为e(0)(T),即

构建残差序列{e(0)(T)}的BP 神经网络:设残差序列e(0)(T),i=1,2,...,n,假设模型预测的阶数为S,那么第i时刻的值就可以通过e(0)(i- 1),e(0)(i- 2),...,e(0)(i-S)来预测,将其作为BP 神经网络训练的原始输入,BP神经网络的期望输出就是e(0)(i)。通过BP 神经网络训练残差序列,得出输入向量所对应的值,整个过程中BP神经网络的权值和阈值就是其根据自适应学习而确定的正确内部的表示。

最后得出最终预测值(i,1):(i,1) =(i) +(i)。即(i)为灰色模型预测值,(i)为BP 神经网络修正的残差,(i,1)为BP 神经网络对灰色模型预测残差序列修正后的预测值。

2 实验过程、结果与分析

2.1 数据集及数据预处理

数据来源于国家统计局(http://www.stats.gov.cn/),选取2008年1月至2017年12月工业增加值作为训练数据集A。按照季度进行划分,A=[a1,a2,a3,a4],其中a1、a2、a3、a4分别为训练集每年第一季度、第二季度、第三季度及第四季度的工业增加值;选取2018年1月至2019年12月工业增加值作为检验数据集B,B=[b1,b2,b3,b4],其中b1、b2、b3、b4分别为测试集每年第一季度、第二季度、第三季度及第四季度的工业增加值。经检验数据无缺失,无异常值,由于神经网络是以概率计算和预测样本的,并且sigmoid 函数在0 和1 之间取值,网络最后的输出也是如此,故要对实验数据采取归一化处理,如公式18。其中,x、xmin、xmax分别为原始数据、原始数据中的最小值、原始数据中的最大值,为预处理后的数值。

2.2 评价标准

为评价模型预测的性能是否合格,本文分别使用平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)作为评价准则,分别定义如公式19-21所示,其中为模型预测值,yi为实际值。显然,3 个评价值越小,就表明模型预测精度越高。

2.3 实验过程

采用上述灰色BP 神经网络组合模型对工业增加值进行预测,首先将2008~2017年工业增加值分组输入灰色模型中,并预测未来两年的工业增加值,通过灰色模型预测得到残差序列并将其作为BP 神经网络的训练集。其中,BP 神经网络模型的参数设置为:训练函数为梯度下降的BP 训练函数,训练周期为50,学习率为0.05,最大迭代次数为300,目标误差为0.001。隐含层节点数根据试算法确定,当节点个数为7 时,误差较小,如表1所示。

表1 不同隐含层节点数预测效果

2.4 实验结果与分析

分别将3 种模型预测数据与实际数据进行分析,见图3、6。

图3 灰色、BP神经网络、灰色BP神经网络模型第一季度工业增加值预测结果

从精度评价角度来看,如表2 所示,采用灰色模型预测的工业增加值的误差范围为0.16%~4.99%;BP 神经网络模型预测的误差范围在0.02%~0.11%;而灰色BP神经网络模型预测的误差范围则在0.01%~0.05%,灰色BP神经网络模型的预测误差大部分都要小于单一模型的预测误差,预测精度明显提高。通过表2可知,由于受到季节波动性的影响以及模型本身适用于数据的局限性,灰色模型工业增加值的预测误差较大,特别是第一季度的相对误差较大,灰色BP 神经网络模型优化了这一点,在运用灰色模型的基础上,加入了能够很好解决非线性时间序列预测误差较大的BP 神经网络,组合模型预测精度得到了明显的提升,相对于另外两种模型拥有更好的预测效果,预测值和实际值十分接近。

表2 灰色、BP神经网络、灰色BP神经网络模型预测精度对比

从稳定性评价角度来看,如表3所示,无论是从平均绝对误差(MAE)、均方根误差(RMSE)还是平均绝对百分比误差(MAPE),灰色BP 神经网络预测模型在稳定性能上都要优于灰色模型和BP 神经网络模型。灰色BP神经网络的平均绝对百分比误差在0.01%~0.03%,均小于灰色模型和BP 神经网络模型的平均绝对百分比误差,灰色BP 神经网络组合模型综合了灰色模型和BP 神网络模型两者的优点,其具备小样本建模和非线性处理数据的能力,相比其他预测模型优越性及预测精确度更佳。显然灰色BP 神经网络模型在预测稳定性能上大大提高,预测效果更佳稳定。

图4 灰色、BP神经网络、灰色BP神经网络模型第二季度工业增加值预测结果

图5 灰色、BP神经网络、灰色BP神经网络模型第三季度工业增加值预测结果

图6 灰色、BP神经网络、灰色BP神经网络模型第四季度工业增加值预测结果

表3 灰色、BP神经网络、灰色BP神经网络模型预测稳定性对比

综上,2018年工业增加值采用灰色BP 神经网络组合模型较灰色模型和BP 神经网络模型预测在精度上分别提升了1.28%~2.93%和0.01%-0.08%,稳定性分别提升了1.43%和0.05%;2019年工业增加值采用灰色BP 神经网络组合模型较另外两种模型预测在精度上分别提升了0.94%~4.98%和0.01%~0.04%,稳定性分别提升了2.97%和0.03%。显然,灰色BP 神经网络组合模型在预测精度和稳定性上均高于单一灰色模型和BP 神经网络模型。上述结果表明,灰色BP 神经网络组合模型不仅能够精确预测工业增加值,而且预测效果稳定。

3 结论

(1)运用灰色模型拟合工业增加值数据序列时,结果呈现季节性,第一季度拟合误差较大,可能是因为一二月份我国传统节日春节来临,工业增加值有所波动。为了避免数据间非线性因素影响预测结果,运用BP 神经网络来调整,使得对工业增加值的预测更加准确。

(2)运用灰色BP 神经网络模型对我国工业增加值进行预测,很好的解决了传统预测模型在预测工业增加值时当出现的特大环境改变(如:自然灾害,疫情,金融危机等)导致预测精度不准确的缺陷,这为预测类似经济指标提供了合理参考,为政府对宏观经济进行决策提供了依据。

(3)工业增加值在国民经济活动中占有主导作用,对宏观经济有很大影响,对它进行精准预测就更有必要。对工业增加值预测可以有利于企业对未来事务进行决策和判断,从而促进工业高质量发展,带动区域的经济增长,帮助政府等相关部门解决就业问题,同时建立高质量的物质技术基础,为我国宏观经济的发展贡献一份力量。

(4)综上,本文针对工业增加值具有季节波动性、周期性且不稳定等特点,结合灰色模型和BP 神经网络模型,发展了一种能够精确预测工业增加值的灰色BP 神经网络模型。结果表明,2018~2019年工业增加值采用灰色BP 神经网络组合模型较灰色模型和BP 神经网络模型预测精度分别提升了0.94%~4.98% 和0.01%~0.08%,预测稳定性分别提升了1.43%~2.97%和0.03%~0.05%。即本文提出的灰色BP 神经网络模型预测工业增加值精度较高,预测值和实际值基本拟合,并随着预测时间增加,精度和平均绝对百分比误差波动范围较小,预测结果更加稳定,进而对政府制定政策和工业企业生产具有重要的指导意义。

猜你喜欢
原始数据增加值残差
中国2012年至2021年十年间工业增加值的增长情况
四川化工(2022年3期)2023-01-16 10:43:31
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
基于双向GRU与残差拟合的车辆跟驰建模
一季度国民经济开局总体平稳
受特定变化趋势限制的传感器数据处理方法研究
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
自动化学报(2019年6期)2019-07-23 01:18:32
今年第一产业增加值占GDP比重或仍下降
消费导刊(2018年9期)2018-08-14 03:19:56
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
汽车零部件(2017年4期)2017-07-12 17:05:53
平稳自相关过程的残差累积和控制图
河南科技(2015年8期)2015-03-11 16:23:52