黄 洋,鲁海燕,程毕芸,许凯波
(江南大学 理学院,江苏 无锡 214122)
灰色理论是邓聚龙在1982年首先提出的,是一种研究少数据、贫信息以及不确定性问题的新方法[1]。在灰色预测模型中,GM(1,1)模型是一种最常用的模型,其在工业以及数据挖掘预测等领域均已被广泛应用。然而在利用GM(1,1)模型进行建模预测时,GM(1,1)模型有时会出现较大的偏差,存在着对数据的学习能力低,预测精度低等缺陷。RBF神经网络是一种网络结构简单,所需训练样本少且学习速度快的神经网络,但是随着样本数据的随机性和预测样本量的变化,RBF神经网络的预测精度就会受到影响,从而降低了预测的精度。
为了进一步提高模型的预测精度,本文提出一种新维无偏灰色RBF神经网络模型。
为了消除传统灰色模型中的指数偏差,吉培荣,黄巍松等[3]提出了无偏GM(1,1)模型。与传统GM(1,1)模型相比,无偏GM(1,1)模型不存在传统GM(1,1)模型所固有的偏差,因而也就消除了传统GM(1,1)模型在原始数据序列增长率较大时失效的现象;而且在交通流预测,降水量预测,能源消耗等[4]实际问题当中有了更加广泛的应用。此外,无偏GM(1,1)模型无需进行累减还原,简化了建模步骤,提高了模型的计算速度。
设有原始时间数据序列,X(0)={x(0)(1)'x(0)(2)'…'x(0)(n)},其中 x(0)(k )≥0,k=1'2'…n。
(1)对原始数据序列进行累加得到新的数据序列:
X(1)其中k=1'2'…,n。
(2)对新的数据序列建立白化方程,即:
dx(1)dt+ax(1)=u,其中a'u为系数。
(3)构建数据矩阵B和Yn:
(4)利用最小二乘法求出白化方程中的系数a和u:
(5)计算无偏灰色模型的参数b和A:
(6)建立无偏灰色模型原始数据序列模型为:
x͂(0)=x(0)(1) ,x͂(0)(k +1)=Aebk。其中k=1'2'…,n-1。
为了提高模型的预测精度,可以对原始数据分别进行对数函数和含参线性函数变换等[5]处理。本文通过对数变换对原始数据进行处理,具体变换过程如下[6]:
对原始数列进行对数变换:
对新的数据序列利用无偏GM(1,1)方法预测:
对预测数据进行指数还原:
=exˉ͂(0)(k),m͂(0)即为无偏GM(1,1)方法预测值。
RBF神经网络是一种由输入层、隐含层和输出层组成的三层前向神经网络。第一层为输入层,由信号源节点组成;第二层为隐含层,从输入层到隐含层是一种用于特征提取的非线性变换;第三层为输出层,它对输入模式的作用做出响应[7]。RBF神经网络的输出可表示为:
其中为第 p个输入样本,ci为网络隐含层节点的中心,wij隐含层到输出层的链接权值,i=1'2'…,h为隐含层节点数,yj为网络的第 j个输出节点的实际输出。
在灰色系统的发展过程中,随着时间的不断变化,一些随机扰动或驱动因素进入系统,从而相继影响系统的发展。而对于灰色预测模型同样也存在这样的问题,模型预测精度较高的仅仅是原始数据以后的1到2个数据[8]。为了提高模型的预测精度,本文提出了基于新维无偏灰色RBF神经网络预测模型。
新维无偏灰色RBF神经网络预测模型的建模步骤如下:
步骤1:通过对居民消费价格指数的原始数据选择一定的维数,建立改进的无偏GM(1,1)预测模型;
步骤2:利用所求的改进的无偏GM(1,1)预测模型对居民消费价格指数进行预测,获得对应的预测序列;
步骤3:将得到的居民消费价格指数的预测序列作为RBF神经网络的输入,对应的实际值作为输出;建立RBF神经网络模型并对其进行训练;得到无偏灰色RBF神经网络组合模型结构;
步骤4:在组合预测模型中,输入需要预测的居民消费价格指数的数据序列;
步骤5:通过去掉原始序列中最开始的一个数据,加入一个无偏GM(1,1)预测值,保持数据等维,从而更新数据序列;
步骤6:返回步骤2,重复步骤2至步骤5,直到达到计算所需预测数据的精度,算法结束。
根据我国1999—2014年居民消费价格指数数据(表1,数据来源:《中国统计年鉴》2015),利用本文提出的新维无偏灰色RBF神经网络模型进行训练与预测。将1999—2010年的居民消费价格指数数据作为训练样本,建立相关的预测模型,同时将2010—2014年的数据作为测试样本。为了验证预测模型的有效性,本文将无偏GM(1,1)模型和无偏RBF神经网络模型与本文提出的模型进行对比。
根据本文改进的无偏灰色模型的建模方法,结合表1的数据,利用MATLAB进行编程求解,求得b=0.0038,A=6.0168。将b和A的值带入无偏灰色预测模型中可得预测结果如表2所示。该模型的平均残差相对值为 ε͂=0.863%,平均精度为:p=99.137%。
表1 1999—2014年我国居民价格消费指数
表2 无偏灰色模型对1999—2010年我国居民价格消费指数的预测值(对数值)
4.2.1 数据处理
对原始数据取对数值后的序列进行等维处理,即去掉1999年的数据,加入利用本文改进的无偏灰色模型预测的2011年的数据值(即6.3215)。利用2000—2011年的数据建立无偏灰色模型。求得b=0.0041,A=6.0264。将b和A的值带入无偏灰色预测模型中可得2000—2011年的预测值如表3所示。
表3 2000—2011年无偏GM(1,1)预测值(对数值)
4.2.2 网络训练
通过利用序列的前3个时刻的值来预测下一时刻的值,即用1999—2001年数据来预测2002年的居民消费价格指数,如此循环,一直到预测2014年的居民消费价格指数。本文利用matlab建立新维无偏灰色RBF神经网络预测模型,采用newrb进行网络训练,输入层的节点数为3,输出层的节点数为1,隐含层的节点数通过网络训练获得最佳的节点数,网络均方误差目标值为GOAL=0.001。利用无偏灰色预测模型得到的预测值作为网络的输入值,对应的真实值作为网络输出值,去训练RBF网络。
4.2.3 三种预测模型的性能比较
通过利用无偏GM(1,1)、无偏灰色RBF模型以及本文提出的新维无偏灰色RBF神经网络模型对2012—2014年我国居民消费价格指数进行预测,同时对结果进行指数变换并与实际值进行比较,所得结果如表4所示。
表4 各模型预测结果比较
由表4中的计算结果可以得出,新维无偏灰色RBF模型的预测结果的最大相对误差与平均绝对误差都比无偏GM(1,1)模型和无偏灰色RBF模型的预测结果小;并且无偏GM(1,1)模型和无偏灰色RBF模型的预测结果的平均相对误差分别为3.9804%和1.1147%,而新维无偏灰色RBF模型的预测结果的平均相对误差为0.46%,这说明本文提出的新维无偏灰色RBF模型的预测效果好,且预测精度高。同时利用本文改进的模型进一步预测出2015年我国居民价格消费指数值为639.2,而2015年我国居民价格消费指数真实值为615.2,相对误差只有3.9%,因此本文提出的新维无偏灰色RBF神经网络预测模型对我国居民消费价格指数的预测具有可行性。
4.2.4 预测模型性能的进一步比较
为了进一步验证本文预测模型的有效性以及预测精度,本文将2012—2015年的预测值与文献[2]中预测模型的结果进行比较,结果见表5。
表5 两种算法性能对比
由表5数据结果可得,本文提出的模型比文献[2]提出的预测模型的结果更接近实际值;并且文献[2]中的模型对2012—2015年我国居民消费价格指数的预测结果的平均相对误差为6.1546%,而本文提出的模型的平均相对误差仅为1.3201%,说明本文模型更具有合理性和有效性,模型预测精度更高。
(1)本文通过利用对数对原始数据进行对数变换,提高了模型的光滑度;对数据进行等维新信息处理,进一步提高模型的预测精度,再结合RBF神经网络的极强的学习能力,从而得到了新维无偏灰色RBF神经网络模型,使得组合模型的预测精度更高。
(2)本文利用无偏灰色模型,无偏灰色RBF模型与本文提出的模型对2012—2014年我国的居民消费指数预测结果进行比较,本文提出的新维无偏灰色RBF神经网络模型平均相对误差仅为0.4597%。同时与文献[2]中的模型对2012—2015年的居民消费价格指数预测结果进行对比,本文模型的相对误差比文献[2]中模型的平均误差小,只有1.3201%。由上述分析对比结果可知,本文模型的预测精度高,且与实际值较为接近。利用本文模型预测出2016年我国居民价格消费指数为646.8。这为我国以后对居民消费价格指数的预测提供一种新的方法,并从一定程度上,对我国经济发展的预测提供一些参考数据。
[1]邓聚龙.灰色预测与决策[M].武汉:华中理工大学出版社,1988.
[2]王丽敏.基于新陈代谢GM(1,1)模型的居民消费价格指数预测[J].价格月刊,2010,(6).
[3]吉培荣,黄巍松,胡翔勇.无偏灰色预测模型[J].系统工程与电子技术,2000,22(6).
[4]Chen S,Qu G,Wang X,et al.Traffic Flow Forecasting Based on Grey Neural Network Model[C].In Proceedings of the International Conference on Machine Learning and Cybernetic,2003.
[5]邹慧,徐波.改进的灰色-马尔科夫模型及其在沉降预测中的应用研究[J].工程勘察,2016,(3).
[6]陶云奇,许江,李树春.改进的灰色马尔柯夫模型预测采煤工作面瓦斯涌出量[J].煤炭学报,2007,32(4).
[7]聂秋平,吴敏,杜友武等.基于灰色RBF神经网络的炼钢煤气消耗预测[J].系统仿真学报,2011,23(11).
[8]陈宝平.基于新维无偏灰色马尔科夫模型的围栏草场面积的预测[J].数学的实践与认识,2012,43(24).