刘述忠
(河海大学商学院,江苏 南京 211100)
在预测领域中,组合预测模型通常综合多种单一预测模型,并且能够充分利用单一预测模型所包含的各种信息进行最优组合。因此,在大多数情况下,相对单一预测模型,通过组合预测模型可以更加准确地把握客观变化的规律和趋势,提高预测的准确度,达到改善预测结果的目的。
灰色理论预测具有需要数据样本少、计算简单、工作量少、短期时间序列预测精度高等优点,但是也存在长期时间序列预测误差较大的缺点。人工神经网络预测具有的优点主要有:对数学模型没有具体的要求,具有较好的容错性,能够充分实现非线性关系的隐式表达,具有较高的预测精度,动态自适应能力也比较强,通常在非线性复杂系统的智能预测领域应用较为广泛。但在进行网络训练时对样本的需求数量比较大,因此,在对输入变量的选取时存在难以选择的缺点。
为解决上述问题,本文研究一种简便可行的股票价格组合预测模型[1],即灰色理论预测和人工神经网络相结合的组合模型。该模型不仅采用了灰色系统理论,而且具有样本数据需求量少、原理简单、运算方便、短期预测精度高和可测试性强等优点,并且同时具有神经网络并行计算能力强、容错性强和自适应性好等优点。
灰色系统理论的基本模型之一就是GM灰色模型。它是建立在灰色模块基础上,通过微分拟合法建成的模型。单变量一阶灰色模型GM(1,1)是使用最为广泛的灰色模型,其通过累加原始序列并通过该方式建立一阶线性微分方程模型,然后使用累减生成操作来恢复到预测变量的原始序列。灰色模型GM(1,1)的建模过程如下[2-3]:
1)给定序列:
x(0)={x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)}
(1)
其中,x(0)表示原始数据序列。x(1)为x(0)的一次累加生成I-AGO,即:
x(1)={x(1)(1),x(1)(2),x(1)(3),…,x(1)(n)}
(2)
2)x(1)可建立下述白化微分方程:
(3)
其中,α、u为待求参数,α为发展系数,u为灰色系数。
3)将式(3)离散化得:
(4)
式(4)写成矩阵的形式:
(5)
其中,向量系数:
(6)
Y=[x(0)(2),x(0)(3),…,x(0)(n)]T
(7)
利用最小二乘法[4]:
(8)
4)将由式(8)得到参数α和u代入式(3),解得时间响应函数:
(9)
预测序列利用I-IAGO递减生成算法得到,即GM(1,1)预测模型表达式:
(10)
原始数据均值:
(11)
原始数据方差:
(12)
记残差:
(13)
残差均值:
(14)
残差方差:
(15)
后验差检验指标有2个[5-6],即:
Powell在1985年提出了多变量差值的径向基函数方法,Broomhead和Lowe在此基础上于1988年提出了径向基神经网络,即RBF神经网络结构[7-8],目前在数据预测领域应用得十分广泛。为了能够实现非线性关系的映射,径向基神经网络采用高斯函数等径向基函数作为神经元传递函数。径向基函数是一个多层前向型神经网络,其结构如图1所示[9]。
图1 RBF网络结构
从网络输入层到隐层的传递函数,即径向基函数采用高斯函数[10]:
(16)
其中,μi为中心;x为输入维;σi为径向基函数的宽度。
从中间层到输出层的传递函数应用线性函数[11]:
f(x)=x
(17)
通常预测都会存在偏差,预测值和原始数据及真实结果对比后肯定会有一定的误差,但是这些原始序列之间会存有一些未知关系的关联。在使用灰色GM(1,1)模型预测多个序列之后,同样会获得一系列与真实数据存在误差的预测值。因此,本文可以将预测值作为输入样本,实际值作为输出样本,利用神经网络模型,采取一定的结构,对神经网络进行训练,这样可以得到一系列对应结点的权值与阈值,用来模拟这些预测值与实际值之间的偏差关系,以及序列之间的相互关系。GM(1,1)的每个模型都使用下一时刻的预测值或多个时刻的预测值作为神经网络的输入,相应的输出是下一时刻或多个时刻最终的预测值。GM-RBF神经网络结构如图2所示[12-13]。
图2 GM-RBF神经网络结构示意图
根据GM-RBF组合预测模型原理,具体建模步骤如下[14-15]:
1)GM(1,1)模型由原始数据组成数列建立。
2)未来时间的第(n+1)至第(n+m)个数据使用GM(1,1)模型预测。
3)网络训练的样本数据源将由第1个至第(n+m)个,共计(n+m)个数据组成,然后根据神经网络理论对样本数据进行归一化、网络训练及预测以及结果的反归一化。
以000648股票月平均价格为例,本文收集了该股票2013-2017年月平均价格数据,如表1所示。
表1 000648股票2013-2017年月平均价格数据
应用GM-RBF模型,根据前述步骤对股票的价格进行预测。以2013-2017年每连续8个月的数据作为一组输入,下一个月的数据被用作为输出,应用GM-RBF网络预测下一时间节点的股票价格,样本数据如表2所示。前40组数据被用作训练样本来训练网络;最后12组数据被用作测试样本来比较预测值与真实值,从而进行误差分析[16]。
表2 GM-RBF网络训练样本与测试样本
对样本数据进行归一化后,利用Matlab工具进行网络训练。SPREAD取不同值,RBF网络径向基函数分布密度会不同,预测误差见图3。RBF与GM-RBF预测误差对比曲线见图4。
图3 网络训练预测误差曲线
图4 RBF网络与GM-RBF网络预测误差对比曲线
通过以上实例的计算并对误差进行对比分析可以得到以下3点结论:
1)对比表1和表2可知,通过GM-RBF组合模型预测,可以增加网络训练的样本量以及提高预测精度;从图4可知,与RBF网络相比,GM-RBF网络的预测误差确实有所减小,明显提高了预测精度。
2)通过图3与图4的比较可知,利用GM-RBF组合模型得到的股票价格预测值与真实值具有更高的拟合度。
3)RBF模型和GM-RBF组合模型均能满足股票价格预测的要求,然而,GM-RBF组合模型具有较高的预测精度,更适用于解决股票价格预测问题[17]。
股票价格通常波动比较大,简单的线性模型或者纯粹的单一预测模型在反映股票价格波动的全部信息上明显不足,不能客观地反映出股票市场变化的全部规律,往往预测的结果在精度上不是十分准确。GM-RBF预测模型不仅仅综合了2种预测模型的优点,而且也能够对2种预测模型的不足进行补充,从而更加客观地反映出股票价格波动变化的规律。通过实例分析也能充分证明GM-RBF预测模型相对于单一的预测模型精度更高,同时有效地减少了样本数据的需求量,降低了运算量,对股票价格的预测更加直接客观。