改进的灰色模型与ARMA模型的股指预测

2010-06-21 06:44吴朝阳
智能系统学报 2010年3期
关键词:残差灰色准则

吴朝阳

ARMA(autoregressive integrated moving average)模型作为使用最广泛的时间序列模型,一直以来被许多学者用于股票价格序列的研究中[1-4].其本质是利用平稳时间序列的统计相关性来进行未来价格的预测.灰色GM(1,1)模型是基于灰色理论的时间序列预测方法,近年来也被广泛地用于股票价格的时间序列预测中[5].GM(1,1)模型的核心思想是用指数方程来捕捉隐藏在时间序列中的能量聚集,而这种聚集可以通过累加操作显现出来,从而可以用指数方程来进行拟合.可以看出这2种办法对于股价的预测都有各自的侧重.由于股价序列的复杂和多样性,以上2个模型中的任意一个都不能完全地描述股价运动,因此一个常规的想法就是结合这2种预测模型建立组合模型.其思想是用GM(1,1)模型来捕捉股价运动的趋势,而用ARMA模型通过挖掘残差序列的相关性来进行股价的预测.

实际上,这种基于灰色GM(1,1)模型和ARMA模型的组合模型已经被广泛地用于时间序列的预测中,并被称呼为GM-ARMA模型(grey model-autoregressive integrated moving average model)[6].但是由于组合模型中GM(1,1)模型不是最优的,并且没有考虑最优的结合点,因此传统的GM-ARMA模型不是最优的.本文将针对这2点不足提出了RGM-ARMA模型并用于股指的预测.

1 通用的GM-ARMA模型

对于给定的时间序列 X=(x1,x2,…,xn),首先用经典的GM(1,1)模型求出其灰色预测序列和点 n+1 的灰色预测值,然后针对灰色残差序列建立ARMA模型,并用该模型求出灰色残差序列Y在点n+1的预测值GM-ARMA模型可以被表示为

可以看出GM-ARMA模型存在2点不足:1)由于GM(1,1)模型不是最优的,导致了GM-ARMA模型也可能不是最优的;2)在用GM(1,1)模型进行建模的过程中,并不考虑对ARMA模型的影响,反之亦然,因此也就不存在最优结合点,这也导致了GMARMA模型不是最优的.针对以上情况,本文在先优化GM(1,1)模型的基础上,找到灰色模型和ARMA模型的最佳结合点,最后找到最优的GM-ARMA模型.

2 优化的GM(1,1)模型

当前,对GM(1,1)模型的优化主要集中在2个方面.

一个方面是通过选择合适的建模所用的数据维度来优化GM(1,1)模型.在经典的GM(1,1)预测中,灰色建模主要是基于少量的数据,因此一般都是直接选择所有的数据进行建模.但是对于一些可以得到大量数据的时间序列来说,选择合适的数据维度来建立GM(1,1)模型就变得很重要了.郝永红等在用GM(1,1)模型预测人口的时候指出,不同的数据维度将导致预测误差差别较大,他们分别用5~8维4种数据维度对人口进行了灰色预测,发现用6维数据进行预测时,预测误差最低[7].李国平等[8]也对这种问题进行了研究,他们指出:“在对股票价格进行灰色预测时,数据量不同,预测结果将有所不同,有时甚至差别很大”.为此他们提出了用黄金分割法来寻找合适的建模所需的数据量.

另一类优化集中在对白化背景值z(1)(k)的优化上.在经典的灰色模型的教科书[9-10]中,对于累加变量x(1)(k)的白化背景值z(1)(k)的定义是

很多学者认为常数0.5将导致预测值不是最优的.为了解决这个问题,他们引进了1个参数来替代常数0.5.不同学者采用不同希腊字母代替常数0.5,这里统一用希腊字母μ来表示这个参数,因此白化背景值z(1)(k)新的定义为

这种改进的GM(1,1)模型通常称为GM(1,1,μ)模型.因为发展系数a和控制变量b是被白化背景值z(1)(k)所控制的,而z(1)(k)又是被参数μ所控制的,因此,优化GM(1,1)的过程就是优化参数μ的过程.为了找到最优的μ,许多学者提出了各种各样的算法,其中有刘虹等的微粒群算法[11],谢开贵等的遗传算法[12],陈举化等的最优拟合点群逼近原始点群的算法[13].

通过上面的研究可以看出数据维度和影响白化背景值z(1)(k)的参数μ确实对预测精度有影响.同时也看到上面的研究主要集中在分开对这2种影响因素进行研究,而没有同时考虑这2个因素对预测精度的影响.针对以上情况,本文尝试提出改进的灰色模型以便同时考虑这2个因素对预测精度的影响.为了方便和统一起见,这里称呼影响白化背景值z(1)(k)的参数为灰色变量,并用希腊字母μ来表示,对数据维度用希腊字母v来表示,并将这种改进的 GM(1,1)模型命名为 GM(1,1,μ,v)模型.

由于本文的研究重点是对股票价格的灰色预测,因此参数μ和v的优化原则也将基于一定的金融背景.在金融股票市场中,人们通常用点数的得失来评价他们的投资策略在过去一段时间的表现,这种度量在统计上,可以用总绝对值误差σTAE(total absolute error)来度量.σTAE越小,说明投资误差在过去的一段时间越小.因此这里认为最优的参数μ和v就是其σTAE最小的参数.基于最小σTAE来选择最优参数组合(u,v)的准则称为TAE准则.对于不同的应用,建立GM(1,1,μ,v)模型可以用不同的准则,但是原理上都是基本一样的.

用TAE准则建立 GM(1,1,μ,v)模型的思路概括来说就是首先对参数μ和v设立上下限:μ∈(l,L),v∈(r,R)并离散化以便构造1个有界的离散参数空间.对于给定的时间序列X=(x1,x2,…,xn)和1 个离散参数组合(μ,v),μ∈(l,L),v∈(r,R)都可以构造GM(1,1,μ,v)模型并得到序列X的灰色预测序列.因此也就可以得到式中:xj表示真实值表示灰色预测值.对每一个参数组合(μ,v),都可以用以上方法就算出σTAE.参数组合(μ,v)满足:

就是最优的参数,相应的GM(1,1,μ,v)模型就是基于TAE准则的最优的灰色模型.

3 RGM-ARMA模型

建立了优化的灰色模型 GM(1,1,μ,v)后,就可以通过找到灰色模型和ARMA模型的最佳结合点来整合这 2个模型了.整合 GM(1,1,μ,v)和ARMA(p,q)的过程就是找到最佳组合(μ,v,p,q)的过程,其基本的前提条件就是参数(μ,v)和(p,q)的选择必须基于相同的统计准则.

在 ARMA(p,q)中,经典的选择参数(p,q)的准则是BIC(Bayesinformationcriterion)和AIC(Akaike’s information criteria)准则;但是由于 BIC和AIC不能用于(μ,v)的选择,那么惟一可能的就是看(p,q)是否可以用TAE准则进行选择.为了验证TAE准则是否可以用来建立ARMA(p,q),首先要针对ARMA(p,q)模型定义TAE准则.参考BIC和AIC的定义,定义TAE准则如下.

对AR(autoregressive model)模型和MA(moving average model)模型的级数设定上界P和Q,针对每个参数组合(p,q),0≤p≤P,0≤q≤Q 建立ARMA(p,q)模型,并基于相同的历史数据计算σTAE,最佳的模型满足:

相应的参数(p,q)也就是最优的参数.为了比较BIC、AIC和TAE准则在预测误差上的不同,用相同的数据基于以上3个准则计算了平均绝对值误差σMAPE(mean absolute percent error).这里的数据来源于YAHOO金融板块,数据为TXS加拿大综合指数日线数据,总数是2008年6月30日—2009年2月6日的一共152个数据,其中2008年6月30日—2008年12月31日的半年的126个数据用于建模,2009年1月2日—2009年2月6日的26个数据用于模型的评测,因此σMAPE的计算为

结果见表1.

表1 不同准则下的σMAPE的比较Table 1 Comparison between different criterions

从表1可以看出,基于3种不同标准的预测误差并不大,实际上,基于TAE准则的预测误差甚至小于基于BIC准则的预测误差,这经验地证明了TAE准则可以用来对参数(p,q)进行选择.

由于 GM(1,1,μ,v)中 的 参 数 (μ,v)和ARMA(p,q)中的参数(p,q)都可以用TAE准则来选择,这就为整合2个模型并找到最优的组合(μ,v,p,q)提供了基础.具体来说,构造RGM-ARMA模型的思想为:

首先对参数(μ,v,p,q)设定上下限,并对连续参数进行相应的离散化处理,以便形成离散参数空间:μ∈(l,L),v∈(r,R),p≤P,q≤Q.对于给定的历史时间序列X=(x1,x2,…,xn)和给定的位于离散参数空间的参数组合(μ,v,p,q),通过式(1)可以建立相应的GM-ARMA模型,并可以用该模型计算出拟合序列,因此也就可以计算出σTAE为

最优的GM-ARMA模型满足:

4 实例研究

为了说明RGM-ARMA模型的建模过程,这里用与上例相同数据来建模,其中开始的126个数据用于模型的建模,后面的26个数据用于模型的检验.

首先需要对参数(μ,v,p,q)建立合适的上下界,其原则是尽量包含最优的解,同时又让计算量不要太大,经过研究比较,这里对参数(μ,v,p,q)定义的上下界为

其次需要对惟一的连续参数μ进行离散化处理,这里用的离散间距为0.1以减少计算量.这样就总共有了880 个(μ,v,p,q)的参数组合,针对每个组合可以基于历史数据计算出相应的σTAE,最小σTAE所对应参数组合(μ,v,p,q)和相应的 GM-ARMA 模型就是最优的模型.

对于本例的历史数据X=(x1,x2,…,x126)和某一个参数组合(μ,v,p,q)=(0.6,7,1,0),其具体的σTAE计算过程如下:

由于(μ,v)=(0.6,7),因此用相应的GM(1,1,0.6,7)模型来得到时间序列X的灰色预测时间序列这里 GM(1,1,0.6,7)的意思是用固定的7个灰色数据量和0.6的灰色参数建立的GM(1,1)模型.其中开始的7个灰色预测数据等于原始的 7 个数据(x1,x2,…,x7),第8个灰色预测数据^z8是7个原始数据(x1,x2,…,x7)建立的GM(1,1,0.6,7)模型预测出来的,第9个灰色预测数据^z9是7个原始数据(x2,x3,……x8)建立的GM(1,1,0.6,7)模型预测得来的,以此类推,第126个灰色预测数据^z126是7个原始数据(x119,x120,…,x125)建立的 GM(1,1,0.6,7)模型预测得来的.由此,可以得到全部126个灰色预测序列 Z^和灰色残差序列 Y=X -=(y1,y2,…,y126).由于(p,q)=(1,0),因此对灰色残差序列 Y建立ARMA(1,0)模型并可得到相应的Y的ARMA模型的预测拟合值,这里是空值.由于灰色模型和 ARMA 模型都要用以前数据递推的缘故,是y8通过建立的ARMA(1,0)计算得到,以此类推是 y125通过建立的ARMA(1,0)计算得到.这样序列X基于参数组(μ,v,p,q)=(0.6,7,1,0)的 GM-ARMA 模型的拟合的就为

总绝对值误差σTAE就为

以上算法可以用Matlab编程实现,本节的例子中,当(μ,v,p,q)=(0.4,6,3,1)的时候,基于历史数据 X 计算出来的 σTAE最小,因此用(u,v,p,q)=(0.4,6,3,1)建立的 GM-ARMA 模型就是基于 TAE准则的最优GM-ARMA模型.其意思是要用6个数据段和采取灰色参数0.6建立GM(1,1)来进行灰色预测,并对灰色残差建立ARMA(3,1)模型来进行预测.效仿前面的(μ,v,p,q)=(0.6,7,1,0)的例子,用(μ,v,p,q)建立 GM-ARMA 模型,可以得到第127个点的灰色预测值和灰色预测残差的预测值,并由此得到序列X在127个点的预测值为

因此,根据RGM-ARMA模型,对TSX指数第127个点的预测值,也就是时间2009年1月2日的日线收盘价的预测值为8 953.2.对于第128个数据,将用开始的127个数据建立改进的GM-ARMA模型来预测,以此类推,可以得到从2009年1月2日—2009年2月6日的全部26个预测数据.并计算出σMAPE为

由于股市判断方向也重要,这里也计算出了方向错误率σDIR(directional errors)为

这里,

因为GM-ARMA模型并没有给出选择GM(1,1)模型的准则,这说明任何灰色维度超过3就可以用,因此这里选择了几个不同的灰色维度来建立GM(1,1)模型,而对残差用常用的BIC准则来构建不同的GM-ARMA模型.用相同数据计算这些模型的误差率,表2列出了各个模型的比较.

表2 不同模型的比较Table 2 Comparisons between models

由表2可以看出,RGM-ARMA模型的3种预测误差都小于ARIMA模型和GM-ARMA模型的各种组合,这也说明了RGM-ARMA模型在实践中是可行的.

5 结束语

本文解决了传统的GM-ARMA模型中GM(1,1)模型并不是最优化的问题,也提出了整合GM(1,1)模型和ARMA模型的一个全新的解决思路,即基于某种定量的原则来建立最优的组合模型而不是依靠经验来建立组合模型.实验结果表明,这种整合思想所得到的结果在误差上小于ARIMA模型和GMARMA模型.更重要的是,提出了一种新的建立组合模型的思想,通过修改组合的条件,该思想可以推广到建立多种组合模型上去.虽然是针对股票的特点提出了基于TAE准则来建立GM(1,1)和ARMA模型的组合模型,但是也可以基于TAE准则建立其他模型的组合模型.例如基于TAE准则建立GM(1,1)、小波分解和ARMA模型的组合模型.或者也可以针对其他的实际情况,通过修改准则来合成组合模型,例如预测国民生产总值GDP这种时间序列时,可以修改成MAPE准则来建立GM(1,1)和AR-MA模型的组合模型.

[1]朱宁,徐标,仝殿波.上证指数的时间序列预测模型[J].桂林电子工业学院学报,2006,26(2):124-128.ZHU Ning,XU Biao,TONG Dianbo.Time-series prediction model of Shanghai composite index[J].Journal of Guilin University of Electronic Technology,2006,26(2):124-128.

[2]POTERBA J M,SUMMERS L H.The persistence of volatility and stock market fluctuations[J].American Economic Review,1986,76:1143-1151.

[3]郭宁,向凤红.灰色理论和神经元网络在证券市场中的应用[J].自动化技术与应用,2008,27(10):1-3.GUO Ning,XIANG Fenghong.Application of grey model and neural network in the stock-market[J].Techniques of Automation and Applications,2008,27(10):1-3.

[4]FRENCH K R,SCHWERT G W,STAMHAUGH R F.Expected stock returns and volatility[J].Journal of Financial Economics,1987,19:3-29.

[5]李国平,于广青,陈森发.中国股票价格灰色预测研究综述[J].东南大学学报:哲学社会科学版,2005,7(2):28-30,126.LI Guoping,YU Guangqing,CHEN Senfa.A review of research on stock price gray forecast in China[J].Journal of Southeast University:Philosophy and Social Science,2005,7(2):28-30,126.

[6]吴庚申,梁平,龙新峰.基于GM-ARMA的年电力负荷组合模型[J].湖北电力,2005,29(2):21-23.WU Gengshen,LIANG Ping,LONG Xinfeng.An annual electric consumption combined model based on GM-ARMA[J].Hubei Electric Power,2005,29(2):21-23.

[7]郝永红,王学萌.灰色动态模型及其在人口预测中的应用[J].数学的实践与认识,2002,32(5):813-820.HAO Yonghong,WANG Xuemeng.The dynamic model of gray system and its application to population forecasting[J].Mathematics in Practice and Theory,2002,32(5):813-820.

[8]邓聚龙.灰色系统基本方法[M].武汉:华中理工大学出版社,1988.

[9]袁嘉祖.灰色系统理论及其应用[M].北京:科学出版社,1991.

[10]李国平,林敬松.一种改进的灰色模型在股票价格中的应用[J].商场现代化,2005(10):188-189.

[11]刘虹,张岐山.基于微粒群算法的 GM(1,1,λ)模型的机械产品寿命预测[J].机械设计,2007,24(10):4-5,61.LIU Hong,ZHANG Qishan.Life-span prediction on mechanical products of GM(1,1,λ)model based on particle swarm algorithm[J].Journal of Machine Design,2007,24(10):4-5,61.

[12]谢开贵,李春燕,周家启.基于遗传算法的 GM(1,1,λ)模型[J].系统工程学报,2000,15(2):168-172.XIE Kaigui,LI Chunyan,ZHOU Jiaqi.Gray model(GM(1,1,λ))based on genetic algorithm[J].Journal of Systems Engineering,2000,15(2):168-172.

[13]陈举华,史岩彬,沈学会.GM优化方法在机械系统寿命预测中的应用[J].山东大学学报:工学版,2003,33(4):379-381.CHEN Juhua,SHI Yanbin,SHEN Xuehui.Application of GM(1,1,ω*)methods in the life prediction of mechanical systems[J].Journal of Shandong University:Engineering Science,2003,33(4):379-381.

猜你喜欢
残差灰色准则
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
浅灰色的小猪
基于递归残差网络的图像超分辨率重建
廉洁自律准则歌
灰色时代
她、它的灰色时髦观
感觉
综合电离层残差和超宽巷探测和修复北斗周跳
学学准则