基于ARIMA和马氏链模型的上证指数预测

2020-01-18 06:20侯甜甜马福强王英贤
通化师范学院学报 2020年2期
关键词:马氏差分概率

侯甜甜,马福强,王英贤

股票价格预测对投资者具有重要的现实意义,同时也受到了国家政府的高度关注.通过对股票价格的预测,判断我国股票发展情况,从而根据现实需要,制定相关的政府政策,以此来推进我国经济的进一步发展.

时间序列是指定量揭示某种现象的客观规律.特别是近年来,它已被广泛应用于金融领域,尤其是股票价格的预测.2008年,刘红梅[1]以鞍钢股票价格序列为研究对象,通过一阶差分平稳化数据,建立了ARMA(2,1)模型,对股票价格的预测取得了较好的结果,但是精确度依旧不太理想.2016年,刘成义[2]从研究沪深300指数股指期货的背景和必要性出发,采用马尔科夫链模型对沪深300 指数股指期货进行短期预测,模拟指数变化规律,并辅助以Matlab 软件计算转移概率矩阵,得出对沪深300 指数股指期货的短期走势较好的预测结果.使投资者在面对错综复杂的股指期货交易时,能避免盲目的投资行为.采取科学的投资方法.在实际中具有很强的参考和应用价值.2017年,李嘉松[3]利用ARIMA模型对沪深300 指数进行预测,并指出造成沪深300 指数的实际值和模型预测值之间有差别的原因,为广大投资者提供了沪深300指数的预测方法.

马尔可夫链模型是一个离散的随机时间序列,其特征是没有后效性,即如果系统的当前状态已知,则可以确定系统的未来状态规律,而不管过去的状态如何.如果有一种事物或某种现象的各种状态的时间序列是马尔可夫链,那么就可以根据转移概率,n时间的状态预测n+1 时间的状态.依据马尔可夫链的这一特点,可以将其应用于股票的研究.

1 预测方法

1.1 ARIMA模型简介

1970年,BOX和JENKINS提出ARIMA模型[4],又称差分整合移动平均自回归模型.ARIMA模型对扰动项进行建模分析后,综合考虑预测变量的过去值、当前值和误差值,以此提高模型的预测精度.具有如下结构的模型称为求和自回归移动平均模型,简记为ARIMA(p,d,q)模型[1]

通过差分观察值序列平稳后,需要判断序列是否有分析价值,因此在建立之前需要进行纯随机性检验,即白噪声检验.检验结果显示是白噪声序列,则该序列没有分析价值.如果是非白噪声序列,则可以进行模型拟合.

再根据时间序列的自相关函数和偏自相关图,对序列的平稳性及周期性进行模型识别.对平稳序列的模型进行识别,若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR 模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型.

1.2 马氏链模型

设随机过程Xn的状态空间I={1,2,…,N} ,绝对概率分布为其中:当n=0 时,为初始分布.马氏链在时刻n处于状态i的条件下,到时刻n+1 转移到状态j的条件概率称为一步转移概率,由其为元素构成的矩阵P1为一步转移矩阵.状态i经过n步转移后处于状态j的概率称为n步转移概率,由其为元素组成的矩阵为n步转移矩阵.设为一个齐次马氏链,其状态空间为I,n步转移概率为则有其矩阵形式为方程为方程的矩阵形式为Pm+n=Pm⋅Pn,进而有由此可得马氏链预测模型[5]为

经过一段时间后,马氏链的状态将趋于这样的一种状态,它与初始状态无关,并且前后两期的状态概率相等,即称为马氏链的稳定状态,此时的分布即为平稳分布.

2 实证分析

2.1 多项式拟合的建立与分析

本文所用数据选取的是上证综合指数的收盘价的日度数据,2018年1月2日到2019年2月25日的日度收盘价数据,数据来源为新浪财经网,收集数据276 个,2018-01-02 至2019-02-25上证指数日收盘价如图1所示.

图1 2018-01-02至2019-02-25上证指数日收盘价

利用Eviews 软件对数据进行多项式模型拟合,模型的拟合结果如下:

模型的拟合图像如图2所示.

图2 多项式模型拟合图

其中上方曲线为原始序列,下方曲线为拟合的数据序列.

由多项式模型拟合的五个交易日的预测值如表1所示.

表1 多项式模型拟合结果

从表1 可以看出,误差相对较大,所以继续利用ARIMA模型来进行预测.

2.2 ARIMA模型的建立与分析

利用R 软件[6-8],得到数据的序列图.由于数据的波动比较大,需要对数据进行差分处理,变得平稳.首先对数据进行一阶差分,经检验,发现需要对数据进行二阶差分.

对二阶差分后序列进行白噪声检验,判断出该数据序列属于非白噪声序列.对二阶差分后的数列的纯随机性检验,序列为非白噪声序列.利用Eviews 软件对二阶差分后数据进行ADF 检验,首先对有常数项和有趋势项进行检验,然后对有常数项无趋势项进行检验,最后对无常数项无趋势项进行检验,检验的结果为统计量均小于在1%、5%、10%显著性水平下的统计量的临界值.所以我们有充足的依据来判断出二阶差分后的序列是一个平稳的序列,同时,它也是一个非白噪声序列,而平稳非白噪声序列,显然是有利于接下来的研究的.通过观察差分序列的自相关图和偏自相关图,来确定滞后项的阶数.二阶差分后时序图如图3所示.

图3 二阶差分后时序图

从图3可以看出,自相关系数衰减到趋于小值的波动过程连续,可以大致判定为自相关系数截尾,也可以大致判定偏自相关系数截尾.可以对数据建立ARIMA 模型进行预测,在这里建立ARIMA(1,2,1)模型、ARIMA(2,2,1)模型、ARIMA(1,2,2)模型、ARIMA(2,2,2)模型并进行拟合检验,可以看出ARIMA(2,2,2)模型的AIC值最小,根据AIC准测,选择ARIMA(2,2,2)模型来进行拟合.模型方程如下:

进行显著性检验.模型的显著性检验是检验模型的有效性,只有通过模型显著有效,模型结果才能进行模型预测,得到的结果才具有说服力、可靠性与价值性.模型的检验也就是对残差序列进行检验.

在各阶延迟下LB 检验统计量的P值均大于0.05,接受原假设,可以认为这个拟合模型的残差序列属于白噪声序列,即该拟合模型显著有效.进行预测.继续对模型进行预测,五期的预测值如表2所示.

表2 ARIMA(2,2,2)预测结果与真实值对比

从表2可以看出,模型最大误差为1.70%,说明模型的预测是比较准确的.该模型的序列预测图像如图4所示,模型的模型置信区间预测图如图5所示.

图4 模型预测图

图5 模型置信区间预测图

从图4和图5可以看出,拟合程度比较好,上证指数在短期内将会继续增长.

2.3 马氏链模型的建立与分析

在马氏链模型建模中[9-11]主要运用马氏链中的转移概率矩阵理论,这里选取的是上证综合指数2019年1月2日到2019年2月1日每个交易日的收盘价.将2 500以下看为状态1,2 500~2 530为状态2,2 530~2 560为状态3,2 560及以后为状态4,状态划分数据如表3所示,转移频数如表4所示.

运用转移频数可以得到转移概率矩阵如下:

此矩阵即为一步转移概率矩阵P.

预测未来五个交易日的收盘价,因为最后一天的收盘价为2 618.232,处于状态4,所以可以取初始状态P0=[0,0,0,1].则未来第一个到第五个交易日预测值如下:

第一个交易日的收盘价状态概率分布的预测值为P1=P0P=[0,0,0.083,0.917].

可以看出接下来的五个交易日的状态预测值均为第4 状态.除此之外还可以求出马氏链平稳时的概率分布为

表3 马氏链模型状态划分

表4 转移频数表

已知转移概率矩阵,可以根据转移概率矩阵写出以下方程:

通过化简计算,可以得到如下方程组:

最终计算的结果为x1=0 ,x2=0.032 2 ,x3=0.193 1,x4=0.774 7.

未来五个交易日的收盘价如表5所示.

表5 马氏链模型预测结果

从表5可以看出,2019年2月11日到2019年2月15日的收盘价所处的状态与预测结果完全一致.

可以看出如果没有其它因素影响,日收盘数据处于4 状态的概率大约在80%左右.因为股票的价格除了受市场的影响以外,还受到很多其他因素的影响,因此也只能做短期预测,对股票的投资提供一个参考.

3 结论

本文运用时间序列中的ARIMA 模型,利用R语言软件建立了模型,还有马氏链模型.对上证日度收盘价指数做出了短期预测,可以看出短期内股票的价格趋势.而根据两个模型的预测数据和真实值的对比可以看出,所建立的模型具有一定的可行度,准确度有了一定的保证.

但是我们在将其运用到实际的预测中,还需要考虑很多影响股票价格的因素.例如宏观经济指标、利率水平、行业发展状况、国家发布的政策、投资者心理的变化等.这些因素都会影响到股票的价格,甚至还包括一些节假日,节日的前后股票价格都会发生较大的波动.本文所研究的内容,和所做出的模型预测是希望可以给投资人的短期投资提供参考意见.

还应该考虑到文章中所做出的研究具有一定的局限性,因为股票价格的时间序列非常复杂.而研究的主要目的是为了对股票的价格做出更精准的预测,今后将会从以下几个方面进行改进.

(1)本文选取的指标,只选取了上证指数日度收盘价作为变量来预测,但是实际情况是,对于股票影响的因素有很多,如开盘价、交易量、最高价和最低价,而这些情况都会对股票价格产生一定的影响,需要考虑如何将这些影响因素也加入到所建立的模型中.

(2)所选取的只有上证指数日度收盘价,应该选取其他股票的价格样本,这样预测效果会更好.

(3)本文只选择了ARIMA 模型和马氏链模型做了对比,还应该考虑时间序列中其他的模型,将它们分别进行对比.

猜你喜欢
马氏差分概率
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
数列与差分
《封神演义》中马氏形象的另类解读
露马脚
抱琴