运用ARIMA模型对股价预测的实证研究

2021-09-22 02:51刘松张帅
经济研究导刊 2021年25期
关键词:ARIMA模型

刘松 张帅

摘 要:随着我国资本市场的扩大开放,国外资本进一步流入我国股市,中国股市迎来新的挑战与机遇。金融市场股票的价格预测问题再次成为公众关注的热点。基于此,选取金融市场股票的历史收盘价数据,以Python为实现工具,通过建立ARIMA模型来进行检验与预测,得到的股价预测值与真实值短期内最大误差不超过0.04。这表明以ARIMA模型对股价进行短期预测具有很好的效果,能够为股市投资者提供帮助。

关键词:Python;ARIMA模型;股价预测

中图分类号:F830.91        文献标志码:A      文章编号:1673-291X(2021)25-0076-03

引言

正如我们所知,股票市场是企业融资的重要渠道,也是反映一个国家经济状况的“晴雨表”。股票的价格作为股票市场的重要信息,其价格的变化是成千上万投资者的共同决策结果,因此影响股价波动的因素众多。不同的因素会对股价造成如何的影响,影响的程度有多大,往往难以衡量。因此,我们不去探究价格变化背后原因是什么,而以过去的价格变化为依据,去发现股价变化的规律,从而实现对股价的预测。当然作为一种随机变化过程,我们无法完全预测股价的未来走向,但这不代表股价就是完全不可预测的,股票价格的变动过程就是一组可以看得到的时间序列数据,其既反映股价的随机变化,也包含了一定的系统运行规律。ARIMA模型理论成熟,是当前处理时间序列数据的常用预测模型,可以很好预测具有波动性的时间序列数据的短期趋势。因此,本文运用ARIMA模型对西南证券的收盘价作为历史数据进行建模,以当前热门的Python作为建模工具,对未来四天的股价进行预测。

一、选题意义与模型理论基础

(一)选题意义

基于Eveiws所实现的股价预测方法已有相应成熟的研究,且该方法在短期的预测精度能够得以保证,但还有许多的不足。而Python在股价预测领域的应用有待检验,基于这样的背景,本文希望通过使用Python工具进行股票价格的短期预测,以对比Eviews工具做出的结果,分析使用新的研究工具是否可以给股价带来更精确的估计。

(二)ARIMA模型理论介紹

ARIMA模型又被称为自回归移动平均模型,于20世纪70年代由美国统计学家Jenkins和英国统计学家Box提出。该模型主要运用在时间序列变量的短期预测中,因单个时间序列值具有不可测性,但整体时间序列值具有一定的规律,使用ARIMA模型将这种规律以数学形式表示。并通过对数学形式的研究,实现对时间序列值的短期预测。

ARIMA模型可分为三种,AR(p)模型为自回归模型,MA(q)模型为滑动平均模型,ARIMA(p,d,q)为自回归滑动平均模型。ARIMA是前两种模型的糅合,其中AR是自回归过程,p为自回归的阶数;MA为移动平均过程,q为移动平均阶数,d为非平稳向平稳转变的差分次数。

一般的ARIMA(p,q)模型形式可以表示为:

(1)式中,{?着t}是白噪音序列,p和q都是非负整数,AR和MA模型都是ARIMA(p,q)的特殊情形,当p=0时,ARIMA(0,q)=MA(q);当q=0时,ARIMA(p,0)=AR(P)。

由于ARIMA模型运用于时间序列平稳状态,而当时间序列处于不平稳时,需要经过一系列的处理,使时间序列平稳化。在含有短期趋势平稳的非平稳时间序列可以通过差分使非平稳序列成为平稳序列。

(三)ARIMA模型建模步骤

ARIMA模型的建模可分为以下四个步骤:首先,对原序列进行平稳性检验,如果检验结果为不平稳,需要通过差分变化或者其他变化,使序列满足平稳性条件。其次,通过计算描述序列特征的统计量来确定模型,并结合BIC准则确定模型的阶数。再次,利用最小二乘法估计模型的参数,并进行合理性检验。最后,进行诊断分析,通过生成的模型对数据进行预测,并将实际数据与之进行对比,进行预测准确定检验。若不精确重新确定参数,再次建立新的模型。

二、ARIMA模型的建立与分析

(一)数据来源

本文数据来源于Wind数据库,从Wind上选取西南证券自2019年1月2日至12月9日的股票收盘价作为原始数据,数据样本总量为229个。样本量基本涵盖了西南证券2019年以来的所有交易日的收盘价。

(二)数据的单位根检验与平稳化处理

通过Python可视化,对西南证券股价的原始数据处理,可以得到收盘价的时间序列图像,通过观察图像我们发现,西南证券的收盘价时间序列数据呈现非平稳的特征,这对于数据的初步判断来说还远远不够。因此,我们通过对原始数据进行单位根检验,对数据进行单位根检验后,得出ADF检验的t统计量为-2.786767均小于在显著性水平为1%、5%和10%时分别所对应的临界值-3.458366,-2.873866和-270.425668。可以得出,原始数据的ADF检验结果落于接受原假设区间内,即西南证券的收盘价时间序列数据存在单位根,数据是非平稳的。时间序列数据的非平稳可以通过差分法来进行解决,因此我们对原始数据进行一阶差分,并进行ADF检验得出t统计量的值,在对数据进行一阶差分处理之后,此时得出的t统计量的值为-16.611521均大于在显著性水平为1%、5%和10%时分别所对应的临界值-3.458366,-2.873866和-270.425668。也就意味着在对原始数据进行一阶差分处理之后,时间序列数据不再是非平稳的。

(三)ARIMA模型的建立与参数估计

建立ARIMA模型的关键就是要通过观察ACF、PACF图,以及通过BIC信息准则来确定ARIMA模型的最佳p值和q值。通过Python,可以得到相应的自相关图ACF和偏自相关图PACF,根据ACF、PACF图的观察方法,暂定ARIMA模型的p、q值为1,1,即模型为ARIMA(1,1)。为保证模型的最优,仅仅通过肉眼的观察不足以判断ARIMA模型最优的p、q值,还必须通过BIC信息准则来做进一步判断,即找出BIC最小值。

猜你喜欢
ARIMA模型
基于时间序列模型的中国出口总额分析及预测
基于R软件的金融时间序列的预测分析
基于Eviews上证综合指数预测
基于ARIMA模型的沪铜期货价格预测研究
组合预测法在我国粮食产量预测中的应用