赖明敏 首都经济贸易大学
直至今日,国内外的很多学者已经提出了很多时间序列的方法,他们用这些方法来对股票价格进行预测分析。在本文中,我们主要讨论如何使用ARIMA模型来预测分析股票价格。ARIMA模型的应用及其广泛,各国的学者都对它进行了深刻的研究,这是因为其模型构建起来比较简便,并且它的预测方法步骤也很简单,特别是在短时期的预测方面,该模型表现得十分优异,结果非常优秀。
国外在经济领域一直有学者应用ARIMA模型来预测股票价格。我们发现,对于不同的国家不同股市,ARIMA模型仍然具有相同的拟合预测效果。Edson(2014)运用ARIAM模型对巴西股票市场指数进行建模并进一步做出预测,使用了MAPE参数与其他平滑模型结果进行比较,结果表明,所利用的模型获得了较低的MAPE值,因此,表明具有更大的适用性。因此,这表明ARIMA模型可用于与股票市场指数预测相关的时间序列指数。Budi和Zul(2019)收集了2000年1月至2017年12月长达18年的印度尼西亚证券交易所(IDX)的每月数据,对其进行ARIMA建模,结果得出最合适的模型是ARIMA(0,1,1),并且预测情况良好。学者们利用ARIMA模型对于不同国家的综合指数进行拟合分析,都取得的良好的预测结果,这可以得出ARIMA模型具有很大的适用性可行性。
国内诸多学者也应用ARIMA模型进行研究和预测。上证综合指数是最早发布的指数,它是一个综合的衡量指标。侯甜甜(2020)等人运用ARIMA模型和马尔可夫链模型对上海证券交易所指数的日收盘价数据分别进行了分析,随后对数据实施了短时期的预测,结果显示其模型预测表现良好。
除了对上证指数进行预测分析,还有很多学者对不同行业的股票进行研究分析。张亚婕(2019)选取了2017年到2018年间共240个数据,将恒瑞医药的收盘价格和深圳综合指数作为样本,拟合出ARIMA模型,结果得出对于平稳时间序列来说ARIMA模型的预测效果十分优异。无论是对于医药行业股票价格的预测还是对于综合指数的预测,在短期来说都是有效的。且不论对于何种行业来说,ARIMA模型预测结果在短期来说都是有效的。董博伦和徐东钰(2015)以香梨股份、敦煌种业、冠农股份三种发展较好且具有代表性的农产品类股票为例,收集了从2008年到2014年近六年的日交易数据和周交易数据,对其进行模型拟合,结果得出预测效果良好,由此可以得知在农产品行业,ARIMA模型拟合预测仍然有效。
无论是对于具有显著代表性的上证综合指数还是对于工业,农业和服务业中的股票价格变化情况,我们都可以利用ARIMA模型来进行拟合预测,并且在短期内预测结果是有效的,我们可以根据预测结果来对各个行业进行进一步的决策和资源配置,使得经济稳步运行。
本文旨在利用ARIMA模型研究中国第三产业中占比最大的五种行业(批发零售业、金融业、房地产业、交通运输邮政业、餐饮住宿业)的发展状况,并对其未来的发展趋势进行预测,由此可以通过预测结果对不同行业提出相关建议以促进行业发展,经济上行,实现有效的资源配置。
样本选取和数据来源:
我们从同花顺软件上导出数据,从中选取一定时间内的收盘价格作为目标变量。在这些数据当中我们要通过一些方法选取合适的数据,再利用这些数据建立合适的模型,利用拟合好的模型对未来的股票价格进行预测。
本文主要研究第三产业中占比最大的五类行业,我们分别从批发零售业、金融业、房地产业、交通运输邮政业、餐饮住宿业中各选取市值最大三只股票,批发零售业中选取永辉超市、苏宁易购和上海医药,金融业中选取工商银行、建设银行和中国平安,房地产业中选择万科A、保利地产和绿地控股,交通运输邮政业中选取中国国航、顺丰控股和上海机场,餐饮住宿业中选取锦江酒店、首旅酒店和岭南控股。从2015年4月30日起到2020年4月30日结束,共1 209个交易日数据为样本。
我们分别从批发零售业、金融业、房地产业、交通运输邮政业、餐饮住宿等行业中选择市值较大的3只股票包括共15只股票,选取从2015年4月1日至2020年4月30日约1 209个交易日收盘价格当作样本数据,再对15只股票分别构建出模型拟合并利用软件往后预测三个交易日的股票价格。
以批发零售业永辉超市股票为例的实证分析:
平稳性检验:
将2015年4月30日至2020年4月30日共1 209个数据导入R系统,得到时序图。由图1清楚显示出序列没有规律的上下波动,没有明显的趋势性。
图1 永辉超市股价时序图
通过永辉超市股价的描述性统计可以看出2015年4月30日至2020年4月30日所选的样本序列中共包含1209个值。股票价格的最大值为16.36,最小值为4.02,均值为8.26,中位数为8.34,标准差为2.17。偏度为0.11,呈现右偏的状况,峰度为0.39,较正态分布稍平。
由ADF检验结果可得P值为0.471 7,结果不显著,因而不能拒绝原假设,故原序列不平稳。
原序列不平稳,所以我们使用差分运算,使得序列平稳。之后可以通过差分后的时序图、ADF检验以及PP检验结果来判断序列是否平稳。由R软件求得最优差分阶数为1,故而我们对原序列进行一次差分运算。ADF检验结果P值为0.01,在显著性水平为0.05的情况下,数据通过了单位根检验,因此我们可以得出数据是平稳的。
我们通过比较各个模型例如ARIMA(1,2,1)、ARIMA(1,2,2)、ARIMA(3,2,1)等的AIC的值和SBC的值。根据最后结果来看,最优拟合模型为ARIMA (2,1,3),它的AIC的值为346.72,和其他备选的模型相比,AIC值是最小的,因此,我们选择ARIMA (2,1,3)为最合适的拟合模型。
残差检验可以利用QQ图进行判断,如果模型是合适的,则可以看到图中的点会落在线上。结果显示数据的点大部分都落在直线上,只有少部分端点落在直线之外,表明数据满足正态分布,则该模型是合适的。Box检验结果可以检验残差的自相关系数是否都为零。此外我们还进行了Box检验,发现P值为0.995 2,非常大,这说明模型的残差没有通过显著性检验,即我们可以认为ARIMA(2,1,3)模型能较好地拟合本数据。
我们通过数据的拟合模型ARIMA(2,1,3),得到如下表所示的回归数据,由此数据我们可以建立拟合模型的方程。
表2 模型系数
由上表可以建立拟合方程:
依据模型ARIMA(2,1,3)对永辉超市股价向后实行三期预测,并计算预测的相对误差(相对误差=预测值减去实际值的绝对值/实际值).
永辉超市股票5月6日的实际收盘价为10.17,预测值为10.10,相对误差为0.68%;5月7日的实际收盘价为9.92,预测的收盘价为10.17,相对误差为2.5%;5月8日的实际收盘价为9.99,预测价格为10.21,相对误差为2.2%。从以上数据中不难看出,5月6日、7日、8日的交易价格的相对误差全部都小于5%,甚至全部都小于3%,这表明我们建立的ARIMA(2,1,3)模型较为精准,在短期内预测效果十分优秀。
同理,对于同属于批发零售业但市值相对较小的苏宁易购股票选取2015年4月30日至2020年4月30日的收盘价格,结果得出最优拟合模型为ARIMA(5,1,5)。然后依据模型ARIMA(5,1,5)对苏宁易购股价实行三期预测,苏宁易购股票5月6日的实际收盘价为8.61,预测值为8.464,相对误差为1.69%;5月7日的实际收盘价为8.58,预测的收盘价为8.501,相对误差为0.929%;5月8日的实际收盘价为8.7,预测价格为8.553,相对误差为1.72%。可以看出5月6日、7日、8日的交易价格的相对误差全部都小于5%,甚至对于该只股票来说都小于2%,表明建立的ARIMA(5,1,5)模型甚至比对永辉超市建立的模型更加优异。
对于批发零售业所选取的两只股票结果可以看出,ARIAM模型对于该行业的拟合预测效果是不错的,短期内预测相对误差均在5%以下。我们对其他四个行业的股票运用同样的方法进行建模,其结果与批发零售业一样,其他四个行业的股票的短期预测相对误差都在5%以下,认为预测是有效的。这表明ARIMA模型对于不同行业的股票价格的拟合预测仍然是合适的,是可以广泛使用的。
从以上各只股票的建立拟合结果来看,以上模型的拟合效果都十分优异,预测十分精准,即使是不同行业种类的股票,亦或是不同市值大小的股票,其拟合结果都显示出非常好的效果。通过模型拟合出来的数据与股票的实际数据十分接近,两者之间的相对误差都控制在5%以内,甚至有的股票计算出的相对误差低于2%,所以我们可以得出ARIMA模型在拟合预测股票价格方面,特别是对于短期的预测方面有着十分优异的成绩。
并且我们可以看到,在2020年年初的时候零售业例如超市和电商等行业遭受了一些损失,而对于医药行业来说增加了销售。同时对于金融业、房地产业、交通运输业和餐饮住宿业等股价都或多或少的下跌,行业发展停滞不前。
从本文我们得出,在股票的拟合预测方面,ARIMA模型的确有着十分优异的成绩。不论股票的行业种类还是股票市值的大小。即ARIMA模型对于股价预测是具有一般性和普遍适用性的,就我们研究而言不存在特殊性。但其中也可能存在一些缺点,例如,对于数据长短的选取,或者模型是否可以优化等,故我们对于股票价格预测还需要进行进一步的研究。相信不久的将来,通过更多学者的研究,在这方面能有更大的突破。