MATLAB中基于GARCH模型对股票指数的拟合与预测

2020-05-25 02:57周丹文
对外经贸 2020年4期
关键词:股票指数时间序列分析

周丹文

[摘 要]从股票指数的基础时间序列出发,分析了时间序列的性质以及股票指数的特性。并以此为基础,运用经济统计与计量经济学,选取恒生指数2009年10月至2019年10月十年间日收盘价进行分析,同时利用MATLAB的金融工具分析箱,建立GARCH模型,对恒生指数的日收益率进行建模与预测。结果表明,GARCH模型能够较好地拟合样本数据的对数收益率;在短期内,模型同样拥有较好的预测效果。

[关键词]股票指数;时间序列分析;GARCH;MATLAB

Abstract: Based on the basic time series of stock index, this paper analyzes the properties of time series and stock index. On this basis, with the knowledge of economic statistics and econometrics, the daily closing price of Hang Seng Index from October 2009 to October 2019 is selected to analysis. GARCH models are established by using the Financial Toolbox of MATLAB to model and predict the daily yield of Hang Seng Index. The results show that GARCH model can fit the logarithmic rate of return of sample data well, and in the short term, the model also has a good prediction effect.

Key Words: Stock Index; Time Series Analysis; GARCH; MATLAB

一、研究背景

(一)股票指数

股票指数是用来度量股票行情的一种指标, 反映了股票市场总体价格水平及其变动趋势,一般由证券交易所或其他金融服务机构编制,用以为股民提供一个衡量股市价值变化的参考依据。股票指数与其编制范围内的股票的平均价格水平同向变化,能灵敏反映市场所在国(或地区)社会、政治、经济变化状况。

(二)时间序列

时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。即对某一个或者一组变量X(t)进行观察测量,在一系列时刻t1, t2, …, tn所得的离散序列集合(X(ti)为随机变量)为时间序列。其主要目的是根据已有的历史数据对未来进行预测。根据观察时间的不同,时间序列中的时间可以是任何时间形式。股票指数即为时间序列数据。

(三)时间序列的平稳性

平稳性是指时间序列的行为不随时间的改变而变化,可分为严平稳与宽平稳两种。严平稳表示时间序列的分布不随时间的改变而变化,序列中随机变量的性质是一样的;宽平稳则没有分布不随时间变化的性质,其强调的是相关系数取决于时间的间隔,而非时间的起点。宽平稳的特性有两点,一为均值函数为常数函数;二为协方差函数仅与时间差相关。

根据平稳性的定义,可以进行平稳性检验。如果序列有明显的趋势或者周期性,那么其就是不平稳的,因为平稳序列具有常数均值和方差。

(四)股票指数的特点

股票指数的收益率一般随时间的变化而变化,因此,它是非平稳的。同时,股票指数的收益率還存在持续偏高或偏低的现象,即波动聚集性。另一方面,股票指数的收益率序列一般不符合高斯假定中的“同方差”假定,即其序列一般具有异方差。

二、研究对象

恒生指数(HSI),由香港恒生银行全资附属的恒生指数公司编制的指数。入选样板股为香港股票市场33家上市公司,是以发行量为权数的加权平均股价指数。为香港股票市场最有影响的指数。

本文选取恒生指数2009年10月8日至2019年10月8日十年间的日收益率作为研究对象,建立模型,并依据其2019年10月9日至2019年12月17日间的收益率对模型进项检验。

三、模型选择

GARCH模型(广义自回归条件异方差模型)由Bollerslev等人在于1986年提出,该模型建立在ARCH模型的基础上,并在当今演化出了多种形式。

传统的计量经济学假设时间序列的方差是固定的,这种假设与实际情况相差较大。对于股票而言, 其收益的波动幅度就是随时间而变化的, 并非常数。这使得传统的时间序列分析对实际问题无效[1]。1982年,Engle在研究英国通货膨胀率的波动性时首次提出了ARCH模型,。

ARCH模型在实际运用时, 误差项的条件方差依赖于之前多期的变化量,存在较难精确估计的缺陷。GARCH模型则在此基础上用较为简单的低阶GARCH模型代替高阶ARCH模型, 降低参数估计的复杂性,适用于有波动性的样本的分析与预测。GARCH模型可表示为GARCH(p,q),当p=0时,GARCH模型则降至ARCH模型。GARCH模型假定当前的条件方差依赖于其滞后项σt-1与残差滞后项εt-1;而当期方差则取决于常数项,前一期的残差与前一期的预测方差。

在高斯分布下,GARCH(p,q)的函数形式如下:

四、模型建立

本次实验运用MATLAB R2018b软件进行分析验证。在2014年之后的版本中,MATLAB中有关GARCH模型的函数部分发生了较大的变化。因此,本文采取了最新的函数形式进行模型建立。

(一)数据导入

本文的数据来源为RESSET金融研究数据库。首先从该数据库中下载相应日期及当日恒生指数的日收盘价,并保存在EXCEL中。同时,为了便于MATLAB的读取与识别,将EXCEL中的日期列的格式修改为“日期”。通过导入功能,将日期与日收盘价两列以“数值矩阵”的形式导入MATLAB中。

(二)绘制收益率曲线

1.日收盘价

通过导入的日期与日收盘价,运用“plot”函数,可以绘制出恒生指数的日收盘价波动曲线。

对收盘价进行分析可知,十年间恒生指数的收盘价总体而言呈上升趋势,但波动较大。在2012年、2015年与2019年,发生了三次剧烈的下降。其中,2012年是由于欧债危机恶化、欧美外围股市下跌等因素的影响;2015是由于股灾;2018年则是因为全球市场的动荡加剧。由于港元采取钉住美元的汇率政策,香港市场对于美国利率的波动尤为敏感。恒生指数也因此较易产生大幅的波动。

2.对数收益率

恒生指数的日收盘价呈现出剧烈的波动趋势,因此,考虑在日收盘价的基础上,计算其对数收益率。

对数收益率是两个时期资产价值取对数后的差额,即资产多个时期的对数收益率等于其各时期对数收益率之和。通过取对数,数据可以变得更加平稳,同时,也利于直接观察收益率。在MATLAB中,可以通过“price2ret”函数对列向量进行对数收益率的计算,并通过“plot”函数绘制出其图像。在本例中,将录有取对数后恒生指数十年间日收益率的列向量命名为“y”。

从图2可以看出,恒生指数的对数收益率具有波动聚集性,集中在(-0.04,0.04)之间,但在波动较大的点达到了+0.06的水平。达到峰值后又迅速回落。但相较于日收益率,其数据已更加平稳。

(三)分布检验

通过MATLAB中的函数,可以计算峰度、偏度等数值,用以判断数据是否符合正态分布。在此次实验中,相关数值如下:

通过计算样本峰度、样本偏差可知,数据的偏度为-0.3121,峰度为5.2792,数据分布左偏且呈现出厚尾特征。说明从整体上来看,收益率低于其均值的时候较多,数据的波动性强。通过jbtest检验,亦可知数据拒绝了服从正态分布的假定。

(四)相关性检验

1.平稳性检验

在MATLAB中,可以通过”adftest”函数判断数据是否平稳。经过检验,可以发现,虽然十年间恒生指数的日收盘价序列并不平稳,符合股票指数的特征;但adftest(y)‘的结果为1,说明其对数收益率序列是平稳的。因此可以利用其十年间的对数收益率建立相关模型。

2.自相关与偏自相关图像

通过”autocorr(y)”与”parcorr(y)”函数,可以分别表示出自相关与偏自相关的收敛阶数。

通过上述自相关图与偏自相關图像,可知两者均约在16阶收敛,表明日收益率没有明显的日相关性。

3.Q检验与ARCH检验

在本例中,用“y-mean(y)”计算恒生指数日对数收益率的残差。MATLAB中分别用于Q检验与ARCH的函数如下:

经过Q检验,可知实验数据在10,15,20滞后阶数内,均呈现出h=0。说明日收益率残差与收益波动之间不存在自相关性。ARCH检验中,可知实验数据在10,15,20滞后阶数内,均有h=1,说明收益率序列有高阶ARCH效应即GARCH效应。因此考虑建立GARCH模型。

(五)具体模型的选择

在GARCH模型中,一般有GARCH(1,1),GARCH(1,2),GARCH(2,2)等多种形式。每种形式中,又可分为有平均偏移量和无平均偏移量两种。模型形式的选择可以通过” 赤池信息准则(AIC)”判断,具体而言,计算出的“AIC”的数值的绝对值越大,则拟合效果越好。

其中,y指恒生指数的对数收益率,aicbic函数中的”3”,为损失的自由度,(具体指常数项,GARCH{1}项与ARCH{1}项),会随着模型中参数的改变而改变。

分别建立GARCH(1,1),GARCH(1,2),GARCH(2,2)没有平均偏移量的模型,并通过赤池信息准则进行检验。经过检验可知在5%的显著性水平下,没有平均偏移量的GARCH(1,2)模型拟合较好(通过aicbic()函数计算,可知其绝对值最大)。再将其与有平均偏移量的GARCH(1,2)模型进行比较,可以发现仍是没有平均偏移量的模型拟合较好。各模型的计算结果如下:

模型的γ1的系数接近于1且通过了显著性检验, 说明恒生指数过去价格的波动与其无限长期价格波动的大小都有关系。条件方差方程中, 系数α1,α2和γ1都为正且显著,说明过去的波动对市场未来波动有影响, 且影响是正向的。γ1+α1+α2的值接近于1, 这说明股市波动对外部冲击的反应函数以一个相对较慢的速度递减, 一旦出现大的波动在短期内很难消除[2]。

通过MATLAB中的 econometricModeler,可以查看GARCH(1,2)对应的函数形式,以及其条件方差和标准化残差。

通过上述图像可以看出,标准化残差变得较为平稳,波动聚集现象已不再明显。

从而写出对应的方程:

五、模型预测

运用MATLAB中的forecast()函数可以进行模型预测。在将上述GARCH(1,2)模型命名为EstMdl2的情况下,具体操作如下:

在执行上述操作后,即得到51天内观测值的预测结果。再对foreY取对数收益率,以10天为一组,将计算出的结果与恒生指数真实的收益率进行比较,结果如下:

综合预测与实际的结果,可以发现,总体而言,随着时间的推移,预测值偏离真实值的范围越大,预测的准确率越低。因此,在短期内,GARCH模型有较好的拟合效果。

六、总结

本文选用GARCH模型分析股票指数,模拟了股票指数波动性变化。结果说明GARCH模型对于股票指数的日收益率有较好的拟合效果,同时短期预测有较高的准确度。股票指数属于时间序列的一种,但其不同于传统的数据,呈现出非平稳、波动聚集与异方差的特征。因此,对于它的建模也应当采用非传统的方法。GARCH模型用方差预测时间序列,对股票指数有较好的拟合与预测结果。因此,对于投资者的决策能起到一定的指导作用。

[参考文献]

[1]俞莹,易荣华.来自新兴市场的公司上市对目的地市场的影响——以中国香港市场为例[J].中国管理科学,2020,28(2):37-47.

[2]吴小丹.中美贸易摩擦以来对我国大豆行业影响及应对策略[J].对外经贸,2019(11):6-11.

[3]徐德贵,李慧,王月月.中证500股指期货对股票现货市场波动性影响研究[J].经济研究导刊,2019(20):136-140.

[4]黄凝.中国股票市场指数波动特征研究[J].现代营销(信息版),2019(7):108-109.

[5]张露. 融资融券对A股波动性的影响研究[D].西北大学,2019.

[6]宋邵阳. A股中小板块股票beta系数均值回归特性研究[D].云南大学,2019.

[7]马勇,何顺.货币周期与资产定价:基于中国的实证研究[J].金融评论,2019,11(2):1-24+123.

(责任编辑:顾晓滨 马 琳)

猜你喜欢
股票指数时间序列分析
四舍五入惹的祸
四舍五入惹的祸
中国股票市场指数波动特征研究
基于布谷鸟算法和支持向量机的股票指数预测
基于布谷鸟算法和支持向量机的股票指数预测
新增开户数与股票指数的格兰杰因果关系检验
基于R软件的金融时间序列的预测分析
基于MATLAB的时间序列预测