李阿勇
[摘 要] 本文在贝叶斯理论框架下对常见的两类模型:GARCH模型和SV模型进行了比较研究,同时基于上证综指和深证成指数据对两类模型进行了实证研究。无论在理论上还是实证分析,SV模型对资产收益波动性的刻画能力要强于GARCH模型。
[关键词] 贝叶斯; 随机波动; GARCH
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 06. 044
[中图分类号] F832.5 [文献标识码] A [文章编号] 1673 - 0194(2014)06- 0073- 03
0 引 言
波动性模型通常用来描述资产收益率的条件方差,目前对波动性建模可以分为两类: ① ARCH模型及其扩展形式,这类模型采用确定性函数描述资产收益率的条件方差; ② SV模型及其扩展形式,这类模型采用随机方程来描述资产收益率的条件方差。Engle在对英国的经济通货膨胀进行研究的过程中提出了ARCH模型,Engle假设资产收益率的条件方差是时变的,同时可以用误差滞后项的平方进行解释。Bollerslev在Engle研究的基础上,将资产收益率的条件方差同时可以由其滞后项作为解释变量纳入模型中,提出了GARCH模型。GARCH模型是对ARCH模型的重要扩展,在研究金融和资本市场时间序列的特征中得到了广泛运用。GARCH模型的扩展形式有很多,Bollerslev、Chou、Kroner等学者都曾对GARCH模型进行过详细的论述,Li等学者也对GARCH模型族进行过综述。SV模型最早由Taylor等学者提出,Taylor假设收益率的扰动项是不可观测的,可以用一个随机过程进行刻画,这个假设决定了随机波动模型是一个具有动态波动特性的模型。Clark、Harvey、Polson、Rossi等学者在早期均对随机波动模型进行过研究,Ghysels等学者对SV模型族进行了详细的论述。本文选取应用最广泛的GARCH - N,SV - N两个模型进行建模,统一采用基于Gibbs抽样技术的MCMC方法对这两个模型的参数进行估计,并利用中国股市数据进行实证研究,分析这些模型对我国股票市场的刻画能力。
1 GARCH模型及其贝叶斯统计推断
ARCH形式比较简单,但其在实际使用过程中往往需要用很高的阶,在应用时受到较大的限制。Bollerslev提出了广义ARCH模型(GARCH模型),解决了ARCH模型参数过多的缺点。GARCH模型同时把均值修正后资产收益率的过去值和条件方差的过去值作为条件方差的解释标量,是对ARCH模型的重要扩展,在研究金融和资本市场时间序列的特征中得到了广泛运用。GARCH模型的具体形式如下:
at = σtεt,εt ~ i.i.dN(0,1) (1)
σ2t = α0 + ■αia2t - i + ■βj σ2t - j (2)
式中,p ≥ 0,q ≥ 0,α0 > 0,αi ≥ 0,βj ≥ 0。
at为时间t的均值修正收益率,σ2t为条件方差,εt服从标准正态分布,p ≥ 0,q ≥ 0,α0 > 0,αi ≥ 0,βj ≥ 0。这个模型被称为GARCH - N模型。
2 SV模型及其贝叶斯统计推断
SV模型最早由Taylor等学者提出,Taylor假设收益率的扰动项是不可观测的,可以用一个随机过程进行刻画,这个假设决定了随机波动模型是一个具有动态波动特性的模型。SV模型具体形式如下:
at = σtεt,εt ~ i.i.dN(0,1) (3)
lnσ2t = α0 + βlnσ2t - 1 + ηt,ηt ~ i.i.dN(0,σ2η) (4)
式中,at表示消去均值后第t期的收益。
3 实证研究
为了分析GARCH模型和SV模型对中国股票市场波动率的刻画能力,本文选取上证综指和深圳成指来对两个模型进行实证研究。我国股票市场与1996年12月16日起实行了涨跌停板限价交易制度,为了保证数据的一致性,本文样本数据选择1997年1月2日至2013年3月1日,共3 908天的日线数据,同时考察日收益率,以每日收盘价为基准。本文采用连续复利计算收益率,即rt = ln(St) - ln(St - 1),St为第t日的收盘价,rt为第t日收益率。
表1为上证综指收益率与深证成指收益率的描述性统计结果。从表中可以看出上证综指收益率还是深证成指收益率的峰度分别为7.329 8、6.439 7,远大于正态分布的峰度3,说明收益率序列分布呈现明显尖峰肥尾特征。表中J - B为Jarque - Bera检验统计量,用以检验序列是否服从正态分布,H = 1则拒绝序列服从正态分布的假设,J - B统计量也表明收益率分布并非正态分布。LM(q)为Engle提出的拉格朗日乘子(LM)q阶检验数,H = 1则拒绝波动率自相关系数全为0的假设,说明序列有ARCH效应。小括号内的数值为检验p值。LM检验表明无论之后阶数取10或20,LM统计量都较大,波动率自相关系数全為0的假设被拒绝,说明模型具有明显的ARCH效应,即明显的波动聚集性。
为了进一步对收益率的情况进行分析,本文对上证综指收益率序列和深证成指收益率序列的平稳性进行研究,分别对两组收益率序列作ADF单位根检验,滞后阶数为5。在显著性水平1%下,上证综指收益率的ADF统计量为 -25.353 6,远小于临界值 -2.863 6,接受上证综指收益率序列为随机游走的概率为0.001,因此拒绝上证综指收益率为随机游走的假设,即该收益率序列是平稳的。深证成指收益率的ADF统计量为 -25.115 9,也远小于临界值,说明深证成指收益率也是平稳的。
目前對SV模型最有效的估计方法是基于MCMC技术的贝叶斯统计推断方法,MCMC方法最重要的软件包是BUGS和WinBUGS。BUGS是Bayesian inference using gibbs sampling的缩写,最初由英国剑桥大学生物统计研究所开发,是目前进行MCMC计算最方便的软件。WinBUGS是BUGS的Windows版本,可以免费使用,本文运用WinBUGS软件完成GARCH模型和SV模型的参数估计工作。对两个模型模拟30 000次,首先对模型的收敛性进行判别。
图1为样本迭代轨迹历史,由图1可以看出迭代历史基本趋于稳定,说明迭代过程是收敛的,从自相关函数图也可对收敛性进行判断。由自相关函数图可以看出,模型中各参数的自相关函数很快接近于0,说明迭代过程已经收敛。
得到模型的各参数估计结果见表2。
以2013年3月1日至2013年4月1日共21个交易日的上证综指和深证成指日收益数据为样本外数据对两类模型的样本外预测能力进行评价。
评价指标选取均方根误差统计量(RMSE)和绝对误差统计量(MAE),两个统计指标如下:
RMSE = ■ (5)
MAE = ■| ri - ■i | (6)
式中,ri为样本点i的实际收益率,■i为预测收益率。
由RMSE和MAE的表达式可以看出两个统计指标值越小说明预测结果越精确。通过前文所述的模型进行样本外数据预测效果。
由表可以看出无论是RMSE指标还是MAE指标,SV模型的预测效果均好于GARCH模型。
4 结 论
本章对常见的两类模型:GARCH模型和SV模型进行了比较研究,同时基于上证综指和深证成指数据对两类模型进行了实证研究。无论在理论上还是实证分析都可以看出SV模型对资产收益波动性的刻画能力要强于GARCH模型。上海股市收益率与深圳股市收益率存在明显的波动聚集性和尖峰厚尾性。GARCH模型和SV模型对这两种性质均具有较强的刻画能力,而且SV模型对两个股票市场波动性的描述更精确。
主要参考文献
[1] R F Engle. Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflations [J]. Econometrics,1982(50):987-1007.
[2] 王鹏,王建琼,魏宇. 自回归条件方差—偏度—峰度:一个新的模型[J]. 管理科学学报,2009(5):121-129.
[3] C W J Granger,J Hallman. Long Memory Series with Attractors [J]. Oxford Bulletin of Econometrics and Statistics,1991,53(1):11-26.
[4] Y Hammao,R Masulis. Correlations in Price Changes and Volatility Across International Stock Markets[J]. Review of Financial Studies,1990(3):281-307.
[5] P Christoffersen,K Jacobs. Which GARCH Model for Option Valuation?[J]. Management Science,2004,50(9):1204-1221.
[6] T Bollerslev. Generalized Autoregressive Conditional Heteroskedasticity [J]. Journal of Econometrics,1986(31):307-327.