高频数据下商品期货波动率研究

2018-09-10 16:46邓亚东,王波
技术与创新管理 2018年4期
关键词:GARCH模型

邓亚东,王波

摘 要:商品期货收益率序列存在明显的厚尾现象,将扰动项设定为厚尾分布的波动率模型要优于普通Gaussian分布以及t分布模型。以7种损失函数作为评价准则,在扰动项分别服从偏t分布以及广义双曲线偏t分布时比较了波动率RV、二次幂变差BV以及medRV3种不同已实现测度下Realized GARCH模型对商品期货的波动性预测能力。最后得到扰动项服从ghst分布的Realized GARCH模型具有更优的预测能力。

关键词:Realized GARCH模型;medRV已实现测度;广义双曲线偏t分布;波动率预测

中图分类号:F 830 文献标识码:A 文章编号:1672-7312(2018)04-0415-06Empirical Study on the Fluctuation of Commodity

Futures with High Frequency Data

——Based on Different Realized Measures and Error DistributionsDENG Yadong,WANG Bo

(School of Management,University of Shanghai for Science and Technology,Shanghai 200093,China)

Abstract:There is obvious fat tail phenomenon in the yield series of commodity futures,and the volatility model with the fat tailed distribution is better than the ordinary Gaussian distribution and the T distribution model.This paper,using seven kinds of loss function as the evaluation criterion,compared the predictive ability of three realized measures of realized variance,bipower variation and medRV based on skewed T distribution and ghst distribution.Finally,under the three different realized measures,the Realized GARCH model with disturbance subject to the ghst distribution has better prediction ability than skewed T distribution.

Key words:Realized GARCH model;medRV realized measure;generalized hyperbolic skewed t distribution;fluctuation prediction

0 引 言

商品期貨市场上的T+0交易制度决定了商品期货市场适合使用高频数据进行波动性建模。随着程序化交易以及高频交易的发展,基于高频数据的商品期货计量模型的研究已经成为备受关注的研究方向之一。

Hansen和Huang基于GARCH模型族提出了Realized GARCH模型对国际不同市场的指数以及各股的高频数据进行波动性建模[1]。Realized GARCH模型既保留了GARCH模型具有的自回归移动平均ARMA结构,而且通过一个测度方程实现了潜在波动率和已实现波动率之间的联系。目前为止,国内外学者针对Realized GARCH模型进行了丰富的后续研究。国外方面,Tian和Hamori使用Realized GARCH模型构建汇率日波动模型并与其他模型比较,得出Realized GARCH模型在预测汇率上更加准确[2]。Louzis等人[3]在Realized GARCH模型误差项服从偏t分布的前提下,验证了该模型在预测VaR上具有更好的效果。TakeuchiNogimor[4]基于已实现核测度的Realized GARCH模型,证明了该模型可实际应用于指数期权的定价。国内方面,黄友珀和唐振鹏等人[5]将高频信息纳入Realized GARCH模型并与tcopula函数结合起来度量资产组合市场风险,认为该模型能够获得更可靠更高效的VaR估计以及更准确的ES估计。刘若萌和郭名媛[6]基于3种不同的误差分布,证明了厚尾分布下的Realized GARCH模型能够更加准确地描述股票波动性。

Realized GARCH模型依然处于发展和完善之中。Hansen和Huang 2位学者的研究只考虑了干扰项新息服从Gaussian分布,并且只分析了单一的已实现核测度RK.魏正元等人[7]将经典的已实现GARCH模型的残差分布拓展到服从广义误差分布的形式。田凤平和杨科[8]基于TVSHAR模型对农产品期货市场已实现波动率进行了研究。Brandt和Jones[9],Engle和Gallo[10]的研究表明将每日极差、已实现波动率的滞后值等变量同时引入预测模型能进一步提高波动率的样本外预测精度。Ghysels等[11]和Ghysels等[12]的研究表明,除已实现波动率自身的滞后值外,BarndorffNielsen和Shephard[13]的1阶已实现多幂次变差也是已实现波动率的预测因子。

由于实际金融时间序列存在厚尾性和偏度,王天一和黄卓[14]研究了厚尾分布下的Realized GARCH模型对s&p500指数以及相关各股的预测效果,得到基于厚尾分布的Realized GARCH模型的向前一步预测能力优于标准Realized GARCH模型,但仅仅考虑了一种厚尾分布,并且也只分析了单一的已实现核测度RK.

研究发现期货日内高频收益率序列不仅仅存在厚尾性和偏度,还存在跳跃现象。跳跃现象的出现有可能会引起相应的市场风险。Corsi等[15]的研究表明由C-Tz统计量检验得到的跳跃成分同样对已实现波动率具有一定的预测能力。BarndorffNielsen和Shephard[16]介绍了一种考虑了跳跃现象的积分波动率估计量,即二次幂变差BV估计量。

Andersen和Dobrev[17]认为二次幂变差BV存在缺陷,因此提出了新的对跳跃稳健的medRV估计量作为二次幂变差BV估计量的替代,获得了更好的估计效果。

因此,文中从以下角度来展开论述:①使用并对比了经过逆尺度因子变换后的偏t分布和廣义双曲线偏t分布,上述2种分布都可以同时容纳厚尾性和偏度,对比了干扰项服从上述2种分布时Realized GARCH模型的预测效果;②考虑了商品期货收益率序列存在跳跃现象。除了使用已实现波动率RV作为潜在波动率的替代变量以外,文中分析比较了把二次幂变差BV和medRV作为潜在波动率的替代变量时Realized GARCH模型的预测效果;③为了全面地分析Realized GARCH模型对中国商品期波动性的预测能力,文中分别从中国3大商品期货交易所上市期货中选取了交易活跃的3种商品期货合约。

1 研究方法

1.1 波动模型构建

自从Hansen和Huang提出Realized GARCH模型,该模型就被广泛地应用,文中采用改进的Realized GARCH模型,对波动率模型取对数,即对数Realized GARCH模型

yt=μt+σtzt,zt~i.i.d(0,1)

(1)

logσ2t=ω+qi=1αilogrt-i+qi=1βilogσ2t-i

(2)

logrt=ξ+δlogσ2t+τ(zt)+μt,μt~N(0,λ)

(3)

我们把yt定义为日收益率,把σ2t定义为对数收益率,把rt定义为已实现测度,同时也可作为实际波动的代理变量。对市场冲击的非对称反映通过τ(·)杠杆函数来体现,该杠杆函数是Hermite多项式,并且文中使用的是二次多项式的形式

τ(zt)=ηtzt+η2(z2t-1)

(4)

该Hermite二次多项式的一个优良的特性是Eτ(zt)=0.同时该多项式也能够给出信息冲击v(z)的定义

v(z)=E(logσt|zt-1=z)-E(logσt)=δt(z)

(5)

因此,100×v(z)为标准化新息函数,体现波动率的变化。Realized GARCH模型的一大特点是保留了标准GARCH模型具有的自回归移动平均ARMA结构。

1.2 干扰项分布函数

Hansen和Huang提出的Realized GARCH模型假定干扰项zt服从标准正态分布zt~N(0,1),但是实际金融时间序列扰动项存在厚尾性和偏度,zt服从标准正态分布假设不能合理地贴近实际,因此,文中从干扰项分布函数角度出发,考虑了能够容纳厚尾性与偏度的偏t分布与ghst分布,并综合分析了在干扰项分别服从偏t分布与ghst分布2个不同分布的情况下Realized GARCH模型的预测效果。

1.2.1 偏t分布

实际金融序列新息存在厚尾性与偏度,为了应对新息的这种特性,Bollerslev[18](1987)首次提出GARCHStudent模型来替代新息服从标准正态分布的假设。学生t分布的概率密度函数如下式所示。

f(x)=Γ(v+12)βvπΓv21+(x-α)2βv-(v+12)

(6)

其中v为自由度参数;Γ(·)为gamma函数。学生t分布的概率密度函数具有对称性,形状类似于标准正态分布的钟行,且均值为0,方差为1,与标准正态分布不同的地方是:学生t分布的峰度小尾部厚。

1.2.2 逆尺度因子变换

实际金融时间序列干扰项新息不仅仅存在厚尾性,而且具有偏度,但学生t分布和广义误差分布只能够包容厚尾性,这是不够的,还不能完全体现出实际新息的分布特征。Fernandez与Steel(1998)提出通过在正负实半轴引入逆尺度因子,使得原本单峰对称的分布具有了偏度[19]。通过给定一个偏度系数ξ,一个随机变量的概率密度函数可以表示为

f(z|ξ)=2ξ+ξ-1[f(ξz)H(-z)+f(ξ-1z)H(z)]

(7)

其中ξ∈R,并且H(·)是Heaviside函数。绝对矩是获得中心距的前提条件,绝对矩可以通过以下公式产生

Mr=2∫∞0zrf(z)dz

(8)

因此,经过变换后的有偏分布下的均值和方差可表示为

E(z)=M1(ξ-ξ-1)

(9)

Var(z)=(M2-M21)(ξ2+ξ-2)+2M21-M2

(10)

通过对学生t分布进行逆尺度因子变换,文中将上述不具有偏度的分布变换成为了具有偏度的偏t分布,从而使得新息分布更加符合实际,文中实证部分分别让干扰项分布服从经过逆尺度因子变换后的偏t分布以及ghst分布。

1.2.3 广义双曲线偏t分布ghst

广义双曲线偏t分布ghst由Aas和Haff(2006)普及,ghst分布一边尾部具有多项式分布特性,而另一边尾部具有指数分布特性,广义双曲线偏t分布的数学形式决定了其可以同时容纳新息变量的厚尾性和偏度,ghst分布概率密度函数如下。

f(x)=

2(1+v)/2δv|β|(1+v)/2K(v+1)/2(β2(δ2+(x-μ)2))exp(β(x-μ))Γ(v2)π(σ2+(x-μ)2)(1+v)/2

(11)

ghst分布是当α→|β|且λ=-v/2时广义双曲线分布的特殊形式。其中,v为形状参数且v>0,为了保证波动为正 v>4,β∈R,同时为了能够容纳偏度和峰度v>8.

1.3 已实现测度

Hansen等人提出的Realized GARCH模型的独特之处在于通过一个测量方程把可观察到的已实现测度与潜在波动联系起来,Hansen以及后来的学者很多都沿用了已实现波动率(Realized Variance,RV)來对国内的股票市场以及股指期货进行了分析研究,但已实现波动RV的缺点在于没有把价格跳变以及市场微观结构噪声考虑在内[20-21]。考虑到金融市场时间序列有可能存在收益率跳跃,并且受到微观结构噪声的影响,所以文中在选择已实现测度上不仅仅考虑了被普遍使用的RV,而且还进一步重点构建并对比了二次幂变差(Bipower Variation,BV)与medRV.2种已实现测度的使用主要是为了应对收益率序列的跳变情况。

1.3.1 已实现波动率

已实现波动率定义为

RV=Ni=1|ΔYi|2,i=1,…,M

(12)

其中ΔYi为日内第i个收益率;M为日内收益率的个数。

1.3.2 二次幂变差

由于RV受到日价格跳变干扰严重,所以很多学者转向其他已实现测度,到目前为止,存在资产收益率跳跃的情况下使用最广泛的积分波动率的估计量为BarndorfNielsen和Shephard提出的二次幂变差波动BV,二次幂变差的定义为

BV=π2NN-1N-1i=1|ΔYi||ΔYi+1|

(13)

二次幂变差估计量的一致性和对跳跃稳健性体现在:如果ΔYi,ΔYi+1~i.i.d.N(0,σ2),那么E[|ΔYi||ΔYi+1|]=π2σ2,并且NN-1是一个有限样本修正因子,因此二次幂变差波动率估计值获得的是潜在波动率的一个无偏估计量,二次幂变差通过对相邻2个收益率做乘法,减少了跳跃的影响。

1.3.3 medRV测度

Andersen,Dobrev(2008)等提出了新的对资产收益率序列稳定的已实现测度medRV,medRV定义为

medRV=π6-43+πNN-2N-1i=2med(|ΔYi-1|,|ΔYi|.|ΔYi+1|)2

(14)

medRV测度也是积分波动率的一致估计量,通过对相邻3个资产收益率取中值的操作,可以消除资产收益率发生跳跃的影响。

1.4 模型预测准确性标准

目前有多种可以对模型预测能力做出评价的方法,文中采用其中一种使用非常普遍的损失函数的方法来检验不同波动模型的预测能力。根据损失函数的定义可以知道损失函数的值越小,所构建模型的预测能力越强,误差就越小,构建模型的预测精确程度越高。单独使用某一种损失函数来衡量会有失偏颇。因此,文中计算了上述所有Realized GARCH模型的7种损失函数值来给出他们的预测能力大小。

2 实证研究

2.1 研究数据及步骤

为了全面地分析基于已实现波动率RV,二次幂变差BV以及medRV 3种不同测度下Realized GARCH模型对商品期货的波动性拟合能力,文中根据2011年至2014年的商品期货成交量信息,分别选取了上海期货交易所、郑州商品期货交易所、大连商品期货交易所平均成交量较高的3个商品期货品种,分别是:螺纹钢期货、PTA期货、豆油期货。螺纹钢期货和豆油期货的总样本数据选取的是2011.01.05至2014.12.25期间的5 min收益率数据,其中,把2011.01.05至2014.01.02期间的收益率数据作为样本内训练数据集,把2014.01.03至2014.12.25期间的收益率数据作为样本外滚动预测数据集,以725期数据为窗口进行滚动预测后240期的波动率。PTA期货的总样本数据选取的是2011.01.05至2014.12.11期间的5 min收益率数据,其中,把2011.01.05至2014.01.02期间的收益率数据作为样本内训练数据集,把2014.01.03至2014.12.11期间的收益率数据作为样本外滚动预测数据集,以725期数据为窗口进行滚动预测后230期的波动率。

研究表明选取5 min商品期货交易数据可以减少高频数据微观结构噪声的影响,因此文中在此基础上使用了上述3种商品期货的5 min高频交易数据,并且以此来构建高频波动模型。由于收益率以及3种已实现测度的数量级非常小,因此,在文中统一都放大了100倍。

2.2 实证结果分析

如图1所示,为新息服从广义双曲线偏t分布时,3种已实现测度下螺纹钢期货预测波动率。如图2所示,为新息服从广义双曲线偏t分布时,3种已实现测度下PTA期货预测波动率。如图3所示,为新息服从广义双曲线偏t分布时,3种已实现测度下豆油期货预测波动率。通过上述图可以说明,在新息服从广义双曲线偏t分布时,波动率的预测效

果比较好,预测波动率与潜在波动率的波动曲线趋势非常的接近。

进一步对比了不同测度方式下的损失函数值。表1中描述了螺纹钢期货不同已实现测度下的损失函数值,分析可知,服从ghst分布下的损失函数值都比sstd分布下的损失函数值小。表2中描述了PTA期货不同已实现测度下的损失函数值,其中的ghst分布下的损失函数值更优。表3中描述了豆油期货不同已实现测度下的损失函数值,说明了ghst分布下的损失函数值也小于sstd分布下的损失函数值。这同时说明了ghst分布下的损失函数值更小,拟合预测效果更优。

3 结 论

文中使用的偏t分布与Hansen提出的Skewedt分布不同,这里使用的偏t分布是对学生t分布进行了逆尺度因子变换而来,使得学生t分布同时具备了厚尾性和偏度。还考虑了商品期货收益率序列存在大幅非连续变动,即跳跃,因此文中除了使用已实现波动率RV和二次幂变差BV外,还使用了对价格跳跃稳健的已实现测度medRV.

通过实证分析证明了一种可以与偏t分布相媲美的广义双曲线偏t分布,与偏t分布的特性类似,该分布不仅具有良好的厚尾特性,而且可以非常好地容纳商品期货收益率序列偏斜特征,文中的这一分析结果对构建以及完善我国商品期货基于高频数据的波动率模型提供了有意义的参考。

因此,在使用基于高频数据的Realized GARCH模型构建并分析中国商品期货收益率波动时,文中建议使用干扰项服从广义双曲线偏t分布,可以获得比其他厚尾分布更好的预测效果,并且可以从多个角度对文中阐述的模型展开进一步研究。

参考文献:

[1] Hansen P R,Huang Z,Shek H H.Realized GARCH:a joint model for returns and realized measures of volatility[J].Journal of Applied Econometrics,2012,27(06):877906.

[2]Tian S,Hamori S.Modeling interest rate volatility:a realized GARCH approach[J].Journal of Banking and Finance,2015,61:158171.

[3]Louzis D P,XanthopoulosSisinis S,Refenes A P.Realized volatility models and alternative value at risk prediction strategies[J].Economic Modelling,2014,40:101116.

[4]Takeuchinogimori A.An empirical analysis of the Nikkei 225 put options using realized GARCH models[J].Studies in Health Technology and Informatics,2012,180(01):143147.

[5]黄友珀,唐振鹏,周熙雯.基于偏t分布realized GARCH模型的尾部风险估计[J].系统工程理论与实践,2015,35(09):22002208.

[6]刘若萌,郭名媛.基于厚尾分布下Realized GARCH模型的中国股票市场波动研究[J].天津理工大学学报,2017,33(05):4650.

[7]魏正元,余徳英,李素平.已实现GARCHGED模型的研究及应用[J].重庆理工大学学报,2018(3):273278.

[8]田凤平,杨 科.基于TVSHAR模型的农产品期货市场已实现波动率的预测研究[J].系统工程理论与实践,2016,36(12):30033016.

[9]Brandt M W, Jones C S, Volatility forecasting with rangebased EGARCH models[J].Journal of Business and Economic Statistics,2006,24(4):470486.

[10]Engle R F,Gallo G M.A multiple indicators model for volatility using intra-daily data[J].Journal of Econometrics,2006,131(1):327.

[11]Ghysels E,SantaClara P,Valkanov R.Predicting volatility:Getting the most out of return data sampled at different frequencies[J].Econometric Reviews, 2007, 26(1):5390.

[12]Ghysels E,Sinko A,Valkanov R.MIDAS regressions:Further results and new directions[J].Journal of Econometrics,2006,131(1):5995.

[13]BarndorffNielsen O E,Shephard N.Power and bipower variation with stochastic volatility and jumps[J].Journal of Financial Econometrics,2004, 2(1):137.

[14]王天一,黃卓.高频数据波动率建模:基于厚尾分布的Realized GARCH模型[J].数量经济技术经济研究,2012(05):149160.

[15]Corsi F,Pirino D,Reno R.Threshold bipower variation and the impact of jumps on volatility forecasting[J].Journal of Econometrics,2010,159(2):276288.

[16]Barndorffnielsen O E,Shephard N,Power and bipower variation with stochastic volatility and jumps[J].Econometric Papers,2003,2(2003W17):137.

[17]Andersen T G,Dobrev D,Schaumburg E.Jumprobust volatility estimation using nearest neighbor truncation[J].Journal of Econometrics,2012,169(01):7593.

[18]Bollerslev T P.A conditional heteroskedastic time series model for speculative price and rates of return[J].Review of Economics and Statistics,1987,69(03):542547.

[19]Fernandez C,Steel M F J.On Bayesian modeling of fat tails and skewness[J].Journal of the American Statistical Association,1998,93(441):359371.

[20]Aas K,Haff I H.The generalized hyperbolic skew students tdistribution[J].Social Science Electronic Publishing,2006,4(02):275309.

[21]Hansen B E.Autoregressive conditional density estimation[J].International Economic Review,1994,35(03):705730.

(责任编辑:王 强)

收稿日期:2017-10-23

作者简介:邓亚东(1991-),男,江西抚州人,硕士研究生,主要从事金融定量分析、机器学习方向研究.

猜你喜欢
GARCH模型
沪深股票市场之间波动性影响关系研究
上证综指收益率波动性实证分析
基于R软件的金融时间序列的预测分析
人民币汇率波动对我国国际贸易的传导效应分析
人民币汇率波动对我国国际贸易的传导效应分析
铜期货市场风险变异性实证研究
沪深300指数收益率波动性分析
基于HP滤波和Garch模型的股票价格波动研究
“沪港通”对中国内地、香港股市波动影响的研究
基于ARIMA—GARCH模型的黄金价格分析及预测