【摘要】本文采用沪深300日间隔为5分钟的高频数据,构建了日间收益序列和日已实现极差波动(RRV)序列,然后分别建立R-GARCH模型与HAR模型,并采用M-Z回归及损失函数作为判别准则对两类模型的波动预测能力进行了测度。结果表明,无论从M-Z回归结果还是损失函数值来看,R-GARCH模型都要优于HAR模型。
【关键词】已实现GARCH模型 异质自回归模型 RRVM-Z回归 损失函数
一、引言
GARCH模型由Bollerslev(1986)提出,它作为低频数据波动刻画的经典模型至今已得到了广泛的应用。随着金融高频数据的出现, Andersen和Bollerslev(1998)提出了已实现波动方法,因其无模型,计算简单而被广泛接受。Corsi(2004)提出了基于已实现波动的异质自回归(HAR)模型,从而提出了基于高频数据的波动预测模型。Martens和Dijk(2007)提出的已实现极差波动(RRV)及其修正量是比已实现波动(RV)更为精确的波动估计量。Hansen等(2011)提出了将已实现波动方法作为条件波动解释变量的已实现GARCH(R-GARCH)模型。本文拟通过对沪深300建立RRV-GARCH模型与HAR-RRV模型并给出滚动样本外一步预测值,然后采用M-Z回归以及损失函数作为判别准则对其预测能力进行比较。
二、相关理论介绍
(一)RRV及其修正量
………………………………(1)
………………………………(2)
其中,表示第日区间该抽样区间的最大对数价格,表示第日区间该抽样区间的最小对数价格,表示日抽样次数。表示第t-i期的日内极差。根据Martens和Dijk(2007)的建议,选取。
(二)R-GARCH模型
………………………(3)
…(4)
……………………………………(5)
其中,,,且与相互独立。为日对数收益,为期对数收益的函数。为日高频数据的已实现波动方法(如RV、RRV等),为测度杠杆效应的杠杆函数,通常取简单的正交形式:
………………………………………(6)
对于R-GARCH模型的参数估计,通常采用准极大似然估计(QMLE)的方法。
(三) HAR模型
………………(7)
其中,为日高频数据的已实现波动方法(如RV、RRV等),为随机误差项。
(四)M-Z回归
M-Z回归是Mincer和Zarnowitz(1969)提出的用来衡量波动模型的预测能力的方法,是目前比较流行的方法之一,它对真实波动率与预测波动率建立一个一元的线性回归模型:
………………………………………………(8)
其中,为真实波动率,为预测波动率,为随机误差项。通常真实波动率是无法度量的,常常选用高频数据的已实现波动方法或者其调整量来替代。实践中常常用回归方程的拟合优度(R2)来测度波动模型的预测效果。
(五)损失函数
损失函数则是一种波动模型预测能力的评价指标体系,通常损失函数的值越小,表明波动预测的误差就越小,那么模型的预测精度就越高。目前使用较多的损失函数主要有MAE、RMSE、MAPE、HRSME和HMAE等。
………………………………………(9)
…………………………………(10)
…………………………………(11)
………………………………(12)
……………………………… ………(13)
其中,为真实波动率,为预测波动率。
三、实证分析
(一)数据介绍
本文将采用沪深300指数08/04/2005到31/01/2011的抽样间隔为5分钟的共1415天数据,其中样本内数据1114个,样本预测外数据300个。
相关研究表明,日间收益并不存在高阶自相关,因而均值方程可选择如下的函数形式: ,其中,为对数收益在前期信息下的第期条件期望收益。日间收益残差存在异方差性,因而可以对其建立已实现GARCH模型。日间收益残差存在一定的厚尾特性,因而可假定服从广义误差分布(GED),而通常假定服从正态分布。且已实现极差波动具有严重的自相关性,因而可以对其建立HAR模型。
(二)RRV-GARCH模型与HAR-RRV模型的波动预测能力比较
为了简便起见,分别对和时的RRV建立R-GARCH(1,1)模型与HAR模型,并用已实现极差波动的修正量来作为日间真实波动的替代量,因而可得表1中结果。
表1RRV-GARCH模型与HAR-RRV模型的预测能力测度
R2 a b MAE RMSE MAPE HRMSE HMAE
R-G(1) 0.271 4.08E-05 1.369 2.24E-04 3.82E-04 0.999588 1.03743 0.62033
R-G(4ln2) 0.271 4.29E-05 1.369 2.24E-04 3.82E-04 0.999589 1.04539 0.62535
HAR(1) 0.238 7.19E-05 1.633 2.66E-04 4.30E-04 0.999636 1.51068 0.95417
HAR(4ln2) 0.237 7.13E-05 4.532 4.22E-04 5.65E-04 0.999781 5.42852 4.24557
从表1可以看出,R-GARCH模型的拟合优度要高于HAR模型,且R-GARCH模型的回归系数比HAR模型的回归系数更接近于1,因而从M-Z回归判别准则来讲,R-GARCH模型在对沪深300波动的刻画要优于HAR模型。其次,R-GARCH模型的5个常用损失函数值皆相应小于HAR模型的损失函数值,因而从损失函数的角度亦可以得到R-GARCH模型在对沪深300波动的刻画要优于HAR模型。
四、小结
从上面的实证分析结果来看,尽管作为混频数据波动模型代表的R-GARCH模型要优于作为高频数据波动模型代表的HAR模型,但是对已实现波动方法建立ARFIMA模型也是目前高频数据波动模型的常规做法,而该模型与R-GARCH模型的波动预测能力如何,尚属未知,因而有待进一步比较研究。
参考文献
[1] Fulvio Corsi.A simple long memory model of realized volatility [R].Working Papers, 2004.
[2] Martens M, Dijk D. Measuring volatility with the realized range [J]. Journal of Econometrics, 2007, (138):181-207.
[3] Peter Reinhard Hansen, Zhuo Huang, Howard Howan Shek. Realized GARCH: A Joint Model for Returns and Realized Measures of Volatility [J]. Journal of Applied Econometrics, 2011.
作者简介:袁周波(1987-),男,重庆人,西安财经学院2010级硕士研究生,研究方向:金融统计。
(责任编辑:陈岑)