陈梓荣 周瑶
摘 要:论文研究了阈值数量和大小对已实现波动率预测的影响,并提出了偏方差已实现波动率预测模型——HAR-PV(G),该模型进一步提高了已实现波动率的预测效果。考虑到不同大小收益对已实现波动率的影响具有非对称性,以HAR-RS模型为基础,选取不同数量和不同大小的阈值组合对日内收益进行分割,并计算对应的偏方差,从而构建HAR-PV(G)模型。论文以沪深300指数为研究对象,比较了不同HAR-PV(G)模型的样本外预测能力。样本外分析表明,阈值数量为3的平分偏方差模型具有比传统HAR、HAR-RS以及其他阈值组合的偏方差模型更好的预测能力。全样本的参数分析也显示阈值数量为3的平分偏方差模型对数据的拟合效果更出众。
关键词:偏方差;已实现波动率;日内收益;高频数据
中图分类号:F 830.9
文献标志码:A
Partial Variance Volatility Forecasting Model
CHEN Zirong ZHOU Yao
(Antai College of Economic and Management, Shanghai Jiao Tong University, Shanghai 200030, China)
Abstract:This paper proposes a partial variance prediction model, HAR-PV(G), which can test the effects of different quantities and different sizes of thresholds on the prediction of realized volatility, aiming at improving the predicting effect of realized volatility. Due to the asymmetric effects of different intraday returns on the realized volatility, this paper selects threshold combinations of different quantities and sizes to segment intraday returns based on HAR-RS model. Then, this paper calculates the corresponding partial variance to construct HAR-PV(G) model. This paper uses 5-minute high-frequency trading data of CSI 300 index to compare in-sample and out-of-sample performances of HAR-PV(G) model. The results show an equal division of partial variance model with 3 thresholds could achieve a better out-of-sample performance compared with traditional HAR, HAR-RS and other HAR-PV(G) models with different threshold combinations. Meanwhile, this equal division of partial variance model with 3 thresholds also has an excellent fitting effect in the in-sample analysis.
Key words:partial variance; realized volatility; intraday return; high-frequency data
0 引言
金融市场中,资产具有波动性是一种被普遍认可的金融事实。用于衡量资产风险情况的波动率在投资组合构建、资产定价以及风险管理等金融领域扮演着极其重要的角色,因此对波动率的统计分析和建模预测一直都是金融计量领域关注的热点问题。随着我国衍生品市场快速发展,市场对衍生品定价的准确性要求强调了波动率预测研究的重要性。此外,宏观政策层面的波动必然带来微观个体的变动,进而引起金融市场的波动;微观市场层面的波动与金融環境和实体经济的稳定密切相关,正确预测波动率对市场从业人员和监管者都有着不可忽视的作用。
波动率通常具有较为复杂的特性,Bollerslev和Taylor提出的广义自回归条件异方差(GARCH) 模型和随机波动率(SV) 模型是传统的两类刻画波动率的模型。随着数据存储技术的进步,日内高频数据的获取成本也大幅降低,因此包含丰富信息的日内高频数据为波动率的估计和预测提供了新的手段。Andersen等首次提出将已实现波动率(Realized Volatility, RV)作为日内波动率的估计量,相较于传统的GARCH和SV等模型,已实现波动率不仅不需要复杂的模型计算和数理推导,而且能够充分利用日内高频交易数据所包含的信息,更精确地刻画金融市场波动率,因此已实现波动率一经提出便得到了广泛的研究和应用。
在已实现波动率预测的研究中,最具代表性的是Corsi提出的HAR模型。Corsi以“异质市场假说”为理论基础,将波动率划分为短期波动、中期波动和长期波动,提出了异质自回归已实现波动率预测模型(Heterogeneous Autoregressive,HAR)。HAR模型不仅降低了传统模型的估计复杂度,也具有很强的扩展性和明确的经济含义,因此逐渐成为已实现波动率预测的基准模型。Andersen等将已实现波动率分解成连续波动(Continuous Volatility, CV)和跳跃波动(Jump Volatility,JV),并分别考虑这两种波动对未来已实现波动率的影响,提出了HAR-RV-J和HAR-CJ模型。作者通过实证发现分解波动率可以显著提高已实现波动率的预测能力。Chen和Ghysels发现好消息和坏消息对波动率的影响是非对称的,因此把已实现波动率分解为好消息驱动的波动率成分和坏消息驱动的波动率成分可以提高已实现波动率的预测能力。遵循这一思路,Patton和Sheppard将日内收益按照正负进行划分,分别平方求和得到已实现半变方差(Realized Semi-Variance,RS)和符号跳跃变差(Signed Jump Variation, SJV),在此基础上提出了HAR-RS、HAR-RV-SJV和HAR-RV-SJVd等模型,实证发现这三种模型的预测能力都优于传统的HAR模型。
国内对已实现波动率预测的研究起步较晚。文凤华、刘晓群、唐海如等在HAR模型的基础上考虑市场波动的杠杆效应和量价关系,提出了LHAR-RV-V模型,并使用沪深300指数的高频数据进行实证分析,证明该模型可以提高传统HAR模型的预测能力。马锋、魏宇、黄登仕等将符号跳跃变差应用到中国市场,比较了HAR、HAR-RV-J、HAR-RV-CJ和HAR-RV-TCJ等已实现波动率预测模型在加入符号变差后的预测能力。陈声利、关涛和李一军将百度指数引入HAR模型中,实证发现新模型可以提高对沪深300股指期货波动率的预测能力。李俊儒、汪寿阳和魏云捷考虑波动率 的测量误差,发现加入波动率测量误差后的HAR模型预测能力的持续性有所提高,且其预测效果优于传统的HAR模型。龚旭、曹杰、文凤华等在4个经典的HAR族模型的基础上,探究了杠杆效应和结构突变因素对已实现波动率的预测能力。
尽管上述HAR族模型对已实现波动率已有较强的预测能力,但是考虑到波动率在金融市场的重要作用,进一步探究如何提高已实现波动率的预测能力仍有必要。因此,本文基于Patton和Sheppard提出的HAR-RS模型,提出偏方差已实现波动率预测模型——HAR-PV(G),并研究了不同阈值组合对已实现波动率模型预测能力的影响。
在HAR-RS模型中,作者对日内收益以0作为阈值进行分割,将已实现波动率分为上行波动率和下行波动率并加入HAR模型,最终发现HAR-RS模型比传统的HAR模型有更强的预测能力。基于HAR-RS的研究,本文进一步探究以下两个具体问题:第一,在中国金融市场,选取非0的阈值对日内收益进行分割,然后计算对应的波动率成分且加入HAR模型中,新的模型是否比HAR-RS模型有更好的预测能力;第二,如果阈值数量大于1,即将日内收益率分成三段或者更多,然后计算对应的波动率成分并加入HAR模型中,新的模型對已实现波动率的预测能力是否会得到进一步提升。
1 计量模型
1.1 已实现波动率预测模型
假设金融资产在交易日t的对数价格p=log (P),服从以下扩散模型:
p=∫ μ ds+∫ σ dW+J. (1)
其中:μ是有限方差的连续跳跃过程;σ代表瞬时波动率,且是一个严格为正的càdlaàg过程;J是跳跃过程。如果用Δp=pp代表s时点的跳跃大小,那么p的二次变差为[p,p]=∫ σ ds+∑(Δp) 。其中:∫ σ ds为积分波动率,又叫作连续波动率;∑(Δp)为跳跃波动。
假设在交易日t,拥有间隔相等的M+1个观察值p,p,…,p。令r代表交易日t内第i时段的对数收益率,r=pp,i=1,…,M。Andersen等提出可以使用日内收益率的平方和作为二次变差的估计量,该估计量又被叫作已实现波动率,其计算方法如下:
在众多已实现波动率预测模型中,Corsi等提出的HAR模型因能够刻画已实现波动率的长尾效应获得最为广泛的应用。HAR模型的形式非常简洁,只需使用上一天、上一周以及上一个月的平均已实现波动率作为预测下一期已实现波动率的预测变量:
其中,RV是t-4到t日的平均已实现波动率,RV是t-19到t日的平均已实现波动率。
Patton和Sheppard考虑了波动率的杠杆效应,提出以0为阈值对日内收益进行分割,并将已实现波动率分解成上行已实现半方差RS=∑ r I{r>0}和下行已实现半方差RS= ∑ r I{r<0},并在此基础之上提出了HAR-RS模型:
在Patton和Sheppard、马锋、魏宇、黄登仕等的研究中,下行已实现波动率和上行已实现波动率对未来已实现波动率的影响具有显著的非对称性,下行已实现波动率的影响更为显著,且HAR-RS模型拥有比HAR模型更好的预测能力。
1.2 偏方差波动率预测模型
HAR-RS的研究表明正负收益对未来已实现波动率的影响是不同的。既然不同大小的收益对未来已实现波动率的影响是不同的,那么是否可以通过对日内收益进行更细致的划分来获得更好的预测效果将是本文试图回答的问题。
在Patton和Sheppard的研究中,周(RV)和月(RV)已实现波动率的分解对预测效果的影响较小,因此本文的研究集中在日已实现波动率(RV)的分解对波动率预测的影响上。
从公式(5)中可以发现,偏方差预测模型中阈值的选择面临两个问题:阈值数量和阈值大小。为了探究如何选取合适的阈值组合进行预测,本文拟从实证的角度来研究阈值的大小和数量对波动率预测的影响。本文将通过比较不同阈值组合的样本外表现,最终对阈值组合的选择提出建议。
2 数据
本文选取沪深300股票指数高频交易数据作为研究对象,数据来源于微盛投资数据库。为了尽可能多地运用高频数据包含的信息,同时避免因为市场结构噪声带来的影响,本文采用5分钟频率的日内收益数据。数据样本时间跨度为2011年1月4日至2021年5月17日(数据库时间截至2021年5月17日)。
从图1的已实现波动率时序图来看,波动率在2015年出现了一个高峰时期,其正好对应了2015年的股灾时期,符合金融事实。此外,从表1的描述性统计来看,已实现波动率的偏度和峰度都很高,说明已实现波动率存在右偏和尖峰厚尾等特征。
3 实证分析
为了进一步深入研究阈值组合对已实现波动率预测的影响,本节将从以下四个角度具体展开研究:
1)阈值数量固定时,不同阈值组合下的偏方差模型的预测能力比较。
2)放开阈值数量固定的限制,不同阈值数量的偏方差模型的预测能力比较。
3)放开阈值数量和组合的限制,允许阈值的数量和大小在每一期都发生变化,并和其他偏方差预测模型的预测能力进行比较。
4)通過全样本的参数估计分析不同大小收益对未来已实现波动率的影响。
前三个分析使用样本外表现来比较不同模型的预测能力,第四个分析使用样本内分析探究不同大小收益对未来波动率的影响。
在实际选取阈值时,考虑到每天的已实现波动率的变化是不同的且波动较大,本文并不直接选取固定的数值作为阈值,而是选取一些特定的分位点作为阈值:
其中,Q(z;q)是z序列的q分位点。同时,本文将用HAR-PV()代表当阈值数量为G且分位点将日内收益率进行平分的偏方差预测模型。
本文主要通过样本外分析对不同偏方差模型的预测能力进行比较。样本外预测采用一步向前滚动窗估计,估计样本窗口设定为1000个交易日,即预测从第1001个交易日开始。由于文章篇幅的限制,本文的实证分析主要集中于预测下一天的已实现波动率RV。
对于样本外预测能力的评判标准,现有研究并未对损失函数的选择达成共识。在传统的HAR模型研究中,不少文献同时采用多个损失函数来比较不同模型的样本外表现。本文遵循Audrino和Hu的做法,选取两个常用的损失函数:
其中,RV是已实现波动率的预测值,RV是已实现波动率的真实值,n代表预测样本数量。预测模型的损失函数值越小,表明模型的预测能力越强。
然而,通过比较不同损失函数值的大小可以直接比较不同模型预测的精度,但是无法判断一个模型的预测能力是否显著优于另一个或另一组模型,因此本文还将采用模型可信集(MCS)检验方法来对比不同模型的预测能力。模型可信集检验是由Hansen等基于Hansen改进之后提出的用于对不同模型的预测能力优劣进行排序的检验方法。MCS检验统计量的构造和比较过程非常复杂,由于篇幅原因在此不过多展开,详细步骤可参考Hansen等。
在后续的结果里,本文将重点报告MCS检验中的P值,根据Hansen等论文里的解释,该P值可以简单理解为在所有进行检测的模型中,该模型拥有最好预测能力的概率。本文的MCS检验采用较为常用的范围统计量(Range)作为检验统计量,窗口长度为25,重复抽样次数为5000,临界值的选择为0.1(置信度为90%)。实证中如果模型的Range统计量对应的检验P值大于0.1,说明该模型具有较好的预测能力;P值越大,表明该模型具有较好预测能力的概率越高。
3.1 固定数量不同阈值组合的预测效果比较
本节先从比较简单的情形入手,比较阈值数量固定的阈值组合对下一期已实现波动率的预测效果。在下文的分析中,阈值分位点的选择区间为0.05至0.95,步长为0.05。
首先,在给定一个阈值的情况下,图2绘制了该情形下的样本外表现。其中,横轴代表了不同的阈值分位点,纵轴代表了对应模型的样本外平均MSE的值。两条虚线HAR-RV和HAR-RS分别代表了传统的HAR-RV模型和HAR-RS模型的样本外平均MSE的值。从图2中可以发现,HAR-PV(1)模型在阈值分位点处于0.5附近时取到最小值,即是说,已实现波动率处在中值水平时取得最小值,此时已实现波动率的中值非常接近于0,因此阈值分位点为0.5的偏方差模型非常接近于HAR-RS模型。该结果表明当阈值数量只有1个的时候,在样本外表现上击败HAR-RS模型是非常困难的。
此外,从图2所显示的两侧尾部的表现来看,当阈值分位点非常偏左时,预测的样本外效果表现并不理想,不仅弱于传统的HAR-RV模型,也远比不上在右侧极端分位点上进行分割后的表现,该结果类似于Bollerslev等对美国S&P500的研究结果,但并不符合通常的认知。在传统的金融研究里,一般认为左侧的极端收益对未来波动率的影响相较于右侧收益更大,因此单独考虑左侧极端风险通常能够提高对未来波动率的预测能力。基于此,本文将在3.4节中进一步深入探讨不同大小的收益对未来波动率的影响。
接着,本文继续考虑两个阈值的情况,这里阈值分位点同样选择从0.05至0.95,步长为0.05。这里有两个阈值,因此共有171个不同的阈值组合。
图3刻画了给定两个阈值下的样本外表现。两个横轴分别代表了两个阈值的选择,纵轴代表了不同模型样本外的平均MSE值。从图3中可以发现,图形中存在两个相对低点,而低点的位置非常接近于[0.35,0.65]的阈值组合,说明 HAR-PV(2)模型在阈值组合为[0.35,0.65]附近的样本外表现相对较好。
综合图3和图4可知,在阈值数量固定为1或者2的两种情况下,具有最好的样本外表现的模型都接近于对日内收益进行平分后的偏方差模型,即HAR-PV()模型。因此,本文进一步推测当阈值数量固定时,平分日内收益率的偏方差模型具有相对较好的预测能力。
为了进一步验证这一推测,下文继续考虑给定阈值数量更多的情况。这一部分一共对5种不同阈值数量的情况进行考虑,即阈值数量为1、2、3、4、5的情况。当阈值数量大于2时,其样本外的平均MSE的值的分布难以通过绘图的方式表现出来,为了让阈值组合的结果可视化,在每个阈值数量下选取了三组有代表性的阈值组合,表2给出了具体的阈值选择的情况。从表2中不难发现,组合1是对日内收益平分的阈值组合;当阈值数量大于等于2时,组合2侧重考虑两侧尾部风险;组合3侧重考虑左侧尾部风险。不对右侧尾部风险单独考虑,主要是因为在传统的金融风险研究中,左侧风险对波动率预测、资产配置等有更为显著的影响。本节将分别计算每一种阈值分位点组合的样本外平均MSE和QLIKE的值,并对每一个阈值数量确定下的三种组合进行MCS检验,进而判断哪一种阈值组合是较好的预测模型。
表3报告了不同组合下的样本外平均MSE和QLIKE的值,其中MSE列的值乘以了10。MCS列报告了置信水平为90%的MCS检验的P值,N代表了阈值的数量。从表3的结果可以看出,在绝大多数情况下,无论损失函数选择MSE 还是QLIKE,平分阈值都有着最小的平均损失值。MCS的结果也更进一步验证了这一点,除去阈值数量是4个,且损失函数采用QLIKE的情况,其他情况下,平分阈值模型的MCS检验下的P值都是1.000,该结果说明平分阈值模型是三种模型中预测能力相对较好的模型。
3.2 不同数量阈值的预测效果比较
上节比较了在阈值数量固定时,不同阈值组合的样本外表现。本节将比较不同阈值数量的样本外表现。为了方便比较,本节直接应用3.1中观察到的结果,直接对比不同数量阈值下的平分阈值组合的偏方差模型的样本外表现。同样阈值数量的选择为1到5,每种阈值数量下都采用平分日内收益率的方法来计算对应的偏方差波动率,即HAR-PV()模型。
图4绘制了不同阈值数量下的样本外表现。其中,横轴代表了阈值的数量,纵轴代表了预测模型的样本外的平均MSE的值,兩条虚线HAR-RV和HAR-RS,分别代表了传统HAR-RV和HAR-RS模型的样本外平均MSE的值。从图4中可以清晰地看到,样本外表现和阈值数量呈现一个正“U”形,样本外表现在阈值数量取到3的时候取到最小值,MSE为3.9E-08。与传统的HAR-RV模型相比,所有对日内波动率进行平均分割的偏方差模型的样本外表现都远好于传统的HAR-RV模型。由此可见,对日内收益率的分割是必要的,这也足以说明偏方差模型可以显著提高对已实现波动率的预测能力。
为了进一步验证上述结论,表4统计了不同阈值数量下不同模型的样本外表现。从表中不难发现,不管损失函数采用MSE还是QLIKE,HAR-PV(3)的样本外损失函数值都是最好的之一,这也与图5一致。此外,在MCS检验中,HAR-PV(3)的MCS检验P值都是1.000,说明HAR-PV(3)模型是拥有最好预测能力的模型集合中的一个。综上所述,在不固定阈值数量的不同组合中,三个阈值数量的偏方差模型具有较好的波动率预测效果。
3.3 阈值动态模型
从上述两节的分析中可知,阈值的数量和大小都会对已实现波动率的预测产生影响。本节将继续探究一个问题:如果允许阈值的数量和大小都随时间的变化而变化,或者称为阈值动态模型,该模型是否具有更好的波动率预测能力。本文将用HAR-PV()代表阈值数量和组合均可随时间变化而变化的阈值动态模型。
本节通过交叉验证的方法来确定每一期的阈值组合;具体方法操作如下:
首先,选取1000个交易日的数据作为训练集。具体地,假设在交易日t,选取t-1000到t日的交易数据作为训练集。
其次,从训练集中随机选取600个连续交易日。
接着,将随机选取的600个连续交易日分为400和200两个区间。
然后,对于每一种阈值组合,利用上文提到的滚动预测的方差预测200个交易日的已实现波动率。
随后,根据预测的已实现波动率计算每一种阈值组合的样本外MSE值,作为评估阈值组合的标准。
重复步骤2至步骤5五次。
最后,选取5次平均MSE值最小的阈值组合对应的偏方差模型作为预测t+1日的偏方差模型。
为了节省计算能力且不失一般性,本节的阈值分位点选取为0.1至0.9,步长为0.1。
表5报告了HAR-PV()阈值动态模型的样本外表现。这里将HAR-PV()模型和其他HAR-PV()模型进行了比较,便于发现最优的波动率预测模型。首先,将HAR-PV()模型和传统的HAR模型的样本外表现进行比较,HAR-PV()的MSE值为4.061,低于HAR模型的4.693,但其QLIKE值为0.201,略高于HAR的0.195,因此,结合两种损失函数的结果,并不能得出HAR-PV()完全优于传统的HAR模型。接着,将HAR-PV()模型和前两节得到论证的日内收益率平均模型HAR-PV()进行比较,类似地,并不能说明HAR-PV()比HAR-PV(3)有更好的样本外表现。此外,虽然HAR-PV()的MCS检验P值均为1.000,但是从平均损失值的角度来看,并不能认为HAR-PV()是比HAR-PV(3)更好的预测模型。
综合3.1、3.2和3.3的分析,可以得到以下三个结论:第一,在固定阈值数量的情况下,平分日内收益的偏方差模型往往具有更好的预测能力。第二,偏方差模型的预测能力和阈值数量呈现一个倒“U”形的关系,模型的预测能力在阈值数量为3附近达到最优。第三,即便放开阈值数量和组合的限制,阈值动态模型的预测能力并未优于HAR-PV(3)。综上所述,阈值数量为3的平分偏方差模型可以击败传统的HAR-RS模型和其他偏方差模型,具有更好的预测能力。
3.4 参数分析
正如前三节所分析的,日内收益率的状况会对波动率产生影响,为了进一步理解不同大小的收益率对下一期已实现波動率的影响,本节通过分析模型的回归系数研究不同的偏方差对下一期已实现波动率的具体影响。
同样,本节采用HAR-PV()模型作为研究对象。因为不同的偏方差相差较大,本文对所有的回归变量进行归一处理,从而可以更好地在不同变量的参数之间进行比较。与上文一致,本节依旧只考虑预测下一天的已实现波动率。
表6报告了全样本内不同HAR-PV()模型的估计结果,括号中是对应参数的Newey-West调整后的t检验值(West),表中的PV(i)对应了不同模型下的第i段偏方差的回归系数。因为分析不涉及常数项,因此表中忽略了常数项。
首先,关注HAR-PV(1)模型的结果。在HAR-PV(1)模型中,负的偏方差的系数为0.519,而对应的正偏方差只有-0.154,且负偏方差的t值达到了4.332,远高于正偏方差的2.190。可见在预测下一天的已实现波动率时,负日内收益包含了比正日内收益更多的信息,且其对下一期已实现波动率的影响几乎是正偏方差的四倍。该结果进一步验证了龚旭、曹杰、文凤华等的研究结果,即中国股票市场的波动率具有杠杆效应。
HAR-PV(2)模型类似于Andersen等提出的HAR-J模型。HAR-J模型将已实现波动率分解为连续波动和跳跃波动,不同于HAR-J模型中考虑极端收益的影响,HAR-PV(2)模型重点考虑两侧较大的尾部收益的影响。HAR-PV(2)模型的回归结果显示,三段偏方差都是显著的。右侧尾部收益的影响和左侧尾部收益的影响相反,左侧尾部收益对下一期已实现波动率的影响为正,而右侧影响为负。
从HAR-PV(3)至HAR-PV(5)的参数估计中可以总结出两个主要结论。第一,中位偏方差在预测波动率中占据主导地位。从估计参数的符号和显著性情况可以看到,在零附近的偏方差的系数始终是正向且显著的,该结果说明常规收益对下一期已实现波动率的影响是要大于极端收益的。第二,左侧极端收益对下一期已实现波动率的影响通常高于右侧极端收益,但右侧较大收益对下一期已实现波动率的影响通常大于左侧较大收益。从HAR-PV(5)的回归结果可以看出,在两侧极端的偏方差中,PV(1)的系数为0.159,t值为1.822,而对应的PV(6)的系数仅为-0.091,t值为-1.399。可见左侧的极端风险对预测下一期已实现波动率的作用更大。这也符合金融市场的风险认知,在传统的金融研究里,左侧风险确实是更为重要的一种。但是,这种情况在考虑两侧较大的收益时发生了反转。同样在PV(5)模型的回归结果中,PV(5)的系数为-0.306,t值为-2.824,而PV(2)的系数仅为0.216,t值为1.547。 可见如果考虑较大的收益对下一期已实现波动率的影响,右侧收益的影响要大于左侧收益。
最后,从回归结果调整后的R看,HAR-PV(4)模型对数据的拟合效果最好,其调整后的R值为0.651。此外,与传统HAR模型相比,对已实现波动率进行分割后对数据的拟合效果都更好(高于0.536),该结果进一步验证了对已实现波动率进行分割的必要性。
4 结语
本文研究了在HAR-RS模型中,是否可以通过改变阈值的选取提高已实现波动率的预测能力的问题。本文以HAR-RS模型为基础,构造了HAR-PV(G)模型,并使用沪深300股票指数5分钟高频交易数据进行实证分析,结果表明恰当选取合适的阈值确实能够提高对已实现波动率的预测能力。
本文对不同模型的样本外表现进行比较,发现阈值数量固定时,平分阈值组合的偏方差模型样本外表现最优。在阈值数量可以变动的情况下,偏方差模型的样本外表现和阈值数量的关系呈现一个“U”形,阈值数量为3的偏方差模型的样本外表现最好。随后,本文进一步考虑了时变阈值模型即阈值动态模型,利用交叉检验的方法在每一期选出最优的阈值组合用以预测下一期已实现波动率,并将最终的预测效果和平分阈值模型进行比较后发现,阈值动态模型并不能显著击败阈值数量为3的平分偏方差模型。
为了进一步探究不同大小的收益对下一期已实现波动率的影响,本文通过平分模型的样本内估计发现负收益对下一期已实现波动率的影响更大且更显著。除此之外,0附近的收益在波动率预测中占据主导地位。同时,在极端的收益中,左侧极端收益对预测的影响强于右侧的极端收益;但在较大的收益中,右侧较大的收益的影响却强于左侧较大的收益。
虽然本文取得了一些创新型的结果,但还存在一些问题需要进一步拓展研究。具体表现在三个方面。第一,本文的研究主要局限在股票市场,文中的结论能否应用于其他金融市场,比如期货、大宗商品等,有待进一步验证。第二,本文的研究主要局限在预测下一天的已实现波动率,在预测下一周甚至下个月的已实现波动率时,是否发生阈值选择的变化有待考证。第三,本文仅研究了波动率预测的问题,后续可以将偏方差模型运用到资产配置、期权定价和风险管理等实际问题中。
参考文献:
[1]BOLLERSLEV T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics, 1986, 31(3):307-27.
[2]TAYLOR S J. Modeling stochastic volatility:a review and comparative study[J]. Mathematical Finance, 1994, 4(2):183-204.
[3]ANDERSEN T G, BOLLERSLEV T, DIEBOLD F X, et al. Modeling and forecasting realized volatility[J]. Econometrica, 2003, 71(2):579-625.
[4]CORSI F. A Simple approximate long-memory model of realized volatility[J]. Journal of Financial Econometrics, 2009, 7(2):174-196.
[5]ANDERSEN T G, BOLLERSLEV T, DIEBOLD F X. Roughing it up:including jump components in the measurement, modeling, and forecasting of return volatility[J]. The Review of Economics and Statistics, 2007, 89(4):701-720.
[6]CHEN X, GHYSELS E. News—good or bad—and its impact on volatility predictions over multiple horizons[J]. The Review of Financial Studies, 2010, 24(1):46-81.
[7]PATTON A J, SHEPPARD K. Good volatility, bad volatility:signed jumps and the persistence of volatility[J]. The Review of Economics and Statistics, 2015, 97(3):683-697.
[8]文鳳华, 刘晓群, 唐海如,等.基于LHAR-RV-V模型的中国股市波动性研究 [J]. 管理科学学报, 2012(15):59-67.
[9]马锋, 魏宇, 黄登仕,等.基于跳跃和符号跳跃变差的HAR-RV预测模型及其MCS检验 [J]. 系统管理学报, 2015, 24:700-710.
[10]陈声利, 关涛,李一军.基于跳跃、好坏波动率与百度指数的股指期货波动率预测 [J]. 系统工程理论与实践, 2018(38):299-316.
[11]李俊儒, 汪寿阳,魏云捷.基于波动率测量误差的波动率预测模型 [J]. 系统工程理论与实践, 2018(38):1905-1918.
[12]龚旭, 曹杰, 文凤华,等.基于杠杆效应和结构突变的HAR族模型及其对股市波动率的预测研究 [J]. 系统工程理论与实践, 2020(40):1113-1133.
[13]CORSI F, PIRINO D, RENò R. Threshold bipower variation and the impact of jumps on volatility forecasting [J]. Journal of Econometrics, 2010, 159(2):276-288.
[14]AUDRINO F, HU Y. Volatility forecasting:downside risk, jumps and leverage effect[J]. Econometrics, 2016, 4(1):8.
[15]HANSEN P R, LUNDE A, NASON J M. The model confidence set[J]. Econometrica, 2011, 79(2):453-497.
[16]HANSEN P R. A test for superior predictive ability[J]. Journal of Business & Economic Statistics, 2005, 23(4):365-380.
[17]BOLLERSLEV T, MEDEIROS M C, PATTON A J, et al. From zero to hero:realized partial (co)variances[J]. Journal of Econometrics, 2021.
[18]WEST N. A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix[J]. Econometrica, 1987, 55(3):703-708.