杨建辉,鲁旭芬
正确度量创业板的投资风险对投资者无疑具有重要意义。波动率是金融资产风险研究的起点和基础。波动率指关于资产未来价格的不确定性的度量。根据信心提取的时间顺序,传统的波动率测度主要采用两种指标,隐含波动率和历史波动率。传统历史波动率的方法主要有GARCH类模型和随机波动模型[1]。GARCH类模型采用改变的条件方差来捕捉价格波动的时变性和序列相关性,随机波动模型假定时变方差遵循某种不可观测的随机过程,并不依赖于过去的观测值。近年来受益于计算机等技术的发展,高频数据变得容易获得。高频数据是相对于日间或者更长时间间隔的数据而言,主要针对以小时、分钟或秒为采集频率的数据。高频数据比低频数据包含了更丰富的日内收益波动、微观市场噪声等信息,因此在金融研究领域备受关注。
Anderson和Bollerslev[2]提出了一种全新的波动率测度方法,在高频时间序列下构造了经典的已实现波动率(realized volatility,RV),把一段时间内收益率的平方和作为波动率的估计。相比传统低频领域的条件异方差模型和随机波动模型,已实现波动不需要模型及参数估计,而且计算简单。在已实现波动的基础上学者又提出了已实现波动的改进方法。徐正国和张世英[3]针对调整“已实现”波动的长记忆性和“杠杠”效应建立ARFIMAX模型,通过设定一系列标准,全面比较基于调整“已实现”波动的ARFIMAX模型、GARCH模型以及SV模型的预测能力。
Martens和Dijk[4]利用金融资产价格的极值理论,构造了已实现极差波动率(realized range-based volatility,RRV)。针对日内效应,唐勇和张世英[5]提出了赋权已实现极差波动,并证明了其无偏性和最小方差性。针对市场微观结构中出现的跳跃间断点,Barndorff-Nielsen和Shephard[6]率先提出已实现双幂波动(realized bipower volatility,RBV),解决了跳跃间断点对波动测度的干扰,但没有考虑日内效应。鉴于此,李胜歌和张世英[7]在已实现双幂波动的基础上赋权已实现双幂波动,并证明了其是积分波动的无偏估计,比“已实现”波动、赋权“已实现”波动以及“已实现”双幂次变差更有效。Barndorff-Nielsen[8]等针对跳跃间断点还提出了已实现核估计。徐正国和张世英[9]把基于一维高频数据的“已实现”波动率扩展到多维高频数据情形,给出“已实现”协方差阵,并给出了协方差阵的极限性质,用以刻画多维金融变量的波动率和相关性。
使用“已实现”波动率来估计金融时间序列真实的波动性的误差主要包括测量误差和市场微观结构误差两方面。测量误差随着抽样频率的升高而降低,但抽样频率过高会引起市场微观结构误差的增大。所以,已实现波动准确度量的关键是高频数据抽样频率的选择。Jeff Fleming等[10]在研究微观市场结构噪声跳跃间断点时,基于MMI中的20只股票对不同抽样频率下的已实现波动分布进行了详细刻画,但国内文献中大部分学者在对已实现波动研究时直接取抽样频率5分钟,并没有考虑不同抽样频率下波动率分布的不同特征及误差的大小。
为实现对创业板指数波动的准确测度,本文基于已实现波动模型,研究不同频率下创业板指数的波动特征。
创业板指数于2010年6月1日起正式编制和发布,基日为2010年5月31日,基点为1000点。本文选取2010年6月1日至2011年12月13日创业板指数的高频数据作为研究样本。样本共计372个交易日,1分钟间隔下有372×240=89280个数据;另外,我国股市全天交易时长为240分钟,金融高频数据的最短抽样间隔为1分钟,相对于国外市场全天390分钟交易时长,我国金融高频数据的抽样频率取值范围要小的多,若抽样频率去1分钟间隔以下或几分零几秒的数值,对实际应用的价值不大,所以抽样频率完全可以采用列举法[11]。故本文抽样频率选取1min,3min,5min,10min,15min,20min,30min,40min,60min等9个间隔。数据来源于国泰安数据库。
本文以1分钟间隔为例,来研究高频环境下创业板指数对数收益率的统计特征。用Eviews6.0计算创业板指数收益率。假设第t交易日内第k个时间间隔的指数为It,k,该时间间隔的收益率为rt,k,收益率采用一阶对数差分形式:
rt,k=lnIt,k-lnIt,k-1
图1为创业板指数1分钟对数收益率的变化过程。在一定的时间间隔频率内,在大幅波动后往往跟随着一个大幅波动,小幅波动后往往有更多的小幅波动,反映出创业板市场和其他金融市场一样具有波动聚集效应。大致从第71250个时间间隔起,即从2011年8月左右开始,指数有较大的波动,最大波动幅度甚至达到了4%。这与从8月份起欧洲债务危机的愈演愈烈不无关系。对1分钟对数收益率序列进行了ADF单位根检验,序列是平稳的。
图1 创业板指数1分钟对数收益率
如表1所示,创业板指数1分钟对数收益率序列的偏度为-4.0284(左偏),峰度达到了454.5223。从图2中可以看到,QQ图的中部为直线,上端右偏离该直线,下端左偏离该直线,具有明显的尖峰厚尾特征。正态检验值Jarque-Bera远远大于0,说明该序列不服从正态分布。
表1 创业板指数1分钟对数收益率的统计特征
本文随机选取2011年4月12日来观察高频数据中的日内效应,图3为2011年4月12日创业板指数1分钟对数收益率的折线图。从图中可以看到,对数收益率从第一个1分钟-0.000731迅速上升至第二个1分钟0.000210,并且在开盘和收盘时波动幅度比其他时段明显增大。刘向丽等[11]认为产生这种现象与金融市场的微观结构和隔夜信息的消化、吸收和释放有直接的关系,但王远志等[12]认为是集合竞价导致了市场开盘的高波动性。另外,对数收益率从119分钟的-6.97e-06上升到120分钟的0.000188,从121分钟的0.001192下降到122分钟的-5.47e-05,这说明对数收益率波动幅度在中午收盘和下午开盘时有显著增大。下午开盘前是没有集合竞价的,所以刘向丽等[11]认为下午开盘前的高波动性是由于在这段无交易时间内积蓄的信息释放的结果,而不是由集合竞价导致的开盘的高波动性。收益率的急升急降从另一个侧面反映了跳跃间断点(jump)的存在。
图2 创业板指数1分钟对数收益率的QQ图
图3 2011年4月12日创业板指数1分钟对数收益率
Hull&White[13]研究期权定价时,给出期权买权持有期内收益波动率的计算公式:
IVt(Integrated Volatility)是第t时期持有期为(T-t)的收益波动率,即积分波动。σu2是第u时刻的波动率。式(1)表示一段时间金融头寸的波动率可以由在这段时间上波动率的积分得到。
积分波动的基本思想是价格符合连续扩散过程,对数收益率为特殊半鞅过程(special martingale),条件协方差矩阵为二次协方差过程。因此,第t日的创业板指数收益率 rt满足[14]:
其中,k为时间间隔序数,w(s)服从几何布朗随机游走过程,u(s)表示该过程的漂移项,σ(s)表示波动率。Anderson等[14]多次证明在无套利市场,满足:
即只要收益率的取值频率足够高,N趋向于无穷大时,一天内连续时间收益率的平方和可以作为日波动率的估计值,用RVt表示第t日的“已实现”波动率,则
所有的r2t,k均是可观测的,已实现波动测度没有模型和参数,简单易行。
使用Matlab7.0和Eviews6.0计算不同抽样频率下的已实现波动率RV及其统计特征。随着抽样间隔的增加,已实现波动的均值不断增加,60分钟间隔已实现波动的均值为1分钟间隔已实现波动均值的2.44倍。标准差呈持续上升趋势,唯独30分钟间隔处相比20分钟间隔处略微下降,说明抽样间隔越大,已实现波动率的值和波动幅度越大。所取抽样间隔下已实现波动的偏度都大于2,峰度都大于8,且总体呈下降趋势,但在15分钟间隔和40分钟间隔上偏度和峰度逆趋势增加。这是市场微观结构误差和测量误差此消彼长共同作用的结果。不同的抽样间隔对已实现波动的均值、标准差、偏度、峰度均有显著影响。
从图4可以看到,在30分钟处,标准差略微下降,偏度最小为2.252276,峰度也最小为8.794841,从标准差、偏度和峰度综合考虑,30分钟的抽样间隔优于其他抽样间隔。
图5为不同抽样频率下创业板指数已实现波动率,1、3、5、10、15分钟等间隔处波动总体趋势类似,但波动范围逐渐增大。5个间隔的已实现波动图形都从第290天(2011年8月9日)起波动明显增大,与前文1分钟间隔对数收益率在2011年8月份波动幅度增大的结果一致。20、30、40和60分钟间隔处已实现波动总体趋势类似,相比前5个间隔,在0~40天和90~130天处波动幅度更大,并且更密集。不同于在前5个间隔后期波动幅度比前期大,在后4个间隔中,创业板指数的已实现波动前期的波动幅度比后期大,前期波动更明显。表明不同的抽样间隔对同一时间的波动测度影响较大。由于在创业板开板初期,创业板指数并没有发布,所以不能得知创业板开板时指数的波动幅度。
表2 不同抽样频率下已实现波动的统计特征
图5 不同抽样频率下创业板指数已实现波动率
本文对不同抽样频率下创业板指数已实现波动的特征进行分析,不同的抽样间隔对已实现波动的均值、标准差、偏度、峰度均有显著影响。在综合考虑微观市场结构误差和测量误差的基础上认为,30分钟为创业板指数经典已实现波动的最优抽样间隔。大多数文献在研究已实现波动时简单直接的取5分钟作为抽样间隔的方法是不可取的,抽样频率对已实现波动的准确度量具有重要影响。但对最优抽样频率的选取标准还有待进一步研究。
[1] 龙瑞等.高频环境下沪深300股指期货波动测度-基于已实现波动及其改进方法[J].系统工程理论与实践,2011,31(5).
[2] Andersen T.G,Tim Bollerslev,et,al.Exchange Rate Returns Standard⁃ized by Realized Volatility are(Nearly)Gaussian[J].Multinational Fi⁃nance Journal,2000,(4).
[3] 徐正国,张世英.调整“已实现”波动率与GARCH及SV模型对波动的预测能力的比较研究[J].系统工程,2004,(8).
[4] Martens M,Dijk D.Measuring Volatility with the Realized Range[J].Journal of Econometrics,2007,138(1).
[5] 唐勇,张世英.高频数据的加权已实现极差波动及其实证分析[J].系统工程,2006,24(8).
[6] Barndorff-Nielsen O E,Shephard N.Lmpact of Jumps on Returns and Realized Variances:Econometrics Analysis of Time-deformed Levy Process[J].Journal of Econometrics,2006,(3).
[7] 李胜歌,张世英.金融波动的赋权“已实现”双幂次变差及其应用[J].中国管理科学,2007,(10).
[8] Barndorff-Nielsen,O.E,Hansen,P.R,Lunde,A,Shephard,N.Multi⁃variate Realized Kernels:Consistent Positive Semi-definite Estima⁃tors of the Covariance of Equity Prices with Noise and Non-synchro⁃nous Trading[C].Working Paper.Stanford University,2008.
[9] 徐正国,张世英.多维高频数据的“已实现”波动建模研究[J].系统工程学报,2006,(2).
[10] Jeff Fleming,Bradley S.Paye.High-frequency Returns,Jumps and the Mixture of Normal Hypothesis[J].Journal of Econometrics,2011,160.
[11] 李胜歌,张世英.金融高频数据的最优抽样频率研究[J].管理学报,2008,5(6).
[12] 刘向丽,程刚,成思危,汪寿阳,洪永淼.中国期货市场日内效应分析[J].系统工程理论与实践,2008,(8).
[13] 王远志,李晔,刘卉.上海期铜日内交易特征的实证研究[J].天津工业大学学报,2005,24(2).
[14] Hull,J,White,A.The Pricing of Options on Assets with Stochastic Volatilities[J].Journal of Finance,1987,(5).
[15] AndersenT.G,BollerslevT,DieboldFX,et,al.TheDistributionofRe⁃alized StockVolatility[J].JournalofFinancialEconomics,2001,61(1).