刘 畅,官 政
(广西师范大学 数学与统计学院,广西 桂林 541004)
随着全球化、信息化和网络经济的蓬勃发展,尤其是近年来,随着大数据的提出,统计学在各个领域大放异彩,学者们对金融市场的数据研究也不仅仅局限于日、周、月等低频数据,转而投向了以秒、分、时为采集频率的高频数据。在Andersen和Bollerslev(1998)[2]提出可以利用日内高频交易数据计算已实现波动率来评价ARCH模型的预测效果之后,学者们开始对事后积分波动率的非参数估计问题产生兴趣;当Barndorff-Nielsen和Shephard(2002)[3]提出当资产价格过程满足扩散模型时,积分波动率的一致估计量就是已实现波动率,并给出了中心极限定理及证明;Valkanov(2006)[4]用绝对幂变差来对波动率进行预测,效果较好;Gallo和Engle(2006)[5]将GARCH模型和已实现波动率结合,从而提高了对波动率的预测精度;Fan和Wang(2008)[6]给出了瞬时波动率的非参数估计;Kristensen(2010)[7]将已实现波动率与瞬时波动率的估计联系起来,并证明了二次幂变差核估计量的渐近正态性和一致相合性。国内的唐勇和刘峰涛(2005)[8]将已实现波动率、SV(Stochastic Volatility)模型、GARCH模型三者对波动率的预测进行比较,发现已实现波动率优于其他两个模型。相较于Kristensen(2016)的结论,基于随机扩散模型,本文对其估计量的相合性提出了更好的证明,并给出了更快的收敛速度。
为叙述方便,始终假设C表示一不依赖于n的大于0的常数,且C每次出现可以取不同的值。
为对本文的结论进行证明,我们需要提前了解以下内容:
随机扩散模型:
其中,X t为金融产品对数价格,μt为漂移过程,σt为扩散过程,且μt和σt为[0,T]上的随机过程,W t为标准布朗运动。
引理1
其中,U~N(0,1)。证明过程见波动率估计研究专题综述(2019)。
引理2(杨善朝,1997) 若X j:j≥1相互独立,且满足E(X j)=0,则存在常数C≥0使得:
全文使用如下基本假设:
A 1)对于任意的p>0和l1≥0,有
A 2)对于任意的l2≥0,有,其中,T→∞。
A 3)对于任意的γ>0和C>0,有
B1)当窗宽h→0时,有n=T/△→∞和△→0:ϑn,T→0。
这里ε>0,δ>0都是任意给定的常数,为方便起见,我们采用等距观测△=ti-ti-1。
定理1我们假定A 1)~A 3),B1)和K 1)成立.
定理2假设T是固定的正数,条件A 1)~A 3)和K1)成立.如果当n→∞时,h→0且ςn→0,其中ςn=,这里δ>0都是任意给定的常数,则
我们将估计量的每一项展开,结合伊藤引理,我们可以得到:
结合(1)式,有:
令:
其中,
(1)R1的证明。
(2)R2的证明。
(3)R3的证明。
①首先处理S'n(τ)项。
设rn为趋于0的待定正常数序列,选取ln个中心在τ1,τ2,…,τln,半径为的邻域B1,B2,…,Bln覆盖[0,T],其中显然
由于:
另一方面,结合马尔科夫不等式:
又因为:
从而,
②再处理S''n(τ)项。
又有:
因此,我们联立上面三个式子,可得:
(4)R4的证明如下:
结合引理2,可以得到:
因此
又因h-1≤Cn-1/2和T≤Cn,所以∀ε>0,取r充分大,有:
由h-2n-1T2+l2→0,知
由于h-1≤Cn-1/2和T≤Cn,所以∀q>1,取r充分大,有:
(5)R5的证明。
其中,
利用σt的Lipschitz条件,有:
对于R53,
联立以上各式,得:R5=O p(h-2△T1+l2+hγ+hm/2),
其中,
对于固定的T,
所以ςn=n-1h-2+n-1/2+εh-1/2+n-1/2h-1/(2+p)-1/2。
因此我们用新的方法对该估计量的相合性进行了证明,并给出了比Kristensen(2016)更好的收敛速度。
我们已经在第三章给出了波动率估计的相合性证明,本章我们将利用数值模拟的方法来对上述估计量的效果进行研究。考虑下面的扩散-波动率模型:
其中,W1,t,W2,t是两个相互独立的标准的布朗运动,利用欧拉方法对上述模型进行离散化,并选取α=0.476,β=0.510,κ=0.227596,再选取时间间隔为1/(60×60×24×100)时所产生的波动率σt2的真值数据,再从这些真值数据中分别选取60 s和30 s不同时间间隔的真值数据进行模拟分析。我们得到时间间隔分别为60 s和30 s的模拟图,如图1、图2所示。图中,1线为估计线,2线为真值线。很容易发现,随着时间间隔的缩短,估计线和真值线的拟合程度越好。这也说明我们的估计量能很好地对真实值进行估计。
图1 时间间隔为60 s的模拟图
图2 时间间隔为30 s的模拟图