邹美红, 程建强, 何幼桦
(上海大学理学院,上海200444)
在金融和经济数据的研究中,条件方差函数(即波动率)是一项重要的研究指标,它与金融衍生证券(如期权)的价格和交易资产的风险度量(如受险价值)密切相关.因此,方差函数的改变将对整个策略和风险管理带来很大的影响.我们把方差函数突然发生变化的时间点估计问题称为方差变点问题.近年来,方差变点的研究已经成为金融和数理统计学家研究的热门课题.
经典变点理论研究的主要内容是:给定一个随机变量的序列,在序列中某个未知时刻分布函数潜在地发生变化,需要使用已知观测数据来估计分布中变点的位置,并在理论上研究变点检验统计量的性质.近年来,已有很多学者对变点问题给出了较为详尽的参数和非参数估计方法[1-2].对经济数据的分析中可以发现,在很多情况下数据之间具有相依性结构,且分布函数形式未知.文献[3-4]讨论了数据的相依结构对变点估计的影响.文献[5]给出了相依序列变点的非参数估计,并得到了估计的最优收敛速度.对于方差变点问题,文献[6-7]分别给出了方差变点的最大似然估计(maximum likelihood estimation,MLE)估计和线性结构下方差变点的估计方法.文献[8]建立了相依观测下方差变点的非参数估计表达式,并详尽地讨论了变点检验统计量的渐近分布,但是,其主要思想是把非参数问题转化为参数问题进行研究.
本工作针对一阶非参数自回归条件异方差模型方差变点问题,在严平稳的β-混合过程前提的假设下,采用核局部线性方法[9]对变点k前后的方差函数进行估计.相对一般的非参数核密度估计,局部线性估计的好处是其为无偏的,对在内部和边界上的点同样成立,均会产生较小的偏倚.然后,以估计值的差值作为变点检验统计量,通过经典变点理论构造变点估计表达式,并着重讨论检验统计量的分布.由于有限样本下统计量分布的复杂性,本工作主要讨论其渐近分布并由此给出变点检验的方法.最后,通过随机模拟展示估计结果的有效性.
考虑如下一阶非参数自回归条件异方差模型:
式中,{Xt|t=1,2,…,n}为严平稳的β-混合过程,m(x)=E(Xt|Xt-1=x),σ2(x)=Var(Xt|Xt-1=x)>0分别为回归函数和方差函数,均具有二阶连续导数且函数形式未知.然而,某些情况下方差函数在某个未知时刻k可能发生变化,模型(1)也相应地转化为
本工作主要考虑模型(2)的方差变点估计及检验问题.文献[8]已建立了相依序列下方差变点的非参数估计表达式,并对变点检验统计量的渐近分布进行了详尽的讨论,但其主要思想是把非参数问题转化成参数问题来研究.本工作主要采用一般的非参数方法对方差变点进行估计,并进一步讨论检验统计量的渐近性质,进而得到变点检验的方法.
首先,给出变点检验统计量,即
为方便起见,上述检验统计量简记为Tk,从而由经典变点理论构造变点估计表达式为
对于一般的变点问题,在变点估计之后还需考虑该估计点是否真的为变点,因此,我们需要对变点检验统计量Tk的分布进行讨论.然而,有限样本下检验统计量的分布较为复杂,所以,在此主要讨论统计量的渐近分布.
先给出假设(A1)~(A5),在此假设下,可得到检验统计量的渐近性质.
(A1)对于给定的点x,序列{Xt|t=1,2,…,n}的一维概率密度函数p(x)>0,方差函数(x)>0,其中i=1,2,当k=3,4时,E(|Xt-1=z)在点x处连续.此外在包含点x的一个开集内一致连续.
(A3)核函数K为对称密度函数,在R内存在有界支撑和紧子集.此外,对于实值x1,x2,有|K(x1)-K(x2)|≤c|x1-x2|,并且|p(x1)-p(x2)|≤c|x1-x2|,其中c为与x1,x2有关的常数.
(A4)严平稳过程{Xt}是绝对正则的,即
在给出定理1的证明之前,我们先给出以下2个引理,其中由引理2可得到变点k前后方差函数非参数估计(x)和(x)的渐近分布.记(x),(x)分别为前k个和后n-k个观测下回归函数m(x)的局部线性估计,其中引理1可由文献[10]中的引理1直接得到.
引理1 在假设(A3)~(A5)同时满足的条件下,令G⊂{p(x)>0}为使得假设(A1)成立的紧子集,则当n→∞时,下式对x∈G一致成立:
式中,
文献[9]和文献[11]分别给出了无变点情况下回归模型方差函数的非参数估计,并对估计的渐近正态性给出了较为详尽的证明.下面在文献[11]的基础上,给出未知变点k前后方差函数估计(x)和(x)的渐近分布.
引理2 在假设(A1)~(A5)同时满足的条件下,当n→∞时,有
此引理的证明可参考文献[11]中的定理8.5,其中只需把样本容量n分成前k,后n-k两部分讨论即可.
下面给出定理1的证明.
I'j(1≤j≤8)与Ij定义方式相同,只是在第t个求和中,多了一个因子(Xt-1-x)/h.
由式(3)~(5)可知
由文献[10]中的定理1可知,当n→∞时,有
所以,本工作主要讨论{I6-I2}的渐近分布.
由假设(A2)和(A3)可知
绝对正则意味着α-混合,且α(j)≤β(j),故由假设(A4)和文献[11]中的定理2.21及上述引理2可知,{I6-I2}渐近正态.
因为,
为方便起见,令k=nθ(0<θ<1),则上式可转化为
对任意的t≥2(j>t),有
由假设(A4)的绝对正则条件和文献[12]中的引理1,可得
绝对值的上界为
对任意的t,j≥1,令
由于
当n→∞时,上式右端第一项和第三项都为0,而式(8)的值也为0,故
从而有E(I2I6)=0.由引理2可得,I2,I6的渐近方差分别为
故定理1得证.
在讨论了变点检验统计量的渐近分布之后,我们给出变点存在的检验方法.由定理1可知,在原假设H0∶(x)=(x)(即模型不存在变点)成立的条件下,有
检验统计量Tk满足下式:
针对模型Xt=σ(Xt-1)ϵt,{ϵt|Xt-1,t=1,2,…,n}i.~i.dN(0,1),方差函数σ2(x)在观测区间内有一个变点k0(0.1n<k0<0.9n),其模型为
在如式(11)所示的方差函数形式下,变点k0前后样本序列的变化不明显,用目测方法几乎察觉不到变点的存在,但是通过本工作给出的方法却可以估计出变点的位置,并检验其是显著的.
下面采用本工作给出的变点估计表达式及检验方法,对不同样本容量n=100,200,400下不同位置的变点k0=0.3n,0.5n,0.7n,0.8n进行估计,并给出检验统计量‖Tk‖/Ck的p值,估计结果如表1所示,其中括号内的数值为p值.
表1 给定样本容量下的变点估计及检验统计量‖Tk‖/Ck的p值Table 1 Estimation of change point and p-value of test statistic‖Tk‖/Ckwith the given sample sizes
表1只是给定样本容量n=100,200,400下的一次模拟结果.通过多次随机模拟发现,对于较小样本容量(n≤200)下的变点估计,本工作提出的方法不是很理想,但对于较大的样本容量(n≥400),估计及检验结果较为理想.对不同样本容量n=200,500,1 000下,变点位置分别为k0=100,300,500的点,随机模拟10次,最终得到估计值以及检验统计量‖Tk‖/Ck的p值,结果如表2所示.
表2 给定变点下随机模拟10次的变点估计值以及检验统计量‖Tk‖/Ck的p值Table 2 Estimation of change point for ten-time simulations and p-value of test statistic‖Tk‖/Ckwith the given change points
从表2可以看出,当样本容量n≤200时,估计结果较不稳定,产生误差较大,这是因为本工作所提出的变点估计是基于非参数模型,对样本容量的要求较高.当n≥500时,估计值k^0的精度随n的增加而提高,特别是在样本容量n=1 000,变点k0=500的情况下,模拟效果较为理想.
[1] CARLSTEINE.Nonparametric change-point estimation[J].The Annals of Statistics,1988,16:188-197.
[2] 陈希孺.变点统计分析简介[J].数理统计与管理,1991,4(1):52-59.
[3] ANTOCHJ,HUŠKOVM,PRASKOVAZ.Effect of dependence on statistics for determination of change[J].Journal of the Statistical Planning and Inference,1996,60:291-310.
[4] HORVÁTHL,KOKOSZKAP.The effect of long-range dependence on change-point estimators[J].J Statist Plann,1997,64:57-81.
[5] SAMIRB H,JONATHANJ W,ZHANGQ.Nonparametric change-point estimation for dependent sequences[J].Mathematique Statistics,2005,341:627-630.
[6] INCLANC,TIAOC G.Use of cumulative sums of squares for retrospective detection of change of variance[J].Journal of the American Statistical Association,1994,89:913-923.
[7] 赵文芝,田铮,夏志明.线性过程方差变点的估计[J].工程数学学报,2009,26:273-277.
[8] CHENG M,CHOIY K,ZHOUY.Nonparametric estimation of structural change points in volatility models for time series[J].Journal of Econometrics,2005,126:79-114.
[9] HÄRDLEW,TSYBAKOVA.Local polynomial estimators of the volatility function in nonparametric autoregression[J].Journal of Econometrics,1997,81:223-242.
[10] FANJ Q,YAOQ W.Efficient estimation of conditional variance functions in stochastic regression [J].Biometrika,1998,85:645-660.
[11] 范建清,姚奇伟.非线性时间序列[M].北京:高等教育出版社,2005:375-399.
[12] YOSHIHARAK.Limiting behavior of U-statistics for stationary, absolutely regular process [J]. Z Wahrscheinlichkeitstheorie Verw Gebiete,1976,35:237-252.
[13] 沃塞曼.统计学完全教程[M].张波,译.北京:科学出版社,2008:241-243.