基于自正则的K-S方法的均值变点检验
——对我国上证综指的实证分析

2013-01-17 02:18罗丽莎潘婉彬缪柏其
中国科学技术大学学报 2013年12期
关键词:变点正则均值

罗丽莎,潘婉彬,缪柏其

(中国科学技术大学管理学院统计与金融系,安徽合肥 230026)

0 引言

在过去的二十多年间,中国资本市场从无到有,从小到大,得到了迅速的发展,在很多方面走过了一些成熟市场几十年甚至是上百年的道路.资本市场促进了中国经济和企业的发展,很好地发挥了市场融资和资源配置的功能.同时,中国资本市场是伴随着经济体制改革逐步发展起来的“新兴加转轨”市场.由于建立初期的整体环境和市场本身制度设计上的局限,中国资本市场积累了一些深层次问题,阻碍了市场的进一步发展.为了深化改革,监管当局推出了一系列旨在完善市场基本制度和恢复市场功能的改革措施.这些措施推动中国资本市场发生了深刻的变化.未来中国资本市场的发展将面临新的机遇和挑战.在这样的背景下,研究中国资本市场的历史,更好地把握资本市场的发展规律,将有利于制定相应的发展战略和措施,推动中国资本市场的进一步发展.

金融时间序列是经济与金融领域中最重要的数据类型,对这类数据进行分析、预测和控制是整个经济和金融活动的重要工作.比较常见的金融时间序列包括债券、汇率、股票价格和金融期货价格等等.在时间序列的建模中,结构稳定是非常重要的前提条件.然而,经济和金融数据中普遍存在着具有非平稳性的序列,如测度金融市场波动的股指价格序列会在某个时刻发生突然变化等.所以在实证分析中,我们需要通过检验金融时间序列是否存在变点来评价其结构稳定性.

变点是指模型或时间序列在某一未知时刻突然出现了变化,该时刻即所谓的变点.常见的变点有均值变点、概率变点及模型变点.从统计学的角度研究均值变点,目的在于根据数据判断和检验变点是否存在,如果存在,检测其位置、个数及其跃度,从而能大体把握模型或者序列的结构,对研究具有分段结构特征的时序有很重大的意义.因此统计变点的检测在金融数据处理中有广泛的应用前景.

对独立同分布的随机变量序列的变点问题,很多学者,如Brodsky等[1],提出了解决方法,但是用到时间序列的变点检测上就未必合适了.由于时间序列数据之间存在相依性,我们需要对原始统计量进行一些必要的修正和改进.

在检验时间序列的均值变点时,常用的有Kolmogorov-Smirnov(K-S)检验,“滑窗”检验等方法.传统的K-S检验统计量要求找到长程方差(long-run variance)的相合估计量,即谱密度函数在0处的取值,这样才能确保极限分布在原假设下不会受到“冗余”参数的影响.而“滑窗法”中的长程方差估计量则要求选择一个合适的带宽参数.对有限样本而言,估计的功效往往对窗宽参数的敏感性比较强,而在实践中,选取合适的窗宽参数本来就比较难.有很多文献指出,窗宽的选择不当会导致非单调功效问题(即当备择假设离原假设越来越远时,功效函数有可能会出现递减).而对一个好的检验来说,当备择假设越偏离原假设,功效函数应该呈单调递增的趋势.这也使得“滑窗”检验变得不那么容易把握.

对于检验统计量而言,功效函数的非单调问题确实是一个很棘手的问题.理论和实证研究都表明,选择数据依赖型的窗宽参数就会导致非单调功效,这个参数是在原假设下设定的,而在备择假设下,它是严格有偏的.因此很多的学者都想研究出它的解决方法,Altissimo等[2],Juhl等[3]提出了解决方法,但是并不见效.他们在避免了选择一个窗宽参数的同时,又牵涉了另外一个窗宽参数的选择.正如Perron等[4]所说:在存在结构变点的背景下,没有任何可靠的方法来选择这个适当的参数.所以,功效函数的非单调性问题仍未能完美解决.

Lobato[5]和Shao[6]中提到的自正则化(self-normalization,SN)因子是一种非常新颖的思想.他们在平稳时序的批量参数的置信区间估计问题中,引入了自正则因子,从而避免了直接估计渐近方差所引入的窗宽参数.现有的很多方法都依赖于光滑参数的选取,而他们的方法对参数有着良好的稳健性.这一优点无疑增大了自正则因子在检验中的应用空间.

1 理论框架介绍

假设想要检测一个单变量时间序列{X1,…,Xn}的均值变点,原假设和备择假设分别可以写成:

其中,1

首先,基于累积和过程,定义如下统计量:

定理1.1在关于Xt的适当矩条件及弱相依条件下,

(1)

具体证明过程见文献[8].

由上述定理得知,当原假设成立时,Tn(└nr┘)弱收敛于σ{B(r)-rB(1)}.这里,Kolmogorov-Smirnov统计量的定义为

(2)

由定理1.1推广,很容易得到此结论.

文献[9]提出了更适用的SN方法.

而U1的极限分布见文献[9].

定义正则化过程:

定义检验统计量:

由定理1.1我们可以推导出Gn的极限分布

其中,

值得注意的是,新构造的自正则因子与k有关,而在原来的Dn对所有的k而言都是一样的.

可以看到,Vn(k*)的数量级与

Δn∶=E(Xk*+1)-E(Xk*)

或者

来检测变点.

2 实证及结果分析

中国资本市场与一般成熟市场自我演进的发展模式不同,它是伴随着经济体制改革逐步发展起来的“新兴加转轨”市场,呈现出比一般成熟市场更特殊、更多元的复杂性.中国的金融市场受到各种重大改革事件和各种外来冲击的影响,而这些重大事件对整个金融市场以及投资者行为的影响是非常重要的,比如2007年的大牛市和2008年的金融危机.2007年中国股市大牛市于2005年缓缓启动,然后开始快速飙升,并于2007年达到顶点(2007年10月的6 124点),期间大盘在两年多的时间里上涨了足足6倍.2008年的金融危机则浮现于2007年下半年,自美国次级房屋信贷危机爆发后,投资者开始对按揭证券的价值失去信心,引发流动性危机,导致金融危机的爆发.到2008年,这场金融危机进一步加剧,并导致多家相当大型的金融机构倒闭或被政府接管.随着金融危机的进一步发展,又演化成全球性的实体经济危机.中国股市作为国际金融市场的重要参与者,其受到的影响不容忽视.

那么是否能根据基于自正则的K-S检验方法从统计学的角度找到这些大事件的一些迹象呢?为了对照,我们也采用了传统的K-S方法来检验.

我们采用上证综指2001-01~2012-01的月底收盘价数据来进行实证分析.由于收盘价格数据是一维的,基于SN的K-S检验统计量和变点位置的估计量分别可以简化为

传统的K-S检验对应的变点位置的估计量(核函数和ln的选取参见文献[3])则为

首先,我们寻找时间序列的3个均值变点(先找第一个,然后左右两边各找一个).表1给出了传统的和基于SN的K-S检验两种方法的变点位置和检验统计量的取值.

表1 两种方法得到的变点位置及统计量值Tab.1 Change point positions and statistics of two approaches

图1 上证综指月度收盘价分别与基于SN的和传统的K-S检验统计量Gn1曲线图Fig.1 Monthly closing price of Shanghai composite stock index and Gn1 statistics of SN based K-S test and K-S test

至于两种方法的优劣,我们也可以结合图1来辨别.从图1可以看到,基于SN的K-S检验在2006-03-30处找到了第一个变点;而传统的K-S检验的变点位置是2006-11-30.2006-03~2006-04恰好是2007年大牛市初显苗头的阶段,在短短一个月的时间里,上证综指由1 300点以下上升至1 400点以上.而2006-11大盘已经在迅猛上升阶段了.这说明基于自正则的K-S检验方法对上证指数均值变点的检验更有效.

接下来我们以2006-03-30(2006-11-30)为分界点,将整个数据一分为二,然后再用这两种方法分别来找数据的另外两个均值变点.得到的结果如图2所示.

图2(a)中左边的均值变点出现在2002-10-31,右边的均值变点出现在2008-07-31;而图2(b)中左边的均值变动出现在2001-09-28,右边的均值变动出现在2008-05-31.接下来我们分别对变点发生位置对应的时代背景进行分析.

图2 上证综指月度收盘价分别与基于SN的和传统的K-S检验统计量Gn2曲线图Fig.2 Monthly closing price of Shanghai composite stock index and Gn2 statistics of SN based K-S test and K-S test

本文研究的数据样本从2001年1月开始.2001年中国股市经历由牛到熊的转变,在国有股减持的背景下,市场一再下挫.2002年1月跌破1 339点.为了稳定市场,监管当局在2002年下半年出台了停止在国内证券市场减持国有股、上市公司增发“门槛”提高、QFII制度等一系列措施.

为应对2008年金融危机导致的经济萎缩,失业增加等负面影响,我国分别出台了相应的货币政策和财政政策.我国从2008年7月份起进行了货币政策的调整,包括2008年9~11月连续4次下调基准利率,3次下调存款准备金率等,目的是为了增加资金的流动性;财政政策方面则主要是减少税收,扩大政府支出(4万亿元投资);减少企业负担,加强公共财政的社会保障/医疗等方面的支出等,保持社会经济发展环境的稳定.

可以看到,结合经济背景,基于自正则的K-S检验得到的变点位置与政策实施时点更加相吻合的.基于自正则的K-S检验,对上证综指的均值变点的检验效果要好于传统的K-S检验,这种结论可能是由传统的K-S检验需要对长程方差进行估计导致的.

3 结论

本文将基于自正则的K-S方法应用于检测我国上证综指收盘价时间序列的均值变点.与传统的K-S检验以及“滑窗”检验不同的是,基于自正则的K-S检验方法不要求对长程方差的估计是相合的,也避免了窗宽参数的选取,检验统计量的渐近分布不受冗余参数的影响,而且其功效也是单调的.通过对我国上证综指收盘价的均值检测,我们发现该方法对上证综指均值变点的检测效果要好于传统的K-S检验.

自正则的K-S方法虽然相对于传统的K-S检

验它存在一定的功效损失,但是作为补偿,基于自正则的K-S检验对样本容量的限制也更宽松.它可以用于小样本容量数据的变点检验,这是前者所不能及的.基于自正则的K-S检验方法对时间序列变点的检测提供了新的前景.因此,下一步的工作可将基于自正则的K-S方法应用于检验频率较低的金融时间序列数据如上市公司季度财务指标的变点等.

References)

[1] Brodsky B E,Darkhovskay B S.Nonparametric Methods in Change-Point Problems[M].Dordrecht,Netherlands:Kluwer,1993.

[2] Altissimo F,Corradi V.Strong rules for detecting the number of breaks in a time series[J].Journal of Econometrics,2003,117:207-244.

[3] Juhl T,Xiao Z.Testing for changing mean monotonic power[J].Journal of Econometrics,2009,148:14-24.

[4] Perron P.Dealing with structural breaks[C]// Palgrave Handbook of Econometric,Vol.1:Econometric Theory.Basingstoke,Hampshire:Palgrave Macmillan,2006:278-352.

[5] Crainiceanu C M,Vogelsang T J.Spectral density bandwidth choice:Source of nonmonotonic power for tests of a mean shift in a time series[J].Journal of Statistical Computation and Simulation,2007,77:457-476.

[6] Shao X.A self-normalized approach to confidence interval construction in time series[J].Journal of the Royal Statistical Society,Ser B,2010,72:343-336.

[7] Shao X,Zhang X.Testing for change points in time series[J].Journal of the American Statistical Association,2010,105(491):1 228-1 240.

[8] Phillips P C B.Time series regression with unit roots[J].Econometrica,1987,55:277-301.

[9] Lobato I N.Testing that a dependent process is uncorrelated[J].Journal of the American Statistical Association,2001,96:1 066-1 076.

猜你喜欢
变点正则均值
回归模型参数的变点检测方法研究
正态分布序列均值变点检测的贝叶斯方法
基于二元分割的多变点估计
独立二项分布序列变点的识别方法
剩余有限Minimax可解群的4阶正则自同构
类似于VNL环的环
均值不等式失效时的解决方法
均值与方差在生活中的应用
关于均值有界变差函数的重要不等式
有限秩的可解群的正则自同构