阈值协整参数的修正估计法小样本性质的比较

2012-09-26 09:11刘汉中李陈华
统计与决策 2012年12期
关键词:样本容量估计量协整

刘汉中,李陈华

0 引言

协整方法已经成为宏观经济和金融经济分析的主流,而协整参数向量的估计与检验就成为了协整方法论发展中的重中之重。虽然Engle和Granger(1987)[1]的经典论文已经证明:当样本容量趋于无穷大时,协整向量的OLS估计量具有超一致性,即OLS估计量以T-1阶收敛于真实的未知参数。同时,众所周知,在平稳序列的回归中,如果解释变量与随机干扰项不相关,即解释变量满足严格外生性(Strict Exogeneity)时,OLS估计量是一致估计量;如果解释变量不满足严格外生性,则OLS估计不是一致估计量;而在非平稳序列的协整回归中,即使解释变量与随机干扰项相关,则协整参数的OLS估计仍然满足一致性(Stock,1987[2];Phillips和Hansen,1990[3])。这说明只要样本容量足够大,不论解释变量与随机干扰项是否相关,OLS估计量是协整参数的一致估计量,这为利用OLS估计协整参数提供了坚实的理论基础。但是由于在实际经济分析中,样本容量的限制,OLS估计方法存在小样本偏差性已经得到了理论计量经济学家的高度重视。

我们通过对各种阈值协整设定下的三种估计法(FM-OLS、CCR和DOLS)小样本性质的模拟并与OLS估计进行比较,揭示各种方法在阈值协整参数估计中的优缺点。这样一方面可以避免利用传统的t、F或Wald检验对参数约束性检验的误导;另一方面又可以揭示各种修正估计方法在阈值协整参数估计中的性质。目的在于通过在小样本下各种估计方法的偏差和标准差的比较研究,找出最合适的阈值协整参数估计方法。

1 阈值协整(Threshold Cointegration)概述

Engle和Granger(1987)认为协整是指如果经济变量Xt=(X1t,X2t,…,XKt)'和Yt之间存在长期协整关系,且正则化协整向量是(1,-β'),则Xt、Yt之间的长期均衡关系可以表示为:

其中 Xt、Yt都是I(1)过程,μt是I(0)过程,且可以表示为一个平稳的自回归过程。而当Balke和Fomby(1997)把阈值协整引入宏观经济分析时,他们认为如果(1)式中的协整误差项μt的数据生成过程(DGP)是以下阈值自回归模型(Threshold Autoregression,TAR):

或者

其中,参数β是变量之间的协整系数向量,γ是阈值变量,μt-1是转换变量。这时的协整被称之为阈值协整。如果协整误差项是形如式(2)的数据生成机制,则称为两机制(Two-Regime)的阈值协整;如果是形如式(3)的误差生成机制,则称为三机制(Three-Regime)的阈值协整。根据Granger表述定理,阈值协整转化为误差修正模型,阈值ECM模型具有非线性调整机制,非线性调节对于检验经济学和金融学理论具有重要的意义(刘汉中,2007)[4]。

如果上面的式(1)表示阈值协整时,随机干扰项必须服从形如式(2)和(3)所示的TAR模型,且同时也要满足平稳性。对于TAR模型的平稳性,Chan和Petruccelli等(1985)[5]提出了式(2)满足平稳遍历的充分条件,即ρ×q<1,ρ,q<1;Bec、Salem和Carrasco(2004)[6]提出了式(3)的平稳遍历性条件,即θ×λ<1,θ,λ<1,且不论中间机制数据过程是否为单位根过程。

2 阈值协整参数的各种估计方法

2.1 完全修正的最小二乘估计(FM-OLS)

FM-OLS估计是基于协整系统的三角形表述而建立,这种协整表述的优点在于:揭示非平稳变量之间的协整关系。假设n维向量Y,都是服从一阶单位根过程,即I(1),且Yt=(Y1t,Y'2t)',其中Y1t是一维标量(Scalar),Y2t是(n-1)×1阶向量,同时也假设这些变量之间存在一个阈值协整关系,规范化的协整系数设定为(1,-γ')',因此阈值协整系统表述如下:

其中,随机干扰项μ1t是形如式(2)或(3)所示的TAR模型,说明式(4)所表示的协整系统是阈值协整,系统的随机干扰项向量的长期方差-协方差矩阵可以表示为:

在(5)式中如果矩阵Σ21不为0,说明协整方程的随机干扰项与解释变量是相关的,即Y2t不满足严格外生性,则阈值协整系数的OLS估计不再具有正态的渐近分布,这也是FM-OLS估计法提出的主要原因之一。

由于样本容量长度的限制,长期方差-协方差矩阵的滞后不可能太长,因此要估计式(5)所示的矩阵且要得到一致估计量,必须借助其他方法来进行。目前较常用的估计方法是采用根据Newey-West(1987)[7]所提出的一致估计方法,其中滞后参数q的选择是根据Newey-West(1994)[8]提出的自动选择原则,即q=4(的整数部分,该法的优点在于对不同的协方差矩阵采用不同的权数,越近的协方差占的权数也越大,目的在于提高长期方差-协方差估计的收敛速度,同时该估计量是长期方差-协方差矩阵的一致估计量。式(5)的一致估计量为:

其中:

所以,式(7)的FM-OLS估计量的最终表达式可表示为:

综上所述,对阈值协整的FM-OLS估计不仅修正了由随机干扰项的自相关而导致的偏差,而且也可以解决协整回归解释变量的内生性问题。在阈值协整中,FM-OLS估计法尤为重要,因为根据阈值协整的定义,协整方程中的随机干扰项服从TAR模型,随机干扰项本身存在自相关是不容置疑的;另外在单方程阈值协整建模中,经常性的问题是静态回归解释变量的内生性问题,利用FM-OLS估计可以修正内生性所带来的影响,此时传统的Wald统计量仍然具有标准的χ2分布(刘汉中,2010[10])。

2.2 正则协整回归(CCR)估计法

根据(4)所示的三角形表述,式(6)所表示的长期方差-协方差矩阵可以写成:

其中,μ̂t=(μ̂1t,μ̂'2t)'是协整方程的OLS残差与差分变量构成的列向量,是式(4)阈值协整参数γ的OLS估计量,在上述变换的基础上进行以下回归:

对(13)进行OLS估计就是阈值协整参数的CCR估计量。Park(1992)已经证明式(13)中参数的OLS估计量是渐近有效估计量(Asymptotically Efficient Estimators),且基于该估计量构造的Wald统计量具有渐近的χ2分布,构造的t统计量具有渐近的标准正态分布,因此CCR估计量与FM-OLS估计量一样,同样能修正OLS估计量的小样本偏差,也同样具有渐近有效性,并且CCR估计量比FM-OLS估计量计算简单,更便于操作。

2.3 动态OLS估计(DOLS)

与非参数的FM-OLS和CCR方法不同,DOLS是基于协整回归式,加入解释变量的一阶差分项的超前(Leads)与滞后(Lags)作为回归方程的解释变量,然后再针对新的回归模型进行OLS估计,以此求得阈值协整参数的估计量。用公式表示如下:

通过对上式进行OLS回归,求得参数α、γ的OLS估计量就是阈值协整参数的DOLS估计量,并且由DOLS估计量构造的t统计量和Wald统计量具有渐近的标准分布,即分别趋于标准正态分布与标准的χ2分布,这样可以利用标准分布对阈值协整回归参数进行统计推断。对于阶数K的确定:运用赤池信息准则(AIC)、许瓦兹信息准则(SC)或利用一般到特殊的建模步骤来确定最佳阶数(Ng和Perron,1995)[11],并且Saikkonen(1991)认为阶数K只要随着样本容量T的增加而增加的速度慢于T13,则(14)的DOLS估计量仍然是超一致估计量,且由此构造的t和Wald统计量仍具有标准的渐近分布。

DOLS估计的基本思想是当(6)中的随机误差项μ1t不仅具有自相关而且也与解释变量Y2t相关时,虽然OLS估计量仍然是超一致估计量,但是在小样本中OLS估计量具有偏差且基于OLS估计量构造的t和Wald统计量不再具有渐近的标准分布(渐近分布依赖于μt=(μ1t,μ'2t)'的方差-协方差矩阵),此时在协整回归式中加入解释变量一阶差分的超前和滞后项,可以保证(14)中随机误差项与解释变量(Y2t和ΔY2t)不相关,即(14)中的解释变量满足严格外生性(Strict Exogeneity),由此得到的DOLS估计量不仅是渐近有效估计量,而且相应的t和Wald统计量具有渐近的标准分布(Saikkonen,1991)。

上述三种估计方法具有同样的极限分布(Kurozumi和 Hayakawa,2009),并且Saikkonen(1991)已经证明三种估计量都是渐近有效估计量,但在有限样本中,三种估计法呈现出不同的小样本性质。目前的研究表明,在不同的数据生成机制下三种方法都有不同的优缺点(Montalvo,1995[23]、Cappuccio 和 Lubian,2001[13]、Christou 和 Pittis,2002[14]等),所以不能笼统地认为哪个方法比其他方法有更加优良的小样本性质。而在阈值协整中,迄今为止还没有对三种估计的小样本性质进行过系统研究。鉴于此,本文将运用模拟技术,揭示三种估计法在各种阈值协整中的小样本性质。

3 Monte-Carlo模拟设计与研究

3.1 MC模拟设计及部分结果

为了研究各种估计法的小样本性质,利用三角形表述设定以下的阈值协整系统,不失一般性,Y1和Y2是I(1)单位根过程,且都是一维的:

其中,μ1t服从TAR(1)模型,说明Y1和Y2之间存在阈值协整。如果是两机制的阈值协整,则μ1t可以设定为式(2);如果是三机制的阈值协整,则为式(3)。随机干扰项εt设定为:

模拟中 σ21分别取0、0.4和0.8,当 σ21=0 时说明(15)中的解释变量是严格外生的。样本容量分别为150和50,真实的协整参数设定为α=1,β=2,Newey-West(1987)一致估计量的滞后阶确定是根据Newey-West(1994)的自动选择原则,各估计量都模拟10000次,分别计算估计量的偏差和标准差。在DOLS的模拟中,利用AIC准则来确定阶数K,K的最大值是不超过12(T/100)14的最大正整数(Kurozumi和Hayakawa,2009)。

在两机制的阈值协整中,ρ1=0.4和ρ2=0.55,0.75,0.85,0.95,0.99,阈值γ=0.2,这样设定参数的目的在于:即使样本容量较小,所生成的数据过程仍包含有阈值效应。见表1。

表1 两机制阈值协整参数估计的小样本性质

在三机制的阈值协整模拟中,自回归参数设定与两机制同,只是阈值设定为0.3,这样便于各种估计方法在两种阈值协整中的小样本性质比较研究,因为自回归系数相同的三机制模型比两机制模型具有更多的持久性,即数据过程均值回复的速度要慢。见表2。

表2 三机制阈值协整参数估计的小样本性质

从模拟结果可以得出结论:①所有估计量的偏差和标准差会随着ρ2和σ21的增加而增加,同时在三机制的阈值协整中,所有估计量的偏差与标准差要比两机制的阈值协整大,这充分说明数据过程的持久性(即数据过程回复均值的速度)是影响各个估计方法的小样本性质的主要原因;另外随机误差项与解释变量之间的相关程度和样本容量T也是影响小样本性质的主要原因,即相关程度越强则偏差与标准差也越大,样本容量越大则偏差与标准差越小;②在所有情形中,FM-OLS和CCR估计都能或多或少地消除OLS的偏差,但只有在持久性和误差项与解释变量的相关性都较强时,FM-OLS和CCR估计比OLS估计更加有效,而DOLS法并没有修正OLS估计的偏差与标准差;③FM-OLS和CCR估计量的偏差与标准差,需进一步研究才能揭示它们之间的优劣。

3.2 小样本性质的进一步研究

以估计量的平均值与真实值之差来表示偏差还不能全面揭示估计量的偏差性,必须通过更深层次的研究方能全面、准确反映估计量的偏差,同时光通过估计量的标准差也不能全面揭示估计量的小样本性质。鉴于此,我们将采用一种新的方法,即设计多个以真实值为中心的区间,计算各种估计量落在区间内的概率,通过该概率就可以更加全面地反映其小样本性质。具体的设计为:首先设定一个以真实值为上界的区间,如(c-a,c),其中c是真实值,a表示固定间隔的一列参数,这样就能揭示估计量抽样分布是否是左偏的;同样可以设计以真实值为下界的相同长度的区间,能揭示估计量抽样分布是否是右偏;然后再合并区间和相应的概率,就可以揭示抽样分布的离散程度(即有效性)。

从前面的模拟结果可非常明显地得出,在其他条件不变的情况下,各估计量的偏差和标准差会分别随着ρ2和σ21值的增加而增加,且不论是两机制还是三机制的阈值协整。因此,这部分的模拟设计中,阈值协整被设定为两机制阈值协整,设定参数ρ2=0.99和σ21=0.8,样本容量设定为100,这是宏观经济分析中通常所遇到的样本长度。其他参数设定同上,模拟次数为20000次,参数a的设定为±0.1,±0.2,±0.3,±0.4,±0.5,±0.6,±0.7,±0.8,±0.9,±1,落在区间中概率通过落在区间内的样本点占全体样本的比例来估计得到。见表3。

表3 落在给定区间内的概率模拟研究

从结果来看:①四种估计法都呈现出较严重的右偏,说明四种估计法都会高估协整参数,尤其OLS和CCR估计更容易高估参数;②FM-OLS估计落在给定区间内的概率是四种方法中最高的,说明FM-OLS估计量比其他估计量更加有效,CCR估计量的有效性次之;③DOLS与OLS法的有效性比较,10种情形中各占5中,即在前5种中DOLS占优势,而在后5种中OLS估计占优势。为了进一步能看出各方法的小样本性质,用核密度估计图和累积分布图进行研究,从图可以得到结论:①四种估计量都能高估未知参数,尤其OLS和CCR估计量高估未知参数的可能性最大;②三种方法的有效性由强到弱的顺序是FM-OLS、CCR和OLS,并且四种估计方法都会高估未知的阈值协整参数;③当累积概率小于约0.7时,DOLS比OLS估计有优势;而当累积概率大于0.7时,OLS估计比DOLS估计更有优势;因此不能得出DOLS比OLS估计量更加有效的结论。为了比较各种估计法高估未知参数的概率,针对不同的a值得到以下概率趋势图:

从上图知,OLS和CCR方法高估未知参数的可能性要大于FM-OLS和DOLS法,且随着a值的增大OLS高估概率增长要快于CCR法,而FM-OLS和DOLS的概率增加速度很接近,二者增长速度没有明显的区别,说明二者高估未知参数的可能性很接近。

4 结论

阈值协整在宏观经济分析中具有越来越广泛的应用,就目前的文献来看,一般是通过OLS法来估计阈值协整参数,因为OLS估计量具有超一致性。但是在实际的经济学分析中,由于样本容量的限制,使得OLS估计量具有偏差,且也不是有效估计量,因此对阈值协整参数估计方法的修正具有十分重要的理论和现实意义。本文针对三种修正的协整参数估计方法(FM-OLS、CCR和DOLS),运用模拟技术,揭示了三种方法在参数估计中的小样本性质,研究结果表明:①数据过程的持久性、解释变量与随机误差项的相关性和样本容量是影响估计量小样本性质的主要因素,即随着持久性和解释变量与随机误差项的相关性的增强,则四估计量的偏差和标准差就越大,而随着样本容量的增加则偏差和标准差就减少;②四种估计方法都会高估未知参数,尤其OLS和CCR估计量高估的可能性最大,而FM-OLS和DOLS高估未知参数的概率很接近;③在同一数据过程下,有效性由强到弱的顺序是FM-OLS→CCR→OLS,小样本偏差由小到大的顺序也是FM-OLS→CCR→OLS,而在模拟中,不能得出DOLS比OLS估计量更加有效的结论。对于CCR方法,从右偏概率来看要明显比FM-OLS和DOLS要大,但比DOLS法更加有效。而对于DOLS估计量,虽然计算很简单,但是由于没有更加合适的确定滞后与超前阶的方法,使得DOLS估计量的偏差与标准差没有明显优势,因此在现实的经济分析中,文章的模拟结果显示DOLS估计法并不是一个好的估计法。综上所述,在阈值协整的经济学分析中,对于协整参数的估计,综合考虑右偏性和有效性。我们认为FM-OLS具有最小的右偏概率且是最有效的估计量。

[1]Engle R.F,Granger C.W.J.Cointegration and Error Correction:Repre⁃sentation,Estimation and Testing[J].Econometrica,1987,(2).

[2]Stock,J.Asymptotic Properties of Least-Squares Estimators of Cointe⁃grating Vectors[J].Econometrica,1987,(5).

[3]Phillips,Hansen.Statistical Inference in Instrumental Variables Re⁃gression with I(1)Processes[J].Reviewsof Economic Studies,1990,(1).

[4]刘汉中.Ender-Granger方法在协整检验中的应用研究[J].数量经济技术经济研究,2007,(8).

[5]Chan,K.S,Petruccelli,J.D.,H.Tong.A Multiple Threshold Model AR(1)Model[J].Journal of Applied Probability,1985,(2).

[6]Frederique Bec,Melika Ben Salem,Marine Carrasco.Tests for Unit-root Versus Threshold Specification with an Application to the Purchasing Power Parity Relationship[J].Journal of Business&Eco⁃nomic Statistics,2004,22(4).

[7]Whitney K.Newey,Kenneth D.West.A Simple,Positive Semi-defi⁃nite,Heteroskedasticity and Autocorrelation Consistent Covariance Matrix[J].Econometrica,1987,(3).

[8]Newey Whitney,Kenneth West.Automatic Lag Selection in Covari⁃ance Matrix Estimation[J].Review of Economic Studies,1994,(4).

[9]Phillips,P.C.B,Durlauf.Multiple Time Series with Integrated Variable[J].Review of Economic Studies,1986,(3).

[10]刘汉中.阈值协整参数的完全修正的最小二乘估计的小样本性质研究[J].预测,2010,(6).

[11]Ng,Perron.Unit Root Tests in ARMA Models with Data-dependent Methods for the Selection of the Truncation Lag[J].Journal of the American Statistical Society,1995,(90).

[12]Montalvo,J.G.Comparing Cointegrating Regression Estimators:Some Additional Monte-Carlo Results[J].Economics Letters,1995,(3).

[13]Cappuccio,N,D.Lubian.Estimation and Inference on Long-Run Equilibria:A Simulation Study[J].Econometric Reviews,2001,(1).

[14]Christou,C.,N.Pittis.Kernel and Bandwidth Selection,Prewhitening,and the Performance of the Fully Modified Least Squares Estimation Method[J].Econometric Theory,2002,(4).

猜你喜欢
样本容量估计量协整
含单调约束的广义回归估计量
最小二乘估计量优于工具变量估计量的一个充分条件
采用无核密度仪检测压实度的样本容量确定方法
外商直接投资对我国进出口贸易影响的协整分析
外商直接投资对我国进出口贸易影响的协整分析
河南金融发展和城乡居民收入差距的协整分析
河南金融发展和城乡居民收入差距的协整分析
分层抽样技术在课堂满意度调查中的应用研究
基于协整的统计套利在中国股票市场的实证研究
基于协整的统计套利在中国股票市场的实证研究