周衍琪 刘静颐 王越
一、前言
回归模型是统计学中发展较早、理论丰富深厚且应用性强的统计模型。由于实际解决问题的需要,回归模型一直是处于不断的发展、进步之中,由参数回归模型到非参数回归模型,上个世纪后期又兴起了半参数回归模型。
参数回归模型有形式Yi=f(Xi;β)+εi,i=1,2,...,n,f为已知函数,β为未知的有限维参数,εi为均值为0的随机误差。该模型最重要的是f是已知函数,但实际应用中,不能给出一个已知的函数,所以参数模型在实际中有模型设定的误差。为了减少模型偏差,、提出非参数回归模型:设响应变量Y是随机变量,协变量X是随机变量或非随机变量。给定随机样本xi,yi,1≤i≤n,可建立回归模型:yi=m(xi)+εi,i=1,2,…n,其中m(.)是未知的回归函数,εi为随机误差。但当协变量X的维数增加时,多元非参数回归估计的精度下降很快,为了克服这种问题,提出了降维模型--半参数回归模型。
接下来本文主要讨论的是半参数模型中一类很重要的模型--部分线性模型,通过查阅大量文献资料,研究了各个学者在部分线性模型中所做的工作,接下来本文就以文献综述的形式一一阐述,首先介绍该模型是怎么提出的,然后将从统计推断和大样本性质这两个部分阐述各统计学家都做了哪些工作。
二、模型的提出
Engle等(1986)在研究电力与气候环境之间的关系时给出了部分线性模型,模型为:
Yi=βT0Xi+g(Ui)+εi,i=1,2,…,n,
其中β0是p维参数向量,g(.)是未知函数。模型由两部分构成:第一部分βT0Xi表示Yi与Xi是线性关系;第二部分g(Ui)表明Yi与Ui是未知的非线性关系。如果使用非参数回归来处理,将会失去Yi与Xi线性关系的信息,从而导致估计值存在较大的偏差,如果用参数回归来拟合,一般不能有好的估计。
三、部分线性模型的统计推断及大样本性质的文献综述
(1)国外研究状况。Robinson(1988)在非参数分量g(.)取N-W核估计时,构建参数部分β0的加权最小二乘估计和非参数g(.)的估计g∧(.),在一些必要的条件下,分析了的渐近正态性和g∧(.)的收敛速度。同年Speckman(1988)采用参数化形式Wγ逼近非参数分量g(.),然后用最小二乘法构造β0的估计,同样研究了该估计量的渐近性质。还有一些作者使用光滑样条方法构造了β0和g(.)的估计量。Heckman(1986)在Xi和Ui独立的情况下研究了β0的惩罚最小二乘估计的相合性和渐近正态性。 Cuzick(1992)利用渐近估计方程来估计参数,且证明估计量的n相合性。Hamilton和Truong(1997)采用局部线性回归给出了各未知量估计,证明渐近正态性。Mammen和van de Geer(1997)应用经验过程理论给出了参数的惩罚拟似然,并推导渐近性质。Xue等(2004)提出了sieve极大似然估计,证明了参数估计的强相合性和渐近正态性,得到了非参数估计最优收敛速度。Ma等(2006)研究了异方差的部分线性回归模型,构造了未知量相合估计,证明了参数的估计是半参数有效的且具有渐近正态性。Dabo-Niang和Guillas(2010)研究了具有自回归误差的部分线性模型,构造了未知量估计量,并证明估计量的相合性和渐近正态性。
Severini和Staniswalis(1994)与H?rdle等(1998)研究了模型的推广形式:广义部分线性模型。估计β0和g(.),Severini和Staniswalis(1994)引进了拟似然估计方法,该方法有类似于似然函数的性质,但仅需指定Y的二阶矩而不是完全分布。Boente等(2006)对广义部分线性模型构造了稳健估计量,并证明了参数估计的n相合性和渐近正态性。
(2)国内研究状况。洪圣岩(1991)用最近邻和最小二乘方法定义了估计量,证明了参数估计的渐近正态性,非参数估计的最优收敛速度。Shi(1992)用分段多项式逼近得到了β0 和g(.)的稳健M估计和g∧(.),证明了渐近正态性,得到了和g∧(.)的弱收敛速度。洪圣岩和赵忠柏(1993)用核和最小二乘定义了估计量,证明了参数分量的渐近正态性,并得到了非参数的最优收敛速度。柴根象和徐克军(1999)与钱伟民和柴根象(1999)将小波方法引入,建立了回归未知量小波估计,证明了好的大样本性质,并讨论了误差方差的小波估计及其渐近性质。
以上为国内外的专家学者在随机点列(设计点列Xi,Ui,1≤i≤n是随机的)下对部分线性模型主要的研究成果,其他的很多研究工作大家可以参考相关文献。
四、总结
本文按时间顺序罗列了对部分线性模型在设计点列为随机的时候的相关文献,给出了各文献研究的主要内容,主要是对模型的参数部分和非参数部分运用各种方法进行估计,并验证了这些估计的一些大样本性质。(作者单位:云南大学)
参考文献:
[1] Robinson P M. 1998. Root-n-consistent semiparametric regression. Econometrika,56:931~954
[2] Speckman P.1988. Kernel smoothing in partial linear models. Journal of the Royal Statistical Society, Series B, 50:413~436
[3] Heckman N.1986. Spline smoothing in a partly linear model. Journal of the Royal Statistical Society,Series B, 48:244~248
[4] Cuzick J.1992. Semiparametric additive regression. Journal of the Royal Statistical Society,Series B,54(3):831~843
[5] Hamilton S A,Truong Y K.1997. Local linear estimation in party linear models. Journal of Multivariate Analysis,60:1~19
[6] Mammen E,van de Geer S. 1997. Penalized quasi-likelihood estimation in partial linear models. The Annals of Statisticals,25:1014~1035
[7] Xue H Q, Lam K F, Li G Y.2004. Sieve maximum likelihood estimator for semiparametric regression models with current status data. Journal of the American Statistical Association,99(466):346~356
[8] Ma Y Y,Chiou J M,Wang N.2006. Efficient semiparametric estimator for heteroscedastic partially linear models. Biometrika,93(1):75~84
[9] Dabo-Niang S, Guillas S.2010. Functional semiparametric partially linear model with autoregressive errors. Journal of Multivariate Analysis,101(2):307~315
[10] Severini T A,Staniswalis J G. 1994. Quasilikelihood estimation in semiparametric models. Journal of the American Statistical Association,89:501~511
[11] Boente G, He X M,Zhou J H.2006. Robust estimates in generalized partially linear models. The Annals of Statisticals,34(6):2856~2878
[12] Shi P D.1992. Mstimation for partly Linear Models. Ph D Thesis, Institute of Systems Science, Chinese Academy of Sciences,Beijing,P R China
[13] 洪圣岩.1991.一类半参数回归模型的估计理论.中国科学,A辑,21(21):1258~1271
[14] 洪圣岩,赵忠柏.1993.偏线性模型的核~-最小二乘估计法的渐近性质.数学年刊,14A(6):717~731
[15] 柴根象,徐克军.1999.半参数回归的线性小波光滑.应用概率统计,15(1):97~105
[16] 钱伟民,柴根象.1999.半参数回归模型小波估计的强逼近.中国科学,29(3):233~240