左卫兵, 时文芳
(华北水利水电大学 数学与信息科学学院 河南 郑州 450046)
生长曲线模型中参数估计误差的上界
左卫兵, 时文芳
(华北水利水电大学 数学与信息科学学院 河南 郑州 450046)
生长曲线模型; 估计误差; RE条件; 兼容性条件; UDP条件; 协调参数
参数估计是线性模型中重要的统计问题,统计学家们提出了惩罚最小二乘方法.例如文献[1]提出了hard thresholding惩罚函数;文献[2]在线性模型下提出了将lasso作为一种较好的惩罚最小二乘方法,lasso能够同时实现变量选择和参数统计.基于这样的优点,统计学家们致力于lasso神谕不等式的研究,相继提出不同的条件,并且设计矩阵满足相应条件时得到相对应的神谕不等式.文献[3]提出了RE条件(restricted eigenvalue condition);文献[4]提出了兼容性条件(compatibility condition);文献[5]指出上述两个条件是众多条件中应用很普遍且较弱的条件,且兼容性条件是最弱的条件;文献[6]提出了UDP条件,并且设计当矩阵是列满秩矩阵时,UDP条件比上述两个条件更弱.
生长曲线模型作为一种广义的线性模型,在近半个世纪得到广泛研究[7-9],但是关于生长曲线模型中惩罚最小二乘方法研究却很少.高采文等[10]将惩罚最小二乘方法运用到生长曲线模型上,得到了相应的惩罚最小二乘估计.本文利用Potthoff-Roy变换将生长曲线模型转化为线性模型,利用文献[10]得到的lasso估计,在设计阵分别满足RE条件、兼容性条件和UDP条件时,依次得到了生长曲线模型中估计误差的上界.
本文研究的模型为
(1)
其中:Yn×p是一个可观测矩阵;X1n×m和X2q×p是已知设计矩阵,且r(X1)=m,r(X2)=q;Bm×q是一个未知参数矩阵;En×p是一个随机误差矩阵;E的行向量互不相关,且行向量均值为0;协方差阵为∑.
对于模型(1),由于r(X2)=q,因此存在p×q的矩阵H使得X2H=Iq×q.令Z=YH,则模型变换为
(2)
下面记B=(B1,B2,…,Bq),Bi=(B1,i,B2,i,…,Bm,i)T,i=1,2,…,q,Z=(Z1,Z2,…,Zq),H=(H1,H2,…,Hq).则模型(2)可以简化为一系列线性模型:
Zj=X1Bj+EHj,j=1,2,…,q.
(3)
文献[9-11]给出了生长曲线模型的惩罚最小二乘估计,
(4)
(5)
(6)
在线性模型中研究神谕不等式时,设计矩阵需要满足某些条件,应用很普遍且较弱的条件有:
1) RE条件[4],即设计矩阵满足
(7)
2) 兼容性条件[5],即设计矩阵满足
(8)
3) UDP(S0,κ0,Δ)条件[7],即设计矩阵满足
(9)
证明 根据生长曲线模型中lasso定义,可得
根据设计矩阵X1满足RE条件时有
同时根据设计矩阵X1满足RE条件,也可得到
定理2 设计矩阵满足兼容性条件时,有
证明 在上面的推导过程中,得到
这里根据设计矩阵X1满足可兼容条件,可以得到
所以
定理3 当设计矩阵满足UDP条件时有
证明 在上面的推导过程中得到
同时除以2λ,并化简可得,
[1] Antoniadis A. Wavelets in statistics: A review [J]. Journal of the Italian Statistical Society, 1997, 6(2):97-130.
[2] Tibshirani R. Regression shrinkage and selection via the lasso [J]. Journal of the Royal Statistical Society, 1994, 58(1):267-288.
[3] Bickel P, Ritov Y, Tsybakov A. Simultaneous analysis of lasso and Dantzig selector [J]. Annals of Statistics, 2009, 37 (4): 1705-1732.
[4] Van de Geer Sara A. High-dimensional generalized linear models and the lasso [J]. Annals of Statistics, 2008, 36(2):614-645.
[5] Van de Geer S, Bühlmann P. On the conditions used to prove oracle results for the lasso [J]. Electronic Journal of Statistics, 2009, 3(2009):1360-1392.
[6] Castro Y D. A remark on the lasso and the Dantzig selector [J]. Statistics & Probability Letters, 2013, 83(1):304-314.
[7] Rotthoff R F, Roy S N. A generalized multivariate analysis of variance model useful especially for growth curve problems [J]. Biometrika, 1964, 51(3): 313-326.
[8] 刘爱义.生长曲线模型的协变量选择与参数估计[J].数学学报,1994,37(3):362-372.
[9] 陈学华,尤进红,孙孝前.一般生长曲线模型中共同均值参数的线性估计的泛容许性[J].信阳师范学院学报:自然科学版,1998,11(3):224-229.
[10]高采文,朱晓琳,曾林蕊.生长曲线模型的惩罚最小二乘估计[J].经济数学,2014,31(2):102-105.
[11]朱晓琳.生长曲线模型的惩罚最小二乘估计和变量选择[D].上海:华东师范大学,2013.
(责任编辑:方惠敏)
Upper Bound on the Estimation Error in a Growth Curve Model
ZUO Weibing, SHI Wenfang
(CollegeofMathematicsandInformationScience,NorthChinaUniversityofWaterResourcesandElectricPower,Zhengzhou450046,China)
growthcurvemodel;estimationerror;REcondition;compatibilitycondition;UDPcondition;tuningparameter
2015-07-08
河南省基础与前沿技术研究项目,编号142300410401.
左卫兵(1976—),男,河南内黄人,副教授,主要从事数理统计研究,E-mail:zuoweibing@ncwu.edu.cn;通讯作者:时文芳(1989—),女,河南新郑人,硕士研究生,主要从事数理统计研究,E-mail:hnxzswf@163.com.
左卫兵,时文芳.生长曲线模型中参数估计误差的上界[J].郑州大学学报:理学版,2015,47(4):33-37.
O212.1
A
1671-6841(2015)04-0033-05
10.3969/j.issn.1671-6841.2015.04.006