生长曲线模型中参数估计误差的上界

2015-01-21 18:25左卫兵时文芳
郑州大学学报(理学版) 2015年4期
关键词:参数估计惩罚线性

左卫兵, 时文芳

(华北水利水电大学 数学与信息科学学院 河南 郑州 450046)

生长曲线模型中参数估计误差的上界

左卫兵, 时文芳

(华北水利水电大学 数学与信息科学学院 河南 郑州 450046)

生长曲线模型; 估计误差; RE条件; 兼容性条件; UDP条件; 协调参数

0 引言

参数估计是线性模型中重要的统计问题,统计学家们提出了惩罚最小二乘方法.例如文献[1]提出了hard thresholding惩罚函数;文献[2]在线性模型下提出了将lasso作为一种较好的惩罚最小二乘方法,lasso能够同时实现变量选择和参数统计.基于这样的优点,统计学家们致力于lasso神谕不等式的研究,相继提出不同的条件,并且设计矩阵满足相应条件时得到相对应的神谕不等式.文献[3]提出了RE条件(restricted eigenvalue condition);文献[4]提出了兼容性条件(compatibility condition);文献[5]指出上述两个条件是众多条件中应用很普遍且较弱的条件,且兼容性条件是最弱的条件;文献[6]提出了UDP条件,并且设计当矩阵是列满秩矩阵时,UDP条件比上述两个条件更弱.

生长曲线模型作为一种广义的线性模型,在近半个世纪得到广泛研究[7-9],但是关于生长曲线模型中惩罚最小二乘方法研究却很少.高采文等[10]将惩罚最小二乘方法运用到生长曲线模型上,得到了相应的惩罚最小二乘估计.本文利用Potthoff-Roy变换将生长曲线模型转化为线性模型,利用文献[10]得到的lasso估计,在设计阵分别满足RE条件、兼容性条件和UDP条件时,依次得到了生长曲线模型中估计误差的上界.

1 准备工作

本文研究的模型为

(1)

其中:Yn×p是一个可观测矩阵;X1n×m和X2q×p是已知设计矩阵,且r(X1)=m,r(X2)=q;Bm×q是一个未知参数矩阵;En×p是一个随机误差矩阵;E的行向量互不相关,且行向量均值为0;协方差阵为∑.

对于模型(1),由于r(X2)=q,因此存在p×q的矩阵H使得X2H=Iq×q.令Z=YH,则模型变换为

(2)

下面记B=(B1,B2,…,Bq),Bi=(B1,i,B2,i,…,Bm,i)T,i=1,2,…,q,Z=(Z1,Z2,…,Zq),H=(H1,H2,…,Hq).则模型(2)可以简化为一系列线性模型:

Zj=X1Bj+EHj,j=1,2,…,q.

(3)

文献[9-11]给出了生长曲线模型的惩罚最小二乘估计,

(4)

(5)

(6)

在线性模型中研究神谕不等式时,设计矩阵需要满足某些条件,应用很普遍且较弱的条件有:

1) RE条件[4],即设计矩阵满足

(7)

2) 兼容性条件[5],即设计矩阵满足

(8)

3) UDP(S0,κ0,Δ)条件[7],即设计矩阵满足

(9)

3 主要定理

证明 根据生长曲线模型中lasso定义,可得

根据设计矩阵X1满足RE条件时有

同时根据设计矩阵X1满足RE条件,也可得到

定理2 设计矩阵满足兼容性条件时,有

证明 在上面的推导过程中,得到

这里根据设计矩阵X1满足可兼容条件,可以得到

所以

定理3 当设计矩阵满足UDP条件时有

证明 在上面的推导过程中得到

同时除以2λ,并化简可得,

4 结论

[1] Antoniadis A. Wavelets in statistics: A review [J]. Journal of the Italian Statistical Society, 1997, 6(2):97-130.

[2] Tibshirani R. Regression shrinkage and selection via the lasso [J]. Journal of the Royal Statistical Society, 1994, 58(1):267-288.

[3] Bickel P, Ritov Y, Tsybakov A. Simultaneous analysis of lasso and Dantzig selector [J]. Annals of Statistics, 2009, 37 (4): 1705-1732.

[4] Van de Geer Sara A. High-dimensional generalized linear models and the lasso [J]. Annals of Statistics, 2008, 36(2):614-645.

[5] Van de Geer S, Bühlmann P. On the conditions used to prove oracle results for the lasso [J]. Electronic Journal of Statistics, 2009, 3(2009):1360-1392.

[6] Castro Y D. A remark on the lasso and the Dantzig selector [J]. Statistics & Probability Letters, 2013, 83(1):304-314.

[7] Rotthoff R F, Roy S N. A generalized multivariate analysis of variance model useful especially for growth curve problems [J]. Biometrika, 1964, 51(3): 313-326.

[8] 刘爱义.生长曲线模型的协变量选择与参数估计[J].数学学报,1994,37(3):362-372.

[9] 陈学华,尤进红,孙孝前.一般生长曲线模型中共同均值参数的线性估计的泛容许性[J].信阳师范学院学报:自然科学版,1998,11(3):224-229.

[10]高采文,朱晓琳,曾林蕊.生长曲线模型的惩罚最小二乘估计[J].经济数学,2014,31(2):102-105.

[11]朱晓琳.生长曲线模型的惩罚最小二乘估计和变量选择[D].上海:华东师范大学,2013.

(责任编辑:方惠敏)

Upper Bound on the Estimation Error in a Growth Curve Model

ZUO Weibing, SHI Wenfang

(CollegeofMathematicsandInformationScience,NorthChinaUniversityofWaterResourcesandElectricPower,Zhengzhou450046,China)

growthcurvemodel;estimationerror;REcondition;compatibilitycondition;UDPcondition;tuningparameter

2015-07-08

河南省基础与前沿技术研究项目,编号142300410401.

左卫兵(1976—),男,河南内黄人,副教授,主要从事数理统计研究,E-mail:zuoweibing@ncwu.edu.cn;通讯作者:时文芳(1989—),女,河南新郑人,硕士研究生,主要从事数理统计研究,E-mail:hnxzswf@163.com.

左卫兵,时文芳.生长曲线模型中参数估计误差的上界[J].郑州大学学报:理学版,2015,47(4):33-37.

O212.1

A

1671-6841(2015)04-0033-05

10.3969/j.issn.1671-6841.2015.04.006

猜你喜欢
参数估计惩罚线性
基于新型DFrFT的LFM信号参数估计算法
线性回归方程的求解与应用
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
神的惩罚
基于自适应参数估计的三轴磁传感器实时校正方法
Jokes笑话
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法
ℝN上带Hardy项的拟线性椭圆方程两个解的存在性
浅谈死亡力函数的非参数估计方法