郭丽莎,金凌辉
(1 中南民族大学 数学与统计学学院,武汉 430074;2 武汉科技大学 城市学院,武汉 430083;3 武汉大学 数学与统计学院,武汉 430072)
带离散辅助协变量的AFT模型的B-J估计
郭丽莎1,金凌辉2,3,*
(1 中南民族大学 数学与统计学学院,武汉 430074;2 武汉科技大学 城市学院,武汉 430083;3 武汉大学 数学与统计学院,武汉 430072)
为处理协变量随机缺失的AFT模型的参数估计问题,首先利用离散辅助协变量对缺失的协变量进行了插补,再结合Buckley-James方法提出了带辅助信息的AFT模型的一种参数估计方法.此方法作为B-J估计在不完全协变量情形下的一个推广,无须指定模型误差项的分布,在应用上有一定的便利性.数据模拟表明:此方法具有较好的估计效果.
AFT模型;辅助协变量;B-J估计;生存分析
在临床医学研究中,由于财力所限或技术原因,有些目标协变量信息很难搜集或存在测量误差.然而,通常我们可以比较容易获得与目标协变量有着较高关联度的辅助协变量,从而利用这些辅助协变量进行统计推断,这样的问题称之为辅助协变量问题.关于这个问题已经有了很多重要的研究成果,如文献[1,2]研究了Cox模型的辅助协变量问题,文献[3,4]探讨了加法危险率模型的辅助协变量问题.相对于上述两种模型,加速失效时间模型(AFT Model)的协变量对失效时间,即响应变量的解释更为直接,因此也有着广泛应用.在这里我们尝试探讨AFT模型的辅助协变量问题.
(1)
(2)
定义估计方程:
(3)
或:
(4)
(5)
把参数的真值设置为β=(β1,β2)=(ln1.5,ln2)=(0.405,0.693),样本量n设置为200,重复计算1000次.表1为删失率取0.2,ρ分别取0.7和0.5以及σe设为0.2和0.6时的参数估计结果.其中Est为1000次参数估计的平均值,SD为估计值的平均样本标准差,SE是估计的标准差的平均值,其结果通过50次重抽样的bootstrap方法计算所得.95%CP表示置信度为95% 置信区间覆盖参数真值的覆盖率.
表1 n=200,删失率为20%的模拟结果Tab.1 Simulation results for n=200 and censoring rate is 20%
表2 不同样本量下95%CP的比较结果
本文基于Buckley和James的方法,给出了带离散辅助协变量的AFT模型的B-J估计.数据模拟的结果表明:我们所提出的方法有着较好的估计效果.这种方
法相对于传统的基于似然函数的方法而言,不需要对误差项的分布进行指定,在使用上有一定的便利性.另外,为充分利用辅助信息,也可考虑使用连续的辅助协变量,但这方面的已有结果主要还是集中在COX模型上,关于AFT模型还有许多方面值得进一步研究.
[1] Zhou H, Pepe M S. Auxiliary covariate data in failure time regression analysis[J]. Biometrika, 1995, 82(1): 139-149.
[2] Liu Y, Zhou H, Cai J. Estimated pseudopartial-likelihood method for correlated failure time data with auxiliary covariates[J]. Biometrics, 2009, 65: 1184-1193.
[3] Kulich M, Lin D. Additive hazards regression with covariate measurement error[J]. Journal of the American Statistical Association, 2000,95:238-248.
[4] Shi X, Liu Y, Wu Y. Continuous auxiliary covariate in additive hazards regression for survival data[J]. Journal of Systems Science & Complexity, 2014, 26(6):1247-1262.
[5] Buckley J,James I. Linear regression with censored data[J]. Biometrika, 1979, 66(3):429-436.
[6] James I,Smith J. Consistency results for linear regression with censored data[J]. Annals of Statistics, 1984, 12(2):145-146.
[7] Lai T,Ying Z. Large sample theory of a modified Buckley-James estimator for regression analysis with censored data[J]. Annals of Statistics, 1991, 19(3):1370-1402.
[8] Jin Z, Lin D, Ying Z. On least-squares regression with censored datas [J]. Biometrika, 2006, 93(1):147-161.
B-JEstimatorofAFTModelwithDiscreteAuxiliaryCovariates
GuoLisha1,JinLinghui2,3
(1 College of Mathematics and Statistics, South-Central University for Nationalities, Wuhan 430074, China;2 City College of Wuhan University of Science and Technology, Wuhan 430083, China;3 College of Mathematics and Statistics, Wuhan University, Wuhan 430072, China)
To handle the parametric estimate problem of AFT model when covariates missing at random, we used the discrete auxiliary covariates to impute the missing covariates, then utilized the estimate method of Buckley-James to get the estimator of unknown parameter. The distribution of the error is unspecified, so our method is convenient in practical application. The results of simulation showed that our method has good effect in estimation.
AFT model;auxiliary covariates;B-J estimator;survival analysis
2017-06-10 *
金凌辉,研究方向:生物统计,E-mail:jinlinghui163@163.com
郭丽莎(1980-),女,讲师,博士,研究方向:生物统计,E-mail: lsgscuec@hotmail.com
全国统计科学研究项目(2014LY102);湖北省教育厅科研计划项目(B2017427);中央高校基本科研业务费专项资金资助项目(CZW15066);武汉科技大学城市学院重点科研项目(2016CYZDKY003)
O212.2
A
1672-4321(2017)04-0146-03