冯敬海, 刘 茹菲, 黄玉洁,2
(1.大连理工大学数学科学学院,辽宁大连 116024;2.鞍山师范学院数学系,辽宁鞍山 114005)
广义线性模型在形式上是常见的正态线性模型的直接推广.它可适用于连续数据和离散数据,特别是后者,如属性数据、计数数据.这在实用上,尤其是生物、医学和经济、社会数据的统计分析上,有重要的意义.广义线性模型的个别特例起源很早.Fisher在1919年曾用过它.最重要的Logistic模型,在20世纪四五十年代Berkson、Dyke和Patterson等曾使用过.1972年Nelder等[1]引进广义线性模型一词,此后研究工作逐渐增加.1982年McCullagh等[2]出版了系统论述此专题的专著并于1989年再版.关于广义线性回归似然或拟似然方程解的存在与唯一和解的大样本性质,在文献[3~6]中已有很多讨论.
在广义线性模型问题的研究中参数估计一直是大家关注的焦点问题之一.文献[7、8]用极大似然方法来估计广义线性模型的参数,文献[9]说明了用极大似然法估计未知参数时具有非稳健性,拟似然法也是如此.在统计实际应用中,估计的稳健性又是必须要考虑的.由于M-估计有较好的稳健性[10],于是本文采用M-估计来估计所提出的广义线性模型的参数,在适当的假设下,研究模型参数估计的强相合性与渐近正态特性.
考虑广义线性模型(generalized linear model)
参数空间H是有界闭集,β0为取值于H上的p维未知参数真值,且β0为H的内点.{X i,i∈N}为平稳遍历序列[11],εi为ε的样本,{εi}是独立同分布的误差,且{εi}与{Xs,s≤i}独立.F(·)为已知单调函数,F′(·)有界,v(·)为已知非负连续有界函数,并设上界为M0.
首先,给出如下假设:
(1)本文中所讨论积分和极限均可换序;
(2)设ρ(u)为已知的对称凸函数,ρ(0)=0,ρ(u)在正半轴上单调递增(可以增至+∞),且ρ″(u)有界,设上界为C1,由ρ(u)为凸函数知0≤ρ″(u)≤C1.令Mb(a)=E(ρ(a+bε)),并设对于任意b>0,Mb(a)在a=0时达到最小.由假设(1)知
令L(b)=E((ρ′(bε))2),并设L(b)连续;
在证明定理之前,先来证明下面的命题.
在固定设计中,建立模型如下:
其中参数空间H、函数F(·)与v(·)的定义如前.此模型中,{x ni,i=1,2,…,n}为固定的p维向量组,且一致有界,x ni代表第n批第i次试验结果.{εni,i=1,2,…,n,n≥1}为独立同分布的随机变量组.记
在模型中,设X服从二元泊松分布,参数真值为β0=(β01β02)T,误差变量ε服从标准正态分布.用蒙特卡罗方法产生n个服从二元泊松分布的X与一元标准正态分布的ε,得到相应响应变量的值.再将该操作重复m次,算出平均误差作为模型误差.仿真结果见表1、2.
表1 仿真结果1(β0=(0.8 1)T,样本容量为100)
Tab.1 Simulation result 1(β0=(0.8 1)T,sample size is 100)
mn β01 β02MSE1MSE2 10 20 0.847 1 1.083 9 0.044 4 0.102 4 30 50 0.873 2 1.070 1 0.043 3 0.067 1 50 50 0.876 8 1.075 6 0.038 7 0.080 6
表2 仿真结果2(β0=(1 2)T,样本容量为100)Tab.2 Simulation result 2(β0=(1 2)T,sample size is 100)
由上表可以看出,模型的M-估计具有良好的性能,不失为一个好的估计方法.
本文针对广义线性模型提出了对参数的M-估计方法,在适当的假设条件下证明了这种估计的强相合性与渐近正态性.最后通过数值模拟结果可以看出这种估计的优良性.本文提出的这一模型与估计方法在实用上,尤其是生物、医学和经济、社会数据的统计分析上有重要的意义.
[1]NELDER J A,WDDERBURN R W M.Generalized linear models[J].Journal of the Royal Statistical Society,1972,135(3):370-384
[2]MCCULLAGH P,NELDER J A.Generalized Linear Models[M].2nd ed.London:Chapman and Hill,1982
[3]HABERMAN S J.Maximum likelihood estimates in exponential response models[J].Annals of Statistics,1977,5(5):1148-1169
[4]高启兵,吴耀华.广义线性回归拟似然估计的渐近正态性[J].系统科学与数学,2005,25(6):738-745
[5]尹长明,赵林城.广义线性模型中极大拟似然估计的渐近正态性与强相合性[J].中国科学A辑:数学,2005,35(11):1236-1250
[6]FAHRMEIR F,KAUFMANN H.Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models[J].Annals of Statistics,1985,13(1):324-368
[7]岳 丽,陈希孺.广义线性模型中拟极大似然估计的强相合性及收敛速度[J].中国科学A辑:数学,2004,34(2):203-214
[8]尹长明,赵林城.广义线性模型极大似然估计的强相合性与渐近正态性[J].应用概率统计,2005,21(3):249-260
[9]HUBER P J.Robust Statistical Procedures[M].Philadelphia:Society for Industrial Mathematics,1989
[10]茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,2006
[11]何书元.应用时间序列分析[M].北京:北京大学出版社,2003:35-36
[12]POLLARD D.Convergence of Stochastic Process[M].New York:Springer-Verlag,1984:170-171