尹长明, 石岳鑫
(广西大学数学与信息科学学院,广西 南宁 530004)
纵向数据(集团数据, 面板数据), 经常出现在生物, 医学, 经济和社会科学的研究中.它是对同一个个体进行多次观测, 所得数据是相关的, 但相关系数未知.广义估计方程(GEE)[1]是分析纵向数据回归问题的重要方法.GEE方法的一个显著特点是即使每个个体多次观测值之间的相关系数(方差)假定错误, 只要均值函数假定正确, 所得回归系数的GEE估计仍具有相合性和渐近正态性.若相关系数假定也正确, 则得到的GEE估计方差最小.
设(Yij,Xij)是第i个个体的第j次观测值,i=1,2,...,n,j=1,2,...,m, 其中Yij是响应变量,Xij是p×1协变量,m是每个个体的观测次数.假设不同个体之间的观测值是独立的, 同一个个体的m次观测值是相关.记Yi= (Yi1,...,Yim)T,Xi= (Xi1,...,Xim),i= 1,...,n, 其中T表示矩阵或向量的转置.设期望和方差分别为
其中µ(θ)是联系(link)函数, ˙µ(θ)>0是它的导数,θij=,β= (β1,··· ,βp)T是回归参数向量.若µ(θ) =θ, 就得到线性回归模型,µ(θ) = eθ/(1+eθ)就得到分析二分类数据的logistic模型,µ(θ)=eθ就得到分析计数数据的对数线性模型.
记µi(β) = (µi1(β),...,µim(β))T,Ai(β) = diag(σi1(β),...,σim(β)), 其中, diag(v)表示一个对角矩阵, 其对角元素是向量v的元素.Balan, Schiopu-Kratina[2]定义方程
的根为GEE估计, 其中估计工作相关矩阵(estimating working correlation matrix)定义为
若协变量维数是发散的, 记p=pn,β=βn=(βn1,··· ,βnpn)T.WANG[3]定义方程
GEE的建模可参看文[4-5].关于GEE的大样本性质, Balan, Schiopu-Kratina[2]研究了协变量维数固定, GEE估计的相合性和渐近正态性, 未研究Wald统计量的渐近分布, 而渐近正态分布的方差含有未知的真实相关系数, 不能直接用于区间估计和假设检验.WANG[3]研究了当样本容量趋于无穷, 协变量维数趋于无穷, GEE估计的相合性和渐近正态性.并且证明了响应变量是两点分布Wald统计量的渐近分布是卡方分布, Wald统计量可以直接用于统计推断.本文证明了协变量维数是固定的或趋于无穷, 响应变量是任意分布Wald统计量的渐近分布是卡方分布.推广了文[2-3]中的有关结果.
在本文中,C,C1,C2,...代表与n无关的正常数, 在不同地方可以表示不同值.为了得到我们的主要结果, 需要如下假设条件.
引理2.1[2]当协变量维数p固定, 若假设条件(A1)-(A5)成立, 则存在一个随机变量序列使
其中
引理2.2[3]当协变量维数p=pn趋于无穷, 若假设条件(A6)-(A12)成立, 则存在一个随机变量序列使
且对任意单位向量αn有
其中
H0:Lβ0=avs.H1:Lβ0a,
其中L是l×p行满秩矩阵,a是l×1向量.下面定理2.1可解决这些问题.
定理2.1当协变量维数p固定, 若假设条件(A1)-(A5)成立, 则存在使(2.1)成立, 且
其中是自由度为l的卡方分布,
注2.1定理2.1填补了文[2]中关于线性假设Wald统计量渐近分布的一个空白.
由于引理2.2也含有未知的Rn0,βn0, 所以引理2.2也不能直接用于统计推断, 而且在实际应用也经常需要检验线性假设
其中Ln是l×pn行满秩矩阵,a是l×1向量.为此我们有下面定理2.2可直接用于统计推断.
定理2.2当协变量维数p=pn趋于无穷, 若假设条件(A6)-(A13)成立, 则存在使(2.3)成立, 且
其中
注2.2显然定理2.2是文[3]中推论3.11的推广, 因为0,1分布的任意阶矩存在.
注2.3对对数线性Poisson模型, 定理2.2与引理2.2所需条件一样, 因为假设(A11)可推出(A13).
为了证明第2节的主要结果, 我们还需要如下一些引理.
则
定理2.1的证明易验证
其中
由假设(A5, (A4), 引理3.1和(3.5)式, 知=Op(1),
且
同理,
且
由假设(A2)和(3.9)式知, 对任意ϵ,
可验证
其中
由假设(A1)知,
由微分中值定理, (3.14)和(A5)知, 对所有1≤i ≤n,1≤j ≤m,β ∈B,
由(3.5), (3.6), (3.15)和(3.16)知,
同理
由引理3.1和(3.15)知,
由微分中值定理, (3.15), (A4)和(3.14) 知,
由(A4)和(A5)知,
且
由(3.21)和(3.22)知,
由(3.1), (3.7), (3.8), (3.12), (3.14), (3.17), (3.18)和(3.23)知,
即对β ∈B,
由(3.19), (3.20)和(3.23)知,
即对β ∈B,
由(3.23), (3.25)和(3.27)知, 对β ∈B,
定理2.2的证明易验证
其中
由假设(A6)和(A10)知,
由假设(A9),(A11),(3.31)式和(A12)可得,
同理,
其中λmax表示矩阵的最大特征根.由(3.34)式和假设(A12)知
记ϵi(βn0)=Yi −µi(βn0).则可验证
其中
由假设(A8)和(A10)知, 对cn ∈Rpn, 有
由(A11), (A9), 微分中值定理, (A6), (3.37), (3.38), (A12)可得
同理可证
对任意an ∈Rpn,bn ∈Rpn,‖an‖=1,‖bn‖=1,由(A11), (A9), (A12), 柯西-施瓦兹不等式和(A8)知, 对βn ∈Bn有
由微分中值定理, (A11), (A9), 柯西-施瓦兹不等式, (A6), (A8), (A12)知, 对βn ∈Bn有
其中
由(A9), (A11)和(A8)知,
由(3.30), (3.32), (3.33), (3.35), (3.36), (3.39), (3.40)和(3.44)知
由(A9)和(A11)知,
由(3.46), (3.47)和(3.44)知,
由(3.41)和(3.42)知,
由(3.44), (3.48)和(3.49)知,
同理
由(3.43), (3.45), (3.50)和(3.51)知,
由文[7]的59页知, 存在可逆矩阵Γn和满足条件=Il的l×pn矩阵得
由(3.46), (3.47)和(A8)知,
由(3.52), (3.54)和引理2.2得,
由引理2.2得,
由(3.56)和(3.54)得,
由(3.53), (3.55), (3.56)和(3.57)得,
当文[3]中的假设成立, 即Yi,i= 1,··· ,n,有共同的真实相关阵时, 定理2.2中工作相关阵Rn可以等于真实相关阵Rn0.若相等, 则估计的渐近方差最小(证明类似文[8]).所以若定理2.2中估计工作相关阵取定理2.1中的形式, 则估计的渐近方差最小.为了节省篇幅,模拟省略.