协变量维数可以趋于无穷的纵向数据的广义估计方程分析

2022-01-19 06:24:20尹长明石岳鑫

应用数学 2022年1期

关键词：维数方差线性

尹长明, 石岳鑫

(广西大学数学与信息科学学院,广西南宁 530004)

1.引言

纵向数据(集团数据, 面板数据), 经常出现在生物, 医学, 经济和社会科学的研究中.它是对同一个个体进行多次观测, 所得数据是相关的, 但相关系数未知.广义估计方程(GEE)[1]是分析纵向数据回归问题的重要方法.GEE方法的一个显著特点是即使每个个体多次观测值之间的相关系数(方差)假定错误, 只要均值函数假定正确, 所得回归系数的GEE估计仍具有相合性和渐近正态性.若相关系数假定也正确, 则得到的GEE估计方差最小.

设(Yij,Xij)是第i个个体的第j次观测值,i=1,2,...,n,j=1,2,...,m, 其中Yij是响应变量,Xij是p×1协变量,m是每个个体的观测次数.假设不同个体之间的观测值是独立的, 同一个个体的m次观测值是相关.记Yi= (Yi1,...,Yim)T,Xi= (Xi1,...,Xim),i= 1,...,n, 其中T表示矩阵或向量的转置.设期望和方差分别为

其中µ(θ)是联系(link)函数, ˙µ(θ)>0是它的导数,θij=,β= (β1,··· ,βp)T是回归参数向量.若µ(θ) =θ, 就得到线性回归模型,µ(θ) = eθ/(1+eθ)就得到分析二分类数据的logistic模型,µ(θ)=eθ就得到分析计数数据的对数线性模型.

记µi(β) = (µi1(β),...,µim(β))T,Ai(β) = diag(σi1(β),...,σim(β)), 其中, diag(v)表示一个对角矩阵, 其对角元素是向量v的元素.Balan, Schiopu-Kratina[2]定义方程

的根为GEE估计, 其中估计工作相关矩阵(estimating working correlation matrix)定义为

若协变量维数是发散的, 记p=pn,β=βn=(βn1,··· ,βnpn)T.WANG[3]定义方程

GEE的建模可参看文[4-5].关于GEE的大样本性质, Balan, Schiopu-Kratina[2]研究了协变量维数固定, GEE估计的相合性和渐近正态性, 未研究Wald统计量的渐近分布, 而渐近正态分布的方差含有未知的真实相关系数, 不能直接用于区间估计和假设检验.WANG[3]研究了当样本容量趋于无穷, 协变量维数趋于无穷, GEE估计的相合性和渐近正态性.并且证明了响应变量是两点分布Wald统计量的渐近分布是卡方分布, Wald统计量可以直接用于统计推断.本文证明了协变量维数是固定的或趋于无穷, 响应变量是任意分布Wald统计量的渐近分布是卡方分布.推广了文[2-3]中的有关结果.

2.主要结果

在本文中,C,C1,C2,...代表与n无关的正常数, 在不同地方可以表示不同值.为了得到我们的主要结果, 需要如下假设条件.

引理2.1[2]当协变量维数p固定, 若假设条件(A1)-(A5)成立, 则存在一个随机变量序列使

其中

引理2.2[3]当协变量维数p=pn趋于无穷, 若假设条件(A6)-(A12)成立, 则存在一个随机变量序列使

且对任意单位向量αn有

其中

H0:Lβ0=avs.H1:Lβ0a,

其中L是l×p行满秩矩阵,a是l×1向量.下面定理2.1可解决这些问题.

定理2.1当协变量维数p固定, 若假设条件(A1)-(A5)成立, 则存在使(2.1)成立, 且

其中是自由度为l的卡方分布,

注2.1定理2.1填补了文[2]中关于线性假设Wald统计量渐近分布的一个空白.

由于引理2.2也含有未知的Rn0,βn0, 所以引理2.2也不能直接用于统计推断, 而且在实际应用也经常需要检验线性假设

其中Ln是l×pn行满秩矩阵,a是l×1向量.为此我们有下面定理2.2可直接用于统计推断.

定理2.2当协变量维数p=pn趋于无穷, 若假设条件(A6)-(A13)成立, 则存在使(2.3)成立, 且

其中

注2.2显然定理2.2是文[3]中推论3.11的推广, 因为0,1分布的任意阶矩存在.

注2.3对对数线性Poisson模型, 定理2.2与引理2.2所需条件一样, 因为假设(A11)可推出(A13).

3.主要结果的证明

为了证明第2节的主要结果, 我们还需要如下一些引理.

则

定理2.1的证明易验证

其中

由假设(A5, (A4), 引理3.1和(3.5)式, 知=Op(1),

且

同理,

且

由假设(A2)和(3.9)式知, 对任意ϵ,

可验证

其中

由假设(A1)知,

由微分中值定理, (3.14)和(A5)知, 对所有1≤i ≤n,1≤j ≤m,β ∈B,

由(3.5), (3.6), (3.15)和(3.16)知,

同理

由引理3.1和(3.15)知,

由微分中值定理, (3.15), (A4)和(3.14) 知,

由(A4)和(A5)知,

且

由(3.21)和(3.22)知,

由(3.1), (3.7), (3.8), (3.12), (3.14), (3.17), (3.18)和(3.23)知,

即对β ∈B,

由(3.19), (3.20)和(3.23)知,

即对β ∈B,

由(3.23), (3.25)和(3.27)知, 对β ∈B,

定理2.2的证明易验证

其中

由假设(A6)和(A10)知,

由假设(A9),(A11),(3.31)式和(A12)可得,

同理,

其中λmax表示矩阵的最大特征根.由(3.34)式和假设(A12)知

记ϵi(βn0)=Yi −µi(βn0).则可验证

其中

由假设(A8)和(A10)知, 对cn ∈Rpn, 有

由(A11), (A9), 微分中值定理, (A6), (3.37), (3.38), (A12)可得

同理可证

对任意an ∈Rpn,bn ∈Rpn,‖an‖=1,‖bn‖=1,由(A11), (A9), (A12), 柯西-施瓦兹不等式和(A8)知, 对βn ∈Bn有

由微分中值定理, (A11), (A9), 柯西-施瓦兹不等式, (A6), (A8), (A12)知, 对βn ∈Bn有

其中

由(A9), (A11)和(A8)知,

由(3.30), (3.32), (3.33), (3.35), (3.36), (3.39), (3.40)和(3.44)知

由(A9)和(A11)知,

由(3.46), (3.47)和(3.44)知,

由(3.41)和(3.42)知,

由(3.44), (3.48)和(3.49)知,

同理

由(3.43), (3.45), (3.50)和(3.51)知,

由文[7]的59页知, 存在可逆矩阵Γn和满足条件=Il的l×pn矩阵得

由(3.46), (3.47)和(A8)知,

由(3.52), (3.54)和引理2.2得,

由引理2.2得,

由(3.56)和(3.54)得,

由(3.53), (3.55), (3.56)和(3.57)得,

4.结语

当文[3]中的假设成立, 即Yi,i= 1,··· ,n,有共同的真实相关阵时, 定理2.2中工作相关阵Rn可以等于真实相关阵Rn0.若相等, 则估计的渐近方差最小(证明类似文[8]).所以若定理2.2中估计工作相关阵取定理2.1中的形式, 则估计的渐近方差最小.为了节省篇幅,模拟省略.

猜你喜欢

维数方差线性

方差怎么算

中学生数理化·七年级数学人教版(2023年6期)2023-05-25 12:17:42

渐近线性Klein-Gordon-Maxwell系统正解的存在性

数学物理学报(2022年4期)2022-08-22 04:08:00

β-变换中一致丢番图逼近问题的维数理论

数学物理学报(2022年4期)2022-08-22 04:06:44

概率与统计(2)——离散型随机变量的期望与方差

中学生数理化(高中版.高考数学)(2021年3期)2021-06-09 06:09:10

线性回归方程的求解与应用

中学生数理化·高一版(2021年2期)2021-03-19 08:32:06

一类齐次Moran集的上盒维数

数学物理学报(2020年3期)2020-07-27 01:19:56

计算方差用哪个公式

中学生数理化·七年级数学人教版(2019年6期)2019-06-25 01:01:32

二阶线性微分方程的解法

中央民族大学学报(自然科学版)(2018年3期)2018-11-09 01:16:34

方差生活秀

初中生世界·九年级(2017年10期)2017-11-08 21:30:36

关于齐次Moran集的packing维数结果

数学物理学报(2016年5期)2016-08-24 07:38:40

应用数学2022年1期

应用数学的其它文章: 基于不确定控制理论的最优策略研究; Dependence of Eigenvalues of Two-Interval Third-Order Boundary Value Problems; 一类拟线性薛定谔方程非平凡解的存在性; The Optimal Error Estimates for the Dynamic Magnetic Field of Solar Interface Problem by H(curl,Ω) Finite Element Methods; 不可压磁流体力学方程组的高精度数值解法; Error Analysis of Kernel Regularized Regression with Deterministic Spherical Scattered Data