刘广会 孙蝶
摘 要:基于半参数模型的特点,结合纵向数据的基本特征,建立纵向数据下半参数指数回归模型,并利用极大似然估计方法对该模型的参数进行估计,讨论模型的Fisher信息矩阵,在此基础上给出似然方程的Newton-Raphson迭代求解过程。
关键词:纵向数据;半参数指数回归模型;极大似然估计;Newton-Raphson迭代
一、模型引言
纵向数据是指对一组个体按照不同的时间或者空间顺序重复观察而得到的数据[1-2]。纵向数据最大的特点就是组内数据相关而组间数据是独立的。近年来,在生物统计,医学、经济学中对总线数据的下各种模型的研究引起国内外广大学者的追捧。纵向数据主要是为了分析响应变量与相关协变量之间的变化影响关系,并且经常适用回归分析的研究方法进行研究。常用的回归模型有参数模型E(y)=α+βx、非参数模型E(y)=α+f (x)、半参数模型E(y)=α+βx1+f (x2)等[3]。参数模型、非参数模型的纵向数据研究较为成熟。本文建立纵向数据下半参数指数分布回归模型,并对模型中的参数进行估计。
纵向数据半参数指数回归模型
,,
其中是已知设计的点列,表示为第个个体在时刻相应的个协变量的观测值组成的向量,表示观测的时间。是维未知回归参数向量,是定义在区间上的光滑的未知函数。,,当时,与相互独立。表示反应变量在第个个体第次的观测响应值。
本文基于纵向数据建立指数回归模型[4-6]
其中,的概率密度函数为
二、模型参数估计
应用一般的线性回归模型中的参数的估计方法,利用观测到的数据得到模型中的未知参数和光滑未知函数估计表达式。这里的函数是关于时间的函数。
通常函数的逼近可以用表达式做近似代替。即设
,
其中 是基函数向量。
设对变量,
则有相应的指数回归模型为
,
其中,,为未知参数。
则的对数似然函数为
令
则有
故对求偏导数有
令
即
则得到未知参数的估计值为 ,但由于的估计值是非线性的方程组,因此用迭代方法求解。
三、信息矩阵
定义:设为正则分布族,。
记
定义
称为分布族的信息阵。
建立在相關理论的基础上,对对数似然函数求二阶偏导数,并计算的信息矩阵及其估计式
参数的信息矩阵是个二阶偏导数所组成的方阵的负矩阵的期望,并记为。信息阵中每个元素与随机变量的观测值无关[7]。故
根据计算最大似然估计的基本理论,获得的最大似然估计值的协方差矩阵为
并求得的最大似然估计,带入,从而得的估计值为
四、指数回归模型的参数最大似然方程的迭代求解
迭代法的基本思路
设是关于参数的元函数,要求出,使得
令
设为第次迭代所得的参数的值,带入到和可以计算出和的值。在处将函数按照元函数的公式展开,展至二次项为即可,有
令
可以解出为,该式就是求解迭代法的一般公式[8]。
基于迭代方法的思路提出指数回归模型的参数估计基本步骤:
作为对数似然函数的目标函数,即
此时令
由此可以得到指数模型的参数的最大似然估计的迭代式为
因此指数模型的参数的最大似然估计的迭代的计算步骤如下:
第一步:给定初始值,计算,并计算和。
第二步:将,和代入,求得。
第三步:由计算出,并计算出和,并将所获得的,和值代入,求得。
第四步:重复第三步骤,当达到时,设定的误差限,有
通过这种方法便可以获得的最大似然估计。
参考文献
[1] 田瑞琴.纵向数据下半参数回归模型的统计推断[D].北京:北京工业大学,2014:168.
[2] 毛新娜.纵向数据的半参数回归模型的研究[D].武汉:武汉理工大学,2005:56.
[3] 闫莉.复杂数据下两类回归模型的统计推断[M].北京:科学出版社,2016:235.
[4] 魏强强,魏立力.半参数纵向数据的Logistic模型[J].四川理工学院学报:自然科学版,2008,21(2):8-11.
[5] 张登峰.纵向数据半参数Possion回归模型[J].广西民族大学学报:自然科学版,2013,19(4):52-54.
[6] 吴楠楠,袁永生,赵佩佩.纵向数据半参数混合效应的Logistic模型[J].云南民族大学学报:自然科学版,2016,25(3):234-239.
[7] 范金城,吴可法.统计推断导引[M].北京:科学出版社,2001:308.
[8] 雷金贵,陈文兵.一类解非线性方程的Newton型迭代法[J].南京信息工程大学学报:自然科学版,2009,1(4):377-378.