Log-binom ial回归在社区干预效果评价中的应用*

2014-03-10 05:25高文龙刘小宁颜
中国卫生统计 2014年3期
关键词:估计值患病率效应

高文龙刘小宁颜 虹

Log-binom ial回归在社区干预效果评价中的应用*

高文龙1,2刘小宁1颜 虹2△

目的介绍利用log-binomial回归评价社区干预效果的原理与方法。方法通过在log-binom ial模型中增加干预变量和时间变量的交互项,获得相对率比(RRR)的估计值,来进行社区干预效果评价,并以实例进行分析。结果通过“儿童关爱”干预措施对婴幼儿腹泻患病率影响的实例分析了在有无协变量的log-binom ial回归在社区干预效果评价中的应用效果,并与Poisson回归模型做了相应的比较。调整混杂因子后的log-binomial回归模型是在控制了个体因素后对干预效应的有效估计,因此,评价的结果更为可靠。结论log-binomial回归模型是社区干预研究的一种有效方法。

log-binom ial回归 社区干预 效果评价

Log-binomial回归模型是广义线性模型的一种特殊类型,由于它很容易得到某一因素率比(rate ratio,RR)的最大似然估计值,因此,能够作为干预效应评价的选择方法。

Log-binom ial回归方法及其评价原理

假定反应变量服从二项分布,连接函数为对数连接的这样一种广义线性模型类型通常被称为log-binom ial回归模型。它一般的模型结构如式(1)表示:

式(1)中,p为结局出现的概率,误差项ei是随机项。该模型利用最大似然估计参数β时需要在SAS软件中,该模型能够通过PROC GENMOD程序,在模型参数中设定DISTRIBUTION=bin LINK=log来实现log-binomial回归。

在社区干预研究中,通常存在两个基本变量:反映干预实施状态的变量(区别了干预和对照)和时间指示变量(区别了干预的前后)。实际上,干预对结局变量的影响是这两个变量的交互效应。具体的评价模型可以由式(1)扩展为式(2)。此时,Log-binomial回归评价干预效应的模型结构如式2所示:

式(2)中,P(Y=1|int,time,X)为int,time和X不同取值时结局出现的概率,int为干预变量(int=1表示干预,int=0表示对照),time为时间变量(time=1表示干预后,time=0表示干预前),X是需要调整的协变量或混杂因素,ei是误差项。由式(2),可以看到exp(β3)实际上就是干预对结局影响的效应估计值,它是干预下结局的率比(RR)在时间点上的比值,即(RR1为干预后结局的率比;RR0为干预前结局的率比),为了与主效应RR相区别,此处称它为相对率比(RRR:relative rate ratio)。当RRR>1时,说明干预提高了结局的发生率,当RRR=1时,说明干预对结局的发生没有影响,当RRR<1时,说明干预降低了结局的发生率。在SAS程序中,社区干预效应评价的拟合模型式(2)与式(1)相比,仅在自变量中增加了int*time项。

实例分析

本文以西安交通大学医学院在2001年和2005年中国农村初级卫生保健项目(2001-2005年)执行前后开展的两次断面调查数据为例,评价“儿童关爱”的干预措施对三岁以下儿童腹泻两周患病率的影响。在两次共同调查的34个县中,9个县接受了“儿童关爱”干预措施,视为干预组;25个县没有接受这一干预措施,被视为对照组。“儿童关爱”的干预措施从2001年开始到2005年结束,两次调查的抽样方法均是在各县中采用多阶段按人口比例抽样法(PPS)获得乡和村样本单元,家庭和儿童的抽样采用完全随机抽样方法。

2001年共调查符合要求的儿童10829名,其中对照组7936名,干预组2893名;2005年共调查10682名,其中对照组7885名,干预组2797名。表1显示了2001年和2005年“儿童关爱”干预组和对照组婴幼儿两周腹泻患病率和样本特征。从表1可见,2001年,对照组婴幼儿两周腹泻患病率为17.72%,干预组为17.01%,干预组和对照组无统计学差异,2005年两者分别为6.84%和4.85%,两者间有显著的统计学差异;无论2001年还是2005年,样本特征很不平衡。

表1 2001年和2005年“儿童关爱”干预组和对照组两周腹泻患病率和样本特征

本实例采用SAS9.1.2软件分别拟合了有和无协变量的log-binom ial回归和Poisson回归两种模型。表2显示了log-binomial回归和Poisson回归两种模型估计“儿童关爱”干预对婴幼儿腹泻患病率影响的效应。由表2可知,log-binomial回归和Poisson回归两种模型有相同的预测值:当未调整混杂因素时,“儿童关爱”干预降低了婴幼儿腹泻患病率26%,当调查了混杂因素后,预测值提高了2%。但无论是否调整了混杂因素,Poisson回归较log-binomial回归模型预测值的可信区间均稍大。

表2 “儿童关爱”干预对婴幼儿腹泻患病率影响的效应估计

讨 论

本研究结果显示,log-binom ial回归由于能够在调整可能的混杂因素的前提下,通过增加干预变量和时间变量的交互项来实现不同时间点上社区干预对结局影响的效果评价。但log-binomial回归中,当存在连续自变量时,最大似然估计的参数通常在参数所限制范围的边界上,最大似然估计方法得不到似然函数的导数为零时的极大值,导致模型不能收敛。此时,无法得到各参数的最大似然估计值[1]。Deddens等人提出了COPY方法对原始数据集调整扩充后再拟合logbinomial回归模型,能够解决这样的问题[2]。这种COPY方法在SAS软件中,可以在数据步通过设定权值按照一定比例和规则扩充数据集,并在PROC GENMOD程序中增加相应的weight语句很方便地实现[1]。Log-binom ial回归模型是在乘法效应的假设下建立了正确的似然结构,因此是率比和可信区间估计最合适的方法[3]。当然,还有其它模型,如Poisson回归,Cox风险回归,也能够得到率比的估计值[4],但它们经常会出现概率越界问题[5],同样导致模型不能收敛,而且,在概率较大的情形下,能够使得估计值的标准误很大[6],从而使得统计检验结果趋于保守。有些研究针对Poisson回归和Cox风险回归中出现的概率越界或标准误大的问题,提出了adjusted Poisson回归和具有稳健方差估计的Cox风险回归等,能够一定程度上解决了这些模型自己的缺陷问题[7]。有研究者也将双重差分模型,多水平发展模型用于社区干预性研究中[8-9]。当然,对于模型的选择问题,应该结合研究的特点、数据特征和模型的优缺点来综合分析,从而更好地选择使用这些模型,来解决社区干预研究中效果的评价问题。

1.叶荣,郜艳晖,杨翌,等.log-binom ial模型估计的患病比及其应用.中华流行病学杂志,2010,31(5):576-578.

2.Deddens JA,Petersen MR,Lei X.Estimation of prevalence ratios when proc genmod does not converge.Proceedings of the 28th Annllal SAS Users Group Intemational Conference.Cary.NC:SAS Institute Inc,2003:270.

3.Traissac P,Martin-Prevel Y,Delpeuch F,et al.[Logistic regression vs other generalized linear models to estimate prevalence rate ratios][in French,English summary].Rev Epidem iol Sante Publique,1999,47:593-604.

4.ZocchettiC,ConsonniD,BertazziPA.Estimation of prevalencerate ratios from cross-sectional data.Int JEpidemiol,1995,24:1064-1065.

5.Yu B,Wang Z.Estimating relative risks for common outcome using PROC NLP.ComputMethods Programs Biomed,2008,90(2):179-186.

6.Skov T,Deddens J,Petersen MR,et al.Prevalence proportion ratios:estimation and hypothesis testing.Int JEpidemiol,1998,27:91-95.

7.Zou G.A modified Poisson Regression Approach to prospective studies with binary data.Am JEpidemiol,2004,159:702-706.

8.刘小宁,高文龙,颜虹.双重差分模型在社区干预研究效果评价中的应用.中国卫生统计,2013,30(1):21-22.

9.高俊岭,傅华.多水平发展模型在社区干预性研究中的应用.中国卫生统计,2009,26(2):459-461.

(责任编辑:刘 壮)

*:国家自然科学基金(81230016);兰州大学中央高校基本科研业务费专项资金(lzujbky-2014-156)

1.兰州大学公共卫生学院(730000)

2.西安交通大学医学部公共卫生学院(710061)

△通信作者:颜虹

猜你喜欢
估计值患病率效应
2022年7月世界直接还原铁产量表
2020年安图县学生龋齿患病率分析
铀对大型溞的急性毒性效应
昆明市3~5岁儿童乳牙列错畸形患病率及相关因素
懒马效应
一道样本的数字特征与频率分布直方图的交汇问题
如何快速判读指针式压力表
应变效应及其应用
428例门诊早泄就诊者中抑郁焦虑的患病率及危险因素分析
老年高血压患者抑郁的患病率及与血浆同型半胱氨酸的相关性