两水平两分类数据的logistic回归模型对比研究*

2014-03-10 07:04可赵华硕张虹何鹏黄水平
中国卫生统计 2014年5期
关键词:层次结构食量单纯性

王 可赵华硕张 虹何 鹏黄水平

两水平两分类数据的logistic回归模型对比研究*

王 可1赵华硕1张 虹2何 鹏1黄水平1

目的研究多水平模型在实际运用过程中的方法学问题,为以后此类具有层次性数据的正确分析提供参考。方法用徐州市区六所幼儿园中3~6岁儿童的资料建立二分类两水平logistic回归模型,并将模型所获得的结果与传统的多因素logistic回归模型进行对比研究。结果二分类两水平logistic回归模型与传统的多因素logistic回归模型所筛选变量及假设检验基本一致,但二分类两水平logistic回归模型对个别指标的敏感性更强;对于有层次结构的数据,模型拟合优度显示二分类两水平logistic回归模型优于传统的多因素logistic回归模型,偏差信息判据(DIC)值分别为362.225和370.428。结论本研究将多水平模型应用于分类变量的层次结构数据中,作为此类数据分析的新途径,此方法具有更好的适用性,能够克服传统回归模型在处理具有层次结构数据中的局限性。

多水平模型 二分类两水平logistic回归模型 单纯性肥胖

多水平统计模型是基于层次结构数据的基础上发展而来的一种统计方法[1],可有效处理传统多元统计方法难以分析的具有层次结构特征的数据,是目前国际上统计学研究中一个新兴而重要的领域[2-4]。本研究对多水平统计模型的应用进行探索,综合比较多水平统计模型和多因素logistic回归模型,利用抽取的徐州市六所幼儿园中3~6岁儿童的资料进行二分类两水平logistic回归模型和多因素logistic回归模型的实证研究,旨在研究多水平模型在实际运用过程中的方法学问题,为以后此类数据的正确分析提供参考。

资料与方法

1.资料来源

资料来源于徐州市区3~6岁儿童单纯性肥胖影响因素调查。该调查采用分层整群随机抽样的方法,在徐州市区抽取6所幼儿园(大班和中班的在园儿童均列为调查对象)共813名儿童,采用现场测量和问卷调查的方式获得数据。数据具有明显的层次结构(幼儿园→个体)。

2.变量选取

本研究引入以下变量进行分析,见表1。

3.统计方法

经单因素分析后,把差别有统计学意义的各因素拟合传统logistic回归模型和二分类两水平logistic回归模型进行比较。传统logistic回归模型分析由SAS9.13完成,二分类两水平logistic回归模型用ML-w iN软件拟合。多水平模型中,食欲、食量和父母对孩子体态的评价以哑元形式纳入;是否喜食油炸、烟熏、烤制食品、平时每次喝多少奶、喜欢油大的食品吗、每天室外活动时间、父母对孩子体力活动的看法和父母是否常以某种奖励鼓励孩子多吃以分组线性变量形式纳入模型。所有以哑元形式纳入模型的变量均以赋值为0的状态为参照组。

结 果

1.传统logistic模型回归结果

传统的多因素logistic回归模型筛选出的徐州市3~6岁儿童单纯性肥胖患病的影响因素为出生体重、出生后4个月内的喂养方式、食欲、食量、平时每次喝多少奶和父母对孩子体态的评价。出生体重越大的儿童单纯性肥胖患病的风险也越高;出生后4个月内喂养方式为人工喂养的儿童单纯性肥胖患病率高于除母乳喂养的儿童,其OR值为3.19,混合喂养的儿童单纯性肥胖患病率与纯母乳喂养者相比差异无统计学意义;食欲适中和食欲旺盛的儿童单纯性肥胖患病的可能性要高于食欲较差者;食量适中的儿童单纯性肥胖的患病风险反而小于食量较差者,其OR值为0.40,食量较多者与食量较少的儿童相比单纯性肥胖患病率差别无统计学意义;平时每次喝奶越多,单纯性肥胖的患病风险反而越小,OR值为0.35;与父母认为孩子太瘦的儿童相比,父母认为孩子太胖的儿童患单纯性肥胖的可能性较高,其OR值为43.08,其余人群间差异无统计学意义。结果见表2。

2.多水平logistic模型回归结果

(1)零模型拟合结果 以幼儿园为高水平即水平2,个体作为低水平即水平1,对数据进行二分类离散数据零模型(即模型中除截距及随机误差外,没有自变量)的拟合。零模型结果见表3。

表1 变量表

表2 传统的多因素logistic回归模型结果

表3 儿童单纯性肥胖患病两水平零模型

模型水平1方差非常接近1,Z=(1-0.982)/0.049=0.37<1.96,P>0.05,表明反应变量基本满足二项分布的假设。计算水平1单位在水平2上的聚集性,即儿童单纯性肥胖患病的组内相关系数为ρ1= 0.3132。此外水平2残差方差属于模型中水平2随机部分,其含义是:不同幼儿园儿童对“3~6岁儿童单纯性肥胖问卷”回答的变异情况,即幼儿园差异。因模型中无解释变量,所以是指未考虑幼儿园和儿童的特征时的变异。由于具有统计学意义,表明数据存在层次结构特征,即不同幼儿园内的3~6岁儿童单纯性肥胖患病情况存在相似性或聚集性,也就是说数据存在以幼儿园为水平2单位的层次结构,适于进行多水平分析。

(2)多水平模型拟合结果 经判断,儿童单纯性肥胖数据在高水平(幼儿园水平)上具有聚集性,进一步引入解释变量,拟合二分类两水平logistic回归模型,固定尺度参数(水平1方差)为1。与两水平零模型相比较,DIC下降88.711,模型拟合有效。

由表4可知,影响徐州市3~6岁儿童单纯性肥胖患病的主要因素有出生体重、母亲职业、出生后4个月内的喂养方式、食欲、食量、平时每次喝多少奶和父母对孩子体态的评价。在控制其他因素不变的情况下,出生时体重越大的儿童患单纯性肥胖的风险就越高,其OR值为1.94;与母亲职业为公务员、事业单位或国企人员者相比,母亲职业为教师或军人的儿童单纯性肥胖患病风险较高,其OR值为6.88,母亲职业为工人、个体工商户、农民和其他的儿童单纯性肥胖患病情况与母亲为公务员、事业单位或国企人员者相比差异无统计学意义;出生后4个月内喂养方式为人工喂养的儿童单纯性肥胖患病率高于纯母乳喂养者,OR值为2.97,母乳为主的混合喂养和非母乳为主的混合喂养的儿童与纯母乳喂养者单纯性肥胖患病率差异无统计学意义;与食欲差的儿童相比,食欲越好的儿童患单纯性肥胖的风险也越高;食量合适的儿童单纯性肥胖患病的风险低于食量差的儿童,其OR值为0.39,食量较多的儿童单纯性肥胖患病率与食量较少者相比差异无统计学意义;随着儿童平时每次喝奶量增加,单纯性肥胖的患病风险反而降低,OR值为0.34;与父母认为孩子太瘦的儿童相比,父母认为孩子太胖的儿童患单纯性肥胖的可能性较高,OR值为46.67,父母认为孩子稍瘦、匀称和稍胖儿童与父母认为孩子太瘦者单纯性肥胖患病情况相比,差异无统计学意义。

表4 两水平logistic回归模型结果

讨 论

两水平logistic回归模型对幼儿园水平的随机效应进行了检验,发现其具有统计学意义,说明3~6岁儿童单纯性肥胖患病在幼儿园这一水平存在聚集性,而这一结果在传统的多因素logistic回归模型中无法获得。

两种模型对徐州市3~6岁儿童单纯性肥胖的影响因素筛选结果均提示:出生体重、出生后4个月内的喂养方式、食欲、食量、平时每次喝多少奶和父母对孩子体态的评价是其影响因素。但二分类两水平logistic回归模型还发现“母亲职业”是影响单纯性肥胖患病的危险因素,而该因素在传统的多因素logistic回归模型中未被筛选出。两种模型所估计的参数及其标准误接近,但两水平logistic回归模型的DIC值比传统的多因素logistic回归模型减少了8.203,说明多水平模型充分考虑了系统结构数据误差的层次性和变量间的相关性,将总误差分解到相应的各个水平[5]。

所以在分析有层次结构的数据时,如此例,应用二分类两水平logistic回归模型要比传统的多因素logistic回归模型所得结果好,数据分析得更加到位[6]。

传统回归模型忽视内在相关性的后果将导致参数估计的标准误变小,使得过于容易拒绝无效假设,增大犯第一类错误的概率,层次结构数据更适宜于运用多水平统计模型进行分析,数据的层次结构不能忽略,多水平模型能够避免损失数据的高水平的特征,在考虑层次结构后获得的参数估计值更稳定,所得出的结论更可信。多水平模型在本次资料研究中的应用,显示了儿童单纯性肥胖在水平2上的聚集性,同时提高了选择解释变量的敏感性,体现了此方法的优势,为进一步挖掘卫生服务资料的信息提供了新的途径。

1.杨珉,李晓松.医学和公共卫生研究常用多水平统计模型.北京:北京大学医学出版社,2007:1-2.

2.李佳萌.多水平模型在吸烟行为研究中的应用.中华流行病学杂志,2007,28(4):398-401.

3.张岩波,张海敏,何大卫.多水平模型及其在医学心理领域中的应用.山西医科大学学报,2001,32(6):510-512.

4.吴晓云,曾庆,周燕荣.多水平模型的最新进展.数理医药学杂志,2003,16(2):152-154.

5.王艳梅,王洁贞,丁守銮,等.多水平模型在纵向研究资料中的应用.中国卫生统计,2007,45(7):658-661.

6.曹静,胡晓吟,刘兴会,等.多水平模型在妊娠期体重指数增长模式中的应用.中国卫生统计,2011,28(5):485-487.

(责任编辑:刘 壮)

*:徐州医学院院课题(课题编号2012KJ03)

1.徐州医学院公共卫生学院(221004)

2.徐州市儿童医院

猜你喜欢
层次结构食量单纯性
90锶-90钇敷贴器治疗单纯性毛细血管瘤的护理体会
“弱弱虎”健身记
基于层次分析法的电子设备结构方案评价研究
基于部件替换的三维模型生成方法
食量与健康
基于计算机防火墙防护技术探究分析
改良大隐静脉剥脱术与传统手术治疗单纯性下肢浅静脉曲张48例临床对比观察
配网自动化通信系统相关问题研究
肋骨带外固定加外敷万伤接骨膏治疗单纯性肋骨骨折的临床分析
探讨微创小切口在单纯性阑尾炎手术治疗中的应用效果