石福艳 赵 倩 潘 静 雷淑林 王麓璐 杨丽平△ 徐勇勇
潜类别模型在常见慢性病与日常生活方式关联性研究中的应用*
石福艳1,2赵 倩3潘 静3雷淑林3王麓璐3杨丽平3△徐勇勇2△
目的 探讨潜在类别模型在超声诊断的常见慢性病与人群日常生活行为方式分型关联性研究中的应用。方法 采用潜在类别分析方法分析早餐是否规律、吸烟、被动吸烟、大量饮酒、锻炼情况等生活行为模式,根据人群生活行为方式对研究人群聚类后,比较不同行为方式人群的人口学特征及B超诊断常见慢性病分布情况。结果 1164例研究对象的行为方式可分为3大类,分别是行为方式基本健康组、行为方式亚健康组和行为方式不健康组。各组人数分布情况依次为:208人(17.3%)、223人(21.4%)和733人(61.3%)。三组人群的年龄、性别、血型、婚姻状况、文化程度和职业状况的内部构成不同(所有P<0.05)。本研究结果显示:除脂肪肝在3类行为方式组中的分布不同外,其他B超诊断常见慢性病的分布无统计学差异(P>0.05)。大多数诊断结果(除肾结石、脂肪肝、肝囊肿外)的变化趋势均符合从行为方式基本健康组、行为方式亚健康组、行为方式不健康组依次增高的变化趋势。多因素logistic回归分析结果表明,影响脂肪肝的主要因素有肥胖、吸烟、大量饮酒及低豆制品摄入。结论 潜在类别模型可用于人群的日常行为方式分型研究,探索不同行为方式与慢性病之间的关联性,揭示健康行为干预的重点人群和内容,进而为有针对性制定干预措施提供科学依据。
潜在类别模型 体检 超声 生活行为 慢性病
随着人类社会的发展,影响人类健康的疾病谱及死亡谱也在发生变化,由过去的急性传染病、寄生虫病、营养缺乏等疾病逐步转移到以心脑血管疾病、恶性肿瘤、代谢性疾病等为主的慢性疾病(简称慢性病),目前慢性病是影响全球人群健康最主要的死因[1]。世界卫生组织调查结果显示,行为因素及生活方式已成为影响居民健康的主要因素[2]。大量研究表明,采取健康的生活方式,如不吸烟、适度饮酒、有规律的锻炼及健康饮食习惯等,可促进人群健康,降低患病风险[3-5]。健康行为通常呈现成簇性发生的特点,即大多数个体表现出不止一种健康行为,此即健康行为的多维度特征[6]。
潜在类别分析(latent class analysis,LCA)是探讨存在统计学关联的分类外显变量背后的类别潜变量的一种统计学技术。该方法的分析目的在于利用潜类别解释多个外显分类变量之间的复杂关联,使之能以最少的潜类别数解释外显变量之间的关联,并使各潜类别内部的外显变量之间满足局部独立的要求。潜在类别分析常用于社会学、生物医学及心理学等多个领域的多维特征分类研究[7-8]。
研究常见慢性病与人群日常行为方式之间的关联性,对不同行为模式人群采取有针对性干预措施,进而实现对慢性病的有效管理、制定公共健康干预措施以及识别高危人群等具有重要意义。本研究采用潜在类别方法,分析西安市西京医院健康管理中心体检人群的健康行为模式及不同行为模式下的人群特征及B超诊断常见慢性疾病的分布差异,为快速识别健康行为重点干预人群和有针对性制定健康干预措施提供科学依据。现将研究结果报告如下。
1.数据来源
选取2014年3月-7月期间在西安市西京医院健康管理中心进行健康体检的人群进行问卷调查。调查内容包括:体检者的一般情况、饮食习惯、生活习惯疾病史及家族史等。除调查问卷收集的内容外,纳入本次分析研究的项目还包括体格检查、腹部B超检查等相关内容。筛选调查中资料不全或资料有缺项者,共有1164名体检人员符合本次研究要求。
2.研究变量
本研究所涉及的常见慢性病主要为体检时腹部B超诊断疾病,主要包括:脂肪肝、肝囊肿、肝血管瘤、胆囊息肉、胆囊炎、胆结石、肾结石、肾囊肿等。纳入本次研究的行为因素主要有:肥胖、吸烟、被动吸烟、饮酒、蔬果摄入情况、锻炼情况、豆制品摄入情况、腌制食品摄入情况、油炸食品摄入情况及早餐食用情况。
3.统计学处理
(1)潜在类别分析的基本模型
潜在类别模型包括潜在类别概率(latent class probabilities)和条件概率(conditional probabilities)两种类型参数。假设有三个外显变量A、B、C,其水平数分别为I、J、K,且其彼此之间不相互独立。若存在某一具有T个潜类别的潜变量X,该变量不仅可以解释A、B、C三者间的关系,而且在X的每个类别中可维持A、B、C这三个外显变量的局部独立性,即为潜在类别分析,则其基本的潜在类别模型为:
(2)模型拟合及参数估计
潜在类别分析主要采用极大似然法(maximum likelihood,ML)进行参数估计,其迭代过程中常用的算法有最大期望法(expectation-maximization,EM)、牛顿-拉普森(Newton- Raphson,NR)和Fisher计分法等,其中以EM算法最为常用。
(3)模型评价
模型评价的工作在于找出包含较少参数、较为简单,但又具有较好拟合优度的模型。其常用的评价指标有:Pearsonχ2值、似然比χ2值、Akaike信息准则(AIC)和Baysian信息准则(BIC)等。其中Pearsonχ2值和似然比χ2值所对应的P值大于0.05,表明模型拟合得好;AIC和BIC统计量值越小,则意味着模型拟合的越好。有研究者指出当样本量以数千计时,BIC指标更可靠,否则AIC更佳〔9〕。
(4)个体的潜在分类
在确定模型后,需要将各观察值分类到适当的潜在类别当中,以说明观察值的后验类别属性,即潜在聚类分析。潜在聚类分析是在一定的概率模型之下,利用估计所得的潜类别概率和潜类别中各外显变量的条件概率计算外显变量反应每种组合分类到各潜类别的后验概率,然后依据后验概率的大小决定该组合的个体应归入的潜类别。后验概率的计算公式为:
(5)统计分析软件
本研究的潜在类别分析采用Mplus 5.1软件,其他统计学分析采用SPSS13.0软件完成。
1.一般人口学特征
本次调查的1164名体检人群中,男性630人,占54.1%,女性534人,占45.9%。血型的分布情况为:A型血、B型血、AB型、O型及血型不清楚者分别有207人(17.8%)、246人(21.1%)、93人(8.0%)、264人(22.7%)和354人(30.4%)。文化程度的分布情况分别为:初中及以下298人(25.6%)、高中233人(20.0%)、大专236人(20.3%)、本科264人(22.7%)、研究生及以上133人(11.4%)。本次研究对象中以企事业单位为主,占46.9%,其次为离退休人员(14.9%)和商业及服务人员(11.9%)。研究对象的年龄范围为22~87岁,平均年龄(47.9±10.5)岁。
2.模型拟合结果
为了选择合适的潜类别模型,我们从潜类别数为1的初始模型开始,拟合了5个潜变量模型。表1 给出了5个潜类别模型的拟合结果。
由拟合信息可知:当潜类别数为3时,模型满足了数据拟合的要求(L2=426.456,P> 0.05),且其BIC值最小(BIC=10914.446);当潜类别数增加到4个潜类别数后模型拟合优度未见明显改善,其BIC值又呈增大趋势,故可选择包含3个潜类别的模型作为本研究分析的理想模型。
3.模型的参数估计
基于3潜类别分析模型,利用EM 算法对潜类别概率和潜类别下各项目的条件概率进行估计,结果见表2。
在模型参数估计之后,依据各项目的条件概率特点对各潜在类别进行解释。由表3可知,在纳入模型的10个项目中,除3个项目(肥胖、高腌制食品摄入和高油炸食品摄入)外,其他项目在三个类别的分布差异较明显。根据分布差异明显的七个项目对各类别命名如下:类别1中7个项目回答均为“否”(赋值为0),其条件概率均最大,因而可将该组定义为“行为方式基本健康组”;类别3中7个项目回答均为“是”(赋值为1),其条件概率均最大,因而可将该组定义为“行为方式不健康组”;类别2中除“吸烟”和“大量饮酒”两个项目回答为“是”(赋值为1)外,其余项目回答均为“否”(赋值为0),故将该组定义为“吸烟、饮酒组”或“行为方式亚健康组”,为了和其他两组的命名一致,本文将其命名为“行为方式亚健康组”。类别1、类别2和类别3三组人群的比例分别为17.4%、21.3%和61.3%。
4.不同类别人群的人口学特征
三类人群在年龄、性别、血型、婚姻状况、文化程度和职业方面的差异均有统计学意义(所有P<0.05)。具体情况见表3。由表3可知,年龄在40~49岁之间的人群在行为方式基本健康组和行为方式亚健康组所占比例较大,分别为21.7%和22.8%;年龄≥60岁人群及年龄<30岁人群在行为方式不健康组中所占比例最高,其所占比例分别为80.7%和70.3%。在行为方式基本健康组,男性比例(93.3%)远远高于女性(6.7%),在行为方式不健康组女性所占比例较高,由此可知,男性的行为方式较为健康。另外,文化程度在三种行为方式组中的分别不同,其中初中及以下文化程度的人群在生活方式健康组及生活方式亚健康组的分布比例较高,而研究生及以上学历者在生活方式不健康组的分布比例较高,为13.5%。
5.不同行为模式人群B超诊断结果分布情况
本次调查结果显示:在各B超诊断结果中,除脂肪肝外,其他B超诊断结果在3类行为方式组中的分布情况均无统计学差异(P>0.05)。大多数慢性病如胆囊炎、胆结石等在行为方式亚健康组和(或)行为方式不健康组中的比例较B超健康组中的比例高。此外,大多数诊断结果(除肾结石、脂肪肝、肝囊肿外)的变化趋势符合从行为方式基本健康组、行为方式亚健康组、行为方式不健康组依次增高的变化趋势。具体情况见表4。对三类不同生活行为方式人群中的脂肪肝患病率进行对比分析,分析结果显示:三组人群的脂肪肝总体患病率不同(χ2=12.207,P=0.002)。进一步对三类不同生活行为方式人群中的脂肪肝患病率进行卡方分割比较分析,分析结果表明:行为方式不健康组与行为方式基本健康组两组的脂肪肝患病率不同,行为方式不健康组的脂肪肝患病率较高(χ2=10.775,P=0.001)。而行为方式基本健康组与行为方式亚健康组、行为方式亚健康组与行为方式不健康组之间的脂肪肝患病率之间无差别(P>0.0125)。
*:相应P值采用Fisher确切概率法计算得到。
6.脂肪肝多因素logistic回归分析
对体检人群中患病率较高的病种-脂肪肝的影响因素进行分析。具体分析方法为:先采用单因素logistic回归分析方法,分别分析影响脂肪肝的主要因素,然后以入选水准α=0.05,剔出变量水准取0.1进行多因素logistic 逐步回归分析。以是否患有脂肪肝为应变量(2=是,0=否),以肥胖、吸烟、被动吸烟、大量饮酒、蔬果摄入、豆制品摄入、缺乏体育锻炼、腌制食品摄入、高油炸食品摄入及早餐不规律等为自变量,先进行单因素logistic回归分析,然后以入选水准α=0.05,剔出变量水准取0.1进行多因素logistic 回归分析。多因素逐步分析结果表明影响脂肪肝的主要危险因素有肥胖、吸烟、大量饮酒及低豆制品摄入,具体结果见表5。
潜在类别分析是一种描述分类变量间相互关系所用的方法,该方法综合了结构方程模型与对数线性模型的思想,可以做探索性研究,也可以用于验证性研究,拓展了潜变量模型的应用范围[10]。本研究以1164例体检人群的生活行为方式为基础,采用潜在类别分析方法对其分布规律及其与慢性病的关系进行了探索研究。
研究结果显示,1164名研究对象的行为方式可归为三个组,分别是生活方式基本健康组、生活方式亚健康组和生活方式不健康组。三组人群分布情况分别为: 208人(17.4%)、223人(21.3%)和733人(61.3%)。除肥胖、高腌制食品摄入和高油炸饮食三个项目外,其他项目在三类人群中的分布特征明显。生活方式基本健康组以不吸烟,无被动吸烟,非大量饮酒、蔬果摄入较高,豆制品摄入较多、早餐规律和经常锻炼等的条件概率较高;生活方式亚健康组以吸烟、大量饮酒等条件概率较高;生活方式不健康组在吸烟、大量饮酒、被动吸烟、低蔬果摄入,低豆制品摄入、早餐不规律和缺乏锻炼等条目的条件概率较高。三类人群的行为方式受年龄、性别、血型、婚姻状况、文化程度和职业的影响(各P<0.05)。各人群特征在三类人群中的分布规律不明显,原因可能为本研究在收集资料时未采用随机化抽样技术,所得样本的某些人口学特征的构成偏性较大(如性别中男性比例较大;职业状况中以企事业单位的人群为主;婚姻状况中已婚者的比例较大等)。
本研究结果显示,脂肪肝在3类生活方式组中的总体患病率不同。其亚组分析结果表明,生活方式不健康组与生活方式基本健康组的脂肪肝患病率不同,但生活方式基本健康组与生活方式亚健康组、生活方式亚健康组与生活方式不健康组之间的脂肪肝患病率无差异。该结果提示人群行为及生活方式与脂肪肝患病率密切相关,其中饮食习惯对脂肪肝的患病率的影响较大。为证实该研究结果,进一步对脂肪肝影响因素进行多因素logistic回归分析,分析结果表明影响脂肪肝的主要行为危险因素有肥胖、吸烟、大量饮酒及低豆制品摄入,该研究结论与潜在类别分型研究结论基本一致。该研究结果进一步证实潜在类别分析研究可以用于常见慢性病与生活方式的关联性研究中。但因本研究所采用的样本含量较小、其他慢性病的阳性检出人数较少等原因,本次研究中未发现其他B超诊断常见慢性病(如胆囊炎、胆结石、肾结石、肝囊肿等)在3类生活方式分型中的分布差异性,未得出其他慢性病与某种生活方式谱之间的关联性。另外,该研究结果可能与本研究中未对常见生活方式疾病谱进行具体分类有关系。本研究组拟在后续研究中通过扩大样本量,根据疾病特点对人群日常生活及行为方式进行具体分类等方式,进一步开展有关潜在分类分析方法在常见慢性病发病及患病状况与人群可干预生活行为方式之间关联性研究中的深入研究,进而为有针对性开展常见慢性病生活方式健康教育及健康促进提供科学依据,也为有效开展人群常见慢性病防治工作奠定基础。
综上可知,本次调查研究的体检人群中(主要以企事业单位人群为主)存在许多不良的生活习惯和行为方式,导致其健康状况下降。因此,有必要在人群中,特别是以脑力劳动为主的人群中开展戒烟、控酒、平衡膳食、体育锻炼等健康促进方式宣传教育,这对降低人群中的危险因素水平,改变人们的不健康行为和生活方式,进而降低常见慢性病患病率、提高人群健康及生活质量等具有重要意义。
[1]龚幼龙.社会医学.北京:人民卫生出版社,2000:39.
[2]WHO.Global status report on noncommunicable diseases 2010.Geneva:World Health Organization,2011.
[3]GIH.Healthy Behaviors:Addressing Chronic Disease at Its Roots.Issue Brief(Grantmakers in Health),2004,(19):1-39.
[4]胡月,陈福宽,龚磊,等.农村居民生活方式及健康行为调查.中国公共卫生,2013,29(6):796-798.
[5]Lantz PM,House JS,Lepkowski JM,et al.Socioeconomic factors,health behaviors,and mortality:Results from a nationally representative prospective study of US adults.JAMA,1998,279(21):1703-1708.
[6]Spring B,Moller AC,Coons MJ.Multiple health behaviours:overview and implications.J Public Health(Oxf),2012,34 Suppl 1:i3-i10.
[7]de Vries H,van’t Riet J,Spigt M,et al.Clusters of lifestyle behaviors:from the Dutch SMILE study.Prev Med,2008,46(3):203-208.
[8]邱皓政.潜在类别模型的原理与技术.北京:教育科学出版社,2008.
[9]Lin TH,Dayton CM.Model selection information criteria for non-nested latent class models.Journal of Education and Behavioral Statistics,1997,22(3):249-264.
[10]曾宪华,肖琳,张岩波.潜在类别分析原理及实例分析.中国卫生统计,2013,30(6):815-817.
(责任编辑:刘 壮)
Application of Latent Class Model in the Research on the Correlation Between Common Chronic Diseases and Lifestyle
Shi Fuyan,Zhao Qian,Pan Jing,et al.
(Department of Health Statistics,School of Public health,Weifang Medical College(261053)Weifang)
Objective To investigate the application of latent class model in the research on the correlation between common chronic diseases diagnosed by ultrasound and lifestyle.Methods Latent class analysis(LCA)was used to indentify patterns of health behavior among eating breakfast,smoking,passive smoking,heavy drinking and exercise,and to classify the individuals.Further studies were conducted to compare demographic characteristics and the distributions of common chronic diseases diagnosed by ultrasound in different subgroups.Results Out of 1164 subjects,three subgroups of health behavior were identified which included“healthy behavioral patterns”(17.4%),“sub-healthy behavioral patterns”(21.3%)and“unhealthy behavioral patterns”(61.3%).The internal constituents of sex,blood type,marital status,educational level and occupational status were different(allP<0.05).No differences of the distribution of common chronic diseases diagnosed by ultrasound were found except for fatty liver among three behavior subgroups.Cholecystitis and gallbladder removal have a larger proportion in the sub-health behavior groups and(or)unhealthy behavior group than that in the healthy group diagnosed by type-B sonic.Except for kidney stones,fatty liver and liver cyst,most chronic diseases have the largest distribution in the unhealthy subgroup.Multi-logistic regression Results showed that risk factors associated with fatty liver were Obesity,smoking,heavy drinking and low soy food intake.Conclusions Latent class model can be applied in the classification of health behavior patterns,which can indicate the key health behavior intervention and provide scientific evidence for the intervention measures.
Latent class model;Medical examination;Ultrasound; Health behavior;Chronic diseases
国家自然科学基金(No.81473071;No.81573250);潍坊医学院青年创新基金(K1302013)
1.山东省潍坊市潍坊医学院卫生统计学教研室(261053)
2.陕西省西安市第四军医大学卫生统计学教研室
3.陕西省西安市第四军医大学第一附属医院综合诊疗科
△通信作者:杨丽平,E-mail:ylp-1971@163.com
徐勇勇,E-mail:xuyongy@fmmu.edu.cn