刘贝贝,田庆丰,郭金玲
1郑州大学公共卫生学院,河南郑州,450001; 2河南省医学会,河南郑州,450008
随着社会经济的快速发展,以心脑血管疾病、恶性肿瘤、慢性呼吸系统疾病、糖尿病为主的慢性非传染性疾病(简称“慢性病”)成为威胁我国居民健康的重大公共卫生问题[1]。慢性病病程时间较长且病因复杂,会给患者带来严重的疾病负担[2]。我国慢性病所导致的死亡人数已占全国总死亡人数87%,其疾病负担约占我国疾病总负担的70%[3]。慢性病患者往往有两个及以上的慢性病[4],2008年世界卫生组织正式提出共病的概念,指患者同时患有两种或两种以上的慢性病[5],共病会增加医务工作者疾病评估与诊疗的难度[6]、消耗更多医疗资源,降低患者的生命质量。
目前,国内关于慢性病共病模式的研究主要是针对某个地区[7-8],缺乏样本代表性。此外,学者大多数采用二分类logistic回归来研究慢性病间的关联性[9-10],而在使用logistic回归分析时,往往会忽略因变量与自变量之间需存在广义线性关系,而关联规则分析对因变量与自变量间是否存在广义线性关系没有要求[11]。为此,本文基于中国健康与养老追踪调查数据,运用关联规则分析来研究我国45岁及以上中老年人群的慢性病共病模式,为进一步提高慢性病筛查与共病管理提供参考。
本研究采用“中国健康与养老追踪调查”(China health and retirement longitudinal study, CHARLS)项目数据,该项目由北京大学国家发展研究院组织实施,于2011年开始基线调查,采取多阶段整群随机抽样,从县(区)、村(社区)、家庭、个人层面上进行抽取。最终受访者分布在全国28个省的150个县(区)级单位,450个村(社区)级单位,共计10257户,人数为17708人。此后,CHARLS数据每两年进行一次追踪调查。本研究采用2018年第四期调查数据,选取数据库中年龄≥45岁人群且关键信息变量(年龄、性别、受教育程度、婚姻状态、慢性病患病状况等)完整的样本为研究对象。2018年第四期CHARLS调查数据共包含样本19415例,剔除年龄<45岁或关键信息缺失的样本数据10925例,最终得到有效样本8490例。
2018年CHARLS调查问卷共包含8个模块。本文的变量主要来自“基础信息”和“健康功能与状态”两个模块。在“基础信息”模块中, 可以得到研究对象的年龄、性别、婚姻状况、受教育程度、居住类型等人口学特征信息;在“健康功能及状态”模块,可以得到研究对象参加社交活动情况及慢性病相关信息,CHARLS数据共询问了14种经由医生确诊的慢性病种类,包括高血压、血脂异常、糖尿病、癌症等。
关联规则是数据挖掘的一个重要技术,能够反映出一个事物与其他事物之间的相互依存性和关联性,它对数据分布没有过多要求,应用更加灵活,在医学慢性病研究中受到广泛关注[12-13]。一般常用支持度、置信度、提升度3个指标来评价关联规则,具体的概念如下。
1.3.1 规则支持度。Support(A→B)=P(D)=P(A∩B/P(D),表示在数据库D中,A与B同时发生的概率。支持度越高,则反映该条关联规则越重要。
1.3.2 规则置信度。Confidence(A→B)=P(B|A)=P(A,B)/P(A)=P(A∩B/P(A),表示在数据库D中,A与B同时发生的个数占仅仅A发生的个数。置信度越高,则反映该条关联规则可信度越高。
1.3.3 规则提升度。Lift(A→B) = P(B|A) / P(B),表示在数据库D中,在A发生的情况下,B发生的条件概率是B发生的非条件概率的倍数。提升度反映了关联规则中A与B的相关性,当提升度大于1且越高时,表示A→B的正相关性越高。
运用SPSS 21.0进行数据分析,对研究对象的基本情况进行描述性分析。计数资料采用例数,计数资料分析采用χ2检验。分类变量采用率和构成比来表示。关联规则分析通过Apriori算法来完成。显著性水平α=0.05(双侧)。
本研究共纳入8490名中老年人。其中,男性4239人(49.90%),女性4251人(50.10%);年龄分布在45-98岁,平均年龄为59.85岁,45-59岁有4529人(53.30%),60岁及以上有3961人(46.70%);居住在城镇有3581人(42.20%),农村有4909人(57.80%);在婚姻状况中,目前在婚有7414人(87.30%),非在婚有1076人(12.70%);在教育程度分布中,小学及以下有5241人(61.73%),初中有2043人(24.06%),高中有798人(9.40%),中专及以上有408人(4.81%)。
2.2.1 慢性病患病率。8490名中老年人中,共有4245名患有慢性病,慢性病患病率为50.00%。根据慢性病患病率高低进行排序,依次为高血压1910人(22.50%)、血脂异常1248人(14.70%)、关节炎或风湿病891人(10.49%)。
2.2.2 不同人口学特征下中老年人群共病患病情况。本研究中老年人患有2种及以上慢性病的有2163人,慢性病共病率为25.50%。不同人口学特征中老年人群共病患病情况比较结果显示:女性共病患病率(13.23%)高于男性(12.25%),60岁及以上人群共病患病率较高(15.54%),农村居民共病患病率(14.02%)高于城镇居民(11.46%),受教育程度为小学及以下人群共病患病率最高(16.57%)。见表1。
表1 慢性病患病率情况
不同性别、年龄、居住类型、教育程度、婚姻状况在慢性病共病情况差异中均具有统计学意义(均有P<0.05)。见表2。
表2 不同人口学特征下中老年人群共病患病情况比较
2.3.1 关联规则分析结果。基于Apriori算法得出慢性疾病间的关联性及关联强度。将最低条件支持度设为1.0%,最小规则置信度设为20.0%,计算共得出32条关联规则。保留提升度为1.5以上的关联规则,共得出19条强关联结果,即为关联强度较强的共病模式。按照支持度排序,依次为血脂异常和高血压、心脏病和高血压、糖尿病和血脂异常。见表3。
表3 关联规则分析结果
2.3.2 不同年龄组关联规则分析结果。将数据按照年龄进行分组,依次划分为45-59岁、60岁及以上,依次对两组人群进行慢性病关联规则分析,筛选出支持度大于2.0%、置信度大于20.0%的关联规则,最后保留提升度大于1.2的强关联结果。结果显示:两个年龄段内的共病模式存在一定差异。60岁以上的人群强关联规则结果多于45-59岁的人群。不同年龄组所筛选出的强关联规则结果见表4。
中老年人群慢性病患病率为50.00%,与2015年CHARLS数据中老年人群慢性病患病率相比较[14],患病率明显增加,反映了我国中老年人群慢性病患病率仍处于较高水平,慢性病防控形势依然严峻。原因一方面是我国人口老龄化水平快速增长助推了慢性病患病率快速升高[15];另一方面随着社会经济的快速发展,人们的生活、工作节奏加快,慢性病危险因素随之暴露出来,缺乏锻炼、不健康的饮食习惯等不良生活方式越来越普遍。建议应加快医学模式转换, 把预防疾病的关口前移, 提高全社会对慢性病的认知;同时积极开展健康宣教工作,唤醒人们的健康意识,让其主动采取健康的生活方式。
表4 不同年龄组关联规则分析结果
我国中老年人群慢性病共病的患病率为25.50%,通过分析发现,年龄越大,共病患病率越高。有研究证实,相比于男性,女性的平均预期寿命更长,带病时期更长[16],加上受传统分工及家庭角色的影响,女性年轻时多以孩子和伴侣为生活重心,老年之后需要照顾孙子孙女,在不停地照顾他人中,容易忽略自身健康,即共病患病率高于男性,这与本研究结果一致。农村地区中老年人群文化水平较低,医学知识匮乏,对慢性病早期预防知识了解较少,且相比与城镇地区,医疗保障水平相对落后,卫生服务可及性差,居住在农村地区的中老年人群共病患病率高于城镇地区。此外,教育程度越高的人群共病患病率越低,这可能是因为受教育程度越高的人群通常有较好的生活环境,再加上对自身健康的关注度较高,从而共病患病率较低。因此,在以后开展慢性病预防工作中,可以着重考虑将筛检人群按照性别、年龄、居住类型、文化程度为基础,分成不同类别来管理,从而采取有针对性的积极干预措施来降低慢性病患病率。
按照慢性病种类分析,患病率较高的两种慢性病为血脂异常、高血压,且通过关联规则结果发现,多种慢性病均与高血压、血脂异常存在关联,两种疾病之间不仅有促进作用,而且还会导致其他慢性病患病率的升高,这与其他学者研究结果一致[17]。所以控制这两种疾病的发生与发展可以在一定程度上降低中老年人群共病患病率。另外,本研究发现高血压与血脂异常两种疾病之间存在强关联,具有较高的支持度与置信度,为最常见的共病模式,这与其他学者研究结果不一致[18]。该研究结果中,高血压与高尿酸血症为最常见的共病模式,分析原因可能与研究中所纳入的慢性病种类及数量不同有关。
慢性病在不同年龄组内的患病率不同,相同的共病模式在不同年龄组内的关联强度存在差异,从侧面反映年龄是影响慢性病患病的一个重要因素,这与此前学者研究结果一致[19]。不同年龄组内的关联规则存在差异,随着年龄增加,筛选的强关联规则逐渐增加,慢性病共病更加普遍,提示相关卫生工作人员应加强对高年龄组共病模式的管理。
关联规则分析能够挖掘出潜在的共病模式,有利于慢性病共病的预防和管理。但由于国内外对于慢性病关联规则参数的设置没有统一标准。因此,本研究参数的设置为参考相关文献和不断调整参数来获取满意的挖掘结果,对于参数阈值的设置有待进一步探究[20]。