基于Logistic回归与决策树模型的老年高血压患者血压控制影响因素分析

2022-08-29 02:58林菲朱晓云
上海医药 2022年16期
关键词:决策树分级程度

林菲 朱晓云

(上海市金山区疾病预防控制中心慢性病防制科,上海 201599)

高血压是心脑血管疾病最主要危险因素之一,会引起严重的心、脑等并发症,对人体健康造成严重危害。有效控制血压可降低相关并发症的发生。而血压控制是一个受生理、心理、社会等多维度影响的复杂过程,因此科学揭示血压控制的影响因素就尤为重要[1]。目前血压控制影响因素多采用Logistic回归分析,该模型能量化影响因素,但不能提供更好的决策建议[2]。而决策树是一种以树形结构建立的分类预测模型,结果可视化且利于临床应用[3]。本研究旨在利用Logistic回归模型与决策树模型分析金山区老年高血压患者血压控制影响因素的结果,为危险人群的综合干预提供参考建议。

1 对象与方法

1.1 对象及抽样方法

采用随机整群抽样法抽取金山区5个社区为研究现场,以调查期间前来社区卫生服务中心就诊、体检或者随访且符合纳入标准并已进入社区高血压健康管理系统的1 100位高血压患者作为研究对象。诊断标准依据《中国高血压防治指南(2018年修订版)》[4]。纳入标准:原发性高血压患者,年龄≥60岁,高血压患病时长≥2年,能正常交流且依从性好。剔除标准:继发性高血压患者,存在多种并发症、语言或认知障碍、身体衰弱等原因而无法接受调查者,不依从者和流动人口。

发放调查问卷1 100份,有效问卷1 053份,有效回收率95.73%。所调查的对象中,血压控制理想者占72.93%。1 053例对象中,男性457例,女性596例,男女比例为1∶1.3,平均年龄(70.65±6.93)岁。

1.2 方法

使用自行设计的《高血压患者血压控制情况测评表》,由经统一规范化培训的调查员(社区的家庭医生)对调查对象进行面对面问卷调查,并在金山区健康管理信息系统中通过调阅医院信息系统(hospital information system,HIS),查阅其健康相关资料,包括二、三级医院的就诊、治疗信息和社区随访信息等。问卷调查内容包括调查对象基本情况、患病情况、生活方式和治疗情况等,由经过培训的社区卫生服务中心工作人员采用统一的规范测量方法现场测量被调查者的身高和体重。

1.3 指标定义

(1)血压控制:血压在140/90 mmHg以下超过6个月为血压控制良好,血压140/90 mmHg以上超过6个月在为血压未控制[4]。(2)身高、体重测量:要求研究对象脱去鞋帽,测量精确到0.1 cm;体重测量要求对象脱去外套及鞋帽,测量数值精确到0.1 kg。计算体质量指数(body mass index,BMI)。

1.4 统计学分析与质量控制

将调查问卷录入Epidata 3.1软件,同时调阅健康管理信息系统中相关信息进行质控和补充;运用IBM SPSS Statistics 22.0软件进行数据分析。计数资料用百分率描述,比较使用χ2检验。血压控制影响因素的多因素分析采用Logistic回归分析和决策树模型分析,变量及赋值情况见表1。以P<0.05为差异有统计学意义。

表1 变量赋值表

2 结果

2.1 影响患者血压控制效果的单因素分析

结果显示,不同文化程度、高血压分级、食油摄入量、食盐摄入量及是否忘记服药的高血压患者间的血压控制率不同,差异均有统计学意义(均P<0.05,表2)。

表2 被调查高血压患者的血压控制情况

2.2 影响患者血压控制因素的Logistic回归分析

以血压是否控制为因变量,将单因素分析有统计学意义的变量作为自变量,进行Logistic回归分析,结果显示,文化程度、高血压分级、食盐摄入量和是否忘记服药是独立影响因素。见表3。

表3 血压控制影响因素的Logistic回归分析

2.3 影响患者血压控制效果的决策树模型分析

根据决策树构建的血压控制影响因素树形图包含2层,共9个节点,6个终端节点。见图1。文化程度、高血压分级、食盐摄入量是影响血压控制的变量,共提取6条分类规则:(1)文化程度>4(高中及以上),血压未控制的患者占该节点构成的13.4%;(2)文化程度≤2(小学以下),食用盐摄入适中,占该节点构成的33.7%;(3)文化程度≤2(小学以下),食用盐摄入偏淡,占该节点构成的18.3%;(4)文化程度≤2(小学以下),食用盐摄入偏咸,占该节点构成的47.3%;(5)文化程度为2-4(小学到初中),高血压分级为I级,占该节点构成的18.4%;(6)文化程度为2~4(小学到初中),高血压分级≥Ⅱ级,占该节点构成的32.9%。

图1 血压控制影响因素的决策树树形图

2.4 两种模型分析结果比较

绘制Logistic回归模型与决策树模型的受试者工作特征曲线(receiver operating characteristic curve,ROC)图。见图2。Logistic回归模型的ROC曲线下面积为0.647,决策树模型的ROC曲线下面积为0.631,2个模型的ROC曲线下面积差异无统计学意义,Z=-0.691,P>0.05,预测效果相近,见表4。

图2 Logistic回归模型与决策树模型的ROC曲线图

表4 Logistic回归模型与决策树模型预测效果比较

3 讨论

本研究通过Logistic回归模型与决策树模型筛选出的老年高血压患者血压控制影响因素有文化程度、血压分级和食盐摄入量。在Logistic回归模型中将是否忘记服药也纳入了影响因素,这与其他研究结果基本一致[5-7]。本研究结果显示,Logistic回归模型与决策树模型的ROC曲线下面积差异无统计学意义,提示2个模型的预测效果相近,且对血压控制影响因素的分析结果有较高的一致性。其中Logistic回归模型计算出了各个影响因素的OR值,反映了血压控制与文化程度、血压分级、食盐摄入量、是否忘记服药等4个因素之间的数量依存关系,但是无法展示各影响因素之间的交互作用,预测结果不直观[8]。而决策树则能很好展示各变量间的交互作用,如研究中文化程度是第1层的因素,说明文化程度是影响血压控制的最重要因素,第2层则展示了影响因素间的交互关系,食盐摄入偏多是文化程度最低的患者血压控制影响因素;而高血压分级偏高是文化程度稍高的患者血压控制影响因素。以上2种预测模型各具优势,在选择模型时将两者结合可更大程度地发挥两者的优势[9]。

从目前情况来看,我国老年高血压患者的血压控制率普遍较低,而控制率偏低的原因又是多方面的,如药物的选择、服用方式与剂量、治疗疗程和辅助措施等方面问题层出不穷[10];尤其是高血压患者对自我管理的知识、态度和行为等方面存在不足[11]。考虑大城市社区老年高血压患者血压控制欠佳的影响因素多与高血压病情及不健康生活方式相关[12],结合本次研究中得到的血压控制影响因素为文化程度、血压分级、食盐摄入量、规律服药与否等4个因素,提示金山区社区医生对文化程度在高中以下、高血压分级Ⅱ级以上的患者进行管理时,着重做好个体化控制血压的药物配置,并给出有针对性的个体化非药物方法指导。食盐摄入量多是高血压患病的危险因素,也是血压控制的影响因素,这与荣红辉等[13]的研究结果一致,说明金山区居民的食用盐量还需要加强控制,加大清淡饮食的宣传力度。社区医生除对高血压患者进行定期随访外,要加大对血压控制不稳定患者的随访频率,宣传健康的生活行为方式,监督规律服药情况。社区医生是直接接触患者的第一线工作者,在这一过程中发挥着不可替代的作用。

综上所述,金山区应在现有社区管理高血压患者基础上,加大全科医生责任制管理高血压患者的力度[14],加强对全人群的高血压防治知识健康教育[15-16],尤其对高血压患者中文化程度低、血压分级高、食盐摄入量多、不能规律服药者采取相应的干预措施,以改善其血压控制情况。

猜你喜欢
决策树分级程度
精致和严谨程度让人惊叹 Sonus Faber(意大利势霸)PALLADIO(帕拉迪奥)PW-562/PC-562
男女身高受欢迎程度表
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
分级诊疗路难行?
分级诊疗的“分”与“整”
基于决策树的出租车乘客出行目的识别
分级诊疗的强、引、合
“水到渠成”的分级诊疗
基于肺癌CT的决策树模型在肺癌诊断中的应用