基于机器学习的老年慢性心力衰竭病人衰弱风险预测模型的构建

2024-06-30 05:07:05海瑞王慧张蓉徐亚萍杨益
护理研究 2024年12期
关键词:预测模型机器学习慢性心力衰竭

海瑞 王慧 张蓉 徐亚萍 杨益

基金项目 新疆维吾尔自治区研究生创新项目,编号:XJ2021G230

作者简介 海瑞,硕士研究生在读

通讯作者 杨益,E?mail:yangyi2671@163.com

引用信息 海瑞,王慧,张蓉,等.基于机器学习的老年慢性心力衰竭病人衰弱风险预测模型的构建[J].护理研究,2024,38(12):2103?2109.

Construction of predictive model of frailty risk in elderly patients with chronic heart failure based on machine learning

HAI Rui, WANG Hui, ZHANG Rong, XU Yaping, YANG Yi

School of Nursing, Xinjiang Medical University, Xinjiang 830011 China

Corresponding Author  YANG Yi, E?mail: yangyi2671@163.com

Abstract  Objective:To construct a predictive model of frailty risk in elderly patients with chronic heart failure(CHF) based on machine learning,and to provide a new method for accurate prediction of frailty occurrence in clinical elderly patients with CHF.Methods:Clinical data related to CHF patients from the cardiovascular medicine department of a tertiary grade A hospital in Urumqi from January 2023 to May 2023 were collected and randomly divided into training and testing sets in the ratio of 7∶3,with the occurrence of frailty as the outcome variable.The frailty risk prediction models were constructed based on four algorithms:Logistic regression(LR),decision tree(DT),random forest(RF),and support vector machines (SVM).The performance of the models was evaluated based on the area under curve (AUC),accuracy,precision,sensitivity,specificity,F1 value,and the optimal model was selected.Results:A total of 423 patients with CHF were included,182 of whom developed frailty(43%).All four prediction models had high accuracy,and the AUC values of the LR,DT,SVM,and RF models were 0.917,0.863,0.941 and 0.952,respectively,with the RF models having the highest AUC values,and the RF model had the highest accuracy,precision,sensitivity,specificity,and F1 value were the highest.The importance of the feature variables was further ranked based on the RF model,and the top five feature variables were hemoglobin,interleukin?6,albumin,malnutrition,and Charlson Comorbidity Index(CCI) scores.Conclusion:The predictive model of frailty risk in elderly patients with chronic heart failure based on RF machine learning has the best performance,which is helpful for early clinical assessment and prevention of frailty risk.

Keywords  chronic heart failure; frailty; machine learning; predictive model

摘要  目的:基于机器学习算法构建老年慢性心力衰竭(CHF)病人衰弱风险预测模型,为临床老年CHF病人衰弱发生的精准预测提供新方法。方法:收集2023年1月—5月乌鲁木齐市某三级甲等医院心血管内科的CHF病人相关临床资料,按7∶3比例随机划分为训练集和测试集,以是否发生衰弱为结局变量,分别基于逻辑回归(LR)、决策树(DT)、随机森林(RF)、支持向量机(SVM)4种机器学习算法构建衰弱风险预测模型。基于受试者工作特征曲线下面积(AUC)、准确度、精确度、灵敏度、特异度、F1分数评估模型性能,选出最优模型。结果:共纳入423例CHF病人,其中182例病人发生衰弱,衰弱发生率为43%。4种预测模型都有较高的准确性,LR、DT、SVM、RF模型的AUC值分别为0.917,0.863,0.941,0.952,其中RF模型AUC值、准确度、精确度、灵敏度、特异度、F1分数均最高。进一步基于RF模型对特征变量进行重要性排序,其中排名前5位的特征变量依次为血红蛋白、白细胞介素?6、白蛋白、营养不良、查尔森合并症指数(CCI)。结论:基于RF机器学习算法构建的老年CHF病人衰弱风险预测模型性能最优,有助于临床早期评估和预防其衰弱风险的发生。

关键词  慢性心力衰竭;衰弱;机器学习;预测模型

doi:10.12102/j.issn.1009-6493.2024.12.007

预计到2035年,我国≥60岁人口占比将超过20%,进入中度老龄化社会[1]。由于老龄化速度的加快,心力衰竭的长期管理是全球医疗保健的主要问题之一。慢性心力衰竭(CHF)作为各类型心脏疾病的终末阶段,在老年人中发病率很高,是导致高发病率和死亡率的重要来源。老年CHF病人容易反复发生心功能恶化或急性失代偿,且多合并衰弱、营养不良、肌少症等常见老年综合征,其心力衰竭进程也会因此而加速[2]。衰弱被定义为一种临床上可识别的、由于多个生理系统的储备和功能下降而增加的脆弱状态[3],它在很大程度上与年龄和多种疾病相关[4]。衰弱在CHF病人中很常见,约1/3的衰弱病人合并CHF,39%的CHF病人合并衰弱,但是衰弱与CHF之间的患病率也会随着研究人群的不同而有所差别[5]。衰弱显著影响CHF病人的预后,研究发现,CHF合并衰弱病人的全因死亡率和再住院率等不良预后指标均升高[6?7],其死亡和住院风险约增加了1.5倍[8?9]。由此可见,衰弱的早期评估和干预对减少不良临床结局和CHF管理非常重要。近年来,机器学习越来越多地融入临床实践,应用范围从临床前数据处理到病人分层和治疗决策[10],尤其在疾病诊断和预测方面优势显著。因此,本研究基于机器学习算法挖掘老年CHF病人衰弱发生的风险因素,并基于不同算法建立CHF病人衰弱风险预测模型,评价、比较各预测模型的效能,以筛选出最佳的预测模型,为临床老年CHF病人衰弱发生的精准预测提供新思路,为制定科学有效的干预措施提供科学依据。

1  对象与方法

1.1 研究对象

选取2023年1月—5月乌鲁木齐市某三级甲等医院心血管内科住院的423例CHF病人。纳入标准:年龄≥60岁;符合《中国心力衰竭诊断和治疗指南2018》[11]诊断标准;依据美国纽约心脏病学会(NYHA)分级为Ⅱ~Ⅳ级;意识清楚、能够理解指令,正常沟通;知情同意后自愿参加本研究。排除标准:合并严重肝肾功能不全、恶性肿瘤;严重精神疾病、严重痴呆病人;正参与其他临床试验的病人。

1.2 资料收集

基于本研究目的,综合相关文献,参考相关临床经验,结合病人信息的数据特点,收集以下数据:1)社会人口学资料,包括性别、年龄、身高、体重、文化程度、婚姻状况、吸烟史、饮酒史等;2)疾病用药相关因素,包括共病、多重耐药、过去1年跌倒史、血红蛋白、C反应蛋白、氨基末端脑钠肽前体(NT?proBNP)等;3)心脏B超相关检验指标,包括左心室射血分数、左房内径、主动脉内径、E/A比值等;4)结局指标,选用Fried衰弱量表[12]进行衰弱风险筛查和评估,包括行走速度下降、握力下降、体力活动下降、疲劳、不明原因的体重下降5项内容,每项计1分,共5分,得分0~2分为非衰弱,≥3分为衰弱,将病人分为衰弱组和非衰弱组。

1.3 数据预处理

根据相关专业知识删除重复特征并去除完全共线性特征,将缺失率超过20%的变量或者研究对象予以删除,对数据缺失率不足20%的变量加以填补。连续性变量使用均值方法进行填补,而分类变量使用随机插补法进行填补,对性别、文化程度、心功能分级等多分类变量进行独立编码,并采用线性函数归一化方法对数据集进行归一化处理,以保证后期分析中数据的一致性。

1.4 模型开发与验证

基于4种常见的机器学习算法构建模型,分别是逻辑回归(Logistic regression,LR)、决策树(decision tree,DT)、随机森林(random forest,RF)、支持向量机(support vector machines,SVM)。首先将数据集按照7∶3比例随机划分为训练集和测试集,训练集用于模型的构建,测试集用于模型的评估。本研究选取单因素分析方法筛选出差异有统计学意义的变量纳入 LR、DT、SVM、RF算法中,模型构建过程采用十折交叉验证(cross?validation,CV),即将训练集数据分成10等份,每份数据都在上述机器学习模型中进行训练和测试,每次选择其中1份作为验证集,剩余9份作为训练集,最终模型评估结果取10次训练结果的平均值,以更准确地评估模型的泛化性能。通过网格搜索(grid search)调整模型参数,不断对模型进行优化。模型性能的评估选用灵敏度、特异度、准确度、精确度、F1分数和受试者工作特征(ROC)曲线下面积(AUC)为评价指标。灵敏度是指阳性结果的真正阳性样本的比例,特异度是指阴性结果的真正阴性样本的比例,准确度衡量正确预测的百分比,精确度衡量所有正预测中真正正预测的百分比,F1分数是精确率和召回率的调和平均值,是平衡这两个指标之间权衡的有用指标。最终绘制4个模型ROC曲线,更加直观地显示各模型的AUC值差异。

1.5 统计学方法

基于IBM SPSS 26.0、python 3.8、开源的Anaconda 23.1.0发行版本、spyder 5.4.1版开发环境进行统计分析和建模。符合正态分布的定量资料以均数±标准差(x±s)表示,组间比较采用t检验;不符合正态分布的定量资料以中位数(四分位数)[M(P25,P75)]表示,组间比较采用非参数检验。定性资料采用例数、百分比(%)表示,组间比较采用χ2检验或Fisher精确概率法。以P<0.05为差异有统计学意义。

2  结果

2.1 两组病人一般资料比较

共纳入CHF病人423例,平均年龄为67岁,男290例,女133例,其中182例病人发生衰弱(衰弱组),241例病人未发生衰弱(非衰弱组),衰弱发生率为43%。衰弱组与非衰弱组一般资料比较见表 1。

2.2 特征变量重要性排序

选用RF模型对老年CHF病人衰弱发生的风险因素重要性进行排名,根据特征排序以及数值大小发现,血红蛋白、白细胞介素?6、白蛋白、营养不良、CCI、尿素、年龄等特征是CHF病人衰弱发生的重要危险因素。具体结果见图1。

2.3 各模型预测效能比较

基于LR、DT、SVM、RF分别建立了4种老年CHF病人衰弱风险预测模型,使用测试集进行内部验证得到各模型的预测效能,见表2,ROC曲线见图2。结果显示,LR、DT、SVM、RF模型的AUC值分别为0.917,0.863,0.941,0.952,其中RF模型的AUC值最高,DT模型的AUC值最低,LR、DT、SVM模型的特异度相等。此外,RF模型灵敏度、特异度、准确率、精确度、F1分数、AUC值均为最高,即整体的预测效能优于其他3种模型。

3  讨论

3.1 老年CHF病人衰弱患病率

衰弱是老年CHF中高度普遍的多系统综合征[13],显著增加CHF病人的不良健康结局[6]。研究显示,由于衰弱与心力衰竭的重叠机制特征,心力衰竭病人的衰弱概率约是无心力衰竭病人的3倍[5]。本研究中423例CHF病人有182例合并衰弱,衰弱患病率高达43%,与Denfeld等[14]研究结果相近。因此,临床医护人员应对CHF病人进行早期筛查,及时识别衰弱并积极采取相应措施进行个性化管理。

3.2 老年CHF病人衰弱风险预测模型的分析与比较

LR模型是目前临床上常用的模型,但对于多重共线性数据较为敏感,容易欠拟合,分类精度不高,且很难处理数据不平衡的问题。而机器学习算法具有处理医疗结构混杂、特征高维的大数据的能力,近年来,已被广泛应用于国内外医疗护理领域。传统的DT模型在单机情况下,无论是计算能力还是存储能力都有一定局限性。RF泛化能力强,能更好地避免过拟合现象。SVM将数据分成2个或多个类别,应用于复杂的数据类型中可避免出现过度拟合或局部极值现象。本研究应用以上4种算法构建老年CHF病人衰弱风险预测模型,结果显示,相比于LR、DT、SVM模型,RF模型的预测效能最佳,其灵敏度、特异度、准确度、精确度、F1分数、AUC值均为最高,可为临床早期筛查衰弱风险提供科学依据。张晗等[15]分别基于DT、LR、RF算法构建创伤性休克病人院内死亡预测模型中,横向对比发现RF模型的准确度及AUC值最高。本课题组成员认为RF模型最优的原因可能是,RF算法可以处理高维特征的数据,且不依赖特征选择[16],同时具有很强的抗干扰性,对于不平衡数据仍然可以维持较高的准确度[17]。

3.3 老年CHF病人衰弱发生的风险因素

本研究利用RF模型对纳入的特征进行重要性排序,进一步确定了血红蛋白、白细胞介素?6、白蛋白、营养不良、CCI、尿素、年龄等是影响CHF病人衰弱发生的因素。既往研究表明,营养状况不佳是CHF病人衰弱发生的重要危险因素,其病人生化指标如白蛋白、血红蛋白与衰弱呈负相关[18],本研究结论与之相近。营养不良可以导致衰弱,而衰弱本身也可以导致病人营养摄入不足,两者是互为因果的关系[19?20],提示老年CHF病人衰弱的营养状况评估以及个性化营养支持显得尤为重要。研究发现,各个年龄阶层的老年衰弱病人的白细胞介素?6、C?反应蛋白水平都会升高[21]。白细胞介素?6作为经典的炎症标志物,无论在心力衰竭还是衰弱的发生发展过程中均起一定作用。心力衰竭病人发病时低灌注、组织缺氧、细胞损伤,使其炎症反应上调;同时,白细胞介素?6的升高可能导致肌肉力量降低,运动能力下降,衰弱加重。由于虚弱和心力衰竭的重叠机制特征,白细胞介素?6对心力衰竭病人衰弱的作用机制需进一步探究。多病共存既是老年人发生衰弱的诱发因素,又是导致衰弱加重的重要原因[22]。研究表明,合并症负担对心力衰竭病人的不良临床结局有显著影响[23]。Pandey等[24]一项研究多变量分析也显示,合并症负担是衰弱的显著预测因子。虽然这些研究阐明了积极管理并发疾病的重要性,但心力衰竭和衰弱两种疾病之间的症状重叠,往往对传统的心力衰竭疗法耐受性较差[13]。因此,建立针对患有多种合并症的老年心力衰竭病人的管理策略是具有挑战性的。年龄已被多项研究证明是老年CHF病人衰弱发生的重要危险因素[25?27],随着年龄的增长,CHF病人更易合并衰弱。这可能与老年人的机体各组织器官趋于老化,各项生理功能逐渐退化,使其抵御外界应激源的能力减弱有关,医护人员应早期识别老年CHF合并衰弱病人,进而及早干预,延缓衰弱的发生发展。

4  小结

综上所述,本研究利用所收集临床数据的多个特征变量,基于LR、DT、SVM和RF机器学习算法分别构建了不同的老年CHF病人衰弱风险预测模型,其中RF模型的预测效能较好。该模型可以帮助医护人员早期识别老年CHF病人发生衰弱的潜在群体,并根据相关重要风险因素,制定科学有效的干预措施,延缓其衰弱的发生发展,减少不良健康结局的发生。但本研存在一定的局限性:首先,单中心研究存在地域局限性,推广性较弱,且未进行外部验证,之后将继续进行前瞻性的研究,进一步调整模型参数,提高模型性能;其次,本研究只对比了4种最为常用的算法所构建的模型,其他算法的效果有待进一步验证。

参考文献:

[1]  健康中国行动推进委员会.关于印发“十四五”健康老龄化规划的通知[EB/OL].[2023-06-11].https://baike.baidu.com.

Healthy China Action Promotion Committee.Notice on the issuance of the "14th Five-Year Plan" for healthy aging[EB/OL].[2023-06-11]. https://baike.baidu.com.

[2]  中华医学会老年医学分会心血管疾病学组.老年人慢性心力衰竭诊治中国专家共识(2021)[J].中华老年医学杂志,2021,40(5):550-561.

Cardiovascular Diseases Group,Geriatric Society of Chinese Medical Association.Chinese experts consensus on the diagnosis and treatment of chronic heart failure in the elderly[J].Chinese Journal of Geriatrics,2021,40(5):550-561.

[3]  XUE Q L.The frailty syndrome:definition and natural history[J].Clinics in Geriatric Medicine,2011,27(1):1-15.

[4]  ESPINOZA S E,QUIBEN M,HAZUDA H P.Distinguishing comorbidity,disability,and frailty[J].Current Geriatrics Reports,2018,7(4):201-209.

[5]  MARENGONI A,ZUCCHELLI A,VETRANO D L,et al.Heart failure,frailty,and pre-frailty:a systematic review and meta-analysis of observational studies[J].International Journal of Cardiology,2020,316:161-171.

[6]  SOYSAL P,ARIK F,SMITH L,et al.Inflammation,frailty and cardiovascular disease[J].Adv Exp Med Biol,2020,1216:55-64.

[7]  UCHIKADO Y,IKEDA Y,OHISHI M.Current understanding of the role of frailty in cardiovascular disease[J].Circulation Journal,2020,84(11):1903-1908.

[8]  MCALISTER F A,SAVU A,EZEKOWITZ J A,et al.The hospital frailty risk score in patients with heart failure is strongly associated with outcomes but less so with pharmacotherapy[J].Journal of Internal Medicine,2020,287(3):322-332.

[9]  YANG X B,LUP?N J,VID?N M T,et al.Impact of frailty on mortality and hospitalization in chronic heart failure:a systematic review and meta-analysis[J].Journal of the American Heart Association,2018,7(23):e008251.

[10]  VERMA A A,MURRAY J,GREINER R,et al.Implementing machine learning in medicine[J].Canadian Medical Association Journal,2021,193(34):E1351-E1357.

[11]  中华医学会心血管病学分会心力衰竭学组.中国心力衰竭诊断和治疗指南2018[J].中华心血管病杂志,2018,46(10):760-789.

Heart Failure Group, Society of Cardiology, Chinese Medical Association.China guidelines for diagnosis and treatment of heart failure 2018[J].Chinese Journal of Cardiology,2018,46(10):760-789.

[12]  FRIED L P,TANGEN C M,WALSTON J,et al.Frailty in older adults:evidence for a phenotype[J].The Journals of Gerontology:Series A,2001,56(3):M146-M157.

[13]  LADDU D R,OZEMEK C,SABBAHI A,et al.Prioritizing movement to address the frailty phenotype in heart failure[J].Progress in Cardiovascular Diseases,2021,67:26-32.

[14]  DENFELD Q E,WINTERS-STONE K,MUDD J O,et al.The prevalence of frailty in heart failure:a systematic review and meta-analysis[J].International Journal of Cardiology,2017,236:283-289.

[15]  张晗,张爱舷,罗嘉琪,等.基于机器学习的创伤性休克病人院内死亡预测模型研究[J].解放军医学院学报,2023,44(4):339-344;371.

ZHANG H,ZHANG A X,LUO J Q,et al.In-hospital mortality prediction model for patients with traumatic shock based on machine learning[J].Academic Journal of Chinese PLA Medical School,2023,44(4):339-344;371.

[16]  WANG F Y,WANG Y C,JI X K,et al.Effective macrosomia prediction using random forest algorithm[J].International Journal of Environmental Research and Public Health,2022,19(6):3245.

[17]  黄光成,周良,石建伟,等.机器学习算法在疾病风险预测中的应用与比较[J].中国卫生资源,2020,23(4):432-436.

HUANG G C,ZHOU L,SHI J W,et al.Application and comparison of machine learning algorithms in disease risk prediction[J].Chinese Health Resources,2020,23(4):432-436.

[18]  江恒,夏丽莉,刘滢.老年慢性心力衰竭病人衰弱相关因素分析[J].实用老年医学,2020,34(6):597-600.

JIANG H,XIA L L,LIU Y.Analysis of frailty-related factors in elderly patients with chronic heart failure[J].Practical Geriatrics,2020,34(6):597-600.

[19]  LAUR C V,MCNICHOLL T,VALAITIS R,et al.Malnutrition or frailty? Overlap and evidence gaps in the diagnosis and treatment of frailty and malnutrition[J].Physiologie Appliquee,Nutrition et Metabolisme,2017,42(5):449-458.

[20]  姜珍,李结华,蒋品.常见血清学指标及衰弱评分对老年慢性心力衰竭病人的临床意义[J].心脑血管病防治,2022,22(4):83-85;89.

JIANG Z,LI J H,JIANG P.Clinical significance of common serological indexes and weakness score in elderly patients with chronic heart failure[J].Cardio-Cerebrovascular Disease Prevention and Treatment,2022,22(4):83-85;89.

[21]  VELISSARIS D,PANTZARIS N,KONIARI I,et al.C-reactive protein and frailty in the elderly:a literature review[J].Journal of Clinical Medicine Research,2017,9(6):461-465.

[22]  李雪嘉,杨开庆,黎伟娟,等.中国老年住院病人衰弱影响因素的Meta分析[J].老年医学研究,2023,4(2):1-6.

LI X J,YANG K Q,LI W J,et al.Factors influencing of frailty in elderly inpatients in China:a meta-analysis[J].Geriatrics Research,2023,4(2):1-6.

[23]  ATHER S,CHAN W,BOZKURT B,et al.Impact of noncardiac comorbidities on morbidity and mortality in a predominantly male population with heart failure and preserved versus reduced ejection fraction[J].Journal of the American College of Cardiology,2012,59(11):998-1005.

[24]  PANDEY A,KITZMAN D,WHELLAN D J,et al.Frailty among older decompensated heart failure patients:prevalence,association with patient-centered outcomes,and efficient detection methods[J].JACC Heart Failure,2019,7(12):1079-1088.

[25]  SZE S,PELLICORI P,ZHANG J F,et al.Identification of frailty in chronic heart failure[J].JACC Heart Failure,2019,7(4):291-302.

[26]  巩静文.老年慢性心力衰竭住院病人衰弱的影响因素分析[D].贵阳:贵州医科大学,2022.

GONG J W.The influencing factors analysis of frailty in hospitalized elderly patients with chronic heart failure[D].Guiyang:Guizhou Medical University,2022.

[27]  顾怡沁.基于营养指标构建慢性心力衰竭病人的衰弱风险预测模型研究[D].南京:南京中医药大学,2022.

GU Y Q.Development of a diagnostic model focusing on nutritional indicators for frailty classification in people with chronic heart failure[D].Nanjing:Nanjing University of Chinese Medicine,2022.

(收稿日期:2023-07-03;修回日期:2024-06-03)

(本文编辑 苏琳)

猜你喜欢
预测模型机器学习慢性心力衰竭
基于神经网络的北京市房价预测研究
商情(2016年43期)2016-12-23 14:23:13
中国石化J分公司油气开发投资分析与预测模型研究
经济师(2016年10期)2016-12-03 22:27:54
基于机器学习的图像特征提取技术在图像版权保护中的应用
40例慢性心力衰竭住院患者下呼吸道感染临床分析
阿托伐他汀联合中医中药改善慢性心力衰竭预后的临床观察
基于网络搜索数据的平遥旅游客流量预测分析
时代金融(2016年27期)2016-11-25 17:51:36
前缀字母为特征在维吾尔语文本情感分类中的研究
科教导刊(2016年26期)2016-11-15 20:19:33
基于支持向量机的金融数据分析研究
基于IOWHA法的物流需求组合改善与预测模型构建
基于预测模型加扰动控制的最大功率点跟踪研究
科技视界(2016年1期)2016-03-30 13:37:45