急性心肌梗死病人再入院风险预测模型的方法学应用现状

2023-10-04 22:32:16邢文惠朴京京谷岩梅
护理研究 2023年17期
关键词:机器入院病人

邢文惠,李 琪,朴京京,谷岩梅

河北中医药大学护理学院,河北 050000

急性心肌梗死(acute myocardial infarction,AMI)具有高复发的特点[1],超过25%的病人在AMI 后出现再次入院[2]。在美国,近20%的医疗保险受益人AMI后30 d 再入院,平均每年AMI 病人再入院的医疗费用超过10 亿美元[3]。有研究显示,AMI 病人第1 次再入院的住院时间为(26.3±25.5)d[4],30 d 再入院率与病人的住院死亡率存在显著关联[5]。AMI 病人再入院风险预测模型有助于准确评估高风险人群,采取干预措施降低AMI 病人再入院率[6]。现对国内外AMI 病人再入院风险模型的方法学进行综述,旨在为我国临床构建风险预测模型提供理论依据。

1 国外心肌梗死再入院研究

常用的构建风险预测模型的方法有Logistic 回归、Cox 比例风险回归分析、机器学习等[7]。随着机器学习技术不断提高,电子病历逐渐应用于临床风险预测。现有研究中,美国学者进行的模型构建研究最多,韩国、印度、加拿大等国家也有学者构建了多因素风险预测模型[8-10]。

1.1 Logistic 回归模型

Logistic 回归模型可用于筛选危险因素、预测疾病的发生与预后,该模型不仅能控制混杂因素,还能对危险因素与结局事件做出定量描述[7],实际中二分类Logistic最常用,由于其操作简便、预测准确性较高,目前已被广泛应用于AMI 病人再入院风险预测模型中。John等[11]将美国94 家医院的3 006 例年龄≥75 岁AMI 病人按2∶1 分为衍生队列和对照队列,使用Bayesian 法与多变量Logistic 回归建立老年AMI 病人30 d 再入院风险模型,最终纳入功能活动度、射血分数、慢性阻塞性肺疾病(COPD)、心律失常、急性肾损伤、首次舒张压、P2Y12 抑制剂使用、一般健康状况共8 个预测因子,首次将功能性活动度纳入再入院风险模型。数据演算模型C 统计值为0.65,具有较好的区分度。然而,仅依据纳入的病人水平特征不能充分预测再入院风险,还需纳入病人层面特征以外的因素。2021 年,John 等[12]在先前的研究基础上将病人自我报告的健康状况纳入研究,用相同队列与方法建立了老年AMI 病人180 d 再入院风险模型,该模型包括功能性移动与自我健康状况两个有力指标,且模型C 统计值为0.68,可以提供短中期的风险预测,由于模型缺少外部验证,限制了其推广应用。

近年来,医疗信息系统的不断发展为临床研究积累了大量电子病历,随着数据分析方法愈发成熟,基于电子健康记录的研究受到广泛关注。Nguyen 等[3]对得克萨斯州6 家医院的826 例AMI 住院病人的电子健康记录进行分析,采用多变量Logistic 回归分别建立“第1 天”和“全住院”AMI 模型进行再入院风险预测,第1天AMI 模型使用了住院前24 h 的数据,而全住院AMI模型包含整个住院期间的数据。第1 天AMI 模型包括肾功能、脑利钠肽升高、年龄、糖尿病、女性、及时经皮冠状动脉介入治疗和低收缩压7 个预测因素,C 统计值为0.73 且校正良好。全住院AMI 模型在此基础上增加静脉利尿剂的使用、出院时贫血状态和出院后急性护理3 个额外预测因素,其C 统计值为0.75,模型性能较好。但是该模型尚未在单独队列中进行外部验证,临床有效性有待验证。

Dannis 等[10]使用Logistic 回归模型来估计AMI 病人再入院情况,在国家健康信息数据库中选取153 523例AMI 病人,以30 d 内出现AMI 再入院为结果,纳入人口统计学资料、临床表现、共病及共病评分等13 个变量建立了适用于加拿大人口的30 d 再入院风险模型,模型C 统计值0.679,具有较好的识别能力。Ansari等[9]对印度三级护理机构的2 849 例AMI 病人医疗健康记录进行回顾性研究,使用正规化的弹性网Logistic回归预测电子病例(EMR)与国际疾病分类(ICD)-10诊断、入院、病理、程序和用药数据对180 d 再入院的影响,分为全特征、未服药和全特征的糖尿病病人3 个特征组,对不同特征组分别建模进行性能比较,结果显示各模型性能为0.61~0.69,特征组为糖尿病病人的模型鉴别效果略好,表明添加共病指标可能会提高模型性能。

以上基于电子健康病历的风险预测模型对数据提取与分析能力要求较高,在一定程度上限制了其推广。根据上述研究可知,Logistic 回归简单高效,对模型的解释性好,然而在处理详细临床数据的危险因素之间非线性或多重共线性问题,回归方法表现并不突出。

1.2 Cox 比例风险回归模型

Cox 比例风险回归模型在医学研究中常用于调查结局事件或生存时间与1 个或多个预测变量之间的关系,该模型可描述不随时间变化的多个特征及其相互作用对某一时刻死亡率或发病率的影响。自变量可以为定量资料也可为分类资料,且不要求估计资料的生存分布类型,已被应用于随访队列研究中[13]。Vinay等[13]通过医疗保险受益人的信息登记,将86 849 例出院诊断为AMI 病人的年龄、第1 次接触医疗时心脏情况、病史和危险因素纳入研究,运用Cox 比例风险回归建立AMI 病人90 d 再入院风险预测模型,结果表明,老年、糖尿病、心力衰竭史是再入院的主要影响因素,该模型C 统计值为0.662,且校准良好,故该模型鉴别能力较好。然而,Vinay 等[13]仅纳入65 岁以上的病人,数据仅来源于定点医院的登记信息且只考虑了第1 次再入院的情况,这些因素均限制了模型的推广性和准确性。因此,AMI 病人90 d 再入院风险预测模型还需进一步外部验证。Noringriis 等[14]使用Cox 比例风险回归模型探究机械不同步对ST 段抬高型的心肌梗死(STEMI)病人心力衰竭病人再入院的作用,研究对象为哥本哈根大学托尔特医院接受了前瞻性登记的373 例被诊断为STEMI 且接受了经皮冠状动脉介入术(PCI)治疗的病人,结果表明纵向应变峰时间标准差是预测STEMI病人心力衰竭再入院的显著预测因子。Logistic 回归模型和Cox 比例风险回归模型均为多因素分析模型,当结局变量是时间和二分类资料时优先考虑Cox 回归模型,该模型的局限性在于分析过多截尾数据容易影响结果的准确性[15]。

1.3 机器学习

机器学习作为人工智能在医疗领域的关键技术,受到广泛关注。机器学习可以最大限度提高整合数据性能,与传统模型相比,机器学习可以精确识别高风险人群及相关危险因素,及时采取干预措施并优化医疗资源的分配。

目前,在AMI 病人再入院风险预测中应用较多的传统机器学习算法有逻辑回归、贝叶斯、支持向量机、随机森林、梯度增强和深度神经网络等[16]。2019 年,Gupta 等[16]以图表形式常规收集AMI 病人30 d 再入院的临床数据,对以上6 种机器学习方法进行了评估,使用C 统计值和Brier 评分分别表示模型鉴别能力和性能。结果显示,所有30 d 再入院机器学习模型表现相似,C 统计值为0.63~0.64,鉴别能力中等。Sung 等[17]通过文献检索的形式,对机器学习与传统统计模型进行比较,纳入的机器学习有人工神经网络、随机森林、决策树、支持向量机和贝叶斯技术,结果显示,机器学习算法表现出了更好的鉴别能力。

机器学习根据有无特定的目标函数形式可分为参数模型和非参数模型,非参数模型表现较好[18]。2021年,Matheny 等[18]基于电子健康记录比较机器学习中参数模型与非参数模型在风险预测方面的效能,参数模型选择弹性网、最小绝对收缩和选择算子和岭回归,非参数模型选择随机森林与梯度提升,指出非参数模型性能要优于参数模型(C 统计值分别为0.686~0.704和0.686~0.695)并选择最小绝对收缩和选择算子作为最佳模型。基于上述研究可知,现存的机器学习算法可以基本满足风险预测的需要,其中非参数机器学习算法性能最佳。然而,数据源对机器学习的影响巨大,未来还需进一步提高对数据的提取与分析能力。

深度学习是更为复杂的一种学习算法,在海量数据分类情况下比机器学习更为出色。Brett 等[19]使用量化的深度神经网络对Premier Healthcare Database(PHD)数据库中1.15 亿例住院病人信息进行推理建模,将数据按8∶1∶1 随机分为训练集、验证集和测试集,其再入院预测模型的受试者工作特征曲线下面积(AUC)为0.71。Bat-Erdene 等[20]使用深度学习算法收集韩国52 家医院数据,建立AMI 病人不同随访时间的再入院模型,并与传统机器学习算法进行比较,该模型的AUC 为0.99,表明深度学习优于传统机器学习。深度学习可以在大样本数据中找寻不同变量间的非线性关系,然而深度学习的过程是未知的,且大量的数据需要多机构数据互通,限制了深度学习的临床应用[21]。

1.4 LACE 指数

LACE 指数通常被用于内科疾病的风险分层,该模型指标包括住院时间(L)、入院的灵敏度(A)、病人的共病(C)和入院前6 个月的急诊科就诊次数(E),西方国家常用LACE 指数作为预测30 d 再入院风险模型[22],其分值区间为0~19 分,>10 分则被认为30 d 再入院高风险。Vasuki 等[22]对韩国3 607 例病人的电子健康档案数据进行回顾性队列研究,使用多因素Logistic回归分析确定指数相关性及风险预测能力,结果表明,LACE 指数具有良好鉴别能力,可用于预测30 d 再入院 风 险。随 后,Vasuk 等[8]对LACE 指 数 与30 d 再 入 院数据进行了Kaplan-Meier 生存分析,结果表明,不同LACE 变量之间的相关性可以作为30 d 内发生再入院的依据,由于模型缺少外部验证,尚不能推广至其他地区。

2 国内AMI 再入院研究

我国AMI 病人30 d 再入院率为6.3%[23],及时的风险预测是降低AMI 再入院率的有效途径。我国关于AMI 再入院风险预测模型的研究较少,学者大多基于传统的Logistic 回归与Cox 比例风险回归统计模型进行研究,电子病历数据与机器学习技术的临床风险预测较少。

2.1 Logistic 回归模型

随着建模方法的不断进步,我国越来越多的学者致力于构建适合我国人群的AMI 风险预测模型。庞琳琳等[7]将中医症候及要素与病症相结合,基于Logistic多因素分析构建了STEMI 病症结合风险预测模型。迪力夏提·吾布力等[24]从吉林大学第一医院心血管数据库选取167 例确诊为STEMI 后心脏破裂的病人,运用单因素分析和二元Logistic 回归建立风险模型以预测病人再入院风险,模型AUC 为0.771,具有较好区分度,该模型将既往脑卒中病史、年龄大、女性、此次入院未行PCI、入院时Killip 分级Ⅲ级或Ⅳ级列为独立危险因素。张萌等[25]采用多因素Logistic 回归分析247 例AMI 病人经PCI 术后1 年再入院的影响因素,以列线图形式展示,结果显示,年龄、糖尿病、总胆固醇、三酰甘油为独立影响因素,模型AUC 为0.843,接近理想曲线。王欲清等[1]基于电子病历系统便利抽样收集了270 例AMI 病人资料,应用Logistic 筛选再入院的影响因素并构建风险预测模型,独立影响因素包括吸烟史、高血压、婚姻状况、住院时间、既往PCI 史和合并心力衰竭史,模型的AUC 为0.840。由于以上研究的样本量较少,且均未进行外部验证,其结果可能存在偏倚。

2.2 Cox 比例风险回归模型

为帮助中国医生识别高风险病人,Li 等[23]从中国53 所不同地理位置的医院,收集AMI 病人的人口学、临床特征和社会经济学等数据,运用Cox 比例风险回归构建了30 d 再入院风险预测模型,模型内部验证结果C 统计值为0.72,研究表明住院期间病情严重度、急性疾病和血管重建的标志物与30 d 的非计划再入院相关。由于中国缺乏国家级相关数据库,数据来源受限,限制了其预测的准确性。

2.3 机器学习

由于目前尚未有各方面性能表现均稳定的模型,Zhang 等[26]提出一种堆叠模型(stacking),并与其他机器学习模型进行比较。stacking 是一种性能强大的集成机器学习方法,它使用了多个机器学习的特征结果训练出一个新的模型。Zhang 等[26]将四川华西医院3 283 例AMI 病人的人口学资料、住院情况、用药史、既往史、并发症、实验室检查等作为变量纳入模型训练,结果表明该模型在各评价指标上表现较好,其中AUC 最高为0.720。因此,stacking 模型能够整合不同模型的优势以提高预测性能。但是,机器学习算法复杂,如何根据临床实际情况和人群特征选择最佳预测模型,仍需进一步研究。

综上所述,国内AMI 再入院风险预测模型已有一定的研究基础,但是临床泛化性略有欠缺,在继续开发不同危险因素与结局事件的再入院风险模型的同时,也要重视模型的外部验证。其次,新兴的机器学习技术在我国应用较少,未来应积极研究基于大数据的风险预测技术。

3 AMI 病人再入院风险预测模型的比较分析

对AMI 后病人再入院风险进行预测和评估,并依据其风险进行个体化干预对AMI 病人预后改善有重要意义。本研究归纳总结了目前研究中广泛使用的再入院风险预测模型,不论是线性回归模型还是机器学习模型,其表现均未达到很高的预测精度,提示以后再入院风险模型构建研究还有广泛空间。

Logistic 回归是概率模型,可以对因变量预测分类,在疾病诊断方面广泛应用。然而很多模型在大样本训练时表现并不好,这是由于模型出现了过拟合的现象,因此需要调整参数以防止模型过度依赖训练集的数据,常用正则化避免逻辑回归过拟合这一趋势[27]。Cox 比例风险回归作为一种半参数回归模型,广泛用于医学研究中,当结局变量是时间和二分类资料时Cox 回归表现要优于Logistic 回归,然而Cox 回归对协变量的纳入并不严格,且该模型亦分析了过多的截尾数据,因此难以实现对风险的有效预测。

回归模型存在诸多局限性,近年来机器学习方法作为一种有前景的技术,从机器学习模型不断发展到深度学习模型,提示使用机器学习方法可能会提高预测和评估的准确性和时效性。相比传统的预测方法,基于结构化电子病历的机器学习预测方法准确率更高,但目前仍缺乏非结构化数据的AMI 病人再入院风险的预测,未来机器学习结合非结构化数据可能会进一步提升预测模型准确性。

有研究表明,深度学习模型优于机器学习[16],然而国外深度学习模型大多用于AMI 早期诊断,基于深度学习模型的再入院风险预测很少。此外,机器学习中单一分类器的预测性能往往具有局限性,集成模型为心血管疾病风险预测提供了新思路,未来可以尝试集合方法来建立更多层次的结构,以提升模型分类精确度。

4 小结

AMI 是全球性的健康问题,AMI 病人再入院风险预测模型对于及早识别危险人群,制定妥善可行的干预措施,促进病人健康具有重要作用。国外Logistic回归模型、Cox 比例风险回归模型、机器学习技术的研究日趋成熟,大多数模型因为缺乏外部验证或作为单中心研究导致鉴别能力受限,目前尚无能有效预测再入院率的风险预测模型[28]。国内对于机器学习技术构建AMI 病人再入院风险预测模型的探索仍处于初级阶段,未来在基于大数据分析的模型构建方面仍需努力。

猜你喜欢
机器入院病人
机器狗
环球时报(2022-07-13)2022-07-13 17:18:39
谁是病人
机器狗
环球时报(2022-03-14)2022-03-14 18:19:44
住院医师入院教育实践与效果探索
未来机器城
电影(2018年8期)2018-09-21 08:00:06
作文门诊室
作文门诊室
病人膏育
故事大王(2016年4期)2016-05-14 18:00:08
作文门诊室
无敌机器蛛