Construction of a risk prediction model for ventilator⁃associated pneumonia caused by carbapenem resistant Acinetobacter baumannii based on random forest model
Abstract" Objective:To analyze the risk factors for ventilator⁃associated pneumonia caused by carbapenem⁃resistant Acinetobacter baumannii(CRAB).Random forest model and Logistic regression two methods were used to construct prediction models,to provide theoretical basis for ICU to reduce the risk of CRAB ventilators associated pneumonia.Methods:A total of 291 patients with ventilators associated pneumonia admitted to ICU from January 2018 to December 2022 were selected as the study subjects.The influencing factors of CRAB ventilators associated pneumonia were analyzed.The predictive model was constructed based on random forest model and Logistic regression,and the operating characteristic curve(ROC) and area under the curve(AUC) were calculated to compare the differences between the two models.Results:Multivariate analysis results showed that oxygenation index,tracheotomy and coma were independent influencing factors of CRAB ventilator⁃associated pneumonia.The AUC of the random forest model was 0.78,and the AUC of the Logistic regression model was 0.61.The accuracy(77.97%),sensitivity(85.37%),and specificity(61.11%) of the random forest model were higher than those of the Logistic regression model(66.10%,73.17%,50.00%).Conclusion:Oxygenation index,duration of antibiotic use,tracheotomy and coma are risk factors for CRAB ventilator⁃associated pneumonia.The random forest prediction model outperforms the Logistic regression model in predicting CRAB ventilator⁃associated pneumonia.
Keywords" carbapenem resistant Acinetobacter baumannii; ventilator⁃associated pneumonia, VAP; influencing factors; random forest; Logistic regression; prediction model
摘要" 目的:分析耐碳青霉烯类鲍曼不动杆菌(CRAB)性呼吸机相关性肺炎发生的风险因素,并采用随机森林模型和Logistic回归两种方法构建预测模型,为重症监护室降低CRAB性呼吸机相关性肺炎的发生风险提供理论依据。方法:选取2018年1月—2022年12月我院重症监护室收治的291例呼吸机相关性肺炎病人为研究对象,分析CRAB性呼吸机相关性肺炎的影响因素,基于随机森林模型和Logistic回归构建预测模型,计算受试者工作特征曲线(ROC)和曲线下面积(AUC),比较两种模型的差异。结果:多因素分析结果显示,氧合指数、气管切开、昏迷是CRAB性呼吸机相关性肺炎的独立影响因素。随机森林模型的AUC为0.78,Logistic回归模型AUC为0.61,随机森林模型的准确率(77.97%)、灵敏度(85.37%)、特异度(61.11%)均高于Logistic回归模型(66.10%、73.17%、50.00%)。结论:氧合指数、抗菌药物使用时间、气管切开、昏迷是CRAB性呼吸机相关性肺炎的高危风险因素,随机森林模型对CRAB性呼吸机相关性肺炎的预测性能优于Logistic回归模型。
关键词" 耐碳青霉烯类鲍曼不动杆菌;呼吸机相关性肺炎;影响因素;随机森林;Logistic回归;预测模型
doi:10.12102/j.issn.1009-6493.2024.19.005
耐碳青霉烯类鲍曼不动杆菌(CRAB)的临床检出率不断攀升[1]。2023年CHINET中国细菌耐药监测结果显示,鲍曼不动杆菌对碳青霉烯类的耐药率已超过70%[2]。CRAB具有快速获得和传播耐药性的能力[3],在重症监护室内检出率明显高于院内其他区域,而CRAB引起的呼吸机相关性肺炎(VAP)发生率也在逐年升高,重症监护室病人更容易引起感染,感染后不仅延长病人治疗时间,增加治疗费用,还会影响其预后,甚至导致病人死亡[4]。因此,建立预测CRAB性呼吸机相关性肺炎的预警模型在临床上具有重要的意义,可以早期预测发生风险,采取干预措施,为医院感染防控提供决策支持。随着人工智能在医学领域的不断发展,随机森林模型已广泛应用于疾病的风险预测,可高效处理混杂和高维度的数据,避免过度拟合[5]。本研究回顾性收集发生呼吸机相关性肺炎的重症监护室病人的临床资料,运用随机森林模型对CRAB性呼吸机相关性肺炎的发生风险进行预测,并与传统Logistic回归模型对比,旨在探索性能更优的预测模型,为指导临床预防和控制CRAB性呼吸机相关性肺炎提供参考依据。
1" 资料与方法
1.1 资料
选取2018年1月—2022年12月我院重症监护室收治的291例呼吸机相关性肺炎病人为研究对象。根据是否为CRAB性呼吸机相关性肺炎分为CRAB组和非CRAB组。纳入标准:1)符合《呼吸机相关性肺炎诊断、预防和治疗指南(2013)》[6]中呼吸机相关性肺炎诊断标准,即气管插管或气管切开病人接受机械通气48 h后发生的肺炎,机械通气撤机、拔管后48 h内出现的肺炎;2)符合《医院感染诊断标准(试行)》[7],确认为医院感染;3)病历资料和检验结果完整、可查询;4)送检标本合格,经细菌学培养、分离鉴定。排除标准:入院前已有定植菌。本研究已获山西医科大学第一医院伦理委员会批准,批准号:NO.KYLI⁃2024⁃113。
1.2 研究方法
1.2.1 临床资料收集
采用回顾性研究,通过医院感染实时监控系统(RT⁃NISS)以及电子病历系统(EMR)收集病人信息。1)基本资料:年龄、性别、既往疾病;2)住院相关信息:呼吸机相关性肺炎发生前入重症监护室时间、机械通气时间、通气后48 h体温、是否昏迷、是否有菌血症和脓毒血症;3)抗菌药物使用情况:糖肽类药物使用史、喹诺酮类药物使用史、内酰胺类药物使用史、氨基糖苷类药物使用史、联用抗生素≥2种、抗菌药物使用时间;4)有创操作:气管切开、中心静脉插管时间及次数、二次插管;5)实验室检查指标:白细胞计数、氧合指数(PiO2/FiO2)等。如病人数据存在判别争议,通过请教医院感染专家和临床专家,同时查阅相关资料后,最终决定纳入或排除。
1.2.2 统计学方法
将收集的数据录入Excle软件,使用IBM⁃SPSS 27.0进行数据统计分析。符合正态分布的定量资料以均数标准差(x±s)表示,采用独立样本t检验;不符合正态分布的定量资料以中位数(四分位数)[M(P25,P75)]表示,采用Mann⁃Whitney秩和检验。定性资料以例数、百分比(%)表示,采用χ2检验及Fisher确切概率法。将单因素分析中有统计学意义的变量纳入多因素分析,并构建Logistic回归模型。基于Python 3.8,采用Sklearn包将数据按8∶2比例分为训练集和测试集,训练集232例,测试集59例;采用LR模型对Logistic回归数据进行运算,并使用NumPy库和Pandas库进行管理。借助随机森林(random forest,RF)Bootstrap抽样的方法随机选择某些变量,根据大多数决策进行分类,通过自适应增强算法(adaptive boosting,AdaBoost)构建模型。计算受试者工作特征(ROC)和曲线下面积(AUC)评估随机森林模型和Logistic回归模型的区分度,并采用灵敏度、特异度、准确性、阳性预测值、阴性预测值对模型进行比较。
2" 结果
2.1 CRAB性呼吸机相关性肺炎影响因素的单因素分析
共纳入291例病人,CRAB组185例,非CRAB组106例。单因素分析结果显示,两组抗菌药物使用时间、肺基础疾病、心血管疾病、肾功能不全、昏迷、气管切开、氧合指数差异有统计学意义(Plt;0.05)。详见表1。
2.2 CRAB性呼吸机相关性肺炎预测模型的构建
2.2.1 Logistic回归模型
将单因素分析中有统计学意义(Plt;0.05)的指标,如气管切开、心血管疾病、肺基础疾病、肾功能不全、昏迷、氧合指数、抗菌药物使用时间作为自变量,变量赋值方式见表2,采用向后逐步回归分析构建Logistic回归模型,结果显示,氧合指数、气管切开、昏迷是CRAB性呼吸机相关性肺炎的独立影响因素(Plt;0.05),CRAB性呼吸机相关性肺炎危险因素Logistic回归分析结果见表3。
2.2.2 随机森林模型
采用Python语言进行随机森林模型拟合,首先将训练集数据导入进行模型训练,利用梯度提升法对模型参数进行调优,当随机森林的子树棵数“n_estimators”取值为50时,均方差最小,决策树继续增加时误差逐渐增大,故设置树棵数为50,完成模型的构建。随机森林中各变量重要性由高到低排序为:氧合指数、抗菌药物使用时间、气管切开、昏迷、肺基础疾病、心血管疾病、肾功能不全。详见图1。
2.3 2种CRAB性呼吸机相关性肺炎模型预测性能
采用测试集数据比较2种模型对于CRAB性呼吸机相关性肺炎的预测效果。随机森林模型的准确率(77.97%)、灵敏度(85.37%)、特异度(61.11%)均高于Logistic回归模型(66.10%、73.17%、50.00%)。详见表4。随机森林的AUC为0.78,Logistic回归模型AUC为0.61。详见图2。
3" 讨论
重症监护室中的呼吸机相关性肺炎是一种复杂的、多方面的临床疾病,具有高发病率(4%~61%)、高死亡率(40%~43%)、预后差、治疗费用高等特点[8⁃11]。以重症监护室病人为研究对象,开展呼吸机相关性肺炎的影响因素和预测模型构建的研究较多,但关于CRAB性呼吸机相关性肺炎的相关研究较缺乏,本研究旨在探究CRAB性呼吸机相关性肺炎的高危风险因素,并基于随机森林模型和传统Logistic回归模型的构建预测发生风险。对早期发现高危病人并及时采取干预措施,为减少呼吸机相关性肺炎发生风险提供一定的参考价值。根据随机森林模型的构建发现CRAB性呼吸机相关性肺炎的重要危险因素包括氧合指数、抗生素使用时间、气管切开和昏迷,其中氧合指数、气管切开、昏迷是其独立影响因素。
3.1 CRAB性呼吸机相关性肺炎危险因素
3.1.1 氧合指数
氧合指数是肺功能的一个评价指标,可用来衡量肺损伤的程度。呼吸机相关性肺炎被认为是急性呼吸窘迫综合征(ARDS)的常见并发症[12],从急性呼吸窘迫综合征病人肺部提取的肺泡巨噬细胞和中性粒细胞,在细菌产物离体刺激后,其吞噬功能受损或最大活性降低;再者,急性呼吸窘迫综合征病人需要比其他病人更长时间的机械通气,从而增加了呼吸机相关性肺炎发生的风险[13⁃14]。重症监护室病人情况危重,基础情况差,咳嗽、咳痰能力进行性减弱,且痰液多黏稠,不利于痰液的排出,从而加剧了病人阻塞气道的程度。病人处于缺氧状态下,肺细胞的周期性伸展诱导环境酸化,促进细菌生长[15],肺泡巨噬细胞和中性粒细胞减少细菌的吞噬和杀伤[16⁃18],从而影响肺和全身的抗菌防御能力,增加了发生呼吸机相关性肺炎发生风险。另外,鲍曼不动杆菌、铜绿假单胞菌、金黄色葡萄球菌等可在呼吸道管壁上形成生物膜,导致病原体难以被清除。尤其是鲍曼不动杆菌形成的生物膜,具有很强的耐药性[19],在重症监护室环境中更容易引起耐CRAB性呼吸机相关性肺炎的发生。以氧合指数作为监测指标,及时纠正呼吸衰竭,避免病情恶化,可有效减少CRAB性呼吸机相关性肺炎的发生。因此,氧合指数的降低可作为早期识别重症监护室病人是否具有CRAB性呼吸机相关性肺炎的提示指标,辅助临床医务人员及时采取有效干预措施。
3.1.2 抗菌药物使用时间及气管切开
鲍曼不动杆菌对环境适应能力极强,对消毒剂在一定程度上具有抑制作用,重症监护室病人通常使用长时间的抗生素,往往会改变正常微生物的感染,导致耐药菌的出现[20⁃21]。耐药菌在人体内定植,易造成菌群失调,为耐药菌入侵提供便利。另外,CRAB在重症监护室中检出率高达40%以上,并且病人在接受有创操作时,面临更大的感染风险,如暴露时间较长、无菌操作欠规范等。研究显示,气管切开是呼吸机相关性肺炎的预测因素,肺部感染的风险增加近3倍[22]。方金林等[23]研究表明,重症监护室气管切开病人呼吸机相关性肺炎发生率是非气管切开病人的5.89倍。气管切开损伤气管上皮细胞、破坏呼吸系统的生理屏障,降低了其防御功能,加上气道暴露,切口易被污染等高风险因素的存在,使得CRAB持久定植和繁殖,感染风险随之增加[24]。因此,在临床工作中谨慎选择抗生素的使用,避免长时间或频繁使用;重点关注需要气管切开的病人,通过规范无菌操作流程、环境清洁消毒、有效隔离防护等有效措施的实施,降低气管切开病人CRAB性呼吸机相关性肺炎的发生率。
3.1.3 昏迷
重症监护室内昏迷病人容易引起胃内容物和口咽部分泌物的反流,从而造成误吸。误吸病人口咽部有大量细菌存在,尤其是进行有创操作的病人,因气道、口咽黏膜损伤,致使细菌大量繁殖,为其进入下呼吸道提供了条件。另外,昏迷病人咳嗽反射能力降低,无法自主咳痰而易引起痰液的反流,从而增加了感染的风险。蔡晓蕾等[25]研究表明,重症监护室昏迷病人迟发型呼吸机相关性肺炎的主要感染路径为气管导管套囊和呼吸机冷凝水。对于昏迷病人应重点关注病人自身情况、呼吸管路的清洁管理以及周围环境中存在的风险,采取严格的消毒措施。有效的隔离防护措施是切断CRAB的传播途径,能有效减少昏迷病人CRAB性呼吸机相关性肺炎的发生。
3.2 2种模型CRAB性呼吸机相关性肺炎预测性能比较
CRAB性呼吸机相关性肺炎极易对重症监护室病人造成严重的后果,给医院造成不必要的经济损失,构建预测CRAB性呼吸机相关性肺炎的模型具有重要意义。随机森林作为机器学习的一种,具有不易受变量共线性影响、运行稳健、不存在拟合等优势,可将各自变量对因变量预测的重要性进行展示,生成重要性评价排序结果,为后续临床决策提供参考依据[26⁃27]。对比两种预测模型,随机森林模型的AUC为0.78,相比于Logistic模型(0.61)来说,拟合度有较大提升,可以更好地预测CRAB性呼吸机相关性肺炎。随机森林模型的准确度为77.97%,较Logistic模型(66.10%)有大幅提高。随机森林模型的灵敏度为85.37%,高于Logistic模型(73.71%),有利于早期更精准地发现高危病人;但该模型特异度较低,为61.11%,可能存在误判病情的情况。总体来看,随机森林模型因其采用更为先进的机器学习算法,更准确、便捷,较传统Logistic回归模型具有更佳的预测性能。
4" 小结
综上所述,本研究通过随机森林模型和Logistic模型的构建,发现基于机器学习的随机森林模型的预测灵敏度明显高于Logistic模型,模型辨别能力的增强意味着更多CRAB性呼吸机相关性肺炎病人可以早期被识别,为重症监护室医护人员及时采取预防和控制措施提供依据。临床医护人员通过对风险因素的干预,可以有效降低CRAB性呼吸机相关性肺炎的发生率,改善病人预后,减少医院不必要的经济支出。但本研究属于单中心回顾性研究,样本量较小,可能存在一定的偏倚。未来可以尝试采用多中心、大样本的研究,利用深度学习模型,进一步提高CRAB性呼吸机相关性肺炎的预测准确率。
参考文献:
[1]" ZHAO Y X,HU K W,ZHANG J S,et al.Outbreak of carbapenem-resistant Acinetobacter baumannii carrying the carbapenemase OXA-23 in ICU of the eastern Heilongjiang province,China[J].BMC Infectious Diseases,2019,19(1):452.
[2]" 佚名.鲍曼不动杆菌(碳青霉烯类)对亚胺培南和美罗培南的耐药变迁[EB/OL].[2024-03-01].http://www.chinets.com/Data/GermYear.
Anon.Changes in resistance of Acinetobacter baumannii(carbapenems) to imipenem and meropenem[EB/OL].[2024-03-01].http://www.chinets.com/Data/GermYear.
[3]" 陈佰义,何礼贤,胡必杰,等.中国鲍曼不动杆菌感染诊治与防控专家共识[J].中国医药科学,2012,2(8):3-8.
CHEN B Y,HE L X,HU B J,et al.Expert consensus on diagnosis,treatment and prevention of Acinetobacter baumannii infection in China[J].China Medicine and Pharmacy,2012,2(8):3-8.
[4]" PINTO A C D S,SILVA B M D,SANTIAGO-JUNIOR J F,et al.Efficiency of different protocols for oral hygiene combined with the use of chlorhexidine in the prevention of ventilator-associated pneumonia[J].Journal Brasileiro De Pneumologia,2021,47(1):e20190286.
[5]" HANKO M,GRENDÁR M,SNOPKO P,et al.Random forest-based prediction of outcome and mortality in patients with traumatic brain injury undergoing primary decompressive craniectomy[J].World Neurosurgery,2021,148:e450-e458.
[6]" 中华医学会重症医学分会.呼吸机相关性肺炎诊断、预防和治疗指南(2013)[J].中华内科杂志,2013,52(6):524-543.
Intensive Care Medicine Branch of the Chinese Medical Association.Guidelines for diagnosis,prevention and treatment of ventilator-associated pneumonia(2013)[J].Chinese Journal of Internal Medicine,2013,52(6):524-543.
[7]" 中华人民共和国卫生部.医院感染诊断标准(试行)[J].中华医学杂志,2001,81(5):314-320.
Ministry of Health of the PRC.Diagnostic criteria for nosocomial infections(proposed)[J].National Medical Journal of China,2001,81(5):314-320.
[8]" POZUELO-CARRASCOSA D P,HERRÁIZ-ADILLO Á,ALVAREZ-BUENO C,et al.Subglottic secretion drainage for preventing ventilator-associated pneumonia:an overview of systematic reviews and an updated meta-analysis[J].European Respiratory Review,2020,29(155):190107.
[9]" CHOUHDARI A,SHOKOUHI S,BASHAR F R,et al.Is a low incidence rate of ventilation associated pneumonia associated with lower mortality?A descriptive longitudinal study in Iran[J].Tanaffos,2018,17(2):110-116.
[10]" SADIGOV A,MAMEDOVA I,MAMMMADOV K.Ventilator-associated pneumonia and in-hospital mortality:which risk factors may predict in-hospital mortality in such patients?[J].Journal of Lung Health and Diseases,2019,3(4):8-12.
[11]" LUCKRAZ H,MANGA N,SENANAYAKE E L,et al.Cost of treating ventilator-associated pneumonia post⁃cardiac surgery in the National Health Service:results from a propensity-matched cohort study[J].Journal of the Intensive Care Society,2018,19(2):94-100.
[12]" JEAN C,FAGON J Y.Ventilator-associated pneumonia[J].Am J Respir Crit Care Med,2002,165(7):867-903.
[13]" MARTIN T R,PISTORESE B P,HUDSON L D,et al.The function of lung and blood neutrophils in patients with the adult respiratory distress syndrome.Implications for the pathogenesis of lung infections[J].The American Review of Respiratory Disease,1991,144(2):254-262.
[14]" CHOLLET-MARTIN S,JOURDAIN B,GIBERT C,et al.Interactions between neutrophils and cytokines in blood and alveolar spaces during ARDS[J].American Journal of Respiratory and Critical Care Medicine,1996,154(3 Pt 1):594-601.
[15]" PUGIN J,DUNN-SIEGRIST I,DUFOUR J,et al.Cyclic stretch of human lung cells induces an acidification and promotes bacterial growth[J].American Journal of Respiratory Cell and Molecular Biology,2008,38(3):362-370.
[16]" DREYFUSS D,RICARD J D.Acute lung injury and bacterial infection[J].Clinics in Chest Medicine,2005,26(1):105-112.
[17]" MUNFORD R S,PUGIN J.Normal responses to injury prevent systemic inflammation and can be immunosuppressive[J].American Journal of Respiratory and Critical Care Medicine,2001,163(2):316-321.
[18]" LUYT C E,BOUADMA L,MORRIS A C,et al.Pulmonary infections complicating ARDS[J].Intensive Care Medicine,2020,46(12):2168-2183.
[19]" STEWART P S.Mechanisms of antibiotic resistance in bacterial biofilms[J].International Journal of Medical Microbiology,2002,292(2):107-113.
[20]" LUYT C E,BRÉCHOT N,COMBES A,et al.Delivering antibiotics to the lungs of patients with ventilator-associated pneumonia:an update[J].Expert Review of Anti-Infective Therapy,2013,11(5):511-521.
[21]" KADRI S S,O'GRADY N P.Review:short and long courses of antibiotics do not differ for mortality in ventilator-associated pneumonia[J].Annals of Internal Medicine,2014,160(10):JC3.
[22]" STOCLIN A,ROTOLO F,HICHERI Y,et al.Ventilator-associated pneumonia and bloodstream infections in intensive care unit cancer patients:a retrospective 12-year study on 3 388 prospectively monitored patients[J].Supportive Care in Cancer,2020,28(1):193-200.
[23]" 方金林,黄燕周,叶红芳.ICU成人患者呼吸机相关性肺炎危险因素的meta分析[J].中国医药导报,2020,17(11):102-106;110.
FANG J L,HUANG Y Z,YE H F.Meta-analysis of risk factors for ventilator-associated pneumonia in adult patients with ICU[J].China Medical Herald,2020,17(11):102-106;110.
[24]" GAN M,BAO Z M,HAN J.Efficacy of Venner-PneuX endotracheal tube system for prevention of ventilator-associated pneumonia in intensive care units:a protocol for systematic review and meta-analysis[J].Medicine,2021,100(1):e24278.
[25]" 蔡晓蕾,马碧君,杨胜男.意识昏迷神经外科手术病人呼吸机相关性肺炎的致病菌与感染路径分析[J].中国消毒学杂志,2023,40(2):140-142.
CAI X L,MA B J,YANG S N.Analysis of pathogenic bacteria and infection pathways of ventilator-associated pneumonia in conscious coma neurosurgical patients[J].Chinese Journal of Disinfection,2023,40(2):140-142.
[26]" MANSOUR Y,SCHAIN M.Learning with maximum-entropy distributions[J].Machine Learning,2001,45(2):123-145.
[27]" 韩玉,施海龙,曲波,等.随机森林方法在医学中的应用[J].中国预防医学杂志,2014,15(1):79-81.
HAN Y,SHI H L,QU B,et al.Application of random forest method in medicine[J].Chinese Preventive Medicine,2014,15(1):79-81.