贾 文,尹 莹,余 晗,柯于鹤*
(1.武汉市中西医结合医院,湖北 武汉 430022;2.湖北中医药大学,湖北 武汉 430065)
2019年12月底,“新型冠状病毒(Corona virus disease 2019,COVID-19)”疫情爆发[1],并迅速在全世界多个国家蔓延开来,至少有34个国家报告了COVID-19病例[2],其中包括美国[3]、意大利[4]、德国[5]等发达国家,2020年3月11日世界卫生组织宣布COVID-19为全球性大流行病[6]。截至目前全世界感染人群已经超过2 000万,死亡人数超过30万,其中危重型患者的死亡率远超轻型/普通型患者[7],在某些国家,危重型患者的死亡率甚至高达27%[4],因此明确易死亡患者的临床特征,探索影响COVID-19患者死亡的危险因素对于降低COVID-19患者的死亡风险有积极意义。尽管已经有相关研究对可能导致住院患者死亡的因素和临床特征进行了初步分析[7- 8],但这些研究多是对患者的临床特征进行简单描述或者采用Logistic回归模型或广义线性模型进行建模分析,但由于影响死亡的因素众多,传统的回归分析或者线性模型在处理存在多重共线性数据资料时存在偏倚[9-10]。其次,在中国国内中药被广泛应用于临床一线[11],但现有研究很少有针对中药或中成药对患者死亡率的影响分析和评价。
决策树是新兴机器学习算法之一[12],其所需要的数据准备往往非常简单,而且能够同时处理数据型和常规型属性,并对大型数据源做出可行且效果良好的结果分析,还能通过静态测试对模型进行评测,对模型可信度进行评估[13],目前疾病的预测模型在临床上已有广泛应用。本研究收集武汉市某定点医院中COVID-19患者的住院数据,采用决策树模型来探索影响COVID-19住院患者死亡率的因素,并将中药治疗(包括使用中成药和中药汤剂)作为影响因素之一,以深入探讨中药治疗与患者死亡率的相关性。
研究对象为2020年3月20日前武汉市中西医结合医院收治的COVID-19患者,其中危重型确诊患者的诊断标准参照国家卫生健康委员会颁布的《新型冠状病毒肺炎临床治疗方案(第七版)》[14],具体内容包括:(1)COVID-19确诊患者:有临床表现、影像学特征,新型冠状病毒核酸检测为阳性;(2)COVID-19危重型:COVID-19确诊患者符合下列任何1条:①出现呼吸衰竭,且需要机械通气;②出现休克;③合并其他器官功能衰竭需行ICU 监护。
本研究纳入所有可获得研究数据的住院患者,排除因特殊原因无法获得完整研究数据的患者。本研究得到武汉市中西医结合医院伦理委员会批准,并在中国临床试验中心进行注册(注册号:ChiCTR2000030719)。
本研究收集了武汉市中西医结合医院卫生信息系统(Hospital Information System,HIS)中的患者住院信息,采用Epidata 3.1软件建立专门的数据提取工具,选择两名研究者对纳入患者的流行病学、人口统计学、临床、实验室检查、治疗方案、转归等数据进行系统采集,并采用双人双录入的方法以减少数据误差,采集过程中所有争议由第三位研究者进行判定。
1.3.2 单因素分析 以住院期间是否死亡作为分组依据,将患者分为两组,采用单因素分析法筛选两组之间具有显著差异的因素,其中计量数据依据是否符合正态分布,采用Mann-WhitneyU检验或t检验;计数数据采用χ2检验,并依据具体数据分布情况选择Person检验或Fisher精确检验,P<0.05表示差异有统计学意义。
1.3.3 方差膨胀因子分析 为保证模型的稳定性,在建立决策树前采用R软件对单因素分析中具有统计学差异的因素进行方差膨胀因子(VIF)分析,以VIF>2作为标准,排除导致潜在共线性的变量。
1.3.4 决策树模型的建立 在排除共线性变量后,采用IBM SPSS Modeler14.1 Premium 软件进行数据管理,并选用Chi-squaredAutomatic Interaction Detector(简称CHAID)算法建立决策树模型,将住院期间是否死亡作为因变量,以排除后潜在共线性的因素为自变量,将纳入研究的70%患者作为训练集建立决策树模型。为防止对数据的过度解读,本研究中的决策树模型将采用交互验证法,并在停止规则中将父分支最小记录数定为5%,子分支最小记录数定为3%,建立决策树模型后以剩余的30%患者对所建模型的准确率进行判断,准确率为90%以上则认为模型预测性良好。
本研究共纳入272例COVID-19患者,需要强调的是由于疫情初期核酸检测不完善的原因,本次研究纳入的患者均是住院后核酸检测为阳性的患者。所有患者中有死亡病例43例(15.8%),危重型患者64例(23.5%);其中男性患者127例(46.7%),患者中位数年龄为64岁,住院时间的中位数为25天;患者中合并有高血压的患者有104例(38.2%),高血压是最常见的合并症,绝大多数患者入院后接受了抗病毒(93.4%)、抗菌(79%)和中成药(68%)治疗,而接受过中药汤剂治疗的患者为204例(75%)。
将所有患者按是否在住院期间发生死亡作为分组依据,共分为两组,采用Mann-WhitneyU检验或χ2检验将两组之间各种因素进行单因素分析(见表1),结果提示两组患者在性别、年龄、危重型患者比例、无创机械通气、有创机械通气、抗病毒治疗、中成药治疗、中药汤剂治疗、出现喘息、出现便秘、合并慢性阻塞性肺疾病、高血压、冠心病、心肌梗死、脑梗死、慢性肾功能不全、病毒性肝炎、D-D二聚体、降钙素原、血沉、白细胞计数、红细胞计数、血小板计数、血红蛋白计数、中性粒细胞绝对值、淋巴细胞绝对值、超敏C反应蛋白、白蛋白、谷草转氨酶、肌酐、尿素氮、肌酸激酶、乳酸脱氢酶、肌酸激酶同工酶、肌红蛋白、超敏肌钙蛋白等36个因素上具有统计学差异(P<0.05)。
表1 新型冠状病毒肺炎住院患者死亡风险的单因素分析结果
对纳入的因素进行方差膨胀因子(VIF)分析,以VIF>2作为标准,排除导致潜在共线性的变量,最终纳入性别、危重型患者比例、抗病毒、中成药、中药汤剂、喘息、便秘、慢性阻塞性肺病、高血压、冠心病、心肌梗死、脑梗死、慢性肾功能不全、病毒性肝炎、D-D二聚体、降钙素原、血沉、白细胞、红细胞、血小板、淋巴细胞绝对值、白蛋白、谷草转氨酶、肌酐、肌酸激酶同工酶、超敏肌钙蛋白等26个变量。见表2。
表2 变量的多重共线性筛选
将上述变量纳入决策树模型,随机选取185例患者作为训练集,通过建模和变量筛选,共筛选出危重型比例、降钙素原、中药汤剂、淋巴细胞绝对值、中成药等5个变量和7条途径(表3);其中依据模型影响力从高到低对纳入模型的5个变量进行排列(图1),依次为危重型比例、降钙素原、中药汤剂、淋巴细胞绝对值、中成药。将剩余的87例患者建立测试集,对建立的决策树模型(图2)的准确性进行评价,结果显示测试集的预测准确率为95.4%,敏感度为83.3%,特异性为97.4%,表明所建模型预测效果良好。见表4。
表3 COVID-19患者住院死亡风险预测决策树模型分类规则
表4 决策树模型检测正确率
图1 影响因素重要性排序
图2 决策树模型
由于目前尚无针对COVID-19的特效治疗药物或疫苗,因此支持性护理,包括症状控制和并发症预防仍然是最关键的治疗方案[15],对于危重型患者这类高危人群[7],临床医师不仅需要关注患者自身基本情况,同时也需要积极采用多种特殊治疗,如气管插管[16]、康复血浆疗法[17]、体外膜肺氧合[18]等,对临床可能出现的多种并发症进行处理。但正是由于影响住院患者死亡的因素太多,从而造成数据的复杂性程度高、噪声大,因此需要灵活和高效的数据处理方法。决策树作为一种重要的数据挖掘算法,相较于传统的Logistic回归或多元线性回归,决策树具有分类精度高、对噪声数据有很好的稳健性、所提取规则可以量化且易于理解等优点[13],不仅可以从众多因素中筛选出有统计学意义的危险因素,同时也可以对各危险因素不同水平下发生危险的可能性作出定性判断。本研究以272例COVID-19患者为研究对象,采用决策树模型法尝试建立了COVID-19患者住院死亡风险预测模型,并深入探索了中药治疗(中药汤剂或中成药)与住院患者死亡之间的相关性。经测试集测试,模型预测的准确率达到了95.4%,表明模型预测效果良好,同时以对模型的影响力为评价标准,从高到低筛选出危重型比例、降钙素原、中药汤剂、淋巴细胞绝对值、中成药等5个预测因素。
本研究中危重型患者被定义为出现呼吸衰竭,且需要机械通气、或出现休克、或合并其他器官功能衰竭需要ICU监护的患者,既往研究结果表明危重型患者的死亡率要远高于非危重型患者[7],这是因为危重型患者一般年龄偏大,合并疾病较多,因此更容易出现急性呼吸窘迫综合征、呼吸衰竭、猝死等不良后果[19],本研究的结论支持既往研究结论。
现有研究结果表明,危重型COVID-19患者体内拥有更高浓度的粒细胞集落刺激因子、干扰素、巨噬细胞和肿瘤坏死因子等炎性因子,这表明炎症风暴可能是加重患者病情和造成患者死亡的重要因素[8]。降钙素原是反映患者体内炎症水平的重要指标[20],其水平会随着感染性疾病严重程度的增加而呈现显著升高的趋势,并与患者预后相关。本研究发现降钙素原作为反映体内炎症水平的特异性指标,在预测COVID-19患者死亡结局方面具有显著作用,同时为既往研究结论提供了佐证。
淋巴细胞降低是COVID-19患者的重要特征之一,现有研究结果表明SARS-CoV-2可作用于人体T淋巴细胞,而病毒的大量复制导致T淋巴细胞耗竭,从而抑制机体免疫,导致人体淋巴细胞数量的下降[21],从而可能导致患者继发细菌感染。中性粒细胞/淋巴细胞比值升高已经被多个研究证实与患者的预后相关[22],而本研究发现淋巴细胞降低可增加住院患者的死亡风险,对既往的研究结论进行了验证。
本病尚无特效药物[23],因此临床常采用联合用药的治疗方法,在国家政策的大力支持下[13],中医药被广泛应用于一线临床治疗,并取得了良好的效果,有临床研究表明,相较于单纯西药治疗,中西医结合治疗可明显减少COVID-19患者的死亡率,并缩短病程[24]。本研究深入探索了中医药与住院患者死亡率之间的关系,发现中药干预(中药汤剂与中成药)是降低患者死亡率的重要因素,本研究结论与本课题组既往研究结果一致[25],通过对患者的中药处方进行统计分析,发现主要涉及的中药有麻黄、苦杏仁、茯苓、白珠、藿香、培兰、黄芪、党参等,相关研究结果表明中药汤剂的多成分、多靶点特性直接或间接作用于COVID-19疾病特异性因子,从而达到改善患者症状的目的[26],但需要注意的是目前关于中医药应用于COVID-19患者的高级证据依然不足[27],未来需要更多大样本的临床研究进行验证。
综上所述,本研究基于决策树法建立了评估COVID-19患者住院死亡的预测模型,并且经过测试准确率良好,最终筛选出危重型比例、降钙素原、中药汤剂、淋巴细胞绝对值、中成药等5个预测因素,但由于时间和人员等多方面因素的限制,本研究采集的患者相关指标还不尽完备,并且样本量较小,因此,筛选出来的危险因素及所建立的预测模型的代表性还需要更大样本的临床数据进行验证。