顾斌斌 姚琳 祝新韵 陈成
2019年12月起,新型冠状病毒肺炎(Coronavirus Disease 2019,COVID-19)肆虐全球[1],给全球公共卫生带来了巨大的挑战[2]。然而,目前仍缺少有效的治疗手段,去遏制新冠病毒。早期识别和分流潜在的严重COVID-19患者,是提高治愈率和减轻医疗系统负担的关键。虽然有不少关于COVID-19的预后评分[3-4],但时至今日我们还不清楚哪一种评分在评估COVID-19疾病进展程度方面最为准确。尤其是针对入院时病情不重,但入院后出现病情迅速进展的患者,很少有学者做这方面的研究。本研究旨在找出适合COVID-19的预后评分,以期帮助临床医师更加快速的识别具有显著进展倾向的患者。
一、研究对象
选取2020年1月至2020年3月收治的确诊为COVID-19的住院患者。纳入标准:经口咽或鼻咽拭子或气管镜灌洗液标本的核酸检测(RT-PCR,反转录-聚合酶链反应)证实,符合国家卫生健康委员会办公厅、国家中医药管理局办公室发布的《新型冠状病毒肺炎诊疗方案(试行第八版)》[5]。排除标准:罹患HIV感染或其他类型免疫抑制的患者;过去14天内曾在其他定点医院治疗的患者。最终纳入87例患者。本研究得到了苏州大学附属传染病医院伦理委员会的批准(批号:2022009),研究方案符合《赫尔辛基宣言》。
二、研究方法
通过电子病历系统,收集所有纳入患者的临床资料,包括患者的临床特征、实验室检查结果、影像学演变过程、治疗结局和预后因素,以入院72小时内出现肺部影像学显著进展(>50%)作为研究终点,分为显著进展组和非显著进展组,使用四种不同的评分方法进行危险度分组,分为低危、中危、高危组,并比较各组患者影像学显著进展的比例。绘制受试者工作特征曲线(ROC),比较PSI、CURB-65、MuLBSTA和COVID-GRAM四种肺炎严重度评分工具的曲线下面积(AUC),评估各评分工具的临床效能,并确定最佳截点值下的敏感度和特异度。
三、四种肺炎评分工具
PSI评分由二十个参数构成,根据评分标准,计算总分。同时根据评分结果,分为5个等级:年龄<50岁且无基础疾病归为I级,0~70分归为II级,71~90分归为III级,91~130分归为IV级,131~405分归为V级,其中I~III级为低危,IV级为中危,V级为高危[6]。
CURB-65评分经常被用于评估社区获得性肺炎(CAP)的严重程度,包括意识障碍、血尿素氮、呼吸频率、血压、年龄这五项指标,并根据标准进行评分分级,其中0~1分为低危,2分为中危,3~5分为高危[7]。
MuLBSTA评分中所有患者的评分都是按分值计算的。评分要点如下:多叶浸润(5分),淋巴细胞计数≤0.8×109/L(4分),合并细菌感染(4分,经实验室检查或痰液检查呈现细菌阳性或CT特征上有感染征象),急性吸烟者(3分,有吸烟史但已戒烟的患者按2分计),高血压(2分),年龄≥60岁(2分)。根据Guo等人的原始研究,将MuLBSTA 评分0~7分,定义为低风险组,8~11分,定义为中风险组,≥12分,定义为高风险组[8]。
COVID-GRAM评分量表是将年龄、合并症数量、中性粒细胞与淋巴细胞比率、乳酸脱氢酶、直接胆红素、是否平片异常、是否咯血、是否气促、是否有意识丧失、是否有肿瘤病史这些变量输入一个计算工具得到,并按照疾病发展为危重症的总体概率分为低危组,中危组和高危组[9]。
四、影像学显著进展的定义
以气管隆突平面及下肺静脉平面为界,将肺叶分为上中下三个部分以及左右两侧,共计六个区域[10],将72小时内肺部病变累及范围超过3个区域定义为72小时肺部显著进展(>50%)[11]。所有的CT图像均由两位受过专业训练的放射科医生独立审查,并通过协商一致达成最终决定。
五、统计学方法
首先采用K-S法进行正态分布检验,符合正态分布的计量资料用平均值±标准差来表示,并用独立样本t检验进行比较。不符合正态分布的计量资料用中位数(四分位数间距)来表示,并用秩和检验进行差异性比较。计数资料用百分位数(%)表示,采用卡方检验进行比较。其次,绘制PSI、CURB-65、MuLBSTA、COVID-GRAM四种评估工具预测影像学进展的受试者工作特征曲线(ROC曲线)(结果变量为72小时内肺部影像学进展>50%),比较曲线下面积(AUC),并确定其最佳截点及对应的敏感度和特异度。所有统计分析均使用SPSS 24.0软件进行,P<0.05为差异具有统计学意义。
一、 人口学特征
纳入的87名患者中,男性49例(56.32%),女性38例(43.68%);所有的患者都没有居住于护理院的病史;年龄最小的9个月,年龄最大的77岁,平均年龄(46.63±13.47)岁;有吸烟史的4例(4.60%);合并症中,高血压病8例(9.20%),脑血管疾病7例(8.05%),糖尿病7例(8.05%),慢性肝病2例(2.30%),肿瘤性疾病2例(2.30%),慢性肾病1例(1.15%),神经系统疾病2例(2.30%),慢性气道疾病3例(3.45%)(见表1)。
表1 人口统计学基本情况
二、影像学进展特征分析
有关影像学进展方面,本研究仔细审查了纳入的87例住院患者3天(72h)内肺部CT的动态变化,最终确定,影像学进展超过50%的患者有20例(22.99%),影像学有进展,但未超过50%的患者有31例(35.63%),72小时内影像学出现吸收的有27例(31.03%),无变化的有9例(10.34%)。基于此,我们以入院72h内出现肺部影像学进展>50%作为标准,将纳入的87名患者分为显著进展组20例(22.99%)和非显著进展组67例(77.01%)(图1、2)。
图1 COVID-19患者影像学进展分类(72h内)
图2 COVID-19患者影像学典型表现
三、 不同评分工具对COVID-19患者严重程度的分层
采用PSI评分,低危组84例(96.55%),中危组3例(3.45%);采用CURB-65评分,低危组82例(94.25%),中危组5例(5.75%),两种评分均未出现高危组患者;采用MuLBSTA评分,低危组56例(64.37%),中危组22例(25.29%),高危组9例(10.34%);采用COVID-GRAM评分,低危组7例(8.05%),中危组70例(80.46%),高危组10例(11.49%)(图3)。
图3 四种评分工具对87例COVID-19患者严重程度的分层
四、不同评分工具获得的肺炎严重程度分组和COVID-19影像学显著进展的关系
采用PSI评分,低危组84例(96.55%),出现显著进展19例(21.84%),进展率22.62%;中危组3例(3.45%),出现显著进展1例(1.15%),进展率33.33%;无高危组患者;组间差异无统计学意义(P=1.000)。采用CURB-65评分,低危组82例(94.25%),出现显著进展18例(20.69%),进展率21.95%;中危组 5例(5.75%),出现显著进展2例(2.30%),进展率40.00%;无高危组患者;组间差异无统计学意义(P=0.352)。采用MuLBSTA评分,低危组56例(64.37%),有7.14%的患者出现显著进展(4/56);中危组22例(25.29%),有40.91%的患者出现显著进展(9/22);高危组9例(10.34%),有77.78%的患者出现影像学显著进展(7/9);组间差异有显著统计学意义(P<0.001)。采用COVID-GRAM评分,低危组7例(8.05%),有0%的患者出现显著进展(0/28);中危组70例(80.46%),有20.00%的患者出现显著进展(14/70);高危组10例(11.49%),有60.00%的患者出现影像学显著进展(6/10);组间差异有显著统计学意义(P=0.002)(表2)。
表2 四种评分工具对COVID-19患者严重程度的分层及与影像学进展的关系
五、 不同评分工具对COVID-19患者影像学显著进展的预测效能
分别以PSI评分、CURB-65评分、MuLBSTA评分、COVID-GRAM评分作为检验变量,以入院72小时内肺部影像学检查显示病灶进展超过50%作为分类变量绘制受试者工作特征曲线(ROC曲线)(图4),结果显示:当PSI取最佳截点值46.50时,其预测COVID-19影像学显著进展的敏感度为64.20%,特异度为60.00%,ROC曲线下面积(AUC)为0.588,95%可信区间0.451~0.725。当CURB-65取最佳截点值1.50时,其预测COVID-19影像学显著进展的敏感度为74.60%,特异度为60.00%,ROC曲线下面积(AUC)为0.678,95%可信区间0.550~0.806。当MuLBSTA取最佳截点值6.00时,其预测COVID-19影像学显著进展的敏感度为67.20%,特异度为95.00%,ROC曲线下面积(AUC)为0.882,95%可信区间0.810~0.955。当COVID-GRAM取最佳截点值104.15时,其预测COVID-19影像学显著进展的敏感度为86.60%,特异度为80.00%,ROC曲线下面积(AUC)为0.886,95%可信区间0.813~0.959。
图4 四种评分工具的ROC曲线
此外,当MuLBSTA与COVID-GRAM联合诊断时,取最佳截点值1.68时,其预测COVID-19影像学显著进展的敏感度为83.70%,特异度为91.30%,ROC曲线下面积(AUC)为0.924,95%可信区间0.875~0.972(图5)。
图5 MuLBSTA联合COVID-GRAM的ROC曲线
综上所述,若将曲线下面积(AUC)在0.5~0.7时定义为预测价值较低,AUC在 0.7~0.9时定义为预测价值中等,AUC>0.9时定义为预测价值很高,则结果提示四种评分对预测COVID-19影像学显著进展的临床效能存在差异。PSI评分和CURB-65评分预测COVID-19影像学显著进展的预测价值较低;COVID-GRAM评分总体预测价值虽略高于MuLBSTA评分,但特异度低于MuLBSTA评分。两者联合对COVID-19影像学显著进展的预测价值更高。
自COVID-19爆发以来,已经给全世界200多个国家造成了大规模的发病率和死亡率。然而,到目前为止,尚未有专门用于治疗COVID-19患者的药物,主要以对症治疗为主。因此,对确诊COVID-19患者的病情进行快速有效的评估显得至关重要,有助于我们早期识别高危患者,及时进行适当的医疗干预,降低重症率及死亡率。
大多数用于评估社区获得性肺炎严重程度的评分都是用来预测死亡率的,对于预测患者疾病进展程度似乎没有明显效果,这导致许多患者被错误的归类为低风险,因此,本研究比较了四种评分工具在预测COVID-19影像学进展方面的价值。
肺炎严重程度指数(PSI)评分由二十个变量组成,其中合并症占有重要的权重[12],它是社区获得性肺炎患者管理中使用最广泛的评分工具之一,根据这个评分,可以决定患者的护理级别、住院与否以及是否进入重症监护室。有研究报告指出,合并症是疾病进展的高危因素。Mostafa等人[13]在对2000篇有关疾病进展预测的论文进行荟萃分析后发现,合并症中的高血压,使COVID-19从轻症到重症的风险增加了2倍,糖尿病增加了2.5倍,慢性阻塞性肺病增加了4倍。虽然,合并症是已知的COVID-19强大的独立危险因素[14],但在本研究的人群中,合并症数量很少,这极大的影响了评分分值。在PSI评分中,分值<90分的死亡率在0.1%和2.8%之间,可以安全地建议门诊治疗,但是在本研究中,PSI评分归为低风险的比率高达惊人的98.03%,但最后出现疾病进展的却占到14.77%。
CURB-65评分量表比较简单,它不考虑社区获得性肺炎中合并症的影响,只由五个变量组成,在这五个变量中,其中一个重要的变量是呼吸频率[7]。而COVID-19也被一些专家称为“沉默的低氧血症”[15],即一部分患者可能有严重的低氧血症,但呼吸频率并不高,所以,这个评分量表可能低估了肺炎的严重程度。CURB-65评分中,评分在0~1分的死亡率在0.1%~2.7%之间,但在本研究中,评估为低危患者,最后出现病情进展的却达到14.29%。Ji等人[16]发表的一项研究中表明,所有的208名COVID-19确诊患者的CURB-65评分分值都在0~1分之间,包括那些后来进展到严重疾病甚至死亡的患者,也就是说,用CURB-65评分对COVID-19进行疾病进展程度评估是不合适的,这与我们的研究结果也不谋而合。
另外两种评分,病毒性肺炎的预警模型,即MuLBSTA评分[8],最近被开发用来预测COVID-19患者的不良结局,其中多叶浸润、低淋巴细胞计数、吸烟史、高血压和高龄都是死亡的独立危险因素,且都与其他研究所描述的COVID-19的危险因素相对一致[14,17]。COVID-GRAM评分是由Liang等人[9]开发的一种预后评分系统,由10个危险因素组成,包括X射线异常、年龄、症状、合并症和生物标志物。该评分也在另外四个队列中得到验证,在开发队列和验证队列中的AUROC均为0.88。它已经被作为一个免费的在线风险计算器推出。
在总的预测准确性上,PSI评分的AUC为0.588,CURB-65评分的AUC为0.678,因此,可以说这两个评分在预测COVID-19患者影像学进展方面都不太准确。MuLBSTA评分的AUC为0.882,COVID-GRAM评分为0.886,两者联合的AUC为0.924,它们对COVID-19患者的影像学进展程度都显示出了很好的预测能力。可以这样说,COVID-GRAM评分预测COVID-19患者影像学进展程度的准确性和敏感度很高,MuLBSTA评分在准确性上虽稍逊COVID-GRAM,但基本接近,且表现出更好地特异度。而MuLBSTA联合COVID-GRAM评分预测COVID-19患者影像学进展程度时,虽然涉及的变量较多,但在准确性、敏感度、特异度上均表现优异。
本研究是一项在单一中心进行的回顾性研究,样本量较小,且所有纳入研究的患者都是在满足一系列标准后从医院病历系统获得的,这可能会带来选择上的偏差。另外,本研究中患者的治疗受政府政策、区域医疗水平的影响,研究结果可能缺乏普遍代表性。