高俐楠 杨鹏坤 曹文君 张茜
1郑州大学第一附属医院新生儿科、河南省危重新生儿救治随访中心、河南省早产儿医学重点学科、郑州市发育障碍防控重点实验室(郑州 450000);2中国科学技术大学计算机科学与技术学院(合肥 230000)
新生儿败血症(neonatal sepsis,NS)是指由细菌或真菌感染引起的可在血液或脑脊液等无菌标本中培养出致病菌的全身炎症反应综合征[1]。NS作为一个全球公共卫生问题,其发病率高,病死率高,并且是新生儿神经发育障碍的主要原因之一[2]。然而,由于其临床表现不具有特异性,易导致漏诊,因此需要提前预测[3]。国外关于NS的预测模型繁多,然而在中国人群中进行验证的研究却相对较少。国内目前也只有少数学者根据心率变异率等临床监护数据建立了NS预测模型[4],或者根据早产、绒毛膜羊膜炎、阿普加评分等来建立NS预测模型[5]。然而这些模型在临床应用中受到一定限制,例如心率变异率需要连续监测,时间上不具备优势,而绒毛膜羊膜炎的准确诊断需要进行羊水抽取。目前,在国内尚未有研究仅利用简单而准确的早期指标来构建NS预测模型。已有大量研究表明血常规中的多个指标在NS的诊断及预后方面具有重要的提示价值[6-8]。鉴于此,本研究旨在利用易于获取的一般临床特征和生后首次血常规检查指标建立NS预测模型,以帮助临床医生早期识别高风险患儿。
1.1 研究对象本研究数据来源于美国麻省理工学院与贝斯以色列女执事医疗中心联合开发的美国重症监护医学信息数据库Ⅲ v1.4(Medical Information Mart for Intensive Care-Ⅲ v1.4,MIMIC-Ⅲv1.4)[9]。本研究者通过了美国国立卫生研究院网站“保护人类研究参与者”培训课程,并获得该数据库使用权限(证书编号:53355921)。筛选入院方式为“新生儿”的首次入住NICU且入院后完善血常规检查的新生儿,排除死亡患儿和信息记录缺失的患儿。最终筛选出3 001例新生儿患者,依据是否发生NS(ICD-9诊断代码为“77181”)将3 001例新生儿分为NS组(n=185)和非NS组(n=2 816)。外部验证数据集来自2020年1月至2022年12月于郑州大学第一附属医院新生儿科住院的患儿,数据获取通过电子病历系统,共纳入3 129例患儿,NS的诊断记录于电子病历表中,其中NS组212例,非NS组2 917例。本研究经过郑州大学第一附属医院伦理委员会审核批准(伦理批号:2023-KY-0460-001)。
1.2 研究变量受试者ID用于识别不同的患者,新生儿的一般临床特征及初始血常规检查指标纳入初步分析,其中一般临床特征包括:性别、种族、胎龄、出生体质量、是否发生呼吸窘迫综合征。新生儿呼吸窘迫综合征是因肺表面活性物质缺乏所致,以生后当时或很快出现呼吸窘迫并进行性加重为特征的临床综合症[10]。初始血常规检查指标包括:红细胞计数、白细胞计数、血小板计数、淋巴细胞百分比、中性粒细胞百分比、中性粒细胞-淋巴细胞比率(neutrophil to lymphocyte ratio,NLR)、血小板-淋巴细胞比率(platelet to lymphocyte ratio,PLR)。新生儿的性别、种族、胎龄、出生体质量出生后即可获取,新生儿呼吸窘迫综合征通常发生在6 h以内,新生儿入院后首次血常规检查往往在24 h内进行,获取结果迅速。所有纳入的研究变量在预测疾病方面,具有时间早的优点。
1.3 新生儿败血症诊断NS的诊断依据2019年专家共识[1],确诊诊断:有临床表现,血培养或脑脊液(或其他无菌腔液)培养阳性;临床诊断:有临床异常表现,同时满足下列条件中的任意一项:(1)血液非特异性检查≥2项;(2)脑脊液检查呈化脓性脑膜炎改变;(3)血中检出致病菌DNA。
1.4 统计分析采用Shapiro-Wilk法对连续性指标进行正态性检验,以均数±标准差或中位数(四分位数)表示,两组间的比较根据情况选择两独立样本t检验、校正t检验或Mann-WhitneyU检验;计数资料以例数(%)表示,根据情况,组间比较选择χ2检验或Fisher精确检验。统计分析采用SPSS 25.0完成,P<0.05为差异有统计学意义。
1.5 预测模型的建立与验证首先采用LASSO回归筛选预测NS的可能因素,在选择最优Lambda参数时采用10倍交叉验证,以交叉验证误差最小时的Lambda值为最优模型。其次对LASSO回归筛选的变量进行多因素logistic回归分析,建立多因素logistic回归模型并绘制Nomogram图。然后通过Bootstrap重采样的方法对预测模型进行内部验证。外部验证时,将来自郑州大学第一附属医院的新生儿的数据集特征输入建立的Nomogram模型生成相应的预测结果。笔者通过计算C-index指数、绘制校准曲线、临床决策曲线和受试者工作特征(receiver operating characteristic,ROC)曲线来评价预测模型的效能。统计分析采用R语言(第3.6.3版)完成,P<0.05为差异有统计学意义。
2.1 NS组和非NS组的临床资料共筛选符合标准的新生儿3 001例,NS患儿185例,检出率6.2%。详细资料见表1。
表1 NS组和非NS组临床资料比较Tab.1 Comparison of data in neonates between NS group and non-NS group
2.2 NS预测因素筛查本研究共纳入上述12个潜在的预测因素(对多分类变量进行哑变量处理),通过LASSO回归对12个预测因素进行降维处理,筛选出最具有代表性的预测因素,LASSO回归结果显示性别、胎龄、出生体质量、是否发生呼吸窘迫综合征、红细胞计数、白细胞计数、血小板计数、淋巴细胞百分比、中性粒细胞百分比、PLR为新生儿发生败血症的预测因素(图1)。
图1 新生儿败血症预测因素的LASSO回归Fig.1 LASSO regression of predictive factors for NS
2.3 NS预测因素的多logistic回归分析应用多因素logistic回归验证上述变量。以是否罹患NS为因变量,以LASSO回归筛选出的因素为自变量进行多因素logistic回归分析,多分类变量进行哑变量化处理,回归结果见表2。结果显示:在控制其他危险因素的情况下,是否发生呼吸窘迫综合征、28周 ≤ 胎龄<32周和32周 ≤ 胎龄<37周、出生体质量、15 × 109/L ≤ 白细胞计数<25 × 109/L、红细胞计数、淋巴细胞百分比、中性粒细胞百分比可作为NS的独立预测因素(P<0.05),此时绘制预测NS的ROC曲线,模型的曲线下面积为 0.860(95%CI:0.828~0.891,P<0.001),见图2。
图2 新生儿败血症logistic回归模型ROC曲线分析Fig.2 ROC curve analysis of logistic regression model in neonates with NS
表2 新生儿败血症多因素Logistic回归Tab.2 Multivariable Logistic regression analysis of NS
2.4 预测NS的Nomogram模型的构建根据logistic回归分析结果,以是否发生呼吸窘迫综合征、28周 ≤胎龄<32周、32周 ≤ 胎龄<37周、出生体质量、红细胞计数、15 × 109/L ≤ 白细胞计数<25 × 109/L、淋巴细胞百分比、中性粒细胞百分比为预测因素,是否发生NS为结局指标建立NS的Nomogram预测模型,见图3。
图3 新生儿败血症Nomogram预测模型Fig.3 The Nomogram predictive model for NS
2.5 Nomogram预测模型的验证与评价Bootstrap重采样1 000次对模型进行内部验证,C-index指数为0.729,示模型有较好的区分能力;绘制模型的校准曲线,模型的预测值和实际值具有良好的一致性,提示Nomogram预测模型有较好的精准度(图4A);对列线图进行了临床决策曲线分析,也观察到了良好的性能(图4B)。此外,根据预测模型对来自郑州大学第一附属医院的3 129例新生儿的数据集进行外部验证,AUROC=0.767(95%CI:0.728~0.805,P<0.001),模型预测性能良好,提示模型有较好的泛化能力。
图4 Nomogram预测模型的评价Fig.4 Assessment of the Nomogram
NS在存活新生儿中的发病率是4.5%~9.7%[11],全球NS总体病死率为1%~5%[12]。NS约占新生儿死亡率的13%[13]。NS的症状和体征无特异性,包括体温不稳定、易激惹、嗜睡、呼吸系统症状、喂养困难、心动过速、灌注不良和低血压等,这与早产儿相似,使得临床医生难以及时诊断[14]。因此,早期预测是必要的。
多年来,NS的早期预测因素主要包括孕产妇指标和新生儿体征。应用广泛的孕产妇指标包括产前最高温度和是否存在绒毛膜羊膜炎等。产前最高温度并不是客观准确的指标,因为体温并不是持续监测的指标。而在大多数妇女中,“绒毛膜羊膜炎”的诊断仅根据临床[15],通过羊水培养、革兰染色或生化分析来确认诊断[16],这限制了其对NS的预测价值。医护人员无法对每一位患儿进行持续性观察,部分新生儿在出现临床体征时早已患有败血症,这降低了新生儿体征作为预测因素的临床价值。目前,NS预测模型在经济发展水平不同的国家进行外部验证的研究极少。本研究克服了上述缺点,基于国外数据库建立了NS的预测模型并在中国人群中进行验证。采用是否发生呼吸窘迫综合征、胎龄、出生体质量和初始血常规检查中的红细胞计数、白细胞计数、淋巴细胞百分比、中性粒细胞百分比几个变量构建了一个简化的预测模型,Nomogram预测模型对各危险因素量化赋分,进而计算总分值对应的风险预测值。内外部验证中多个指标包括C-index、AUROC、校准曲线和决策曲线表明本研究的列线图得到了令人满意的预测结果。
对NS负担的估计因研究设计而异[17],不同收入水平的国家对负担的估计也不同[18]。在本研究中MIMIC Ⅲ数据库NS检出率为6.2%,来自中国的外部验证数据集中NS检出率为6.8%。本研究的结果提示胎龄和出生体质量是NS的预测因素,这与既往的研究一致。与胎龄<28周的早产儿相比,胎龄≥ 28周的早产儿发生败血症的风险明显降低。随着出生体质量的增加,NS发生风险降低。小胎龄和低出生体质量的新生儿特别容易受到继发的系统性感染,原因是免疫系统不成熟、住院时间长、肠道喂养延迟、抗生素早期暴露以及维持生命所需要的侵入性干预[19]。本研究显示呼吸窘迫综合征可作为NS的独立预测因素。这类新生儿肺泡萎陷,导致肺部氧合能力降低,需要更多的氧气维持正常生理功能。高浓度氧气治疗可导致肠道通透性增加、肠道菌群紊乱及细菌向远处器官转移,肠道菌群的紊乱增加NS发生风险[20]。另一方面,呼吸窘迫综合征的新生儿呼吸困难,可能需要机械通气和静脉注射营养等操作,增加感染风险。
本研究表明初始红细胞计数的增加提示NS发生风险降低。红细胞具有免疫黏附作用,可增强吞噬性白细胞对微生物的吞噬作用。红细胞计数的减少可影响氧气在体内的利用和传递,从而影响免疫功能。此外,有研究[21]表明,发生NS时贫血的程度高,改善贫血可预防NS的并发症。新生儿出生时白细胞总数为15 × 109/L,出生后随着时间的推移而发生改变[22]。白细胞计数≥ 25 ×109/L或<5 × 109/L均提示NS风险[1,23]。白细胞计数与NS的发生并非简单的线性关系,据此,笔者将白细胞计数作为分类变量进行分析。在本研究中,15 × 109/L ≤ 白细胞计数<25 × 109/L可作为NS的预测因素,这与既往的研究不同,原因可能是本研究建模人群来自MIMIC数据库,其中大多数为白种人,不同的研究中白细胞计数的分布存在差异性,获取检测指标的时间也不同,导致白细胞计数在不同的NS预测模型中阈值并不统一。本研究显示初始淋巴细胞百分比和中性粒细胞百分比减小,发生NS的概率会小程度增高。这可能与新生儿不成熟的免疫系统有关。淋巴细胞和中性粒细胞都是人体免疫系统中重要的类型,中性粒细胞主要负责吞噬和消灭病原体,淋巴细胞的主要作用是产生抗体和调节免疫。中性粒细胞功能的降低和低浓度的免疫球蛋白增加了早产儿对侵袭性感染的易感性[14]。虽然有部分研究显示NLR、PLR是NS的预测因子[8,24]。然而在本研究中NLR和PLR均未纳入最终模型,这与研究人群及指标获取时间有关。
本研究存在一些局限性,纳入的预测因素不全,仅纳入了数据库中记录相对完善的指标。其他临床指标如头围、小于胎龄儿、生后窒息、阿普加评分等指标在数据库中未记录或缺失值大于90%,此外,数据库也没有提供初始血常规中的平均血小板体积和红细胞分布宽度,这两个指标在其他研究中显示对NS有临床预测价值[25-26]。国内外相关研究示C反应蛋白、降钙素原、血清淀粉样蛋白A等可作为诊断NS的生物标志物[27-30],新生儿的这些指标在MIMIC数据库中记录缺失。本研究作为回顾性研究,难以控制混杂变量。本研究没有区分早发型和迟发型败血症,一方面是由于MIMIC Ⅲ对诊断时间记录不详,另一方面两者的诊断条件除发生时间外均相同,且部分迟发型败血症在出生时获得,但在72 h后才具有临床表现。因此本研究提示一个总的败血症风险预测值,对指导临床抗生素治疗没有提示作用。
综上所述,本研究基于MIMIC Ⅲ数据库建立了NS早期预测模型并在中国人群中进行验证,模型预测性能良好,参数简单,适用范围较为广泛,希望能提高医护人员对高风险患儿的警惕性,减少NS的漏诊。