电子病历数据库脓毒症病例筛选方法综述

2020-11-30 08:33:50周飞虎

解放军医学院学报 2020年9期

齐霜，周飞虎

1解放军医学院，北京 100853；2解放军总医院第一医学中心重症医学科，北京 100853

脓毒症是一种由感染导致的生理、病理和生化异常的综合征，是感染患者死亡的主要原因[1]。仅在2017年，全球范围内估计有1 100万患者的死亡与脓毒症相关，占当年死亡人数的19.7%[2]。随着电子病历(electronic medical records，EMR)应用的增多，使基于电子病历数据库的脓毒症相关研究日渐增多。目前被开发及使用的电子病历数据库很多，很多地区以及医疗机构均有自己的电子病历数据库，如法国的OUTCOMEREA数据库、美国的原生医疗数据库(Premier Healthcare Database)、荷兰国家重症监护评估(National Intensive Care Evaluation，NICE)数据库、美国全国住院样本数据库 (Nationwide Inpatient Sample，NIS)、重症医学信息(Medical Information Mart for Intensive Care，MIMIC)数据库及远程医疗ICU(Telehealth ICU，e-ICU)协作数据库[3]等。其中MIMIC数据库及eICU数据库为开源数据库，大众熟悉度较高[4-5]。

脓毒症发病率在不同研究之间有很大差异，这些差异可能是由于收集数据方法、研究时间段或研究区域不同所造成。这一现象提示了关于脓毒症的标准化定义和数据筛选是临床研究的重要一环[6]。怎样利用数据库中的数据筛选脓毒症患者，是研究首先要面对的问题。电子病历数据库中的数据均为前期的医疗记录，已无法根据患者临床情况进行诊断，只能利用数据库中现有的数据进行合理的筛选。此外，自1991年至今，脓毒症的定义及诊断标准已经过3个版本的变化[7]；且因数据库记录的特点及研究目的的不同，脓毒症患者的筛选方式各有不同，但其根本原则均是围绕不同时期脓毒症的定义及临床诊断标准。目前基于数据库的脓毒症相关研究中病例筛选方式较多，本文选取几种常用的数据库病例筛选方法结合脓毒症的定义进行介绍，系统分析其各自特点，为相关大数据研究提供参考。

1 脓毒症定义的变化

1992年美国危重症医学会(Society of Critical Care Medicine，SCCM)、美国胸科医师协会(American College of Chest Physicians，ACCP)首次提出了脓毒症的定义(Sepsis-1)。脓毒症被定义为感染导致的全身炎症反应综合征(systemic inflammatory response syndrome，SIRS)，即脓毒症=感染+SIRS；严重脓毒症是指脓毒症伴有器官功能障碍、低灌注异常或脓毒症引起的低血压，即严重脓毒症=脓毒症+器官功能障碍。脓毒症休克是严重脓毒症的一个子集，定义为脓毒症引起的低血压，尽管经过充分的液体复苏，但仍持续存在低灌注异常或器官功能障碍[8]。2001年SCCM、ACCP、联合欧洲危重症医学会(European Society of Intensive Care Medicine，ESICM)、美国胸科学会(American Thoracic Society，ATS)以及外科感染学会(Surgical Infection Society，SIS)共同发表了脓毒症的第2次定义(Sepsis-2)[9]。此次定义并未对Sepsis-1中脓毒症、严重脓毒症、脓毒症休克的定义进行过多修改，只是增加了脓毒症的临床诊断标准，但是因为较为复杂，临床应用受限。2016年拯救脓毒症运动根据ESICM和SCCM的会议共识，发布了脓毒症第3次定义(Sepsis-3)，重新定义脓毒症为宿主对感染反应失调引起的危及生命的器官功能障碍，器官功能障碍可以通过序贯性器官功能衰竭评分(Sequential Organ Failure Assessment，SOFA)增加2分或更多来表示。即脓毒症=感染+SOFA评分增加≥2，取消了严重脓毒症的诊断。脓毒症休克是脓毒症的一个子集，临床特征是在无低血容量的情况下需要使用升压药物维持平均动脉压≥65 mmHg (1 mmHg=0.133 kPa)，且血清乳酸水平＞2 mmol/L(18 mg/dl)[1]。

所有的基于数据库的研究中，经常使用的脓毒症患者的筛选方法均依据上述三种脓毒症定义及临床标准，但会根据数据库的特点及研究目的、内容而有所不同。

2 常见的基于数据库研究的脓毒症病例筛选方法

2.1 出院诊断中国际疾病分类编码筛选方法国际疾病分类(International Classification of Diseases，ICD)是依据疾病的某些特征，按照规则将疾病分类，并用编码的方法来表示的系统，由世界卫生组织统一发布。目前广泛使用的是第10版，即ICD-10编码，但是由于数据库中的数据均是既往的诊疗信息，时间较为久远，所以ICD-9编码也很常见。在医院的电子病历系统中，通常患者出院时，病历系统会根据出院诊断自动分配ICD编码。出院诊断中与脓毒症相关的国际疾病分类编码，可同时应用疾病诊断相关分组(diagnosisrelated group，DRG)记录。DRG是一种病例组合分类方案，根据患者的一般情况、疾病诊治过程等因素，将患者进行分组管理，从而根据不同分组进行医疗付费的一种管理体系。

ICD-9/ICD-10编码是患者出院时根据诊疗记录分配的，体现诊疗过程，可信度极高，但漏诊可能性大，脓毒症的发病率可能会被严重低估[10-11]。且明确的脓毒症编码使用的是基于疾病分类的ICD编码，更易受到相关政策的影响[12]。如在德国，没有进行过血培养的患者无法被分配脓毒症ICD编码[11]。MIMIC数据库中，使用明确的脓毒症编码(严重脓毒症、脓毒症休克的ICD-9编码)，筛选出的脓毒症患者数量小于Angus方法或Martin方法[13]。随着对脓毒症认识的加深，脓毒症的诊断水平显著提高，脓毒症ICD编码的比例随着时间的推移而增加，在较晚时间接受诊治的患者，出院时被诊断为脓毒症的可能性更高[14-15]。但脓毒症的诊断标准是不断更新变化的，如果数据库中的数据时间跨度较长，此时应用ICD编码进行脓毒症患者的筛选可能面临标准不一致的问题。

2.2 Angus方法 Angus等[16]于1994年在美国严重脓毒症流行病学研究中提出的用于诊断严重脓毒症的新方法，基于Sepsis-1的标准，定义严重脓毒症=感染+急性器官功能障碍。其使用了国际疾病分类第九版临床修改(International Classification of Diseases，Ninth Revision，Clinical Modification，ICD-9-CM)编码鉴别细菌或真菌感染及急性器官功能障碍，当患者同时具有这两种ICD-9-CM编码即可被诊断为严重脓毒症。Angus等共筛选出1 286个诊断感染的ICD-9编码，如562.13，结肠憩室炎伴出血；急性器官功能障碍主要包括心血管、呼吸道、神经系统、血液系统、肝、肾6个器官系统，如785.51，心源性休克。

Angus方法在ICD-9-CM中具有很高的敏感度，且该方法符合Sepsis-3中脓毒症的定义，故在Sepsis-3的定义出现后依然被不断使用[17]。但是Angus方法最初应用于严重脓毒症患者的筛选，在使用这种方式筛选时，会降低脓毒症患者的病例数；同时，Angus方法要求确诊感染，有明确的关于感染的ICD编码，这同样会缩小脓毒症Sepsis-3的诊断范围。在实际数据提取中，使用Angus标准筛选脓毒症时，可单独使用感染与急性器官功能的ICD-9编码，也可联合脓毒症ICD编码，以减少漏诊的可能[18-19]。

2.3 Martin方法 Martin等[20]在2004年进行脓毒症流行病学研究时提出此方法，同样是基于Sepsis-1的标准。在这项研究中使用ICD-9-CM编码，脓毒症代码包括038(败血症，septicemia)、020.0(败血症等疾病，septicemic)、790.7(菌血症，bacteremia)、117.9(播散性真菌感染，disseminated fungal infection)、112.5(播散性念珠菌感染，disseminated candida infection)及112.81(播散性真菌心内膜炎，disseminated fungal endocarditis) 6类相关疾病。急性器官衰竭则包括心血管、呼吸道、血液系统、代谢系统、神经系统、肝及肾7个系统32种急性器官功能障碍有关疾病的ICD-9-CM编码，或当前程序术语(current procedural terminology，CPT)编码。脓毒症伴发急性器官功能障碍则诊断为严重脓毒症。

Martin方法在临床研究中应用较多，只是其更关注败血症及血源性感染[20-21]。与Angus方法一样，Martin方法中的严重脓毒症的筛选方式符合Sepsis-3中脓毒症的定义，故部分试验使用该方法筛选脓毒症患者[13]。这种方式无疑大大缩小了脓毒症患者的诊断范围，所筛选的脓毒症患者病情更重、死亡率更高[20]。

2.4 Sepsis-3标准法源于2016年提出的Sepsis-3诊断标准[1]。Sepsis-3对于脓毒症的定义是感染+SOFA评分急性变化≥2分。使用Sepsis-3标准筛选脓毒症患者可以不依赖于疾病编码(如ICD-9/ICD-10编码)，而使用电子病历中患者的病理生理数据，更好地利用了数据库，所得的结果更具有可比性[15]。使用Sepsis-3标准可以估计脓毒症发生的近似时间，而不会同上述三种方式将脓毒症的诊断扩展至整个住院时间。对于脓毒症患者的具体筛选方式，如对于怀疑感染，可以用抗生素的使用+留取培养来定义，将两者中最早的时间定义为怀疑感染时间，在怀疑感染时间的前后一段时间内计算SOFA评分，如SOFA评分增加≥2，则可诊断为脓毒症。对于部分研究，可能需要确定具体的脓毒症发生时间，如精确到某一小时，可以分别计算每小时或每一时间段内SOFA评分，以确定脓毒症近似发生时间，为脓毒症预测、模型建立等提供可能[22-23]。

Sepsis-3标准对于数据库内容要求较高，如治疗信息、生命体征、实验室检查结果、出入量记录等，这些记录可能会受到临床医生和医院差异的影响，如关于心血管系统的SOFA评分，可能会因为临床医师对于血管活性药物的使用及其种类和剂量的差异而产生区别。一些病例数据缺失较多，影响了病例筛选及后续的数据分析，如采用插补的方式弥补数据缺失的不足，则需要对很多数据标准进行重新定义，对原始数据影响较大。也有部分研究，利用Angus标准完成脓毒症Sepsis-3中对于感染的诊断，使用Angus标准中与感染相关的代码确定感染，如果同时满足SOFA评分的标准，即诊断为脓毒症[24]。只是Angus标准中的感染均为确定感染，可能会缩小Sepsis-3对于脓毒症患者的诊断范围。

2.5 其他筛选方法部分研究采用了入院时的脓毒症诊断，这部分研究所用的数据库可能是前瞻性研究数据库[25]。这种数据库的数据质量更高，但病例数可能较少，部分研究受限；也可能是入院诊断为脓毒症的患者接受了脓毒症的相关治疗，对于某些关于脓毒症治疗方式的研究更有利[26]。部分研究采用了Sepsis-2的标准筛选脓毒症患者，随着Sepsis-3的提出，这一筛选方式的使用较前减少[27-28]。

还有如Dombrovskiy等[29]的方法、医疗保险和医疗补助服务中心(Centers for Medicare&Medicaid Services，CMS)标准等，多用于脓毒症的流行病学统计，临床研究使用较少，不做过多介绍。

3 结语

基于数据库的脓毒症相关研究有多种病例筛选方式可供选择(表1)，没有哪一种方式比另一种更优秀[30]。不同的研究可能需要不同的诊断标准，如Angus、Martin方法最早是为研究脓毒症流行病学，其诊断不关注疾病的具体发生时间。因此部分研究会在使用Angus标准时有其他条件限制，如入住重症监护病房后的前3 d内使用静脉输注抗生素等；而Sepsis-3标准为估算脓毒症发生时间提供了可能。不同的筛选方式得到的结果差异很大，如Angus等[16]估计1995年美国严重脓毒症的年发病例数为75万例(300/100 000)，住院死亡率为28.6%；Martin等[20]估计2000年美国严重脓毒症的发生例数为25.6万例(81/100 000)。即使使用同一数据库的数据，采用不同的脓毒症筛选策略，所筛选的病例数量也可能有3倍或更多的差异[13,31]。以MIMIC数据库为例，采用Sepsis-3的标准，使用EMR的临床信息记录进行筛选，所获得的病例数最多，Angus标准其次，Martin标准再次，明确的脓毒症编码所获得的病例数最少，病例死亡率与之相反。使用不同的策略可以筛选出病情严重程度不同的患者队列，其发病率、死亡率会有很大差异。总体来说，筛选出的患者数量多，则疾病的严重程度较轻，死亡率更低，反之亦然。不同研究应根据具体内容选择适合的病例筛选方式。

表1 数据库中脓毒症病例常见筛选方式及特点