柳青青,田国祥,宋伟伦,耿辉,王雪,吕军
重症医学是研究任何损伤或疾病导致机体向死亡方向发展过程的特点和规律性,并对重症进行治疗的学科[1]。该学科重点是对危重患者实施监护、对器官功能低下或衰竭脏器实施器官支持,使患者在保证氧输送和维持器官功能条件下赢得去除病因的时间[2]。由于有完整的学术内涵与自身特点,重症医学已成为应对突发公共事件、抢救危重患者时,不可替代的专业学科[3]。重症医学科已被证明能够适应变化,并引领学科发展。大数据时代为重症医学的研究提供了前所未有的机遇,可以预见,通过加强基础与临床研究,充分利用大数据与人工智能是未来重症医学的发展趋势[4]。
为了促进重症医学研究工作,在美国国立卫生研究院的资助下,由美国麻省理工学院计算生理学实验室、贝斯以色列迪康医学中心以及飞利浦医疗共同发布的MIMIC(Medical Information Mart for Intensive Care)数据库收集整理了2001~2012年间住在贝斯以色列迪康医学中心重症监护室共4万余例真实患者的临床诊疗信息[5]。该数据库样本量大、信息全面、跟踪患者时间长、并且可免费申请使用,为重症医学的研究提供了丰富资源。但MIMIC数据库在使用过程中涉及到编码的工作,这对于临床医生来言是一个挑战。github(网址:https://github.com/MIT-lcp/mimic-code)是一个开放的平台,该平台提供了分析患者特征的开源代码包,可以免费下载使用,当发现代码包需要改进时,可修改并在讨论区分享,供其他研究者下载使用。该代码库是研究人员使用MIMIC数据库的有利工具。
MIMIC是一个重症医学数据库,全称是Medical Information Mart for Intensive Care。在美国国立卫生研究院的资助下,来自贝斯以色列执事医疗中心、麻省理工、牛津大学和麻省总医院的急诊科医生、重症科医生、计算机科学专家等在2003年共同建立了这个数据库。该数据库在建立之初的名字为Multiparameter Intelligent Monitoring in Intensive Care Ⅱ,简写为MIMIC Ⅱ。2016年MIMIC Ⅱ升级为MIMIC Ⅲ。 目前的版本是1.4(V1.4),共包含了2001年6月~2012年10月间在重症监护病房住院的38 645例成年个体和7875例新生儿的58 000余次住院资料。这些资料被整理成了26个CSV格式的表格供研究者查询。不仅如此,MIMIC Ⅱ及MIMIC Ⅲ都与社保数据库相连接,记录了患者的随访时间和结局,这一点对于开展远期预后研究来说极为关键。
MIMIC Ⅲ数据库一共有26个CSV格式的表格,这些表格详细记录了患者在ICU治疗期间的几乎所有的数据,比如实验室检查数据、人口学特征、微生物学检查结果、住院期间的流转、治疗过程、液体进出量等。表格主要分为两种,一种是以D开头的,表示该表格为字典,比如d_labitems,表示实验室检查字典,内含每个实验室检查结果的说明;没有以D打头的表格则是记录患者信息的表格,比如labevents表示患者住院期间的所有实验室检查结果。
MIMIC代码库的代码可在线获取,而且是开源的。根据网址https://github.com/MIT-lcp/mimiccode打开网页,进入代码库,界面如图1所示。
图1 代码库界面
代码库主要由基准,buildmimic,概念,notebooks,notebooks/aline,测试以及教程这七个部分构成(表1)。
表1 代码库内容及功能
研究过程中要使用的代码主要集中在概念部分,因此,本文将着重介绍概念部分,方便读者快速了解代码库的内容并查找所需代码。概念部分的结构如图2所示。
3.1 合并症合并症是指由一种疾病的发展所引起的另一种疾病或症状。住在重症监护室的患者都是危重患者,住院时间长,损伤性操作多,留置管道较多,护理中稍有不慎,极易发生各种合并症(如院内感染等)。大多数ICU患者在急性发作前都患有慢性疾病,这些疾病会影响他们在危重疾病下幸存的可能性[6]。MIMIC数据库样本量大,患者信息全面,可提供充足的并发症资料,帮助临床工作人员进行相关研究。Elixhauser等利用代码将这些合并症分类[7],如肥胖,凝血病和电解质紊乱等。美国健康与研究质量小组继续利用项目维护这些代码,并根据诊断和治疗的变化对其进行相应调整[8]。这些代码都可以在MIMIC代码库中找到并下载使用,界面如图3所示。
图2 概念部分内容
图3 合并症代码界面
3.2 脓毒症脓毒症是指由感染因素引起的全身炎症反应综合征,严重时可导致器官功能障碍和(或)循环障碍,是严重创伤、烧伤、休克、感染和外科大手术等常见的并发症。按脓毒症严重程度可分脓毒症、严重脓毒症和脓毒性休克,进一步发展可导致多器官功能障碍综合征等[9]。流行病学研究显示其发生率呈逐渐上升趋势,已成为导致人类死亡的重要因素之一[10]。许多学者都致力于脓毒症的研究,但MIMIC数据库中并没有直接表示脓毒症的代码。Angus和Martin等利用管理数据,特别是在出院时获得的账单编码,回顾性进行脓毒症的鉴定,使用一组代码定义了脓毒症的算法[11]。Angus等提出的标准在Iwashyna等的后续研究中得到了验证[12]。这些代码可以在存储库中下载使用(图4)。
图4 脓毒症代码界面
3.3 疾病严重程度评分ICU患者病情复杂多变,因此,风险水平的准确判定对ICU患者极为重要,规范标准化的、具高精确度和特异度的评分标准为临床医生的诊治提供了依据。近几十年来,疾病的严重程度评分不断发展。这些评分可客观评估新入住患者的病情严重程度及判断预后。在临床研究工作中,可以对患者人群进行风险调整,以进行基准测试和研究,例如临床试验中的比较队列和观察性研究[13]。但这些评分纳入的指标较多,计算较复杂,不同疾病的严重程度评分所纳入的指标也不同,在MIMIC数据库中,也无法直接获取表示疾病严重程度评分的指标,增加了利用MIMIC数据库研究脓毒症的难度。这一问题在MIMIC代码库中得到了解决,目前在该代码库中包含了三种疾病严重程度评分:牛津大学疾病严重程度评分(OASIS)(图5),简化急性生理学评分(图6)(SAPS)以及序贯性器官功能衰竭评分(SOFA)(图7)。疾病严重程度评分代码界面如图8所示。
图5 牛津大学疾病严重程度评分
图6 简化急性生理学评分
图7 序贯性器官功能衰竭评分
图8 疾病严重程度评分
OASIS是由Johnson等建立的疾病严重程度评分系统,旨在简化危重护理中的风险调整。与传统疾病严重程度评分不同的是,OASIS的计算仅涉及10个参数,包括转入ICU前住院时间、年龄、心率、平均动脉压、呼吸频率、体温以及尿量等,不依赖于任何实验室检验指标[14]。SAPS是目前临床上常用的疾病严重程度评分之一[15],由17项变量[生理学变量12项、年龄、住院类型及3种慢性疾病——获得性免疫缺陷综合征(AIDS)、转移癌和血液恶性肿瘤]构成,每项变量分值不等,最低0分,最高26分,总分0~163分。生理学变量仍取患者入住ICU后第1个24 h内的最差值(即得分最高者),缺如项视为正常,总分越高,表示病情越重,预后越差。SOFA评分的目的是描述多器官功能障碍综合征的发生、发展并评价发病率;定量的、尽可能客观地描述群体患者乃至个体患者在不同时间脏器功能失常或衰竭的严重程度;评价新疗法对脏器功能失常或衰竭病程的影响,具有客观、简单、容易获得及可靠的特点,对所评价的器官功能有特异性,每个医疗机构都能以常规的方法每天检测,避免了有创性操作。这些变量与患者来源、病种、人口统计学特征等因素无关,与治疗措施无关,它能区分单个器官功能障碍或衰竭的程度。在MIMIC代码库中有直接上述三种评分的代码,可极大程度节省研究人员的时间与精力。
除此之外,该代码库还提到了三种可通过编码获得,但目前尚未完成的疾病严重程度评分(图9),分别是简化急性生理评分Ⅱ,简化急性生理学评分Ⅲ以及急性生理与慢性健康评分Ⅳ,研究人员可以自行编写代码并上传到讨论区与其他用户进行交流。
图9 文件查找页面
3.4 其它MIMIC代码库中还包含了人口统计学资料,诊断,第1 d入住ICU的情况,液体平衡,器官衰竭及各种治疗的起止时间或各种现象的持续时间等指标的代码。研究者在使用MIMIC数据库的过程中,可直接下载并使用这些代码。为方便用户快速找到所需代码MIMIC代码库还设置了文件查找功能(图9),极大提高了研究者的工作效率。
医学研究是不断在进步的,代码库中现有的代码并不能够满足全球科研工作者的需求。MIMIC代码库不仅可提供代码,还支持全球的研究者在讨论区上传自己的代码(图10),可加强MIMIC数据库的维护者与普通用户之间的交流。研究人员可以在讨论区提出关于收集和分析数据的问题,有经验的用户可以提供见解和建议。这种对应关系有助于对数据进行适当和有意义的使用,并且由于所有讨论都是公开的,讨论结果可直接被下载使用。这项功能可以鼓励研究人员为MIMIC代码库做出贡献,也可促进代码库的不断发展。
MIMIC数据库收集整理了2001~2012年间住在贝斯以色列迪康医学中心重症监护室共计4万余名真实患者的临床诊疗信息,样本量大,信息全面,且免费向全球的研究者开放,为重症医学的研究提供了丰富的数据。但MIMIC数据库使用过程中涉及到编写代码的问题,对于普通的临床工作者来说,操作难度太大。Github为MIMIC代码库搭建了一个平台,该代码库中有大量分析患者特征的开源代码包,包括合并症、疾病严重程度评分、脓毒症及人口统计学资料等,为大多数研究者解决了编写分析代码的困难。此外,该平台还提供了讨论交流区,用户可提出问题并与其它用户探讨,或上传自己的代码,经验证后供其他用户下载使用,这种交流可以促进MIMIC代码库不断的发展。本文介绍了MIMIC代码库的主要内容,旨在减少科研工作者在编写代码等方面所花费的时间和精力,从而帮助科研工作者快速、高效的进行科研工作。
图10 讨论区界面