沈智达 傅国胜
近年来,专业学位临床医学研究生培养目标由以专业实践能力为主导转向为以综合素养培养为主导,已形成了以专业学位临床医学研究生培养方案以及住院医师规范化培训计划的“双轨合一”培养模式[1]。“双轨合一”旨在通过强调课堂教育与临床实践相结合,从基础医学教育、临床能力实践以及科研能力培养三方面有机结合,切实保障专业学位研究生综合素质的培养,提升教学质量,有效节省教育资源,提高人才培养效率,从而培养符合社会需要的综合性卫生技术人才[2]。然而,二级学科培养方案尤其是内科学和外科学专业硕士培养过程中科室培养时间紧凑,培养重点更倾向于提高临床技能,导致专业学位研究生存在临床研究能力欠缺的通病。在心血管专业学位硕士的培养中,这一问题同样明显,尤其对于就职于科研要求较高的附属医院的临床医生,研究能力的短板成为自身发展以及晋升方面难以逾越的障碍。
随着信息技术以及互联网技术的发展,医学中心内爆炸式增长的数据为大数据分析的操作以及实践提供了良好的基础。但由于数据容量巨大,数据存储方式杂乱,数据存储类型繁多,如何从大量数据中提取有价值的信息成为信息时代新的难题。近年来,基于公共医学大数据的循证医学为疾病流行病学统计、预后生存分析以及对于各种诊疗指导提供重要作用[3]。本文基于现阶段“双轨合一”培养模式,以重症监护医疗数据仓库(medical information mart for intensive care,MIMIC)作为主要练习手段,就培养心血管内科专业学位研究生“MIMIC数据获取-回顾性研究分析-临床结局探讨”的方法和步骤进行探讨,期望进一步提升现阶段“双轨合一”培养模式下心血管专业学位研究生主动发现临床问题,获取临床数据,探讨临床规律的相关能力。
目前,心血管内科教学主要对象是参加住院规范化培训的内科住院医师以及专业学位硕士研究生。然而,目前大型三甲医院心血管内科的特殊性现状对于年轻医生系统认识心血管疾病造成了一定的阻碍[4]。一方面,心血管内科就诊患者数量庞大,周转较快,导致学生在住院医师阶段的工作较为机械。同时,住院患者多以介入治疗为主。因此,心血管疾病治疗相关能力培训仍有欠缺。另一方面,由于目前医疗指标考核的压力,医院心内科更多倾向于收集相对病情较轻且介入治疗指征较为明确的患者。因此,临床环境和规培方案之间的现实冲突使住院医师在规培中存在理论与实际脱轨的情况。尤其是心血管专科研究生,在临床中往往搜集不到合适的研究对象人群来开展临床研究,从而对后续科研能力的提升以及自身的发展产生一定的影响。
与此同时,心血管研究领域正经历着由经验医学至循证医学乃至精准医学的重大变革[5]。心内科疾病谱也由以往较为单调的冠心病、心力衰竭等转变为更精准复杂的罕见疾病。基础心血管领域基因组学以及蛋白质组学的飞速发展也为心血管新领域变革打下良好基础。这些领域的飞速转变对目前心血管领域的医务人员提出了更高的要求。
大数据有别于传统的临床数据统计分析以及基础生理化学实验的开展。大数据已完成了原始数据的积累,更注重工作者对于数据的搜集、筛选、整合以及总结的相关能力[6]。近年来,由于信息化技术在医疗方面的广泛应用,生命科学领域信息数据获得了爆炸式增长。医疗大数据涵盖范围较广,包括基于电子病历系统的数据存储仓库、就医挂号平台、医患沟通平台等等。其中,基于电子病历系统的数据存储仓库是医疗大数据的核心内容,其包括就医患者基本信息、入院前病情及生命体征、在院期间诊断及治疗、相关辅助检查结果以及病人在院以及出院转归情况,是诊疗行为的核心。通过标准化、规范化采集以及存储相关信息有助于不同医疗部门之间信息交互和共享,有效提升了医疗数据利用的广度以及深度,从而为后续数据分析提供帮助。
目前,最新的MIMIC-Ⅲ涵盖了以色列Beth Isreal Deaconess 医学中心重症监护病房53 423 人次去隐私化后患者入ICU记录,包括患者基线资料、监护记录仪数据、相关用药、护理文书以及死亡事件等。其中,由于其死亡信息与当地社保机构相绑定,因而可以轻易追溯到相关患者真实可信的死亡事件。庞大的患者群以及丰富的临床信息使得多种分析方法的实施变成了可能[7,8]。
MIMIC 数据库监护室数据主要来源于内科ICU、心脏外科ICU、外科ICU、心内科ICU、创伤外科ICU和新生儿ICU,其数据存储是通过SQL语言架构存储。通过对首次入ICU 数据进行患者分类,即可以发现共有7 726 人次入心内科ICU 记录。因此,心内科ICU数据可为心血管专业研究生大数据运用能力培养提供充足素材。同时,MIMIC 数据库中对心血管常见疾病谱进行分析,例如冠心病(ICD-9码:4142,4143,41401 等)、心房颤动(ICD-9 码:4273)以及慢性心力衰竭(ICD-9 码:39891,40201,40291,40413,40493,4280 等)都有数万人次的住院诊断。因此,作为心血管目标研究人群,其具有充足的目标人群可用于后续的分析。
以3名浙江大学医学院附属邵逸夫医院心内科专业硕士为对象,采用“MIMIC 数据获取-回顾性研究分析-临床结局探讨”的方法进行运用大数据能力的培养。培训计划旨在培养研究生主动分析问题,主动寻找数据源,主动学习提取数据并对数据进行统计总结得出结论的一个过程。
4.1 选取问题 在初始阶段,通过立足于临床实际,对研究生进行相关临床问题的启蒙,引导学生先探索单项实验室指标与感兴趣的临床结局之间的关系,并自主检索既往文献进行初步解释。例如有关红细胞分布宽度(red cell distribution width,RDW),既往研究中关注RDW于血液系统疾病中的作用,RDW 宽度升高往往代表贫血,血液系统疾病可能。近年来,RDW 发现同炎症反应、肿瘤进展等均存在一定关系[9,10]。最近研究显示,RDW 发现与心血管疾病存在显著相关性,例如房颤,心衰以及冠心病等[11~13]。然而,探讨RDW与合并心血管疾病重症患者死亡率的相关性研究目前仍非常匮乏。因此,可以引导学生探索关于RDW于罹患心血管疾病重症患者中的诊断以及预后价值。
4.2 通过数据源提取数据 通过Physionet 申请MIMIC 权限后,通过SQL 获取MIMIC 相关临床数据。同时,可以通过ICD-9 编码选定患某种特定疾病人群。类似的,在ICU 期间相应用药可以通过prescriptions 查询得到,而ICU 期间实验室结果也在labevents 中可查询得到。所有数据都是去文字的,是通过编码进行存储,需要通过另一张工具表例如d_icd_diagnoses 或者d_labitems 等予以查询。将相应数据通过相应工作表查询并进行提取后,整合在一张表格中,用于后期分析。
4.3 数据统计分析 通过选择MIMIC 数据库入组人群的相关资料,判断其是否符合正态分布而采用不同的方式表达其基线资料;而对于分析目标,可以通过既往文献资料或者Loess 拟合曲线乃至简单的区间划分划分不同的组别。对纳入的危险因素以及相关协变量,可以通过单因素分析用于筛选,对于存在显著差异的基因,可后续用于多因素logistic分析模型中。而对于患者生存结果分析,可以通过拟合COX模型予以实现。
4.4 得出结论 研究者通过分析单危险因素(如RDW)与合并心血管疾病重症患者临床结局(例如全因死亡率)之间相关性,初步得出结论。通过系统的训练,可以使研究生对于临床研究初步入门,同时培养研究生主动学习的能力,为后续独立从事临床研究工作奠定基础。
4.5 结果统计 通过1 年MIMIC 数据库练习,学员的自主学习能力和创新能力获得了明显的提高。一方面,通过结合主观和客观题的办法,在问卷调查中,3 名学生运用数据进行统计分析能力显著提高;同时,1名学员使用我院心内科数据库成功发表2 篇SCI 论文,1 名学员使用MIMIC 数据库发表1 篇论文。提示通过数据库进行大数据科研方法的培养对专业学位研究生提高数据运用能力有一定可行性,后续拟对科室有志于从事大数据分析工作的学员进一步开展工作。
“双轨合一”培养模式对新时代专业学位研究生提出了更高的要求,不仅要求更完备的临床思维能力,同时需要自主学习并开展相关研究的能力。未来心血管界主力军的研究生人才更需要顺应目前医疗领域尤其是心血管领域发展趋势,在既往开展临床工作的基础上,着重培养具有“发现问题-获取数据-获得临床规律”能力的心血管领域医疗研究者,使其不仅具有合格的临床实践能力、良好的医德医风,同时又具有主动探索前沿高效临床进展,使用高效研究工具,开展临床研究的能力。部分缓解临床培训计划中研究生因所在医院目标病人数目不足、电子病历系统资料缺失以及实验室项目不够完备以及病理资料收集过程繁琐造成的困难,解决目前专业学位研究生培训过程中理论与临床实践连接不紧密,无法展开切实可行的临床研究的问题,为培养具有国际化视野的新型医疗工作者做出贡献。