袁骏毅,汤钦华,马群圣
上海交通大学附属胸科医院 信息中心,上海 200030
随着精准医疗以及智慧医院的深入,医院信息化的重点需要更精细化地聚焦在专病与亚专业的科研与决策方面。医学上专病的研究往往伴随着大量的患者信息,以及贯穿整个诊疗活动的医学检查和影像学资料等,在每个专病领域中又各有特殊的要求。目前,国内用于特定专病研究的数据库正处于蓬勃建设阶段,金涛等[1]通过研究归纳国内专病数据库的建设情况发现,虽然包括运动障碍、前列腺癌等专病数据库建设取得了较好的效果,但是数据库中主要是患者病史,结构化程度不高,手术数据等仍有待完善。Barnes等[2]和Khan等[3]通过对特定专病的研究认为,专科病例数据库可以促进疾病的健康教育、治疗与随访的效果。胸腺瘤作为前上纵隔原发性肿瘤,病理类型复杂,临床医生往往由于辅助专业知识限制因而认识有限[4]。因此,研究胸腺瘤专病数据库的建设对于临床工作的有效展开具有重要的现实意义。
上海市胸科医院为三级甲等专科医院,在胸外科疾病诊治方面具有明显的学科优势与专业特色。本文以胸科医院为背景,通过在电子病历系统中新增病种模板,进行数据库需求分析和整体架构构建,设立数据质量评估指标体系,建设基于结构化电子病历的胸腺瘤专病数据库,为此类专病的诊疗质量、临床方案与医疗决策提供数据和技术上的支持。
建立胸腺瘤专病数据库的前提,在于能够从专病病历中采集到有效的数据。因此,需要通过细化医生的输入模式,对病种的关键病历内容进行分析与处理,进而在电子病历系统中设立专病结构化模板[5-8]。专病模板的结构化是较为复杂的工作,既要考虑结构化后录入的方便,又要兼顾数据元颗粒度的大小,足以支撑病历检索和分析[6-10]。在数据库需求分析阶段,采用了现场扎根访谈的形式,根据目的性采样的原则,与胸外科共计4位医生进行需求调研(2位副主任医师、2位主治医师)。调研结果表明:医院现有的电子病历虽然已经实现部分结构化,包括入院记录、首次病程录、手术记录、出院小结等15种病历文书。但是已有的病历文书强调描述性信息,缺乏针对专病管理需求而制定的关键指标,无法后续进行病种数据的采集与挖掘。经过分析讨论,最终确定的胸腺瘤结构化专病模板包括患者信息、诊断、检查及检验、手术情况(如Osserman分期、肿瘤情况)、术后情况、病理报告等内容,共计689个结构化指标项。例如,结构化后的胸腺瘤手术记录模板见图1。
图1 胸腺瘤结构化手术记录模板
胸腺瘤专病数据库依托于临床数据中心(Clinical Data Repository,CDR)进行建设,以专病患者为研究对象,将此类疾病的入院诊断与出院诊断编码(ICD10码:D38.401、C37.X00等)进行标签,独立于其他类疾病,最终实现以患者身份证为主索引,建立完整的诊疗过程中产生的数据记录。数据来源范围涵盖了医院信息系统(Hospital Information System,HIS)、电子病历(Electronic Medical Record,EMR)系统、医嘱系统、检查检验系统、病理系统等。实现对胸腺瘤专病数据多层次多角度的分析,为临床诊断提供数据支撑,系统架构见图2。
图2 系统架构
由于专病数据库存储方案高度依赖于所需解决病历的信息表示模型,传统的关系数据库事先虽可明确定义属性和关系,但无法描述复杂的数据类型。因此,胸腺瘤专病数据库基于XML技术进行存储,采用了SQLSERVER的R2版本。R2版本是一种基于标准病历数据描述的语言,可以满足临床诊疗过程中如主诉等直诉性内容的记录,同时也支持SNOMED等医学标准术集的结构化嵌入,在结构化与文本化之间达到灵活控制。为了在复杂的医疗信息环境中具备良好的适应性,数据库不仅开放标准的XML数据访问方式,同时临床文档以XML Schema的URL形式注册在数据库中,提供以文件目录展现的虚拟文件,避免调阅方花费精力进行二次解析,快速实现多种格式类型的文档查看。
数据中心CDR采用数据库复制技术从生产库上实时发布订阅,然后采用ETL技术把数据抽取入库,在抽取过程中对临床数据进行相应的清洗和转换工作,胸腺瘤专病数据库则定时从CDR按设定的病种标签规则同步更新数据。专病数据库存在大量与其他系统的集成,其他临床系统支持直接调用专病数据服务接口,调用方式通过面向服务的架构进行分布式的部署及应用。在与科教平台、数据分析平台等系统对接时,方便医院在临床业务系统中调阅胸腺瘤专病数据的相关服务[11-14]。
定期对专病数据库进行数据完整性与准确性方面的检查非常重要。因此,结合胸腺瘤专病的实际特点,经过与医务管理部门多次讨论,从数据的采集量、数据的多态性、数据综合质量及系统建设质量等四个方面来设立数据库质量评估体系,为日常巡检数据收集的可用性制定了判断的依据。如表1所示。
表1 胸腺瘤专病数据库建设的质量评估体系
目前医院已完成了胸腺瘤结构化专病数据库的建设,实现了患者数据的集成。正式投入使用后,共收集了394例胸腺瘤患者的诊疗数据,这些数据全部转化为可供查询分析的结构化数据。目前数据库的数据量约为45万条记录、21兆容量(不含影像资料)。随着医院的业务增长与数字化更精细化,经统计对比,每年收录的数据量约有10%的复合增长率,满足了临床医生快速及准确的获得患者信息资源的需求。
专病数据库对临床提供统一的检索服务,实现了常规的文字搜索和高级特定范围搜索。常规搜索功能类似百度之类的搜索,提供搜索词联想功能、分词功能、同义词以及在结果中检索等功能,检索结果中关键字以高亮的形式显示。改变了医生以往需要在多个业务系统进行调阅的不便之处,支持更快速地定位到符合研究要求的患者,将患者历次就诊以结构化数据的明细结果导出,便于对数据进一步综合分析和使用。数据库应用效果图,见图3。
图3 数据库应用效果图
胸腺瘤数据库的价值不仅在于数据本身,更在于充分利用数据进行回顾性分析所产生的价值。专病数据库的建设是一个持续的过程,随着医院信息化建设的不断完善,专病数据库中接入的数据将越来越全面。医院通过胸腺瘤数据库中建立的6个数据分析模型,在此基础上临床医生完成了4个科研随访项目的研究,取得了一定的成效,对于医院在病种数据库的建设上起到了以点到面的示范性作用[15-16]。可以预见的是,随着各个医院单病种专病数据库的完善,有利于推动未来的区域内医联体构建更大型的、整合多家医疗机构的多中心专病数据库,在病种数据的标准化以及跨院数据综合利用上起到支撑作用,进一步促进医务人员更好地分析胸腺瘤疾病的发展趋势,完善临床治疗方案,为患者提供更加优质的服务。