姬娜 潘杰 冯源 丁涛
摘要:目的:针对医院未来管理及医疗业务需求,构建基于VMware vSphere的医院大数据中心平台。方法:通过ETL的DataStage工具将各异构系统数据进行抽取后,统一存储管理,构建基于统一数据平台的数据分析及应用。结果:实现数据中心的日常业务管理、临床医疗体系管理、资源管理、控制管理以及医院数据信息的集中共享和交互。结论:统一集中的数据中心平台保障了医院业务核心数据完整性、准确性,达到数据管理可视、高效、便捷的交互和应用,为医院信息系统挖掘临床数据和临床事务统一处理提供有力支撑。
關键词:医院;大数据;异构数据;共享
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2022)18-0015-03
开放科学(资源服务)标识码(OSID):
1 引言
近年来,随着高质量发展的要求,各个医院以信息化为抓手,不断通过信息技术在诊疗、服务、管理过程中的应用,推动医改政策的落实和深化[1]。为了便于业务工作和精细化管理,医院陆续实施众多不同的业务及管理信息系统,不同系统的多样性和复杂性导致各系统间数据分散[2],特别是系统的异构性和数据标准不一致[3]使得数据的共享和深层次挖掘利用变得非常困难,如何通过数据信息整合手段实现分散数据资源的集成和利用,进行统一存储和管理,构建以患者为中心的临床数据中心,逐渐成为支撑医院发展和数字化建设的重要内容。
本文基于VMware vSphere构建医院大数据中心平台,实现以患者为中心的服务流程应用、以诊疗数据为中心的数据挖掘应用、以成本核算为中心的运营决策支持、以专病数据库为中心的科研管理应用以及以专病案例库为中心的教学管理应用五大体系,完善历史数据、归档数据中心建设,实现医院人、财、物信息的一体化管理,患者、诊疗、业务数据的统一和共享。
2 医院大数据中心平台的总体架构
系统采用数据访问层、Web服务层、客户端应用层三层架构[4]。在功能上,由四个层面组成,由下往上分别为医疗资源信息平台应用层、医疗资源信息平台交换层、医疗资源信息平台资源层、医疗资源信息平台应用层。基础应用层即临床服务以及医疗管理各业务基础系统。医院大数据中心交换层实现各系统基于数据标准的实体信息交换,同时能够为医疗资源信息平台数据标准化提供实现路径,保障业务子系统的协作和信息平台资源层的标准化获取。信息平台交换层通过集成平台中间件工具来实现。信息平台资源层是医疗信息资源平台的核心,由临床大数据中心、运营大数据中心、科研大数据中心、教学案例库组成。平台应用层实现对外交换,接入区域卫生信息平台或其他医疗机构,实现不同的信息系统、不同的医疗机构之间的信息交互及其共享应用。同时基于信息资源层的数据进行分析利用,如临床科研分析、运营决策分析等,搭建患者临床信息集成视图、健康门户等,如图1医院数据中心平台架构图所示。
3 医院大数据中心功能应用
3.1 临床数据中心建设
临床数据中心(CDR)在基于电子病历的信息平台中主要扮演信息资源层的角色,用于平台各类数据的存储、处理和管理[5]。各业务子系统产生的医疗信息业务数据、临床及管理信息数据,通过临床大数据中心进行整合患者基本信息、医疗卫生从业人员注册信息及各种术语字典等由此形成电子病历信息。整合集成了医院分散的各业务系统,建立全方位患者临床数据中心,对患者在院内发生的所有临床活动相关的数据以患者为中心进行组织关联,对患者就诊数据做360°全方位展示,更好地辅助医务人员完成临床业务,同时为科研工作奠定基础。临床辅助决策系统 CDSS 包含智能诊断模块、治疗方案推荐模块、医学知识库模块,按照不同的模块又分为几大核心功能:辅助诊断、检查推荐、用药推荐、量表推荐、相似病历推荐、知识查询。在建设统一的临床数据库的基础上,逐步建立面向疾病、医生、患者、卫生经济等主题数据集,为医护人员提供统一完整的数据展现。同时,对原始数据进行整合后提供数据检索和导出工具,服务于医疗科教。实现临床信息数据的互联互通,根据诊疗规范、临床路径及循证医学,辅助医生进行决策,提高医疗质量。
3.1.1 患者主索引管理(EMPI)
患者主索引(Enterprise Master Patient Index,EMPI),是患者基本信息检索目录[6],将来自多个系统的患者标识进行关联,实现同一病人多业务固定标识号码(Identity Document,ID)的关联和患者信息的统一或关联。其本质上是一个数据整合系统,是在一个复杂的医疗体系内通过唯一的患者标识将多个医疗信息系统有效地关联在一起。整合后有效解决了多系统中识别病人身份的问题。患者主索引服务是指为保持在多域或跨域中用以标识患者实例所涉及的所有域中患者实例的唯一性所提供的一种跨域的系统服务。实现各个系统之间的互联互通,保证对同一个患者分布在不同系统中的个人信息采集的完整性和准确性。
3.1.2 主数据管理系统
主数据(Master Data,MD)是指医院各应用子系统之间的数据共享[7],包括数据实体(公用代码、疾病代码、费用代码、检验检查等数据)和数据字典(科室字典、药品字典、医嘱字典、手术字典等)。目前由于各应用子系统之间能够保证一致的主数据只包括少量数据实体,同时各应用子系统的数据字典不统一,医院得不到全局性的统计数据。通过主数据管理平台来定义数据的值域和制定标准,建立院内标准体系,提供必要的语义保证来实现互操作,统一管理医护、病患、科室、医嘱等数据及相关主索引。
3.1.3 临床数据集成视图
临床数据集成视图是基于临床数据中心进行数据的整合展现型应用,可以嵌入任何业务系统中,临床数据集成视图可以在一个操作界面上对多次就诊的所有临床信息按时间轴进行集中展现。通过时间轴,医护人员可快速了解患者的历次诊断、生命体征、出量入量、长嘱开立与停止、临嘱开立与执行,各项检查检验结果、手术完整过程、电子病历书写过程、临床路径出入径状况等临床信息,彻底解决医护工作者需要通过不同系统不同界面多次访问才能了解患者临床信息的状况。
3.1.4 临床辅助决策系统
充分利用大数据基础管理平台构建的临床科研数据管理系统进行临床数据采集、清洗和抽取,同时实现与其他业务系统的协同。考虑加入自然语言处理(分词+语义分析),建立基于病种的高频词+语料库,完善历史数据采集。建立科研病历库、标本数据库、基因数据库,进行大数据存储和利用。以智能医学临床辅助系统和智能医学科研分析系统实现基于病种的大数据分析,助力科研和临床工作。
3.2 运营数据中心建设
运营数据中心的建设是医院内各种业务系统、部门之间协同工作的数据中心,以患者、费用、科室、员工、病种纬度对运营效率进行数据接入和建模,是整体信息化基础设施的信息中心,用来存储多媒体、文档资料和政策法规,是预测决策所需的数据仓库中心。运营数据中心实现了数据的清洗、转换、标准化,以患者、费用、科室、员工、病种等纬度对医院内各种业务系统数据接入和建模,并且通过应用开发、商业智能(Business Intelligence,BI)展现等构建以主题为核心的业务应用,完成了实时动态、门诊分析、住院分析、数据上报、医疗质量及运营报表分类下的数十个报表及图表页面,将结果反映给管理人员,为医院预测决策提供支持。
3.3 科研数据中心建设
科研数据中心为有科研需求的医生提供数据统计、导出功能,辅助科研项目研究,整合集成了医院分散的各业务系统,建立了以患者为中心,关联历次就诊记录的全部诊疗病历视图,以支持诊疗医护的连续性,需要以单病种为主线浏览患者的历次就诊记录,进行队列管理,随访补录,以便对不同分组和队列病人进行结果的分析和统计,对病人在院内产生的相关的数据提供自定义组合查询及导出,同时为科研工作奠定基础。科研数据中心构建了以病人为中心、关联历次就诊记录的全部诊疗病历视图,以支持诊疗医护的连续性;支持以单病种为主线的患者的历次就诊记录浏览,患者随访、补录,并可以根据各种维度,自由组建患者筛选方案,设置患者观测指标,对患者临床数据进行统计导出,有效支持科研进展。
3.4 教学辅助支持系统建设
临床科教资料的积累是提高教学质量、激发学生学习兴趣的重要基础工作。针对临床教学资料的积累面临收集不易、不能共享、质量不高等困难。通过教学辅助支持系统的建设,我们为临床教学资料的收集、管理和使用提供信息化的工作平台。开发的教学辅助支持系统是由导师在360视图中标记具有教学意义的典型病历,审核通过后,由实习生查看学习的系统。建立三个教学资料库:标准化病例库、疾病影像资料库和学生实习病案库。三个库共同支撑临床教学的资料收集与应用、实习学生病历书写能力培养和考核。
3.4.1 数据资料标识与管理
数据资料是指病案、检查影像、手术录像、治疗过程的影像等临床资料,在形态上包括动态、静态影像及语音、文字、图表等多媒体。数据资料的标识是在临床工作中,如手术、检查、病历书写或治疗过程中随时对该数据资料标识为临床教学资料,然后进行管理及数据资料转录。
3.4.2 数据资料归类与标注
资料归类、标注是对已标识的数据资料按病种、课程或教学单位等进行分類,并进行数据的集成、归并和标注。
3.4.3 数据资料编目管理
为方便学生和教师对临床教学资料的使用,按使用权限对已整理好的资料进行编目和分级,方便查询、浏览。
3.4.4 数据资料质量审核
由授权教师对入库资料进行内容和质量的审核,确保入库资料符合教学要求。
3.4.5 数据资料检索与统计
提供资料检索、统计等管理功能。
3.4.6 数据资料浏览
提供教学资料在课堂教学、学生自学的查阅,支持台式机及手机上的浏览。
3.5 历史数据归集数据中心建设
整合集成了医院自2003年以来分散的各系统业务数据,建立患者360视图,对患者在院内发生的所有临床活动相关的数据以患者为中心进行组织关联,更好地辅助医务人员完成临床业务,同时为科研工作奠定基础。
3.5.1 标准化改造
ETL工具集包括对多种异构数据源进行格式和语法层面的抽取、清洗、转换等自动加工操作,以实现离散数据的互通机制。
3.5.2 数据采集服务
数据采集服务提供平台通过医疗机构前置系统从医疗机构信息系统采集健康档案信息,并对数据交换和数据采集行为进行规范化。主要功能包括:采集数据、数据转换服务、数据封装、代码解析、数据导入。
3.5.3 数据迁移服务
利用跨数据库平台数据存取技术实现历史数据和动态数据的整合与迁移,要求数据迁移工具支持常用的四类数据库系统:Oracle、IBM DB2、Microsoft SQL Server、Cache。利用数据迁移工具对医院旧系统中的数据进行迁移,提供人工录入数据的录入界面,由相应的人员对数据进行录入。基础数据录入完毕后对数据进行测试,包括数据字典测试、新旧数据对比等,保证基础数据的准确性,在此过程中可以对旧系统中的数据进行优化。
4 系统架构环境及实现
4.1 系统架构环境
采用双核心交换机Cisco N9k,采用多模光纤双链路聚合模式来实现链路冗余。通过虚拟化技术vpc对设备进行融合。网络架构部署按每层独立划分vlan。以内网Cisco N9k为基础,AP模式的无线网络覆盖了全院所有病区,通过Aruba7210对AP节点进行控制,POE交换机无强电汇集各个区域的AP从而达到一体化管理,通过两台光纤通道的交换机同步书写的方式对数据实时保护,以防发生单点故障时,医院核心业务数据做到“零丢失”,同时可快速切换至容灾存储来恢复业务系统。
4.2 系统实现
3台数据库服务器均配置采用H3C,UN-R6900-G3/DL580,CPU:4*5118(12核),内存:1TB,SSD:2*960G,R530-8i支持RAID0.1.5,双口千兆550W单电。两台数据库服务器实体机均安装ORACLE LINUX6.9操作系统,通过VMware vSphere平台部署WEB服务器、缓存服务器、日志服务器、ETL服务器(用于CDR、ODR数据采集)、BI服务,实现负载均衡,满足数据统一存储管理及数据备份要求,以保障数据的完整性及连续性。大数据中心通过HIS系统的集成平台Health Connet与各业务子系统进行数据交互。采用两台NetAppA300存储服务器作为数据的主存储和容灾存储。使用基础组件为Stage的IBM DataStage(简称DS)作为ETL工具,通过Active Stage完成数据的转换和加载,Passive Stage与数据库或者文件进行连接,然后让Active Stage完成其他操作,将医院历史数据归集。
基于VMware vSphere的大数据中心上线后,以信息大数据反哺临床医疗、科研和管理,为临床人员提供统一的数据整合视图以及实时的诊疗活动决策支持。根据医院上报数据要求将本地化非标准数据标准转换、规则校验以及敏感信息处理,实现了医疗质量与安全持续改进。
5 医院大数据中心的运行效果
基于VMware vSphere的医院大数据中心于2020年10月正式上线运行,其中临床“患者360视图”“科研数据中心”“单病种随访”“临床决策支持系统(CDSS)”四个核心模块能更好地服务于临床医疗及诊疗活动、构建以科研管理为核心的数据集成与挖掘、整合院内业务信息系统的各种数据表单,为临床诊疗和科研提供数据支撑,有效提升工作效率。数据上报模块基于完整的全院临床医疗数据,高效率、高质量地完成“委属医院数据上报”“流感数据上报”“流发热门诊数据上报”等近十个数据上报任务,筹建肝脾专病数据库等专科疾病库,根据临床科研工作需要,为后续建立其他专病数据库提供数据支持,为进一步建设电子病历、互联互通和数字化“智慧医院”奠定坚实基础。
参考文献:
[1] 董霞,杨泽华,陈曦.“十四五”时期综合性公立医院高质量发展探索与思考[J].中国医院,2021,25(12):21-23.
[2] 米春香.大數据技术助力医院精细化管理[J].中国医疗设备,2019,34(7):93-95.
[3] 丁涛,丁小春,周作林,等.医院多介质多渠道支付流程改造措施研究[J].卫生经济研究,2020,37(11):66-68.
[4] 贺佳彦.麻醉临床信息系统的建设及在麻醉质量控制中的应用[J].医疗装备,2015,28(17):120-122.
[5] 胡笑凯.临床数据中心建设及数据挖掘、关联应用[J].电脑知识与技术,2021,17(27):30-32,37.
[6] 周凯.智能化时代医院信息化建设与管理问题研究[J].电脑知识与技术,2020,16(36):250-252.
[7] 蔡芳.基于统一编码的企业主数据管理[J].电脑知识与技术,2017,13(31):3-4.
【通联编辑:代影】