赵晓婧,黄政
(1.广东省第二人民医院 医学工程部,广东 广州 510000;2.中国联合网络通信有限公司广东省分公司数字与智能化创新中心,广东 广州 510000)
广东省第二人民医院(原解放军第一七七中心医院)诞生于1947 年,2004 年3 月更名为广东省第二人民医院,是一家集医疗、教学、预防、保健、康复及科研为一体的大型综合性医院。自本院信息化建设工作开展以来,已建设有HIS、PACS、SAP、SPD 和微信预约等就诊平台。随着信息化进程的推进,信息系统建设的逐渐增加,这些系统对医院正常运营起到了良好的支撑作用。医院各类信息系统日常运行所产生的数据,也已经由TB 级逐渐发展到PB 级,数据总量巨大且种类繁多,各系统间信息又彼此独立,形成了各式各样的“信息孤岛”,使得数据不能共享,业务无法协同,给医院运营带来的价值也无法体现。
在传统的医疗信息化当中,数据从产生到消亡并没有为整个医疗体系带来显著的价值。当今的医疗信息系统更多是关注服务,缺少对信息系统所产生数据的深层次分析及价值挖掘。医疗信息系统生产的巨大数据可在医院日常运营、科研、临床诊疗及辅助决策等多个领域带来巨大的价值。针对以上所述的医疗信息化缺陷,利用数据中台技术结合现代数据治理方法论,实现数据标准化,建设科研模型、临床分析诊断模型、决策模型等,为各项医疗业务提供敏捷的数据服务。
中台是马云在2015 年参观一个游戏公司后提出的,其核心理念是“大中台”“小前台”,是为了应对像“双十一”这样的业务高峰,应对大规模数据线性可扩展的问题和业务系统复杂关联性的问题。本院数据中台建设基于阿里巴巴提出的中台理论,以大数据平台为基础,运用大数据(治理准备-治理过程-治理结果)流程,形成一个行之有效的解决方案[1],同时结合医院各个医疗信息集成交付经验,抽象、归纳多种应用场景,从而形成一套基于医疗信息化的大数据中台。此项举措是促进数据管理体系建设和执行体系落地的有力支撑平台,将分散、多样化的核心数据通过标准化、质量清洗、集成及监控等操作进行优化,形成医院内的数据管控体系,并结合科室部门组织结构,形成数据管控执行体系,在医院内部持续运行,提升、挖掘主数据的应用价值。
数据中台提供了数据汇聚、数据融合、数据治理、数据服务和资产管理五大核心能力。数据汇聚实现将各医疗信息系统的数据归集到数据中心;数据融合支持根据业务需求建立数据模型并实现数据的加工处理;数据治理用于消除数据噪音,提升数据质量;数据服务基于数据服务目录为各科室部门、各信息系统提供数据共享服务,并支撑基于数据资产的新应用,例如建立患者档案、临床诊断辅助决策、科研数据分析、医疗生产运营等[2];资产管理基于数据资产目录实现对数据资产的动态追踪盘点。
通过建设医院数据中台,形成数据资产到业务应用的闭环,实现数据资产化(对内增值)和资产业务化(对外增效)。见图1。
图1 医院数据中台总体架构
1.2.1 数据汇聚 系统提供数据源云连接功能进行数据汇聚,支持连接大量结构各异的数据源,进行多样化的数据整合。一次建立数据连接后,便可随时抽取该数据源的数据进行建模、治理和共享服务[3-4]。
医院数据中台系统支持连接主流关系数据库(Oracle、DB2、MySQL、SQLServer 和达梦等)、大数据平台(Hadoop Hive、SPARK 等),NOSQL 数据库(MongoDB、Redis 等)及MPP 数据库(Greenplum、TeraData 等)。
为兼容各医疗器械的数据开源问题,数据中台支持离线数据的导入,支持批量导入EXCEL、TXT、CSV 等文件数据源,支持百万级数据一次性导入和分批追加。
1.2.2 数据融合 通过建模的方式进行数据融合,提供可视化方式建立库表数据集、文件数据集、自助数据集、SQL 数据集,帮助用户轻松建立满足业务需求的数据模型。
系统提供可视化方式建立库表数据集,支持一键复制多个数据源的多张数据表结构和数据,实现高效的库表同步。系统支持根据EXCEL、TXT、CSV 等文件格式建立文件数据集,支持数据批量导入和支持数据追加。
医院数据中台的核心功能,支持使用图形化拖拽方式建立自助数据集,支持只用一个流程,将多个数据源与大数据库中的数据聚合为一个模型,并提供字段选择、数据过滤、剪切字符串、行列互转、去除重复记录、值映射、计算器、字符串替换、合并记录等丰富的聚合能力[5]。系统支持直接在图形化建模界面中,通过鼠标点选实时查看每个处理步骤输出的数据结果,帮助用户即时验证流程的正确性,追朔问题步骤,从而正确及时的完成模型建设。
1.2.3 数据治理 数据治理是方法论与工具结合的关键,主要包括数据标准与数据质量。
数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准一般包含3 个要素:标准分类、标准内容和标准规则[6]。①标准分类:提供对数据标准分类管理功能,支持直接在标准分类树上进行标准分类的新增、修改、移动、删除。②标准内容:提供数据标准创建功能,包括设置标准名称、所属分类、说明、状态、质量标准等。③标准规则:提供标准的质量规则设置功能,用于设置标准所应用的数据质量规则。
数据质量管理系统从数据使用角度监控管理数据的质量,其主要特点是自动化智能化,用户设置质量规则和校验任务后,系统可自动根据规则对数据进行检验,定期输出数据质量分析报告,准确定位问题数据。
1.2.4 数据服务 数据服务管理提供对数据共享服务的统一管理,包括医院内部数据共享和外部数据流通,通过构建数据服务目录、授权数据服务等手段实现数据共享服务,有效完整的记录数据服务信息,形成数据服务统计,展示数据服务的价值。
数据服务提供数据集服务接口生成及服务接口的相关管理功能,主要功能子项有:数据资源目录、系统注册、我的发布、我的订阅、服务审批、目录编排。
1.2.5 数据资源目录 数据资源目录是医院数据治理的成果体现之一,整合医院数据资源,把核心价值数据往外输出,支撑各科室部门工作开展、上级部门审计审查、科研实验室数据支撑、院领导辅助决策、临床诊断辅助等。
数据中台是企业数据产品和数据服务的搭建和实施的方法论。它不仅仅是工具,还包括系统架构、数据图谱、数据质量、组织架构、规范流程等一切与医院数据价值相关的建设体系,并且通过一系列方法和体系来为业务系统提供计算和分析服务[7]。
不同行业的经营策略和数据场景千差万别,本文结合本院实际情况,制定了适合本院实施的数据治理技术架构及功能规划。数据中台的体系建设和管理规范流程,都是有规矩可循;数据中台的实施,可根据自身机构发展需求探索适用的最佳实践。
1.3.1 以患者数据为核心的维度建模 在本院数据中台建设实施过程中,以维度建模的设计思路,建立了以患者为中心的多维度数据模型,包括预约挂号、就诊、检查、住院等多个维度的信息[8]。在财务部的应用中,数据中台整合了所有患者的收入、成本相关数据,建设成了以患者为最小颗粒度的数据匹配。在财务会计事务中,可按各种维度,分析患者的利润匹配,成本控制和收入监控,从而辅助财务资金决策。
1.3.2 设备资产管理 在设备管理科中,建设了以设备资产为核心的数据域,基于医院业务开展的特性,设备绩效分析提供精确可信的数据辅助决策业务[9-10],为医学工程部、医学装备委员会、财务、党委会等组织部门在进行决策时提供有效的手段,使采购流程大幅降本增效。在耗材管理方面,借助各个耗材历史使用情况,建立耗材消耗模型,掺杂时间、范围、科室等影响因子训练各科室使用耗材消耗模型,提升采购部门耗材消耗预测能力,提前预测耗材消耗。
数据中台的开发实施,是医疗信息数字化转型的重要里程碑,为本院信息化带来了巨大的便利。在医院数字化专项中,引入数据治理的方法论,由数据指导医院的数字化转型,发挥数据生产的主观能动性。本院在数据汇聚、数据融合、数据治理、数据服务和资产管理五大核心能力的助力下,首先实现了核心应用系统的数据标准,保证了各信息系统之间信息传输的一致性,且有利于对相关数据进行统计和分析[11-13],为医院业务经营决策提供可靠的数据支撑;同时,各信息系统实现了数据互联,最大层度地满足数据共享的需求,提高工作效率,减少数据变换、转移所需的成本和时间、降低数据的冗余度,提高数据的有序化程度和使用效率。
在医院数字化转型中,数据作为生产要素,已经成为医院数字化转型的关键基础。本文结合数据治理方法论,论述了医院中台的技术架构及功能构建,实现数据能力的抽象、复用和共享,赋能医院科研、医疗运营、临床决策和患者服务。数据中台的实施,仅仅是医院数字化转型的开始,随着数据应用的场景深化,数据的作为生产要素在医院运营中发挥着越来越重要的作用,数据安全问题将越来越突出。数据应用安全是未来医院数字化转型的挑战,数据中台也在不断的迭代中完善,下一阶段的研究工作将会重点对数据安全领域做深入的开展,建立完整数据运营机制,建设安全的数据应用环境。