医院大数据中心建设及应用

2024-01-19 04:12:52陈继何
数字通信世界 2023年12期
关键词:数据中心数据库医院

陈继何

(福建省福州儿童医院,福建 福州 350001)

0 引言

医疗行业是我国较早数字化、信息化的行业,每时每刻都在产生海量数据[1]。我院经过十几年的信息化建设发展,医疗业务系统、管理系统等越来越多,随之积累了海量的医疗临床数据。这些海量的医疗临床数据的应用及发掘,自然也就成为推动医院发展的主要动力。由于医院信息系统由不同的厂商帮助建设、数据结构存在较大差异,导致医疗数据价值利用率不高[2]。

1 数据中心的整体设计

1.1 数据中心技术架构

我院数据中心整体架构采用以Hadoop+Oracle+数据引擎的混合体系,其核心以Hbase为数据仓库,结合关系型数据架构与分布式数据架构相结合技术体系,以主数据系统作为数据互联标准,以数据捕获引擎、数据转换引擎、非关系型数据接入引擎作为数据支持,大数据管理平台集资产管理、运维管理、数据服务平台、安全监控于一体,有效地保障数据的时效性、准确性、安全性和易用性,整合数据互通标准、提升医院信息化管理水平、服务水平、整体建设水平。如图1所示。

图1 我院数据中心整体架构

将临床业务数据、运营管理数据、财务管理数据、质量控制数据、科研管理数据等医院所有数据,通过Oracle GoldenGate数据捕获引擎将分别汇集到ODS数据库,将医院现有的非关系型数据直接汇集至分布式数据中心。数据清洗与转换引擎通过Oracle GoldenGate Application Adapters推送功能将实时变化数据库推送到Kaf ka消息队列,Kaf ka消息队列接收到相关变化数据后,按事先定义好的数据转换与洗清规则对推入的数据进行清洗转换,清洗转换完成后,分成两种数据格式,分别存入关系型数据中心与分布式数据中心。

1.2 Oracle GoldenGate实时数据同步

利用Oracle GoldenGate与Kafka消息队列工具实现生产库到数据中心的实时同步模式。考虑到数据同步与处理对生产数据库性能会产生一定的影响,所以需要在生产数据库和平台之前增加ODS服务器,实现数据先从生产数据库到ODS库,再由Oracle GoldenGate Application Adapters与Kafka消息队列完成数据实时同步到数据中心。

Oracle GoldenGate通过对源数据库业务日志的解析,获得数据的变化,完成数据同步,实现大量数据实时交互、源数据库与目标数据库的数据实时同步。同时形成隔离层,降低影响业务库的风险,且数据集能够满足各应用的数据需求等。

1.3 ETL历史数据抽取

ETL的一般过程:从操作型的数据源,经过数据中转区,最后到达数据仓库(ODS)的数据处理过程。底层是整个ETL过程中都涉及的数据抽取、加载、插入ODS数据库。

1.4 数据变化推送

我院数据中心推送工具采用Oracle GoldenGate Java Adapter,数据中心各个主题库的数据是通过捕获ODS数据库中相关业务表的变化数据,将实时变化数据通过Oracle GoldenGate Java Adapter推送到Kaf ka消息队列,在Kaf ka消息队列中将推送进来的数据进行拼装与清洗,然后将拼装与清洗完成后的数据写入按事先定义好的主题库中。

1.5 非结构化数据同步

将非结构化文件、共享文档、科研数据等加密保存,并支持不同环境下的数据调用,根据不同场景需要提供不同的底层技术访问数据。同时通过HDFS文件系统分布式存储物理文件。

2 大数据中心建设内容

2.1 构建医院信息集成平台

信息集成平台集成了医院业务系统,该平台是基于SOA消息协同的ESB总线组成的异构、异步集成平台,可以消除系统间依赖和阻塞,辅以大数据中心,对医院数据资产统一存储,统一管理,为后续运维、决策、分析提供完整集中的数据支撑。按照国家标准,通过对医院的业务系统进行数据梳理和标准化流程改造,实现符合国家标准的安全体系。

平台建设过程中,要求院内所有需要接入的业务系统进行标准化改造,形成统一的接口标准化交互体系。将医院所有信息系统以标准化的方式进行互联互通,制定了厂商接入改造的专用技术指导手册,提供了代码辅助审核和编程指导,降低整体改造难度,实现院内多源异构系统之间以及与外部机构之间的互联互通;以推送业务为主,降低重复业务调用、增加消息补偿接口分散查询业务压力等方式,提高平台集成能力;建立主数据主索引管理,统一业务术语值域,在平台内建设业务值域和完整性验证,进而保障业务一致性。最终整合各个业务系统,实现医院的信息集成平台建设效果。

2.2 构建患者主索引管理系统(EMPI)

根据医疗业务管理的需要,主索引管理系统以病人的基本信息为基础,采用复杂的算法和原理,形成一套标准化数据匹配规则,有效提高主索引验证和判断的准确性。EMPI提供患者主索引合并、更新、人工判断等多种功能。根据患者的基本资料生成主索引号,以主索引号联通所有业务系统。患者主索引管理平台再通过患者主索引号关联各个业务系统的历史数据,最终实现所有业务系统数据互联互通,解决历史数据的信息孤岛问题。

2.3 建立医院主数据信息库(MDM)

对全院的基础数据字典如科室字典、职工字典、检验项目字典、收费项目字典、检查项目字典等数据字典进行标准化处理,建立统一的标准数据字典库。同时收集国家标准术语集,与各个业务系统建立映射关系,构建统一的主数据订阅、发布和回收的接口服务,基础数据字典和标准术语的一致性,大大提高数据准确性和数据质量。

2.4 建立数据仓库(ODS)

ODS是大数据中心体系结构中的一个重要部分,该库的数据为实时性数据,并保证与源库数据保持一致,能够用于信息集成平台服务开放、查询、统计等应用。

将临床各个业务系统的历史业务数据经过ETL抽取,可以快速的将海量历史数据同步至ODS(数据库)中。历史数据抽取完成后,再利用Oracle GoldenGate与Kaf ka消息队列工具实现将生产端数据实时同步到ODS(数据库)中,这样ODS数据仓库就搭建起来了。

在ODS搭建前,需要数据或者报表时由各个系统生成,但涉及跨系统关联时数据难以关联使用,并且直接从业务系统获取数据对系统性能有一定影响。

在ODS搭建完成后,各个系统数据汇集到ODS,为各类应用系统提供原始数据。消除系统间的隔阂和限制,可以从主题出发,结合各个系统的ODS数据给出最全面准确的信息。同时可以有效地减少生产环境的负担。

2.5 建立临床数据中心(CDR)

临床数据中心以患者为中心,在医院就诊过程中所产生的所有医疗数据信息都被送入临床数据中心,实现患者临床诊疗数据的集中展现。

临床数据中心为了同时支持结构化数据与非结构化数据,由大数据管理平台进行可视化管理、配置、监控等,并将数据仓库实时变更的数据通过数据引擎及时推送到消息队列对数据进行标准化处理后送到临床数据中心更新。

2.6 建立运营数据中心(MDR)

医院运营数据中心可对医院临床医疗、运营管理等多种数据的集中展现和分析,对医院现有数据信息进行整合应用,以更大程度地发挥出所有数据的价值。运营数据中心以数据仓库实时变更的数据通过数据引擎及时推送到消息队列对数据进行标准化处理后送到运营数据中心更新。

2.7 建立数据中心管理平台

为了更好的展现数据中心实际运行情况,方便医院对数据资产进行管理,通过大数据中心管理平台实现对存储设备、网络设备、服务器设备、安全设备等基础设备环境进行综合有效的管理,并实时推送业务系统运行异常的告警和可视化问题定位、性能检测和预警分析。系统主要功能包括可视化数据集成、数据监控平台、统一的消息平台。

2.8 加强数据中心安全建设

在大数据中心建设工作中,中心的安全性至关重要,只有在安全的前提下,才能真正实现数据融合共享、开放应用。我院大数据中心利用VMWare的虚拟化技术和基于docker部署Oracle 19c,利用分布式存储方式,有效保障数据中心的安全性。在网络边界部署了防火墙、网闸、入侵防御系统、态势感知等安全设备来保障边界安全。

3 基于数据中心的典型应用

3.1 360患者全息视图

360患者全息视图是基于HL7数据规范,搭建的基于患者为中心的全息数据视图,将患者历次就诊所产生的临床数据汇总到Web应用系统,由Web应用系统统一展现患者临床数据,解决医院临床数据不统一,不集中的现象。基于临床数据中心(CDR),将多源异构的数据进行整合。基于患者患者主索引ID,查看患者当前及其历次所有就诊信息,包括患者基本信息、诊断记录、医嘱用药、病历文书、生命体征等临床数据,使分散在各个系统中的临床诊疗数据的集中、直观地展现给临床医护人员,实现医疗质量效率双提升。

3.2 医院决策分析系统

医院决策分析系统以医院数据仓库为基础,通过对数据的标准化处理,采用可视化界面、简洁简便直观操作,为医院管理者提供一个多功能的智能决策分析平台。对医院各系统的业务数据进行收集、整合、分析展示,加大全院范围内信息资产的利用率,提高信息分析的准确性、一致性、时效性,不断完善各个业务数据指标和运营管理模式,为医院管理提供科学的依据,从而提升医院的核心竞争力。

医院决策分析系统以移动分析平台,运营决策与分析平台,实时监控大屏为核心;其中移动分析平台:从今日简报、昨日简报、门诊业务、住院业务、等方面入手,为院领导提供全方位的运营相关的数据展示和预警分析,支持多个入口,例如微信、钉钉或医院移动OA端;运营决策与分析平台:主要面向医院不同部门、不同角色,提供相对应的主题和多维分析,通过分析国家和地方医疗政策,结合医院管理决策所需,构建了不同的多维主题包括门诊主题、住院主题、医务主题、医保主题、手术主题、药学主题、医技主题、护理主题等;实时监控大屏:从院长大屏、医务大屏、门诊大屏、住院大屏、等业务主题入手,给医院管理者一个全方位的实时运营数据展示和预警分析。同时在这三个核心基础上扩展出其他个应用。

4 结束语

大数据中心的建设,推动医院高质量发展以及医疗服务由“信息化”向“数字化”的转型。在其建设过程中首先要对医院数据资产进行全面掌握,对数据资产进行归类、梳理和整合,其次再对数据进行汇聚、标准体系建设、数据模型建设、指标梳理、安全性建设等工作。一个高效、稳定的大数据中心,在进行系统的分析设计、开发部署和管理运维时必须遵循如下原则:一是数据的完整性原则;二是数据的标准化原则;三是数据的安全性原则;四是数据的可管理性原则;五是数据的可靠性原则;六是数据的服务开放性与易用性原则;七是保护医院现有系统的原则。

猜你喜欢
数据中心数据库医院
酒泉云计算大数据中心
我不想去医院
儿童绘本(2018年10期)2018-07-04 16:39:12
民航绿色云数据中心PUE控制
电子测试(2018年11期)2018-06-26 05:56:24
数据库
财经(2017年2期)2017-03-10 14:35:35
数据库
财经(2016年15期)2016-06-03 07:38:02
萌萌兔医院
数据库
财经(2016年3期)2016-03-07 07:44:46
数据库
财经(2016年6期)2016-02-24 07:41:51
带领县医院一路前行
中国卫生(2015年8期)2015-11-12 13:15:20
基于云计算的交通运输数据中心实现与应用