陈章清 谢乍晴
“互联网+医疗健康”政策背景下的健康医疗卫生信息化建设,是体现医疗资源深度整合、医疗服务全面协同及患者服务全面覆盖的整体大健康战略。泰州市“泰康云”项目的建设将以“互联网+医疗健康”为核心指导思想,在泰州市现有的健康医疗卫生信息化基础之上,通过全面的数据整合、纵横交错的业务协同及全流程的患者服务来完整构建整个项目。项目建设过程中涉及新技术的运用、系统框架及架构的提升、数据异地实时备份、数据采集及治理、数据交换等方面的建设与研究,本文主要是对“泰康云”项目的框架、技术实现方式、关键技术解析及相关应用等进行了建设经验的分享和初步讨论。
目前泰州市的健康医疗信息化基础扎实,全市的各级各类医疗机构都具备完善及成熟的信息系统,部分区县已经建设了全民健康信息平台。但这些信息系统大多数为分散建设,数据标准及业务标准之间存在不统一,全市医疗信息不能交换和共享的问题任然存在,由于“信息烟囱”、“信息孤岛”等问题的存在,一定程度上也直接滞碍了全市健康医疗业务协同服务、数据共享及患者服务等方面,管理上所需的各项精细化管理也未能得到有效支撑。
本次“泰康云”项目重点有数据共享交换平台、“健康泰州”APP应用两个重要维度组成。数据共享与交换方面,依托云计算基础设施,运用最新的数据库底层同步技术和文件同步复制技术,实现对全市结构化与非结构化数据的实时采集。通过数据清洗建立“泰康云”健康大数据主题库。通过企业服务总线(ESB)建立数据交换共享平台,为“泰康云”提供基础的运行支撑。
“泰康云”数据共享交换平台采用多层次,解耦化的体系架构。重点以国家卫健委“国家医疗健康信息区域/医院信息互联互通标准化成熟度测评”为核心指导思想,结合泰州市的实际情况制定相关的数据及业务标准,充分处理好“泰州标准”与“国家标准”之间的对应关系。
数据共享交换平台需要基于面向服务的体系架构(SOA),由企业服务总线(ESB)、资源目录中心、异构资源适配器、统一监管中心、消息中间件、集成开发中心等产品组成。主要包含应用集成和数据集成,通过应用集成实现全市医疗协同业务的有效开展、通过数据集成实现全市医疗信息的全面共享。
依托政务云、视频云相关的云计算基础设施(政务云、视频云由泰州市人民政府统一建设),采用最新的數据库底层同步技术和影像文件同步复制技术,将医院结构化数据全面同步至政务云,将医院影像非结构化数据同步复制至视频云,建立医院数据云备份中心;通过数据采集和数据清洗技术将医院云备份中心数据、基层运营数据、公卫机构数据、各市、区区域健康信息平台数据在统一标准体系下建立“泰康云”健康大数据主题库;通过企业服务总线(ESB)建立数据交换共享平台,为“泰康云”提供基础的运行支撑,提供服务定义、服务发布、服务注册、服务发现、服务绑定、服务协作、事务协调、服务质量管理等主要功能。
数据同步服务。数据实时同步将区域内二级以上医疗机构业务系统中的数据实时同步至云数据中心,数据中心备份数据库支持各医疗机构生产数据库异常情况下的接管,以及当生产数据库恢复正常后数据的回写操作。
数据治理服务。通过大数据治理服务工具,对所有实时同步的数据进行抽取、清洗、转换及装载等标准化处理,最终形成能够符合国家卫健委、江苏省卫健委以及泰州市卫健委实际要求的数据源、数据字典及资源目录等。
主题数据资源库。通过数据采集与治理等工作,建立标准化的数据资源中心,根据实际业务要求建立主题数据资源库,重点建立全市的医疗运营数据中心(ODR),主要包括全市医疗机构的人事、物资、财务(部分)等数据,主要为绩效及运营管理等提供数据支撑。主数据中心(MDR),建立统一的人员、科室主数据及术语编码服务,实现院内字典,卫生部医疗标准/国际医疗标准的统一访问和应用。 临床数据中心(CDR),通过临床文档结构化语义定义、临床文档分析、临床文档展现、临床文档跨系统共享等方式来实现临床文档的互操作性,从而逐步建立基于疾病、治疗、影像、卫生经济、医生、患者等各方面的主题数据集,提供完整、统一的数据展现。
数据交换与共享服务。通过企业服务总线(ESB)建立数据交换共享平台,为“泰康云”提供基础的运行支撑,提供服务定义、服务发布、服务注册、服务发现、服务绑定、服务协作、事务协调、服务质量管理等主要功能。
数据应用服务。通过数据同步、数据治理、主题资源库及数据交换服务的建设,其核心目的是为整个泰州市的健康医疗协同服务(泰州健康APP)提供数据基础,通过本项目未来能够支撑监管部门的大数据决策分析、全市分级诊疗业务落地及全市居民的健康服务等应用。
(一)实现方式
1.数据实时同步
结构化数据通过Flume、DSG及ODG等工具完成对全市二级以上医疗机构信息系统数据的实时异构集成与同步,非结构化数据制定统一的文件格式标准,利用数据共享与交换平台文件适配器功能实现文件传输转化作业流程,实现非结构化数据的同步备份。二级以下医疗机构通过云HIS、云LIS、云PACS等“基卫云”系统的建设统一布署。
2.数据清洗标化
按照平台制定统一的标准,通过专业软件对现有医院业务系统备份数据进行数据的解析、转换和加载。软件提供图形化开发模式,支持远程Web管理与监控。
3.数据抽取
包括定时抽取、实时抽取、全量抽取、增量抽取等。抽取途径,包括数据库、Web服务接口、文件(XML、CSV、Excel等)、技术接口等。采集频度,具备按业务需求进行多种时间周期采集。
4.数据清洗转换
实现对采集信息的加工处理、不同数据源格式转换、信息传输、加载等功能。支持基于模板的业务适配、支持字典值域映射、支持标准导入功能、支持函数转换,最终实现数据过滤、数据清洗、数据替换、数据计算、数据验证、数据加解密、数据合并、数据拆分、数据裁剪、数据追加、数据丰富等功能。
5.数据加载
根据不同的业务类型,制定不同的传输模式。支持JMS/MQ、WebService、FTP等多种上传加载方式,支持生成文件存储,保存至数据库,上传至第三方接口,支持实时查询和异步传输两种传输模式。具有数据压缩功能,具有断点续传、不重传、不丢消息包的功能。
6.调度管理功能
支持对各业务机构数据采集业务的新增、部署、变更、查看、配置等操作;支持多种运行策略配置,配置采集任务启动时间、循环执行间隔时间、采集周期等功能。提供数据采集情况监控,提供数据采集流程实时监控。
7.企业服务总线
通过企业服务总线(ESB)建立数据交换共享平台,建立全市统一的医疗服务资源池,遵循医疗行业标准,构建符合HL7标准的CDA文档,具备完善的医疗行业消息处理能力,建立全市统一支付平台,完成医保无卡结算,实现诊间结算、床边结算功能。
8.资源目录中心
建立平台统一资源目录,并以资源目录为框架维护医院资源信息,主要包括数据标准、应用系统、应用服务、应用系统提供数据的能力(元数据、数据字典)以及应用系统间数据转换规则,促进跨机构、跨地域健康医疗数据资源的共享、开放与应用。
9.异构资源适配器
基于适配器框架技术,实现统一的客户化应用服务接口,支持大多数主流的数据库、消息中间件产品和通信协议,提供扩展开发以便支持非标准的信息连接要求,提供服务封装与协议转换功能。实现对各种数据源、信息源以及各种应用系统的无缝衔接。
10.统一监管中心
对平台的运行情况进行全面监管,直观的体现应用及相关服务的依赖、调用关系,支持全方位的服务质量监控和运行报告分析;细化对业务报文的监控,方便对业务的审计和问题的追溯。包括应用依赖分析、性能指标分析、流水检索分析、交互服务管理、资源健康管理以及异常情况下的告警管理等等。
11.消息中间件
适用于任何需要进行网络通信的系统,负责建立网络通信的通道,进行数据或文件发送,实现跨平台操作,为不同操作系统上的应用系统提供高效、灵活的同步和异步传输处理、存储转发、可靠传输等技术支持,确保消息在任何情况下都能够安全、可靠的送达。
12.数据质控
提供数据质量的校验功能,提供字段级合理性校验及业务级合法性校验,对校验失敗的数据,支持生成校验报告并反馈给相关业务机构。
(二)关键技术解析
1.医疗全息文档(Medical holographic documents)
“泰康云”建设的关键是能否完整集成病人每一次在不同医疗机构的诊疗信息,由于认识到传统关系型数据库在临床诊疗应用方面的局限性,因此在设计时,就明确了基于医疗全息文档的设计思路。全息临床文档使用XML对文档内容进行逻辑定义,具体信息使用自然语言进行记载,如实记录各种情况。医疗全息文档能够适应目前信息化发展的要求,在多变的政策及行业要求环境中,通过医疗全息文档建立符合国家互联互通要求及全市实际发展要求的数据采集及共享机制,对内满足全市各医疗机构之间的实时数据交互与共享、对外满足行业要求,医疗全息文档“以不变应万变”。
2.实时异构数据集成
数据集成将改变现有“自下而上” 提交标准化数据的模式,真正将数据集成的主动权交给全市的平台,由平台来决定在什么时间段,提取什么数据,按什么样的标准格式转换。实时异构数据集成(Current severice)采用了“自上而下、主动、实时”的集成模式,数据集成时不再需要各业务信息系统进行大量的数据接口改造。同时,实时异构数据集成(Current severice)中还涉及对文本信息的抽取,电子病历中同时包含结构化,半结构化和自由文本这三种数据。医嘱,检验检查等数据在数据库中,属于全结构化数据,病历中的表格以网页形式存在,属于半结构化数据,主诉、现病史、病程录等段落属于自由文本,将这三种数据的抽取以统一的抽取模型来处理,可以提供一套集成抽取工具和统一抽取语言,这样抽取规则就可以由非计算机专业的医学领域专家来编制,大大提高了规则编写速度和匹配准确度,并减少了程序出错的可能性,因为不再需要人工为每条规则单独编写程序。
3.唯一身份识别(Unique health identity Definition)
唯一身份识别采用交叉索引机制,交叉索引的设计原理利用自然身份信息进行编码,并与身份证号、医保号、电子健康卡号等建立交叉索引,采用人脸识别技术进行验证,同时记录患者卫生服务数据路由表,从而实现全市范围内的患者唯一身份识别。
5. 消息引擎(Message engine)
消息引擎驱动业务集成是一个基于TCP/IP技术的医用网络通讯框架,其不仅实现业务系统的对接,还在不同业务系统之间增加了流程驱动,目的是改变传统的临床医疗工作方式和流程协调方式,提供主动、实时、协同的信息交互,对全市各医疗机构的协同工作流程进行优化和重构,最终形成符合全市医疗业务管理要求,不断优化与改造的业务场景。通过以临床文档业务模型标准为核心的集成配置管理,建立完善的业务节点库,配置不同的业务场景,并对这些场景中各个节点的执行流程和生成的消息内容进行灵活配置。
依托“泰康云”项目的建设,通过对全市医疗卫生管理不同职能部门的角度来透析项目的整体应用,应用效果如下:
以全市健康医疗信息互联互通为核心的患者全息医疗浏览器,建立患者统一视图,实现以患者身份为索引的数据查询,为管理和决策支持提供数据依据,也为未来的教学和科研提供参考和支持。
以管理者的视角来构建全市的健康医疗决策分析及精细化管理,开展基本公共卫生服务、基本药物、合理用药监管、处方监管、临床路径管理、按病种付费、药占比、医用耗材管理、区域绩效考核管理等一系列的监管,并根据所管理的医疗卫生机构的特点,植入特定的监管流程和预警规则,实现医疗卫生机构KPI(关键绩效指标)监控和业务运营预警,为宏观政策制定和管理提供数据支持。
以患者的视角来体验更加优质、便捷的医疗服务,运用“云计算、大数据、物联网、移动技术”等最新技术,为患者提供一站式服务。提供基于手机APP的患者门户,为患者提供全流程导诊服务,实现全市各医疗机构内部的医疗信息网络与社会手机移动平台之间的医疗信息交互,改善患者就医体验。
以全市战略发展的视角来落实分级诊疗工作,分级诊疗制度的落实也加快了全市各医疗机构医联体建设的脚步,医联体的开展将为分级诊疗背景之下如何获取更加优质的患者资源、如何整合医疗机构内部医疗资源奠定结实基础,本项目的建设将更好的支医联体内的转诊、会诊、转检转验、多点执业、远程管床等应用。
患者唯一身份识别,临床医疗活动均是以患者为主线的,如果患者的信息不统一是无法实现以患者身份为索引的电子病历共享文档数据。因此,项目建设时要建立全市的患者交叉索引服务,为患者全息医疗文档的集成提供基础。
文本信息抽取,现有各医疗机构现运行的电子病历系统,留存着大量的文本信息,如何对此些文本信息进行结构化处理是整个项目建设的核心任务之一。本项目通过文本信息抽取及自然语言分析技术实现对文本病历进行标准化处理,支撑全市标准化临床共享文档的建设。
实时异构数据集成,数据集成会涉及多个异构系统的对接,这些系统由不同开发商进行建设,采用操作系统、开发环境、软件体系架构、数据格式等均不同,数据来源、環境、格式极其复杂。传统的整合方式将给信息系统的稳定性、安全性、可靠性、效率等带来巨大的隐患,同时使运行维护成本成倍增长。“自上而下”的数据集成服务,在降低第三方系统接口改造量及不影响运行稳定性的前提下实现数据集成。
业务集成,传统全市的医疗协同业务是由多个系统之间是点对点连接,信息系统之间的整合度不足,难以支撑纵横交互的复杂业务流程。同时,全市的医疗协作业务流程缺乏有效的监控和闭环管理机制,不利于业务流程的过程管理和统计分析,无法满足全市监管部门的深度需求。本项目通过HL7 CDA临床文档架构标准及结合自主研发的可视化消息引擎,实现了业务流程定义、整合、闭环管理。
本文对“泰康云”的建设核心要素、关键信息技术及平台应用建设进行了研究,上述研究内容也是基于框架涉及及实际业务建设经验的分享。本项目建设要能够根据全市的实际现状而定,并非最先进的系统架构、技术路线就能百分之百确保项目建设成功。相反,选择一个适合全市实际发展的体系架构、技术路线才是建设成功的重要因素。
作者单位:泰州市人民医院