盛志华,夏开建
1. 常熟市疾病预防控制中心 质量管理科,江苏 常熟 215500;2. 苏州大学附属常熟医院 信息科,江苏 常熟 215500
随着信息技术和网络技术的发展,医疗信息化建设提出了新要求。在这些要求中医疗信息资源共享需求特别紧急。国内外越来越多的医院正加速实施基于信息化的平台建设,以提高医院的服务水平与核心竞争力[1]。然而,现有的大量的医疗机构和不同层次的医疗信息系统无法直接相互通信,导致形成了许多信息孤岛,增加了医疗信息系统之间的互操作性的难度。近年来,由于云计算具有灵活的基础设施、新颖的服务模型和快速的响应能力等优点,云计算在分布式处理和其跨系统集成方面得到了广泛的应用。一直以来,国内卫生部门的医疗资源都不足以满足人们对医疗服务的需求。因此,随着云计算技术广泛使用和逐渐成熟,为解决信息闭塞与资源不足的矛盾提供了契机。
近年来,基于数据交互的信息化建设已进行深度的研究与广泛的应用。陈芳等[1]提出了一种基于XML(可扩展标记语言)的命令和控制信息交换模型,该模型主要关注命令和控制信息的基本交换规范的定义,然而这个信息交换程序有一些限制,只适用于基于命令和控制的信息化建设领域;陈娇花等[2]提出了一种基于反射的多代理数据交互模型,该模型利用许多相互协作的代理来实现数据实时交互,在用户需要更改时进行适当的配置。胡晓璇等[3]提出了一种通用数据交互接口模型,提高了数据交互的实时和灵活性。它基于发布/订阅模式传输数据,但是该模型很难满足具有各种交互模式的医疗数据交互的需求。
由于医疗数据是一种非常宝贵,且不可复制的资源,因此在许多医疗机构中期望共享拥有的医疗数据,同时又不会失去对这些数据的控制权[4-5]。因此,如何找到可以访问、检索和分析医疗数据的方式是很重要的,然而许多学者热衷于从不同理论方面研究医疗信息共享,但缺乏工程技术层面医疗信息共享分析。本文提出了一种基于云服务的医疗数据交换体系结构,可用于解决异构信息系统和数据处理的医疗数据,实现医疗数据的交换,共享资源,使医疗模式得到优化和创新。
云计算是共享基础设施的一种新兴技术,不仅可以集成分布式软件、硬件或其他资源,还可以通过网络提供动态的按需服务。云计算技术导致了服务概念的出现,并使其成为核心业务模式[6-8]。在这种模式下,用户从自建的信息系统转向购买所需的信息服务。因此,与传统模型相比,基于云服务的系统具有以下几个优点:
(1)可以支持现有的应用程序和新兴的数据驱动型应用程序,并提供丰富的计算、存储和网络资源。
(2)使用虚拟化技术将计算、存储和网络资源集成到一个具有统一的管理、自动化部署、高效调度、随需分配的弹性资源池中。
(3)新的基础设施模式可以节省企业建设和维护信息系统的成本。
(4)云计算中心采取了许多措施,以确保在硬件和软件水平上的服务的高可靠性,例如互换同构计算节点、多份数据容错等。
(5)对客户端计算机的配置要求较低,用户只需使用一个廉价的联网智能终端就可访问云服务。
以上分析与总结可以看出,云计算完全符合新的医疗改革的需要,不仅可以降低医疗信息建设的成本,而且还能解决区域医疗机构之间共享医疗信息的问题。
在医疗机构间进行信息共享,资源交互涉及的数据具有异构和分散的特性,不同的信息系统存储不同格式的数据资源,不同的交互方式适合不同的交互业务[9]。如何实现不同数据的集成是目前迫切需要解决的问题。医疗数据交互业务例如病例交互、医学图像诊断交互和术后身体康复交互等只有具有灵活性和可扩展性优势的医疗数据交互架构才能满足医疗卫生行业的需求。
随着医务人员对医学数据的需求日益迫切和专业化,对数据质量也越来越看重,数据交互平台必须根据医学人员的需求做出相应的策略调整,以适应服务需求的不断改变和提高。因此对平台产生的结构化、非结构化和异构性的大量数据进行分析和深度挖掘成为必然,以满足快速、及时、高效、安全地反馈在线学习者的要求和便于医务人员对信息进行分析,图1展示了基于云服务的医疗数据交互平台架构。
数据交互涉及消息传递、交互方式、语义解析和数据封装等过程。目前已采用的几种用于数据整合的架构模型都无法获得满意的效果。由于云计算技术将数据交互过程封装到组件中,用户可以通过注册和应用请求交互组件,然后在相应的交互式工作流的辅助下完成医疗数据的交互。也就是说,通过利用云计算资源、存储资源和硬件资源来实现数据交换,以避免更新各种医疗机构的现有信息系统,并减少本地服务器上数据处理的压力[10-11]。与此同时,通过云软件对数据交换过程进行管理,可以提高数据交换的效率和安全性。在本文中,我们提出了一种医疗数据交互平台的分层体系结构,它由服务管理层、动态组件重构层和支持层组成,其中数据交互层分为三部分,下层是数据库,中间层是数据挖掘分析整合,上层是标准化处理。分层架构是一种体系结构模式,有助于构造复杂的信息化交互系统,这些系统可以分解为一系列子任务,其中每一组子任务都处于特定的抽象级别。服务管理层采用基于安全认证服务的分层安全方案进行管理与调度,并为可以访问系统的用户分配权限。不同的用户可以在不同的级别层次上享受交互服务,不同的信息有不同的保密级别。经过身份验证的合法用户可以向工作流生成器提出特定的交互需求,并由工作流生成器根据用户权限生成相应的工作流;最终为具有合理配置和调度较低的组件提供交互式流程规则。
图1 基于云服务的医疗数据交互平台架构
数据交换针对不同权限的用户,通过身份验证为其分配合理资源和交互组件,医疗数据存储在公有云平台,交互组件在医院的客户端和私有云上实现并执行[12]。
动态组件重构层使用组件的动态重构方案来满足数据交互过程中的各种需求。这一层包含工作流引擎、重构和分配服务器、组件管理模块、组件存储库和数据交互组件。这些模块负责不同的任务。工作流引擎负责解析相应的工作流;重组与分配服务器负责生成工作流信息,以满足重组组件的需求;组件管理器模块利用来自组件存储库的信息,然后根据运营商的需求对组件进行重组。组件存储库能够存储许多信息,比如组件的属性、方法和其他信息。通过用户界面,用户可以浏览组件数据库及其数据属性,并调用检索到的数据上的统计操作。
因为医院已有的数据平台与后续扩展增加的平台具有较大的异构性,直接连接与交互比较困难,所以本文通过公有云控制异构平台间的交互,从而使得异构信息系统对于用户是透明的。
因医疗数据交互过程中可能产生一些异常小数据,例如医学图像诊断交互中产生的无效值和病例中产生的缺失值,为了保障医疗数据的准确度和降低误诊概率,本文采用了徐倩漪等[13]文中的机器学习方法,并将其应用于小数据识别与跟踪等一系列处理,从而尽可能地清洗异常数据。
平台支持层可以为平台上的应用程序服务提供各种虚拟资源。这些资源包括以下方面:① 为归档医疗数据提供丰富的存储资源;② 在数据交互的高峰期,为交互服务提供网络资源;③ 为决策部门的数据挖掘提供强大的计算资源;④ 医疗数据交互后,用户通过客户端经私有云访问医疗数据,并通过动态组件重构层进行数据检索和分析。平台支持层可以增加资源的利用率,使管理任务更容易,降低了整体的功耗,并使用户能够按需获得计算资源。通过安排合理的底层虚拟资源,以确保数据交互的可靠性,并提高数据交互的效率。
通过以上分析可以看出,面对迅速增加的复杂数据,医疗数据交互平台利用云计算和大数据进行现代数据管理,将所有类型的数据持久存储于“云存储”数据中心,保持数据实时更新,为之后数据共享、分析、发现、整合、优化数据和增强数据价值奠定基础。分析挖掘需要特定格式带有过程信息的标准数据文件作为输入,原始数据不能被直接用于分析挖掘,因此都要结合平台需求对存储数据进行有效的过程信息识别并整合为标准数据格式。离线数据是存储在数据中心的信息,用户可以直接进行访问,是从各种服务器端和客户端中采集的用户访问信息和行为信息。清除冗余,用聚类、分类等算法进行模式分析,建立基准数据资源为数据流挖掘分析作准备。对动态性的在线数据挖掘,是利用云计算做到占用内存少,处理速度快,实现关联规则、分类和聚类的挖掘。
为了验证与分析采用的云服务平台架构的性能,本文选择CloudSim作为模拟器来分析主要性能,比如数据交互处理效率和出现峰值时间。CloudSim是在GridSim模型基础上发展而来,可以模拟云计算系统和应用程序配置环境的模拟工具包,提供了云计算的特性,支持云计算的资源管理和调度模拟。
本文受到了卫生部创新课题的资助,并采用了本省四家三甲医院的平均日处理医疗数据作为测试数据。测试数据主要包含两种类型,即实时交互数据和归档数据。对前者的操作包括检索、封装和传输。后者的操作包括转换、清洗、封装和传输。四家医院各部署四台个人计算机和一台服务器构建硬件网络环境。这些计算机的主要参数配置有:CPU采用i3-7100,显存是2G,硬盘是1TB HHD,操作系统是Linux Ubuntu 18.04。
两种条件下的硬件、网络环境对比,试验结果没有意义,无法说明云服务的优势。使用CloudSim来获得数据处理性能指标的结果,并在此前后使用我们提出的交互平台方案进行对比,其结果显示如表1所示。通过使用和不使用交互式方案对比生成的结果,交互式方案的优点就显现出来了。可以看出使用该方案可以降低峰值发生次数,缩短客户端执行时间,从而有效地提高了医疗交互系统工作效率。
表1 仿真结果
这项研究的目的是将云计算技术应用于本市医疗信息系统的改革中。为了分享医疗信息和创新医疗服务,不同医疗机构可以共享医疗数据,提高患者诊治的效率与针对性,也为一线医务人员提供交流的平台。
在省电子政务办公室的推动下,本地区开展了医疗卫生信息建设工作。目前,共享数据中心已经建成。数据中心把健康记录作为核心。一方面,每个医疗和卫生机构都可以上传医疗和健康信息,而不影响内部信息系统的日常运作;另一方面,用户可以方便地通过终端网络浏览他们的个人健康记录。在合法注册后,市民可以浏览他们的个人健康记录并与跨机构的专家进行沟通。可以看出,该系统平台对预防和跟踪慢性疾病的个人护理也具有重要意义。医务人员只要得到病人的许可也可以浏览病人的健康记录。这一措施将有助于制定有效的治疗方案,减少病人的诊断时间。基于本课题的研究,今后将逐步实现交互共享服务,如双向诊断、转移检查、远程医疗等。
本文分析了跨机构与区域的医疗数据交互与共享的需求,并提出了医疗数据交互平台的体系结构,包括服务管理层、动态组件重构层和支持层。它为医务人员和普通市民提供了方便和灵活的服务,同时不同级别的服务可以满足不同的需求。本课题的下一步研究重点是基于数据交互平台的创新服务模型,它将有助于实现医疗资源利用最大化。