王 瑜 鲍 鲲 黄婷婷 邵 新*
随着医学技术的发展,医疗设备在医疗诊疗活动中的地位逐渐提高,逐步成为衡量医疗机构规模、技术水平和现代化程度的重要标志[1]。医疗设备的可靠性及运行效能直接影响医疗技术水平,建立科学规范的医疗设备管理系统是确保医疗质量的重要保障。其中,医疗仪器设备档案的采集、查阅、分析和展示是应用的重点。
在医疗设备信息化建设的发展中,不同业务领域分别构建了对应的信息系统,快速积累了大量的设备信息数据,在规模、结构和使用等方面逐步形成了大数据环境,给数据管理及应用带来了挑战。现有医疗设备档案相关业务系统在功能上虽提供了检索、分析及展示功能,但无法满足系统应用的整体要求[2]。如何将不同业务系统间的数据集整合并运用信息化手段和科学的分类、汇总和统计分析方法,将现有各业务模块和查询数据报表统一展现,本研究基于Power BI工具的大数据分析,以医疗设备档案科学管理为背景,建立多维数据检索系统,为不同应用场景提供数据分析,为决策提供依据[3]。
医疗设备档案管理中,设备档案相关业务系统往往针对具体业务构建,在应用中缺乏整合和关联,尤其是数据查询,往往需要跨库查询,应用难度大,执行效率低;档案查询及分析过程停留在静态状态,依赖系统构建时的功能设计,无法满足不断更新的业务需求;档案查询通常采用数据报表和数据表的形式展现结果,缺乏灵活快捷的可视化展示工具。因此,医疗设备的档案管理尚需实现下述功能。
医疗设备管理内容的更新缺乏时效性和完整性,缺乏能全面覆盖医疗设备管理内容的应用体系。因此,在分析业务需求的基础上,各业务系统应建立统一的标准化接口,使业务数据间的数据可按照标准设计自动更新,并可通过数据结构构建、校准和转换,完成数据采集及质量控制,提高数据的完整性、稳定性和时效性。
大数据时代下,现有的医疗设备管理系统无法实现复杂结构数字档案的灵活快速管理需求。需要一种面对不同业务场景下的应用需求,实现快速检索和过滤多维度检索条件,并对检索结果进行统计、排序和运算,最终以各种统计图的方式提供给决策者,辅助决策。
能够根据数据模型实现数据的采集、整合、查阅、分析和展示等功能,提高系统应用效率和灵活性。
目前,数据分析领域广泛应用的商业智能(business intelligence,BI),可基于数据仓库(data warehouse,DW)技术从海量数据中钻取信息并挖掘知识[4-5]。BI技术层次及业务流程上包含提取转换加载(extraction transformation loading,ETL)、DW、联机分析处理(on-line analytical processing,OLAP)和数据挖据(data mining,DM)等多环节,可为医疗设备管理提供技术支持,从而满足医疗设备科学管理的现实需求[6-7]。因此,构建支持异构业务系统来源的混合架构BI分析系统的多维数据检索系统,是解决当前业务需求的有效方式。
多维数据检索系统分为数据层、ETL及数据模型层、数据分析层和数据展示层。ETL及数据模型层可定期从业务系统中抽取数据到数据仓库。以医疗设备为主题构建的数据仓库,在功能上可实现数据展示和查询统计应用,用户可通过Web应用、移动端及Restful等方式提供数据访问和统计分析服务。多维数据检索系统结构见图1。
图1 多维数据检索系统结构
Power BI是微软公司出品的商业智能工具,具有经济、迭代更新快和使用便捷的优点,支持各种主流数据源连接,可对数据进行编辑、数据建模和可视化展示,能满足本研究医疗设备多维数据分析的设计需求,可为数据分析提供从源头到末端的全流程服务[8]。Power BI工具由Power Pivot、Power Query和Power View模块组成,其中Power Pivot模块可实现数据建模,Power Query模块工具可实现经过筛选、合并、转化和组合后的数据整合,Power View数据模块可视化组件可提供多种数据展示样式以匹配不同的场景使用。
目前,医院现有的医疗设备档案管理系统包括医疗设备综合管理系统、医疗设备工作量管理系统、医疗设备计量与质量控制管理系统以及固定资产管理系统等[9-10]。①医疗设备综合管理系统以医疗设备出入库管理工作为核心,包含仪器设备合同管理、仪器设备库房管理、在用仪器设备档案管理、仪器设备维修管理、仪器设备效率、效益管理、仪器设备退役处理、仪器设备折旧处理、仪器设备质量等级调整处理、仪器设备综合统计查询以及子系统维护等11个子系统,共40余个子功能,涵盖医疗设备购置到报废的全过程;②医疗设备工作量管理系统以医疗设备管理人员为核心,包含人员字典、分组及工作量管理等业务内容[11-12];③医疗设备计量与质量控制系统包括受检设备管理、检测事件管理及检测记录管理等内容;④固定资产管理系统以经费管理为核心,涉及资产入库、出库、标识和账目管理等业务内容。由于上述系统业务数据主要围绕医疗设备及其相关事件,因此,选择医疗设备作为数据主题[13]。
多维数据检索系统的数据建模数据划分为设备及人员2个主题,其中,设备主题包括设备信息和设备事件,设备事件包含采购、验收、出入库、安装、维修、维护养护、计量及质量控制和报废等;人员主题包括设备管理人员信息、分组、工作记录、受训以及请(休)假等信息。设备主题数据来源于医疗设备综合管理系统、计量与质量控制管理系统、固定资产管理系统等;人员信息来源于医疗设备工作量管理系统以及请(休)假记录、人员档案和培训记录等文档记录。数据主题模型见图2。
图2 多维数据检索系统数据主题模型
使用Power Pivot模块的“数据导入向导”功能,选择数据表及试图、检索字段、更新周期和数据转换,完成数据导入[13]。为实现多数据集关联查询,需要在不同数据集中建立关联性,Power Pivot模块可通过构建事实表与维度表实现。以建立多维数据检索系统的设备主题为例,设备档案记录、设备事件记录及文档记录为事实表[14];设备类型字典、科室字典、生产厂家字典、代理厂家字典及经费来源等为维度表。
多维数据分析可通过Power Query模块工具实现,Power Query采用数据分析表达式(data analysis expressions,DAX)数据分析语言实现检索功能,DAX支持Excel运算式及Query查询语言,便于功能移植及重构。结合业务需求,集合数据模型及组织结构,整理分析业务模型7种,见表1。
表1 业务模型功能
以医疗设备档案多维数据分析为例,抽取设备基础信息、维修记录、计量质量控制等关系型数据库数据,并分别针对招标计划、审批、采购、验收记录、维修记录、报废申请与批复等文本资料建立Mongo DB数据库存储文本记录;采用Power Pivot模块建立数据抽取策略,基于设备基础信息建立记录主索引,并以设备申请号、序列号(serial number,SN)、设备批复号及人员工号等建立多数据集合关联;分别以设备标准名、生产厂家、代理厂家、经费来源、事件类型、时间以及使用科室等维度建立多维数据查询;按照维修参数(事件记录数、维修费用、维修设备类别和时间段)统计单项、多项或全部数据,分析和推测设备组成、使用、故障及维护工作量等规律,并研究季节、型号规格、费用以及使用科室等因素间因果关系,制定适合医院发展的采购及维修依据。
Power BI工具采用Power View模块实现数据可视化功能,该组件具有操作简单和效率高的优点[15]。Power View模块中,通过定义可视化类型并选择数据源快速创建可视化效果,支持基于数据表格建立预览,帮助实现最佳阐述数据的可视化效果。Power View模块搭配Power BI工具的其他组件形成数据建模、数据检索和数据可视化一体化操作流程[16]。通过预定义数据模型,实现联动显示,最终可通过构建Restful服务、Power BI工具服务注册和Web应用模块嵌入等方式发布,支持用户通过客户端应用、Web页面以及服务调用等方式访问。
随着医疗设备领域信息化的发展,面对日积月累的海量数据,传统分析手段已无法满足快速而简便地分析利用数据的难题。近年来涌现出的分析方法中,Power BI工具的解决方案以其特有的优势,在类似应用环境中取得了广泛的应用,该策略主要包括数据获取、数据预处理、数据建模、数据分析和数据展示等步骤。通过数据建模,在异构数据源中整合并实现符合条件的查询,采用图形化、动态化数据报表,展示事实表与维度表相互的关联和变化。在面对海量数据管理和复杂分析需求时,用户可通过图形化操作界面采取拖拽、点击等简单操作解决医疗设备管理中日趋复杂的业务统计分析要求。
基于Power BI工具应用于医疗设备数据分析的多维数据检索系统,降低了数据利用难度,增强了设备档案查阅的即时性,可帮助设备管理人员快速归档并调阅医疗设备档案信息。在测试应用过程中,以查询某季度某种类型设备维修及维护信息(包括计量检定及日常维护)为例,通过35次的查询时间平均值显示,基于Power BI工具的多维数据检索系统查询时间随业务复杂度变化仍较稳定,尤其是查询业务为多维度且涉及跨库数据集时,手工查询无法直接实现跨库查询,单库查询结果需要人工整合实现,而基于Power BI工具的多维数据检索系统查询统计呈现出显著优势。针对120万条关联测试记录进行单条件跨库查询,多维数据检索系统的平均查询速度为48 ms,而手工跨库查询平均为770 ms,多维数据检索系统的平均查询速度为手工跨库查询的16倍。与此同时,基于Power BI工具的多维数据检索系统应用于设备管理能规范医疗设备档案管理流程,降低人为文档交接、查询、归档及备份等日常工作量,可增强数据的安全性,提高工作质量以及医院设备管理质量和效率。多维数据检索系统查询性能测试比较见图3。
图3 多维数据检索系统查询性能测试比较
本研究基于Power BI工具的多维数据检索系统,实现了多渠道数据源资源整合,能以低耦合性和高扩展性方式实现已有的医疗设备数据对接,为建立医疗设备全生命周期管理创造了平台条件。以大数据为契机,转变管理模式,从传统的被动数据统计向知识发现和信息服务方向发展,凸显了档案数据在医疗设备管理中的价值,提升了医疗设备管理的科学性,为医疗设备全生命周期监管提供信息支持。
基于Power BI工具工作组件及其处理流程设计的多维数据检索系统,实现了面向医疗设备、人员为业务主题的多维分析模型,可满足灵活高效的医疗设备信息整合需求以及医疗设备管理中普遍存在的数据采集、检索、分析及展示等现实需求,支持异构化数据集成及业务扩展,提高了医疗设备档案管理的科学性,为医疗设备信息化建设构建类似业务系统提供参考。