数据仓库技术在医院决策支持系统中的应用

2010-01-25 00:40杨松涛王宗殿
通化师范学院学报 2010年4期
关键词:决策支持系统数据仓库门诊

俞 磊,杨松涛,王宗殿

(安徽中医学院 医药信息工程学院, 安徽 合肥 230031)

近年来,国内医疗市场竞争日趋激烈,社会对医疗质量、医院工作效率和服务质量的要求越来越高.人们需要随时获取患者、资金、物流、工作量等方面的数据、指标和报表,需要采用复杂的统计分析方法和数据挖掘技术反复处理海量历史数据,从中总结出临床医学和医院管理方面的新知识.原有医院信息系统[1,2]HIS(hospital information system)相对简单的功能已不能满足这些需要,而数据仓库作为数据管理和利用的综合性技术,以其独有的特点和优势逐步得到了广泛的应用,于是以数据仓库为基础的医院决策支持系统建设已成为数字化医院建设又一新的发展方向.在医院决策支持系统的设计过程中,数据仓库的设计和实现是重中之重,是整个系统成功实现的基础.本文在一个基于 DW+ OLAP+DM 的医院决策支持系统框架的基础上,详细探讨了该系统中数据仓库的设计方法和过程,并给出了具体的实现步骤.

1 医院决策支持系统的框架结构

系统采用的是基于DW+ OLAP+DM这一新型框架结构.其中DW实现数据的存储、组织与管理,OLAP集中于数据的分析,DM则致力于知识的自动发现.具体结构如图1所示,分为四层[3].

最底层为数据获取层,数据源主要包括患者信息、药品信息、门诊信息、住院信息以及一些外部数据.外部数据主要包括竞争数据及国家的相关政策法规等,其它信息来自医院信息系统 HIS.为保持数据一致性,必须对数据源中的数据进行清理、抽取、转换,生成综合性统一的数据类型存入医院DW.

数据存储层主要用来存储和管理加工处理后的面向决策主题的综合性数据,并按决策主题的需求进行重新组织,为决策支持提供大量的数据依据.

图1 医院决策支持系统的体系结构

数据处理层主要是通过OLAP与DM从DW中得出有用的信息、知识.

数据访问层为决策者提供与系统交互的入口.把数据处理层得到的信息和知识通过人机交互界面展现给用户,主要包括用户交互、格式化查询及报表和统计图的生成等.

可以看出,数据仓库在整个决策支持系统中的作用至关重要,是实现联机分析处理和数据挖掘的基础.

2 医院决策支持系统中数据仓库的设计

数据仓库的设计包括需求分析、主题确定和数据仓库建模.需求分析就是确定系统的使用者所关注的问题;主题确定是根据需求分析结果把分散的数据统一管理以便更加高效可靠的利用这些数据;数据仓库建模则包括概念模型设计、逻辑模型设计和物理模型设计三个步骤.下文按上述主要内容详细讨论本系统中数据仓库的设计方法和过程.

2.1 需求分析

在分析医院需求前,必须意识到医院是一个非盈利性的机构,它设立的根本目标是治病救人,更好的为病人服务.所以,医院决策支持系统使用者的需求主要有以下几个方面:一是病人信息,包括病人的基本信息和医生诊断的详细方案;二是药品信息,包括药品的采购信息和销售(医生开处方)信息;三是费用信息,包括门诊费用和住院费用(在病人住院的情况下).

2.2 主题确定

主题是一个在较高层次将数据归类的标准,它能反映出分析对象所涉及的各项数据及相互联系.经过对医院需求的仔细分析,确定了三个基本主题:病人主题、药品主题和费用主题[4,5].为了更清楚的对各主题内容进行标志,又对每个主题进一步划分成若干个子主题.各主题的详细内容如表1所示.

表1 医院数据仓库中各主题详细内容

2.3 数据建模

(1)概念模型设计.概念模型的设计主要是以信息包图的方法用二维表格反映各主题数据的多维性,从总体上表示用户多信息的需求,指明用户希望从数据仓库中分析的各种指标.它包含三个重要对象:度量指标、维度和维的层次.其中“度量指标”是指决策者分析的目标数据;“维”是事实的信息属性,也是观察事实的角度;“维的层次”又称维的深度,是维的划分单位,体现数据单元的详细程度与级别,写在对应维度的下方.以“门诊费用”这个子主题为例,其完整的信息包图如图2所示:

图2 "门诊费用"主题的信息包图

(2)逻辑模型设计.数据仓库的逻辑模型有三种:星型模型、雪花模型和混合模型[6].医院决策支持系统的数据仓库采用星型模型,每个子主题对应一个星型模型结构.星型模型由一个事实表和多个维表构成.根据不同的分析主题,确定描述各个主题中可用于分析与决策支持的相应指标,即多维数据模型的事实表,并根据各个指标的约束因素,确定多维数据模型的各个维表.还以“门诊费用”主题为例,它含有时间维、科室维、疾病维、费用维四个维表,形成了“门诊费用”分析的不同角度(某段时间、某个科室、某种疾病和某类收费).事实表由这四个维表的主键和一个度量指标即“门诊应付费用总计”组成.一个事实表与四个维表联系起来构成了一个四维分析空间.对于“门诊费用”这个子主题,其星型模型结构如图3所示.

图3 图3"门诊费用"主题的星型逻辑模型

(3)物理模型设计.物理模型设计主要是根据逻辑模型设计数据仓库的实际存储方式,是逻辑模型在数据仓库中的实现.数据仓库的存储方式有:虚拟存储方式、关系型存储方式和多维立方体存储方式[6].由于关系型存储方式较为成熟,可通过关系型存储方式ROLAP技术把关系型数据库建模成为“虚拟多维立方体”来存储和管理面向主题的数据,以实现OLAP的功能.

3 医院决策支持系统中数据仓库的实现

在本医院决策支持系统中,是利用Microsoft SQL Server 2000进行设计、存储和管理医院数据仓库,具体步骤如下:

(1)数据仓库的创建.数据仓库的框架是由事实表和维表组成.数据仓库的创建可以采用Microsoft SQL Server 2000中的数据库与表创建工具实现.

(2)数据的抽取.主要是通过网络把从HIS中提取出的数据传输到系统DW中.要完成以上工作,需利用Microsoft SQL Server 2000的数据转换服务DTS包组件,在包中指定源数据与目标数据间的映射关系, 把数据转换和导入导出过程保存在存储过程中,让服务器自动、定期的执行.

(3)数据的清理和转换.提取出来的数据还需要进行数据的一致性检查、格式化处理等清理工作, 并对数据进行必要的转换.在Microsoft SQL Server 2000 中可以使用Transact-SQL、DTS、命令行应用程序及ActiveX脚本实现数据的清理和转换.

(4)数据的加载.在SQL Server 2000 中可以使用Transact-SQL、DTS 和BSP将数据加载到数据仓库中.

4 结束语

本文在对医院决策支持系统框架结构分析的基础上,重点探讨了本系统中数据仓库的设计方法、过程及具体实现步骤.下一步主要是进行联机分析处理(OLAP)和数据挖掘(DM)模型的设计,拟采用Microsoft SQL Server 2000自带的 Analysis Services来创建并用ADOMD接口实现对多维数据集的访问,用 MDX语句向OLAP服务器提出查询请求并获得结果集,从而完成整个医院决策支持系统的搭建与实现.

参考文献:

[1]王徐冬,杨希武.数据仓库与数据挖掘在医院信息系统中的应用[J].医院数字化,2008,29(8):47-49.

[2]吕英华,马静.数据仓库技术在医院信息系统中的应用[J].医院数字化,2009,30(4):48-49.

[3]黄淑芹,曹杰.电力营销DSS体系结构的研究与设计[J].通化师范学院学报,2007,28(8):37-38.

[4]叶明全,宋念东.基于HIS的医院数据仓库设计与实现[J].计算机工程与设计,2008(3):779-781.

[5]杨凤娟.基于数据仓库技术的医疗质量数据模型设计[J].情报探索,2008(10):72-74.

[6]高洪深.决策支持系统(DSS):理论方法案例[M].北京:清华大学出版社,2005.

猜你喜欢
决策支持系统数据仓库门诊
护理临床决策支持系统的理论基础
门诊支付之变
基于数据仓库的数据倾斜解决方案研究
面向知识转化的临床决策支持系统关键技术研究
临床决策支持系统应用于呼吸疾病的现状概述
基于数据仓库的住房城乡建设信息系统整合研究
电务维修决策支持系统研究
探析电力系统调度中数据仓库技术的应用
汉字小门诊系列(四)
汉字小门诊系列(九)