基于循证医学的电子病历资源整合与挖掘的宏观模型构建

2010-08-15 00:46曹洪欣第二军医大学医学信息学教研室上海200433
图书馆理论与实践 2010年9期
关键词:数据仓库资源整合病历

●曹洪欣,徐 维(第二军医大学 医学信息学教研室,上海 200433)

1 引言

作为医院信息管理系统(Hospital Information System,HIS)的重要组成部分,电子病历(Electronic Health Record,EHR)诞生伊始即被赋予了“共享病人完整信息、提供医疗提示和报警、提供医疗知识库支持”的公认内涵,[1]其目标是“提高医疗质量、降低医疗成本、改善工作流程、提供知识库支持”。[2]但随着医学本身的不断发展与进步以及计算机、网络技术和信息技术在医学领域的不断拓展与应用,使得临床数据呈现以几何级暴涨的趋势,而反观全球电子病历系统的发展,因存在时间性、区域性、技术标准等方面的巨大差异,使得富含宝贵信息资源的电子病历越来越背离了其建设初衷和应用目标而成为一座不断膨胀的信息孤岛。因此,如何整合、挖掘电子病历信息,使其能够共享、可交换,实现其服务医疗实践、医疗知识库及医疗决策支持等的初衷成为当务之急。本文拟从循证医学视角出发,构建电子病历信息资源整合与挖掘的宏观模型。

2 构建思路及目标

EHR本身即具有多样性、动态性、冗余性、时间性、多维性以及不完整性等特征,[3,4]加之各个国家和地区在建设时间、采用技术、应用标准以及应用目标等存在的较大差异,使得各EHR系统存在广泛的异质性,无法直接实现共享与交换,因此EHR资源整合与挖掘宏观模型的构建思路,应在确保EHR数据安全的前提下,遵循着眼解决上述问题,实现“共享病人完整信息、提供医疗提示和报警、提供医疗知识库支持”的内涵,达成“提高医疗质量、降低医疗成本、改善工作流程、提供知识库支持”的设计思路。

基于上述思路,在确保医疗机构EHR系统数据安全的前提下,可兼容各异质EHR系统,能够实现EHR数据共享与交换,适应循证医学医疗模式,融合国际、国家和区域性标准,满足各种数据挖掘需求的区域性或国家性资源整合与挖掘的平台模型是本研究的构建目标。

3 相关理论、标准与技术

电子病历信息资源整合与挖掘宏观模型的构建必须具有相关理论予以支持,必须遵循国内外相应的有关标准以保证系统的实用性与兼容性,必须通过相关技术予以实现。

3.1 相关理论

循证医学(Evidence-Based Medicine,EBM)是20世纪80年代才从医学实践中独立发展起来的一门新兴学科,也是一门极具生命力的基础理论研究科学。其核心思想就是充分利用客观的临床科学证据进行医疗决策,从而提高医疗质量。目前循证医学已被广泛应用于医学实践的各个领域,如医疗实践、临床科研、医院管理、医学教学等。

循证医学的实践模式与传统模式的差别是碰到问题后医生不仅仅是通过咨询专家、教科书等传统方式获取决策支持,而是要通过获取最新科研证据、最全临床证据方式获取决策证据,达到这一目标必须要有一个便捷、高效、权威、真实、客观的数据中心的支持,而EHR正是最直接、最真实、最客观的临床证据来源之一。EHR最终目标亦即EHR的高级阶段是高度共享和智能化、结构化、构建具有决策支持的国家性或区域性的基础和通用性EHR系统,[5-7]但这必须在循证医学的理论框架下加以解决。

3.2 相关标准

全球范围内的EHR系统历经40多年的建设与发展,但目前尚未有一个国家建成基础和通用的EHR系统,[6]其中最难突破的瓶颈之一就是标准问题。尽管国际上已制定了许多国际性、国家性和区域性的各种标准,但由于种种复杂因素而始终无法满足EHR资源整合与共享的发展需求,这也是EHR标准成为全球范围内的研究热点的原因。而对EHR资源的整合与挖掘也必然面临同样的瓶颈,因为对EHR资源的整合与挖掘也必须要在相关标准及法律法规框架下进行,否则对EHR资源的整合与挖掘将步履维艰。通常EHR资源整合与数据挖掘所涉相关标准同EHR系统建设一样,可分为术语标准、通信标准、法规标准三类。

3.3 相关技术

本文采用数据中心模式构建EHR资源整合与挖掘模型,涉及的核心技术主要要有数据仓库、数据挖掘、XMLWebServices技术。

3.3.1 数据仓库

数据仓库(DateWarehouse,DW)是面向主题的、集成的、时变的、非易失的数据集合,用以支持决策制定过程。最根本的特点是物理地存放来源于其他数据库中的数据,需建立在一个较全面和完善的信息应用基础之上,用于支持决策分析。[8]数据仓库是数据库技术的一种新的应用,是一个信息提供平台,它从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识。从功能结构划分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(DataAccess)三个关键部分。

模型构建拟利用数据仓库技术实现EHR资源整合与挖掘模型的数据库集成与源数据建设。

3.3.2 数据挖掘

数据挖掘(DataMining,DM)又称为数据库中的知识发现(Knowledge Discoveryin Database,KDD),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,获取有效的、新颖的、潜在有用的、最终可理解的模式的信息和知识的非平凡过程。它起源于多种学科,其中最重要的是数据库、机器学习和统计学三个领域。

数据挖掘技术主要有关联规则(Association Rule)发现、分类(Classification)、聚类(Clustering)分析、泛化(Generalization)和预测(Prediction)等;数据挖掘的主要方法有频繁项集和关联规则、决策树(Decision Tree)方法、贝叶斯(Bayesian)方法、人工神经网络(Artificial NeuralNetwork,ANN)等;常用的理论主要有模糊集合(FuzzySets)、粗糙集(RoughSets)理论、树立统计、机器学习(MachineLearning)、人工神经网络、决策树、模式识别(PatternRecognition)、高性能计算等等。

模型构建拟利用数据挖掘技术实现EHR资源整合与挖掘模型的数据挖掘与应用。3.3.3 XMLWebServices

WebServices是一种基于透明标准体系的组件化松散耦合技术,其目标是实现不同系统间跨平台、跨编程语言的可互操作性。它是一个基于XML的可编程实体,提供一种特殊的功能元素,可以通过Internet标准,如XML和Http等来访问任何分布式的操作平台,实现应用的互相协同工作。[9]WebServices的定位是拓展分布式应用,适合大数据量低频率的远程数据调用。[10]Web Services框架的核心技术包括SOAP、WSDL和UDDI,它们都是以标准的XML文档的形式表达的。

XMLWeb Services是分布式计算的重要标准,也是未来软件开发的技术趋势,通过XMLWeb Services标准,应用软件之间可以实现跨平台、跨编程语言的联接和互操作。作为微软平台的一个基本功能,基于XMLWebServices标准的.NET开发平台可以实现个人之间、个人与企业之间、企业之间的信息互连,满足人们可以随时随地存取和使用信息的需求。

模型构建拟利用该技术实现EHR资源整合与挖掘模型的数据结构化处理及数据交换,以实现语法互操作。

4 模型构建

目前,EHR资源整合与挖掘常用的模式主要有P2P、索引中心和数据中心三种模式。[11]

P2P模式常用于两个医疗单位间的点对点直接数据通信,对医疗单位的信息化程度要求比较高;索引中心模式通过索引数据库→信息源系统数据库方式实现数据查询与访问,但查询性能不高。P2P和索引中心两种模式都是直接访问医疗单位的EHR等信息源系统获取相关信息,其缺点是:① 对EHR等信息源系统安全威胁较大;② 对EHR等信息源系统资源占用较大;③ 无法支持数据挖掘等深层次的信息处理与共享应用等。而数据中心模式是指通过建立一个集中的数据集散中心,将来自各信息系统的数据进行数据清洗、转换、装载、集成,存储到中心数据库,并以一定的方式与各信息源进行数据同步,从而实现HER等信息源系统的信息资源整合、共享和再开发利用。基于上述分析,本文拟采用数据中心的模式进行EHR资源整合与挖掘的模型构建。

模型可分为四大模块:模块1是源数据模块,是数据仓库的数据源,主要来源于医疗机构的各种操作型信息系统数据库(如HIS系统、EHR系统、PACS系统、RIS系统等)、各种医疗数据文档以及其他相关数据;模块2是数据仓库管理模块,主要是通过数据仓库管理工具、各种规范标准及元数据库等,对模块1的源数据进行清洗、转换、装载、集成,并通过数据建模工具完成各种异质数据及数据结构的统一、规范;模块3是数据仓库,集成了经过标准化、规范化处理后的各种数据,并可根据具体需求建立各种数据集市;模块4是分析应用模块,通过Web Services层完成各种分析应用(如查询工具、C/S工具、OLAP工具、数据挖掘工具等)与数据仓库的数据传输请求。

本模型通过仓库管理模块将各种异质数据源集成于数据仓库中,并通过分析应用模块完成基于Web Services模式的终端应用,即可兼容不同时间、不同区域、不同标准、不同结构的各种源数据资源,避免重复建设和浪费资源,又可以通过各种个性化的工具实现对EHR相关资源的共享与应用,实现基础与通用的EHR系统建设目标。

5 结语

21世纪基于循证医学提供集成的个性化医疗服务已经成为了世界范围内的共识和目标,而这样的医疗服务也必然是建立在基于EBM的、完整的海量信息基础之上,基于EBM的EHR资源的整合与挖掘是实现这一目标的必然之路。但还有许多问题亟待研究解决,尤其是基于EBM信息需求和基于现代医学技术、信息网络技术不断发展的各种临床信息语义、语法及各类标准、规范的研究与制定,仍然是个漫长而艰辛的过程,必须在国家层面予以支持不断完善。

[1]Institute of Medicine.The Computer-Based Patient Record[M].Washington:National AcademyPress,1997:55-56.

[2]JohnHalamka.电子病历与临床信息技术革命——美国的现状及深远影响[J].郑强等译.中华医学杂志,2005(22):1513-1515.

[3]丁卫平,等.电子病历挖掘:概念、技术及应用[J].计算机工程与设计,2008(2):405-407,410.

[4]丁卫平,等.基于频繁概念格的电子病历馆里规则挖掘研究[J].微电子学与计算机,2008(8):125-128,132.

[5]李昊旻,等.电子病历与标准化和结构化[J].中国数字医学,2008(10):9-12.

[6]徐勇勇,等.电子病历与临床信息标准[J].中华神经外科疾病研究杂志,2005(6):481-485.

[7]邱国华.电子病历的临床规范[J].中国医学创新,2009(9):144-145.

[8]邵峰晶,等.数据挖掘原理与算法[M].第二版北京:科学出版社,2009.

[9]王伟,郑衍衡.基于Web服务的教委财务信息化管理平台的研究[J].计算机应用研究,2006(12):90-91.

[10]王碹,李燕.应用WebServices构建多层架构的高效.NET应用 [M].北京:科学出版社,2005.

[11]余本功,等.基于第三方的电子病历信息整合平台研究[J].计算机系统应用,2008(5):2-5,19.

猜你喜欢
数据仓库资源整合病历
少先队活动与校外资源整合的实践与探索
强迫症病历簿
“五育并举”下家校社资源整合的价值意义
基于数据仓库的数据倾斜解决方案研究
“大数的认识”的诊断病历
海外并购中的人力资源整合之道
基于数据仓库的住房城乡建设信息系统整合研究
智慧高速资源整合方式实践
探析电力系统调度中数据仓库技术的应用
为何要公开全部病历?