数据挖掘技术在医院信息系统中的应用

2012-11-16 03:42史今驰
中国医疗设备 2012年1期
关键词:决策树数据挖掘数据库

史今驰

聊城市人民医院 信息科,山东 聊城252000

数据挖掘技术在医院信息系统中的应用

史今驰

聊城市人民医院 信息科,山东 聊城252000

本文主要介绍了数据挖掘技术在医院信息化平台中的应用,通过对医院信息系统中的有关数据进行挖掘,从中筛选出大量的病案数据及费用数据,从而不断完善医院的信息化管理和提高经济效益。

数据挖掘;数据仓库;医院信息系统

当今,随着计算机信息技术的迅速发展,数据库的规模也不断扩大,形成了一个大型的数据库。但在这个庞大的互联网信息数据库中,有大量的数据是我们通常无法辨认出来的。要想在这些隐藏的数据中挖掘有用的信息,数据挖掘是一个必要的过程,尤其在当今的医学领域中的应用更为广泛。

1 数据挖掘技术简介

数据挖掘技术其实就是长期在数据库中进行研究和不断开发的结果。最初大量的数据是储存在计算机的数据库中的,后来便可以在数据库中查询和访问数据。随着计算机技术的不断发展,数据挖掘开始广泛应用,它使数据库进入一个崭新的阶段,并不断发现数据库中各类数据之间的联系和特点,最后形成了一种更稳定、更成熟、更易于理解操作的数据挖掘技术。

所谓数据挖掘就是通过在大量的、模糊的、有噪声的、不完全的、随机的数据中不断提取出很多事先不知道或者潜在隐含的数据信息和知识的过程。它主要有大量的数据、知识和规则以及挖掘过程3个重要的要素。数据挖掘技术的主要特点主要有以下4个方面:① 处理大量的数据。②利用数据挖掘技术为用户精确找到有用信息。③通过数据挖掘技术统计规律并发现大量规则。④ 随着数据库的不断更新,数据挖掘发现的规则也不断更新[1]。

数据挖掘技术的主要功能有:① 概念描述:通过对描述某类对象内涵并概括该对象的特征。② 关联分析:指在一类可被发现的知识数据中,有两个或者两个以上的变量间存在着某种规律可循。③ 分类与预测:分类是指根据属性对对象进行分门别类和建立分组等;预测是指利用数据库中的历史数据来建立模型,在根据最新的数据输入对将来数据的预测和分析,从而得出可能性的属性值和该值的范围。④ 聚类分析:也可以称其为无指导学习,它将特征相同的对象分为一类,将数据聚集在一起,从而对聚集的状况进行解释分析。⑤ 趋势分析:是指在相当长的时间内,通过仔细观察发现其中的规律和趋势。⑥ 孤立点分析:是指在数据库中会存在一些与一般行为或模型不同的数据。⑦ 偏差分析:主要通过对差异或者极端特例的描述揭示事物间偏离常规的异常现象。

2 医院信息系统(HIS)中的数据挖掘技术的研究和应用

20世纪70年代,计算机就开始被应用于医疗卫生行业。从20世纪80年代开始,HIS也开始逐步发展起来。随着互联网和数据库的不断发展进步,我国的医疗信息系统也进入了一个崭新的时期。它通过计算机和网络现代化手段,对医院各个所属部门的人口流动、财务流动和物流等进行综合管理,并处理各个阶段产生的数据加工生产各种信息,为医院提供了全面的和自动化管理的信息服务系统[2]。所以,HIS对医院的信息化管理有着重要的作用,而且是现代化医院建设的重要的基础设施和支撑环境。

2.1 HIS中的数据挖掘算法分析

HIS中的数据挖掘技术主要是完成医院的信息化管理、医疗服务和经济的运行等任务,从而方便及时了解医院的医疗质量信息、经营状况和资源储备等信息,最终更好的为医院决策提供依据。

目前,常用的数据挖掘算法有很多种,而且大多数是数学统计方法、人工智能和人工神经网络等,HIS的数据挖掘算法主要分为以下5种。

2.1.1 决策树算法

决策树算法主要用于分类和预测,它主要包括决策节点、叶子和分支。一个决策树就表示一系列问题,在建立决策树模型中,不断对数据进行切分和剪枝进行分析从而解决问题。它主要适用于非值型的数据。利用决策树算法,可以在线监测医务人员配药的情况,药房配药工作者通过在线监测结果,可以及时发现和制止恶意配药的不良行为。

2.1.2 关联规则算法

关联规则算法是从数据库中存储的大量数据找出有趣的关联性和相关性。我们利用数据的关联规则算法,可以对医院的信息化系统进行数据的分析和挖掘,可以自动监控药物的用量、抗药性、用药途径、看病疗程和预防用药等,从而更好地监测医院药物的使用情况,同时它还可以发现不同病历间的相关性,从而对医院病人并发症进行挖掘[3]。

2.1.3 聚类分析算法

聚类分析算法先定义一个合适的变量,再计算两个样本间的距离,当这两个样本间的距离小于某个值时,则这两个样本就属于同一类;当这两个样本间的距离大于某个值时,则它们各自单独成为一类。聚类算法分析可以医疗费用进行统计分析,从而使医院的社会效益和经济达到最优。

2.1.4 人工神经网络算法

人工神经网络算法通过对一个训练数据集进行学习并且应用所学的知识,最终生成分类和预测的模型。它是仿真生物神经网络,利用链接各个节点,并对每个节点进行一一预测的。所以人工神经网络算的优点是可以解决上百个参数的问题,使过程变得更简单。在HIS中,可以利用人工神经网络算法来完成分类聚类和关联规则等的挖掘任务,并发现某些药物和疾病发作的关系。

2.1.5 遗传算法

主要是通过计算当前基因群体中每个个体的环境适应度并形成了一个适应度函数,把其中适应度较好的进行交叉配对繁殖。在医疗领域中,可以诊断和分类某些疾病症状,从而使医院的工作效率达到最好。

2.2 HIS中的数据挖掘技术的应用

2.2.1 改善医院的经济效益

当前社会,客户的价值不断影响着企业的价值,提高客户的满意度对企业的经济效益有着至关重要的作用。所以我们通过对病人的潜在价值的考虑,结合病人期望得到最佳的医疗服务等因素来建立预测模型,从而判断出未来的就诊人数,并采取相关的措施,来促进医院服务的发展和医疗设备的适当配置[4]。

2.2.2 培养人才

在医院里,每年都会通过组织安排去国外进修来提升医生的能力。但进修的名额却是有限的,不是每个医生都能有这个机会。未能进行医生可以通过查看病案直接了解病人的病历。在海量的病人案例中,有效地查看信息,就要利用数据挖掘进行筛选有用的信息,避免敏感的信息。只要根据病人的疾病名称和临床表现等进行检索,就可以协助医院培养有用人才。

2.2.3 通过对处方的实时监控,降低患者的药品费用支出

医院每天都会有大量的药品输出,所以数据库会产生大量的数据信息,通过对病人的诊断和检查可以指定一个合理的治疗方案,有效地监控对药物数据的取舍,从而减少了恶意配药的行为,降低病人在药品的费用支出,达到真正的降低患者药品上的支出[5]。

2.2.4 完善药品采购计划

药品库存是医院每天经营活动的基础,它可以促进库存的有效管理和对患者的服务水平。通常的做法是通过药品的销售量来判断订货量,但这样却忽视了病人的真正需求,因此,我们利用数据挖掘技术来实现药品库存的动态预测,从而有效地减低了库存的成本和提高了服务水平。

2.2.5 促进医疗设备的管理

医疗设备是医疗机构为广大患者提供良好的服务的重要因素,医院领导通过对医疗设备进行预测分析来判断是否购置医疗设备,我们通过建立数据挖掘模型进行收益预测,从而使医院的管理人员可以判断出是否购置医疗设备来避免资金的浪费[6]。

2.3 数据挖掘的应用举例

数据挖掘是在海量数据是利用各种分析工具寻找数据与模型间关系的过程。

实际上,疾病的诊断过程同时也是疾病分类的过程,即依据疾病特征划归分为某个疾病或者疾病类的过程。医学书一般会把这一复杂问题逐次分解,使之成为一些小问题体系结构,依据患者的不适部位及不适特征,定位到具体的疾病,此过程与现实的分类过程非常相似。以糖尿病判断为例,可以运用决策树方法判定患者的糖尿病的类型。首先是创建决策树,其起点为血糖高,分支条件为是否处于妊娠期。如果答案是肯定的,那就直接指向妊娠糖尿病,这是因为,对于妊娠期的女性患者,高血糖的出现是要归于妊娠糖尿病一类的;如果答案是否定的,则继续判断患者是属于Ⅰ型或者Ⅱ型糖尿病。那么判断依据应该是什么呢?答案是频数计算法的使用。首先,Ⅰ型或者Ⅱ型糖尿病差别的体现主要表现在3个方面:一是有无自发性酮症,二是年龄,三是病情轻重以及起病快慢。对这三个方面进行调查,获得相应的频数,然后依据据病人表现症状,将累加相应的频数,得出糖尿病患者患病类型的概率。

调查总结后得出Ⅰ型糖尿病的频数,见表1。

表1 I型糖尿病频数表

将频数转成相应的百分数,建立如图1所示的决策树。

图1 决策树示意图

节点1:有自发性酮症;节点2:无自发性酮症;节点3:有自发性酮症,病情重,起病急;节点4:有自发性酮症,病情轻,起病慢;节点5:无自发性酮症,病情重,起病急;节点6:无自发性酮症,病情轻,起病慢。节点3.1:年龄<40;结论:患有Ⅰ型糖尿病的几为20%+35%+40%=95%。节点3.2:年龄>40;结论:患有Ⅰ型糖尿病的几率为35%+20%=55%。节点4.1:年龄<40;结论:患有Ⅰ型糖尿病的几率为20%+40%=60%;节点4.2:年龄>40;结论:患有Ⅰ型糖尿病的几率为40%;节点5.1:年龄<40:结论:患有Ⅰ型糖尿病的几率为-40%+20%+35%=15%;节点5.2:年龄>40;结论:患有1型糖尿病的几率为-20%+35%-40%=-25%;节点6.1:年龄<40;结论:患有Ⅰ型糖尿病的几率为-40%+20%-35%=-55%;节点6.2:年龄>40;结论:患有Ⅰ型糖尿病的几率为-35%-20%-40%=-95%。

如果是男性患者、年龄25岁、病情较重、起病较急,有自发性酮症,则依据此算法进行决策能够得出的结论为:患有Ⅰ型糖尿病的百分比是95%。这样就能够起到辅助医生决策的作用。

挖掘出来的结果最终无论是用来预测、干预还是描述、理解,我们运用的目的都是为了提高决策的支持能力。

3 小结

随着计算机信息化的不断发展,医院开始建立各自的信息系统,数据库规模也在不断扩大,功能也越来越复杂。所以我们运用数据挖掘技术中的决策树、聚类、人工神经网络算法和遗传算法,对医院在医疗活动中产生的大量的数据进行深层的挖掘,从而得到有用的信息,并帮医院的科学管理活动中提供了重要的预测数据和支持。数据挖掘技术在医院信息管理系统中的应用具有十分广阔的前景,为医院各个领域的管理不断开辟新的途径。

[1] 王炯,夏宏斌.浅析数据挖掘技术在医院信息化平台建设中的应用策略[J].学术交流,2000,14(5):67-68.

[2] 刁琰.数据仓库与数据挖掘技术在医院信息管理中的应用[J].华南国防医学杂志,2008,27(12):45-46.

[3] 陆斌杰.数据挖掘技术在医院管理中的应用[J].中国医疗器械杂志,2006,32(34):56-57.

[4] 梁瑜,洪嘉铭,邝国庭.数据挖掘技术在医院科研信息服务中的应用探讨[J].医院信息化,2005,11(7):45-46.

[5] 李怀庆,张文东.数据挖掘技术在医院信息系统中的应用[J].医疗设备信息,2007,22(12):46-47.

[6] 周爱华,郑应平.医学数据挖掘综述[J].中华医学实践杂志,2005,4(2):126-127.

[7] 赵岚,吴洁人,凌枫,等.应用数据挖掘技术建立智能化医院感染监控平台[J].中华医院感染学杂志,2010,20(12):1733-1735.

The Application of Data Mining Technology in the Hospital Information System

SHI Jin-chi
Information Department, Liaocheng People's Hospital, Liaocheng Shandong 252000, China

This paper mainly introduces the data mining technology in the application of hospital information platform. Through the relevant data mining of the hospital information system, we can get a large number of medical records data and cost data, then to constantly perfect the hospital information management and improve the economic benefits.

data mining; data warehousing; hospitals information system

TP311.13

B

10.3969/j.issn.1674-1633.2012.01.029

1674-1633(2012)01-0086-03

2011-08-01

作者邮箱:jiankang20092050@163.com

猜你喜欢
决策树数据挖掘数据库
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
决策树和随机森林方法在管理决策中的应用
数据库
软件工程领域中的异常数据挖掘算法
决策树多元分类模型预测森林植被覆盖
基于决策树的出租车乘客出行目的识别
数据库
数据库