陈郁韩
数据挖掘技术在医院管理中的应用
陈郁韩①
目的:医疗数据挖掘能够对医院现有数据库中数据进行自动分析并提供有价值的医学知识,为医院管理中各项决策提供有力的技术支持。方法:介绍数据挖掘的概念,分析数据挖掘的主要任务,阐明医学数据挖掘的应用现状。结果:对数据挖掘技术在医院中医疗质量管理、医用耗材备货管理、手术室感染管理以及影像科管理中的具体应用进行了分析研究。结论:提出数据挖掘应用时必须注意的问题,肯定了快速发展的图像数据挖掘技术所具有的较高学术价值和广阔的应用前景。
数据挖掘;数据库;医院管理
[First-author’s address]Equipment Department, Affiliated Hospital of Nantong University, Nantong 226001, China.
近年来,数据挖掘(data mining,DM)已经成为非常活跃的研究领域,在医疗界得到广泛应用,并形成了医疗DM这一重要研究分支[1-2]。随着信息技术的发展,采集、存储和管理数据的手段日益完善和丰富,各行业积累的数据量快速增长,医学领域也面临同样的情况,仅登录在美国Gen Bank数据库中的DNA序列总量在2002年就已超过了280亿个碱基对[3]。面对爆炸式的数据增长,若仅采用传统的数据分析方法,通常只能从中获取一些表层信息,而无法发现数据的内在联系和隐藏的内容。DM技术可以应用于任何类型的信息储存库以及瞬态数据,能够提供强大的数据分析功能,用于医院慢性病数据仓库的建立与分析、恶性肿瘤的诊断与恶性程度的判断分析、呼吸道感染患者的病情危重度的分析以及医院医疗数据的挖掘和疾病专家系统的建立等,为医院的医疗质量管理、医用耗材备货管理、手术室感染管理及影像科管理等提供支持[4]。
1.1 DM技术的内涵
DM又称为数据库中的知识发现(knowledge discovery in database,KDD),是对大量观察到的数据进行分析,从中发现事先未知的联系和规律[5]。DM所要处理的问题,就是在庞大的数据库中寻找出有价值的隐藏事件加以分析,并将有意义的信息归纳成结构模式,提供给有关部门在进行决策时参考。DM技术看重的是数据库的再分析,包括模式的建构或是资料特征的判定,其主要目的就是要从数据库中发现之前关心却未曾获悉的有价值信息。DM技术是人工智能和数据库发展相结合的产物。图1所示为典型的DM系统[6]。
图1 典型的数据挖掘系统
1.2 DM的任务
(1)数据抽取。其目的是对数据进行浓缩,给出他的紧凑描述。DM技术主要关心从数据泛化的角度来讨论数据总结,数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。
(2)分类发现。其目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个。分类可以用于预测,目的是从历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。
(3)聚类。是把一组个体按照相似性归成若干类别,即“物以类聚”。目的是使得属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。聚类方法包括统计方法、神经网络方法和面向数据库的方法。
(4)关联规则分析。是描述和分析已有数据中是否存在共生现象,主要反映事物之间的关联性,即某些事件一起发生的可能性。用于关联规则发现的主要对象是事务型数据库,如果对这些数据进行分析,则可对患者的情况提供极有价值的信息[7]。
在我国,医学的数据资源极为丰富,但运用DM技术分析和处理这些数据资源的研究尚处于起步阶段。主要原因是:①DM系统采用许多复杂的数学工具,但对于医学领域的研究者而言,并不需要设计这些数学工具,他们需要的是理性地使用这些现有的工具,许多数据处理软件包(如Weka、SPSS和SAS等)都包含常用DM方法的功能;②当前医学教育中的知识结构使大部分医学研究者对DM系统这类数据分析处理技术不甚了解、也不甚敏感,也就更难以自觉地应用。针对这种情况,有些大学(如第二军医大学和哈尔滨医科大学等)已经面向医学本科生及研究生开设了相关课程,上海交通大学医学院也向医学专业研究生开设了“生物医学数据挖掘”的课程,旨在使医学院校学生及医学科学研究者了解这些知识,能理性地应用这些数学工具,并建立和其他学科领域研究人员合作的基础[8]。
医疗过程中收集到的数据一般是真实可靠、不受其他因素影响的,而且数据集的稳定性较强,这些对挖掘结果的维护、不断提高挖掘模式的质量都是非常有利的条件。医疗数据是在对患者的诊断治疗中获得的,包括了与患者的交谈记录,各种医学仪器拍摄的图片,医生的观察说明等。医学DM在所有的生物信息DM中是收获最大但最困难的。
目前,很多医院都已建立了庞大的数据库,如果没有相应的技术手段对其进行整理、分析,就不能分析出数据中存在的关系和规则,亦不能根据现有的数据预测未来走势,从而陷入数据爆炸的困惑中。DM技术的出现改变了这种现状,并已在医院管理的各个方面得到广泛应用并取得巨大收益。从数据仓库中利用计算机应用软件提取有用的数据,运用统计学的相关知识对这些数据进行分类汇总,再利用DM软件对有用的数据进行宏观分析,来发现数据的各种信息,供医院决策者更好地制定管理策略[9]。
3.1 医疗质量管理中的DM
(1)工作量指标趋势分析。反映医疗工作量的指标有很多种,如门急诊及出院人次指标反映了医院每年服务患者门诊工作量和住院工作量的增减程度,只有做到门诊量、住院量及收入总量的同步持续稳定增长,医院才能有持续性发展。因此,可以利用DM技术中的环基比和定基比来分析数据的增长速度和发展速度,也可以用曲线拟合来预测未来的发展趋势。
(2)工作量指标影响因素分析。目的是科学、合理地评价各种影响因素,找出影响关键变量发展变化的主要因素,为医院管理提供决策依据。利用DM技术中的灰色关联分析方法对医院收治患者人数的影响因素进行分析发现,从关联度大小看,病床周转次数、住院患者手术人次与年收治患者人数关联程度较高,是影响医院年收治患者人数的主要因素;其次是平均开放病床数和年平均医生人数。
(3)疾病诊断分析。在医疗诊断中,可以根据大量确诊的病例,以疾病诊断结果作为决策属性,以各种疾病症状数据为条件属性,建立医疗病例知识库(或医疗决策表)。通过对医疗决策表进行数据挖掘,可获得有价值的医疗诊断知识,如医院疾病的构成种类、医院各年疾病的变化规律,找出医院的主要病种。但由于症状数据对疾病的影响程度各不相同,对疾病诊断的贡献也不同,经常存在冗余症状。应用基于粗糙集的DM技术对这些医学决策表进行分析,可以求出与疾病关联的最重要的症状组合[10]。Melgani等[11]以美国麻省理工学院的心律失常数据库的心电图为原始数据,采用SVM分类器、KNN分类器和ANN等不同的分类模型,对心电图的5种异常波形和正常波形进行分类。研究结果表明,SVM分类模型的性能最优。
(4)医疗质量综合评价。应用DM技术对医疗质量进行综合评价,将对加强医疗质量管理起着积极的促进作用。可以采用同一评价模式、同一评价指标、同一标化方法、同一权重系数以及同一分类方法对医疗、护理工作检查资料以及根据医院业务工作报表指标,对终末质量进行综合评价比较。
3.2 医用耗材备货管理中的DM
医用耗材的消耗容易受到季节、疾病好发时段及手术择期规律的影响,用一些固定的方法,如设定低限量自动提示来解决医用耗材的领用问题缺乏科学性,容易造成医用耗材的积压和断货现象,而无菌物品及一次性用品在积压中因为客观条件的原因易发生灭菌期、有效期的过期和破损、被污染现象。应用DM技术中的时间序列预测方法,对医院现有的医用耗材用量信息进行计算模拟,得出医用耗材消耗模型。根据实际情况自动产生下一时间段的医用耗材领用量,满足了医院感染管理和各种手术的需要,提高了医用耗材备库的合理性和科学性。
3.3 手术室感染管理中的DM
由于手术室的房间使用、手术次序、接台手术间隔的消毒方式及持续时间都对消毒效果和监测结果有明显的影响,DM技术重点应放在手术室消毒灭菌工作与消毒效果和监测结果产生规律搭配上。DM过程中可采用按模型聚类的方法,对聚类结果采用约简等处理后可获得一组有意义的消毒灭菌工作与消毒效果及监测结果之间的规律。DM技术使手术室感染管理的常规工作有据可查。对手术室环境、无菌用品、消毒液的生物监测工作;手术室的无菌操作、消毒隔离技术规范;消毒液的效果与质量、无菌物品及一次性用品的保存;医院感染的监控和报告;手术室人员进行的消毒灭菌和院内感染岗位培训直至医用废弃物的科学分类和无害化处理等都可以进行一系列的质量跟踪分析[12]。
3.4 影像科管理中的DM
影像科拥有大量检查仪器,如MRI、CT、DSA、DR以及彩超等,通过DM技术可以从PACS系统的数据库中得到这些设备每年、每月甚至每周、每日的实际使用情况,包括开机率、使用时间、检查数量及保养维修情况等。DM技术通过分类、关联性分析、序列分析、群集分析、机器自我学习等分析每台设备的使用频率、保养和维修费用,找出设备使用量与维修费用间的变化关系,从而得到最佳使用量。通过对影像科数据进行统计学挖掘,科室管理人员可及时通过对总检查量、单台设备检查量、单个工作人员的工作量及工作效率进行观察和综合分析,实时监控,以适时做出岗位调整,从而将有限的人力资源使用最大化。通过对工作人员质量档案数据进行决策树挖掘,可以提取某个摄片技师各个摄片部位的摄片质量或某个诊断医师对某病种的诊断符合率,分析其在某方面的特长或欠缺,确立提高目标。培训时,可以对受训人员在各个阶段的摄片或诊断质量进行分析,找出培养盲区,适时修正培养计划,提高培养效率,改进质量控制管理。通过对影像科建立的庞大的病例信息、影像和诊断结果资料库进行关联挖掘,摆脱了前提假设的束缚和主观因素的干扰,使结果更真实、客观,为临床、教学和科研提供素材和指导依据。
DM技术作为一门新兴学科已应用到诸多领域,但在医院管理中尚较少使用,必须充分认识到他的重要性才能有效提高医院管理的能力,为管理决策提供有效依据。DM技术在医院管理中的应用有其自身的优势,因为在医学上收集到的数据是真实可靠的,不受其他因素的影响,而且数据仓库的稳定性较强,这些对挖掘结果的维护、不断提高挖掘知识的质量非常有利。DM系统中数据准备的目标数据确立是得出最终结果的前提,也是管理决策的依据,因此如何选择目标数据对实施DM技术起到主导作用。DM的工作效率如挖掘工具的采集速度是左右得到最终结果时间的决定性因素,速度太慢将使结果无法适时运用到管理流程中,影响管理绩效。各种数据分析手段对最终的结果有何影响需要通过实践来判定,并以此找到真正适合的数据分析工具。用户界面的友好程度也是不容忽视的,他可以帮助决策者迅速理解分析结果。
随着医院信息系统的广泛应用,产生了海量的电子病历数据和影像资料,“医疗协同”项目的实施更是产生了大量的交换数据。DM技术作为一个在海量数据中获取知识的有力工具,在为医院管理中新知识的发现开辟了新的途径,快速发展的图像DM技术更是具有较高的学术价值和广阔的应用前景。但存在的问题是医院数据库中存在许多脏数据和已破坏了的数据、数据库中的临床信息标准不统一或者不规范使得DM过程中对数据库的矫正、去除噪声等显得相当困难,这些实际应用中的困难有待于进一步的研究并给予解决。
[1]杨志民,齐志泉.模糊支持向量分类机在冠心病诊断中的应用[J].计算机工程与应用,2006,42(9):172-175.
[2]李运贤,杜瑞卿,王相东.粗糙集理论在酒精性肝病诊断中的应用研究[J].北京生物医学工程,2006,25(3):307-311.
[3]徐刚,袁兆康.数据挖掘及其在医学领域中的应用和展望[J].实用临床医学,2006,7(11):196-198.
[4]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰译.北京:机械工业出版社,2008:3-10.
[5]Fayyad U,Piatetsky-Shapiro G,Smyth P.From data mining to knowledge discovery[M]//Advances in data mining and knowledge discovery.Menlo Park:AAAI Press,1996:1-34.
[6]龚著琳,陈瑛,苏懿.数据挖掘在生物医学数据分析中的应用[J].上海交通大学学报:医学版,2010,30(11):1420-1423.
[7]魏继勇.数据挖掘技术在用户流失分析模型中的应用[J].中国医学装备,2009,6(3):17-19.
[8]刘申菊,田丹.浅谈数据挖掘的应用[J].价值工程,2010,29(36):95.
[9]洪弘,李淑娟.医疗数据挖掘的特点、过程及方法[J].价值工程,2011,30(32):166-167.
[10]叶明全,伍长荣,胡学钢,等.基于粗糙集的医疗数据挖掘研究与应用[J].计算机工程与应用,2010,46(21):232-234.
[11]Melgani F,Bazi Y.Classification of electrocardiogram signals with support vector machines and particle swarm optimization[J].IEEE Trans Inf Techno Biomed,2008,12(5):667-677.
[12]喻晓芬,王峥,过湘钗,等.数据挖掘技术在医院消毒和医院感染管理中的应用[J].中国消毒学杂志,2007,24(4):391-393.
Application research of data mining technology in hospital management
/CHEN Yu-han// China Medical Equipment,2014,11(1):62-65.
Objective:Medical data mining can provide automatic data analysis and generate valuable knowledge from medical database in existence. Besides, it offers strong technical support to various decision-making in the hospital management.Methods:This paper introduces the concept of data mining, states its main tasks and then clarifies its present application status.Results:Moreover, a variety of application examples of data mining technology are elaborated in the management of medical quality, consumable items stocking, operation room infection and radiology.Conclusion:Finally, some issues which need to be paid attention to are advanced in the process of data mining application, and meanwhile it is confirmed that the rapidly developing image data mining technology possesses the high professional value and wide application prospect.
Data mining; Database; Hospital management
1672-8270(2014)01-0062-04
R197.324
A
10.3969/J.ISSN.1672-8270.2014.01.022
2013-05-16
①南通大学附属医院设备科 江苏 南通 226001
陈郁韩,男,(1975- ),硕士,高级工程师。南通大学附属医院设备科,研究方向:医疗设备信息化管理。