沈旴亮 彭宇竹
数据挖掘(data mining)是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。数据挖掘作为一种新的知识发现手段,自上世纪80年代末产生起,就引起了学术界和产业界的极大重视,许多国家和机构都加入了此类研究,目前它正以强大的生命力在蓬勃发展。其在国际上的典型应用领域包括:商务管理、生产控制、市场分析、工程设计和科学探索等,在这些领域的成功应用,使得国际上掀起了一股空前的“数据淘金潮”。
医疗机构作为一个具有特殊性质的机构,不同于一般企业或者机构,其内部的数据具有多样性、动态性、冗余性三重特性。医疗机构中的数据类型多种多样:电子病案中关于人口学特征的数据为文本型;检验科中有关病人生理、生化指标为数字型;影像科中如B超、CT、MR、X线等为图像资料;如心电、肌电、脑电图等则是信号数据。很多医学数据如脑电图、心电图的检测数据呈非规则的波形,血压、心率等数据与时间呈函数关系;许多患者的门诊、急诊、住院就诊与季节、地域有时间序列关系。医学数据呈指数增长并不意味着与信息呈正比,有大量与诊疗及管理无关的数据,需要与之相适应的数据整合、特征提取等方法。总之医院数据的多样性及特殊性,需要该领域方法学的研究。
目前的医学数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据丰富,信息贫乏”的现象。根据初步统计,在我国的医疗机构中,庞大的数据量已经远远超出了人们的处理能力,仅有不足10%的数据用来分析,结果数据库中那些极少被访问的数据档案逐步形成了“数据坟墓”(data tombs),这就意味着医院不仅失去了很多有价值的信息,而且浪费了有限的数据存储空间。
现今,医院的信息系统正处于高速发展时期,系统中所积累的数据的广度与深度不断提高,因此使用数据挖掘技术对海量数据进行开发,提高数据的利用率势在必行。通过数据挖掘技术可以有效地整合院内各种信息系统,激活医院现有数据库,消除医院内部信息孤岛;同时,在使用数据挖掘的过程中,能够对现有数据库进行全面系统的梳理,促进信息数据库的日臻完善。
当前,数据挖掘技术的应用已经可以囊括医院管理中的各个环节,其主要应用领域归纳为以下4个方面:(1)医疗质量方面:采用同一评价模式、同一评价指标、同一标化方法、同一权重系数、同一分类方法,利用医院现有各类系统中储存的大量信息数据,借助数据集成系统,选择特定的项目指标,开展医疗、护理、医技、药剂实时质量跟踪,实现关键数据预警,对指定数据进行查询、分析、评价、考核。(2)运行效率方面:开展医院、科室、个人工作效率、经济效益和科室成本效益评价,分析控制平均住院日、术前占床日影响因素。进行单级设备效益分析,综合考量设备的成本、折旧、维修等因素,掌握设备的投入产出比,为采购设备的必要性提供可靠的参考依据。通过对收支、财务比率、总资产、固定资产、净资产的变化进行对比,全面评价医院运行效率。(3)科研教学方面:通过运用数据挖掘技术,切分整合海量数据,提供技术创新、科学研究、学术发展的有效信息查询使用支撑。掌握课题、文章的覆盖面以及各个学科所占比例,发现医院科研发展中的薄弱环节,促进科研协调发展。全面解析教学过程,统计教学工作中各类问题出现的频率及产生原因,不断优化教学方案,提高医院的教学质量。(4)资源配置方面:实时跟踪人力资源发展变化,定期开展主要部门单元人员、设施、空间的数量、结构与业务工作开展的匹配评价,分析评价资源配置效能。针对医院药品及耗材的使用情况,合理配置库存数量,减少其所占流动资金比例,提高医院的资金利用率。
数据挖掘在医院管理领域的研究与应用刚刚起步,尚处于摸索阶段。数据挖掘在医院管理中的应用有其自身的优势,因为在医学上收集到的数据是真实可靠的,可以基本排除其他因素的影响,而且数据存储的稳定性较强,这些条件对挖掘结果的维护、挖掘质量的提高是非常有益的。因此,利用数据挖掘技术在探求诊治疾病的规律,提高医疗服务质量、管理水平方面拥有巨大的潜力,能有力推动医院信息化研究的规范化进程。作为一个新兴技术,随着数据库、人工智能等技术的发展日臻完善,随着理论研究的深入和进一步的实践摸索,数据挖掘技术必将在质量管理、运行管理、科研管理、资源管理等方面发挥巨大的作用,帮助管理者完善管理医院的相关措施,为医院制定竞争策略提供强有力的技术支持,为医院创造可观的效益。