廖冬雪
摘要:随着数据挖掘的不断发展,社会各领域也在探索这门技术的应用价值,其中包括医学领域。本文主要介绍数据挖掘的定义及其主要技术,医学中数据挖掘存在的特点和挖掘技术在医院信息系统、疾病诊断、生物医学、影像等医学各方面的应用。
关键词:数据挖掘 医学领域 疾病诊断 技术应用
进入信息时代以来,各行业为了日常业务处理的方便快捷,积极投入到业务處理的信息化当中,以代替不必要的人工劳动,但随着业务数据的不断录入,各行业的日常业务数据量基本上呈指数级别增长,从而致使超大量的数据堆积,然而这样的数据再凭人或计算机简单地理解,就是几乎不可能的。为了从这些数据中挖掘出有用,具有预测性的信息,数据挖掘技术应运而生。其中医学领域亦是如此。但医学上的数据更具有主观性,大部分是非结构化的,并与其他领域的数据存在较大的不同。因此怎样从医学数据中挖掘出价值更大的信息,如何进行医学中的数据挖掘,并为信息管理,诊断,疾病预防,生物医学等服务,是当今一直研讨的问题。
一、数据挖掘的概述
(一)数据挖掘的概念
数据挖掘的英文名称为Data Mining,其定义是指通过运用科学的方法与技术,从大量繁杂,有噪声且随机的模糊数据中,得到其中具有隐含性的,且有用的知识或情报。这些模糊数据来自于信息系统的实际业务处理。然而经过日积月累的业务处理,这些数据的量非常大,因此需要数据挖掘这门新兴技术来探索其中有价值的知识,以便掌握事物实际的,更深层次的发展规律。另外,从数据挖掘与统计学的关系来看,数据挖掘是在传统的统计学方法与技术上发展起来的。但由于它发现的知识更具有预知性,有用性,早已不同于传统的统计学。
(二)数据挖掘的主要技术与方法
目前,随着信息时代的高速发展,数据挖掘能够深入到社会各个领域中,一直是一个热门领域。社会各行各业都需要数据挖掘技术来得到本领域中潜在的有价值的知识。因此,数据挖掘的理论与技术能够不断被人们探索,从而得到发展。其技术主要有: 神经网络法,关联规则法,决策树,聚类分析,粗糙集等,另外,遗传算法同样在实际应用中有着很好的效果。神经网络法是指一种模拟人类大脑的神经网络结构,并从抽象的网络中获取知识的算法。由于这种算法适应性强,容错能力高,因此广泛应用于各个领域;关联规则法能够在满足置信度以及支持度的条件下,深入分析各种数据,从而得到数据之间的联系和符合一定条件的关联规则;决策树算法是通过对各个变量因素进行分析并分类,推测出每个变量的变化趋势的过程。这种技术与聚类分析法等相比,其设置形式更灵便,因此能更广地应用于其他领域;聚类分析主要是分析样本数据间的密集程度,从而获得各数据间的联系和总体角度下的分布情况;粗糙集是与模糊集相关联的,要理解粗糙集就需要认识模糊集。模糊集是用于分析未知的,不明确的信息,并探索隐藏其中的规律。但粗糙集常和遗传算法等结合使用;遗传算法指的是通过对初始数据进行选择,交叉等迭代操作,最终得到最优的聚类结果。由于这种算法能够更深入地研究数据,其结果更具有前瞻性。
(二)医学数据挖掘的特点
医学中的数据常常关乎病人的生死问题以及隐私问题,而且这些数据基本上由检查影像,诊断单,电子病历,以及各种化验结果等大量异质性数据组成。这就使得医学数据挖掘与一般数据挖掘相比而言,具有一些特点:医学数据量大而复杂,这给相应的数据挖掘带来一定的困难,从而表现出医学中数据挖掘的繁杂性;医学数据主要分为两大类。一类是医生的诊断说明及与患者的交谈记录,这种数据是医生凭借主观经验而写成的,具有强烈的非结构性,很难标准化。另一类则是患者的各种检查影像和化验单,而这类数据基本上是以图片形式存储,难以用计算机捕捉其中隐含的内容。在进行数据挖掘时,还需要将这两类数据进行综合分析;医学领域的数据挖掘有一个特点就是医学数据难以用数学公式来表示和推算。但随着计算机技术不断深入到医学领域中,人们也在逐渐克服这个问题;由于医学数据涉及到患者的隐私,安全问题和数据本身的所有权问题等,因此这个领域的数据挖掘还存在着伦理性的,法律性的以及社会性的问题。正是有了这些复杂的问题,人们也在努力地克服,数据挖掘才不断得到完善。与此同时,成熟的数据挖掘技术也为医学问题提供良好的解决方案。
二、数据挖掘在医学上的应用
(一)医院信息系统中的应用
医院信息系统主要是用于管理医院的日常业务工作,例如:病人挂号,收费,以及医疗资源的调配问题等。这些工作往往无时不刻都在进行着,并造成大量的数据堆积。我们可以利用数据挖掘技术来对这些业务数据进行分析,找出业务数据中存在的规律,以便能够预测医院中医疗资源的使用情况,为管理层提供决策依据,从而提前做好充分准备。但在这方面进行数据挖掘的时候,需要考虑到诸如流感,政策等多种外界因素,这样才能使挖掘的结果更具有准确性。
(二)疾病诊断及预测的应用
在医疗过程中,准确的诊断对于患者的生命尤为重要,医师对患者开具的药品对病情的康复起到决定性因素。在现实生活中,医生往往会依据CT、X光等检验数据及自身经验进行病情诊断,依据该类疾病的治疗方案进行诊治,在后期患者的恢复过程中,又根据复查的检验结果进行治疗方案的修订,直至患者完好出院。对于这一治疗过程,可以使用数据挖掘中的分类分析进行分析诊断,依据患者的检验数据,将患者划分病症类别,再依照该类病状的治疗方案进行治疗,加大了诊断的科学性、准确性和合理性。在疾病预测方面,可通过关联分析,研究某类疾病的相关并发症,可有针对性地制定检查方案和采取相应的预防措施。
(三)医学影像的应用
当前,随着医疗影像设备的飞速发展以及计算机技术的不断深入,医生一般在诊断前都要求有关患者身体的影像数据,如CT,DR,超声成像,SPECT等。这使得越来越多的医学扫描影像存储在数据库当中。 然而在这些影像中大多存在着一定的不确定性,况且医生在诊断时基本只参照当前的影像,不会结合以前所有有用数据来诊断,这些因素都有可能导致医生诊断失误或延迟,最终造成患者未能及时接受治疗,影响医院声誉等严重后果。这时,就需要数据挖掘发挥其重要作用。一方面可以利用数据挖掘技术,对影像结果进行深度分析,从而逐渐减少存在影像中的不确定性,提高医学影像报告的质量。另一方面,医生通过这门技术,能看到患者的以前数据变化,而不只是当前的这几张影像,这样就能在一定程度上提高诊断质量。
三、结束语
数据挖掘的应用提高了医院的管理能力和诊断效率,为医学领域带来了可观的经济和社会效益,说明医学上的数据挖掘具有很好的发展前景。虽然这门新兴技术在医学各个方面都有较好的应用,但由于每个挖掘方法都存在着一定的缺陷,所以在运用数据挖掘技术时需要根据实际应用情况来选择合适的方法,与此同时,还需要不断地研究数据挖掘理论及实践方法,将优秀的挖掘算法应用于这个领域中。
参考文献
[1]李明江,唐颖,周力军.数据挖掘技术及应用[J].中国新通信,2012,(22):66-67+74
[2]吕峰,杨宏,普奕,贾婧蓥.遗传算法的数据挖掘技术在医疗大数据中的应用[J].电子技术与软件工程,2017,(05):203
[3]秦文哲,陈进,董力.大数据背景下医学数据挖掘的研究进展及应用[J].中国胸心血管外科临床杂志,2016,(01):55-60
[4]强邦红,刘冬,朱向明.数据挖掘技术在医学影像领域中的应用进展[J].临床超声医学杂志,2013,(04):287-289