引言:在这个信息技术飞速发展的时代,与信息技术相关的采集应用技术也被带动着得到了飞速的发展,为了更好地适应信息技术的飞速发展,数据挖掘诞生了。下面就简单的介绍一下数据挖掘的含义,并通过殊绝挖掘的方法在生物学数据分析上应用的案例,总结了数据挖掘和生物学数据分析之间的联系。然后结合中国数据挖掘的在医学数据分析应用的现状,对今后数据挖掘在医学数据分析上的发展做出了预测。
前言:
为了提高医学上的工作效率,慢慢的引入了计算机,到目前为止,计算机已经在医学中得到了广泛的应用。医学上为了对医学数据分析系统化,理论化。也慢慢的出现了一个新的系统,医学信息系统。这个医学信息系统大大的促进了医学数据的数字化程度,为以后的医学数据分析带了极大地方便。但是与此同时也带了麻烦,要知道医学数据是非常庞大的,要想提高办事效率,就必须在短时间内得到与这些数据相关的有价值的信息。因此我们把数据挖掘应用到了医学数据分析上,让医生能在短时间在庞大的医学信息系统中获得最有价值的信息对医学数据作出分析,这样不但提高了医生的工作效率,而且还让医生的判断更加准确。所以说数据挖掘在医学数据分析中的应用是十分重要的。
一、 数据挖掘的概念和基本操作流程
数据挖掘技术是一项全新的技术,它是近年来数据库技术和人工智能技术飞速发展的产物。数据挖掘是帮助人们从数量庞大的,不健全的,乱七八糟的数据中找到人们需要的,能够对人们产生价值的信息。因此数据挖掘存在隐蔽性,所有我们也可以说,数据挖掘也是一个潜在有价值信息的过程。数据挖掘它具备了自动化的优点,它能根绝人们的需要自动的对人们的需求进行分析和总结,然后帮助决策者做出合理的决定。
它的基本过程:数据挖掘一般可以氛围三个阶段。数据的集成,数据的选择和数据的转换可以划分为一个部分,成为数据预处理阶段,数据的预处理阶段的效果将直接影响着数据挖掘质量的好坏。模式的发现是中间阶段,是运用数据挖掘算法从数据库中提取有效模式的阶段,最后一个阶段是后续处理阶段,它包括了模式的评估和知识的表示两个部分,后续处理阶段通过已经制定好的标准识别出有用的知识。
二、 医学数据的特点
根绝医学信息系统数据自身的局限性,我们可以对医学数据的特点作出以下总结:
(一) 隐私性
因为医学自身的局限性,导致了临床上产生的医学数据有的会牵扯到病人的隐私,如果这些隐私不经过患者的允许被公众了,就会在一定程度上对患者造成侵扰。这就要求数据挖掘者在工作的时候一定要保护好医学数据的安全性和机密性。
(二) 多态性
医学数据包含的东西很多,但不仅仅是文字,图像,其中会有很多的声音,信号等,这是其他信息所不具有的,医学信息的多属性模式给数据挖掘带了很大的麻烦。
(三) 不全面性
因为在医学上疾病多种多样,再加上案例的局限性就让医学信息系统不能全部的反应出任何一种病的信息。同时再加上记录本身的局限性,很多醫学数据不能得到很好地记录,所以导致了医学信息的不全面性。
(四) 时域性
医学数据中存在很多的时间函数,有的是延迟,有的是提前,有的是波形的时间函数。同时,还有一些静态的数据,尽管这些静态的记录不具有时序性,但是这部分医疗记录在记录的时候一定要详细到某一时刻。
(五) 重复性
正如我们前面所提到的,医学数据的数量是庞大的,它具有相似性,不同的疾病有时候会采用相同的医疗手段,这样就会有很多的相同的医学数据被记录到医学信息系统中,这样会给以后数据的查找带来不便。
三、 数据挖掘在医学数据分析应用的举例
(一) 医学图像处理上
在疾病诊断的工具中,有很多方法,数据挖掘就是其中应用比较广泛方法之一。也是数据挖掘在医学数据处理应用最重要的一个方面。数据挖掘在医学图像上的应用主要是从图像上发现之间的关联,变化,然后总结出规律。提高医生的决策效率,同时也提高决策的准确度。
在数据挖掘算法中,应用最广的就是决策树算法,它是一种归纳推理算法,它通过逼近离散值函数来对噪声数据处理然后分析出表达式的方法来实现的。在这种方法中,表达式被称为决策树,也正是如此才被叫做决策树算法的。
下面我们就谈一下决策树算法的特点:一方面,种方法便于理解,因为从事教务处管理的老师并不了解数据挖掘相关的知识,而决策树算法非常形象的通过树形结构表示最后的分类结果。它符合人们认识事物的一般规律;一方面决策树算法的计算量小,复杂程度小,这样就能提高工作人员的效率吗,能在短时间内解决更多的问题;最后一方面,决策树算法能够主次分明的表达出重点,属性的重要程度能被一眼看出来。
(二) 在辅助医疗上
医学诊断是一个复杂的过程,它需要按照一定的程序进行。医生通过多种途径搜集和待诊断疾病的相关知识,然后构建诊断网络,而这些病例数据被存放在医学信息系统中,所以从医学信息系统中提出有价值的诊断规则成为了现阶段研究的重点。在数据挖掘技术的帮助下,通过数据挖掘中的正常训练集模型所筛选出有价值的诊断规则。获得有效的知识。
(三) 其他方面
数据挖掘在医学数据的处理上应用广泛,上面我们仅仅介绍了应用的几点,没介绍的也很多。比如在医疗政策数据方面上,在医疗保健数据方面上,在医疗资源数据方面上,在新药品和新毒品的数据方面上等等都有很广泛的应用。
结语
虽然数据挖掘早医疗数据分析上已经得到了很广泛的应用,但是在多年的应用中逐渐出现了这样或那样的问题,影响着数据挖掘在医疗数据分析上的再突破和再发展。所有说,数据挖掘在医学数据分析上还具有很大的发展空间,这就要求我们随着医学理论的健全和发展,不断地对数据挖掘在医学数据分析应用上进行创新,进一步的实践探索,经过我们的努力,相信数据挖掘将会在疾病的诊断治疗医学科研和教学中产生巨大的效益。
参考文献
[1]龚著琳,陈瑛,苏懿,刘雅琴,徐立钧.数据挖掘在生物医学数据分析中的应用[J].上海交通大学学报(医学版).2011(11).
[2]朱远平,陈伟,李建彬,陈剑鸿,许树欣,鲁春元.构建web服务的医学数据挖掘演示系统[J].数理医药学杂志.2012(04).
[3]唐佑萍,卓绮雯,叶霭莹,王亚娜.基于医院信息系统实施数据挖掘[J].医学信息学杂志.2013(09).
(作者单位:长沙医学院)
作者简介:李红艳,女,出生于1984年1月,籍贯湖南省衡阳市,就职于长沙医学院,讲师