医学影像学诊断中粗糙集方法的应用分析

2013-08-15 00:54董亚群
山东工业技术 2013年10期
关键词:粗糙集胶质瘤决策树

董亚群

(吉林师范大学 计算机学院,吉林 四平136000)

粗糙集理论是一个交叉融合多种学科形成的新学科,已被广泛用于各个行业包括:市场营销、卫生、电信、金融、农副产品、互联网语言的识别以及知识管理系统等等。粗糙集理论在很多的领域已取得令人骄傲的应用效果。在医学影像学领域中,随着影像学数据信息不断的增长,在医学影像学诊断中运用粗糙集方法,能客观地展现出海量数据信息以及高维资料的背后的真实情况,更好的帮助医生做出客观、准确的判断,有利于临床诊断正确性的提高。

1 简要论述粗糙集方法

1982 年波兰数学家首次提出粗糙集概念,这是以等价关系为基础的,用于分类问题的研究,用上集合与下集合生成一个相逼近的新集合,新结合的边界线被定义为上下近似集的差集。是继概率论、证据论之后有一个不确定性问题的处理工具,是一种新型的软计算方式。

这种建立在分类机制前提下的粗糙及理论,可以把分类解释成为一定区域中的等价关系,这个区域正是由等价关系进行划分的。将知识归纳为数据的划分,被划分后的集合定义为概念。充分利用已知的信息库,对不确定或不精确的知识通过已知的信息库进行近似刻画。无须提出数据集合以外的一切知识,因此,对于问题的描述比较客观、比较具体,再加上粗糙集理论不包含不确定或不精确原始数据机制,与证据理论、概率论等有较强的互补性。

粗糙集合理方法适用于研究不定型问题的工具,作为集合理论的扩展,粗糙集理论主要用来研究不完整的信息数据挖掘技术。它可以在缺乏数据的先验知识前提下,用考察数据分类的能力解决模糊不定的数据并加以分析处理,与此同时粗糙集算法简单且容易操作,现在以它为基础的数据挖掘工具也非常多,粗糙集理论其出发点是假设所有研究对象都涉及一些的信息。随着粗糙集理论的广泛应用,其有效性被越来越多的证实,成为了现阶段人工智能研究的重点。

2 医学影像学诊断中粗糙集方法的应用实例分析

收集了2011 年1 月-2012 年1 月来我院进行胶质瘤诊断治疗的50 例患者的临床资料进行详细研究,其中,29 例男,21 例女,患者年龄在23 岁-77 岁之间,平均年龄为58.7 岁。其中,11 例WHO I 级,25例WHO II 级,9 例WHO III 级,5 例WHO IV 级。对上述患者进行MRI检查,平扫TIW1 横断面与矢状面得出影像学资料。由放射科专业医生对上述患者的MRI 影像学资料进行分析研究,包括病灶位置、形状、囊变、TIW1、T2W1、水肿、钙化、出血、性变等等,按照影像学特征对不同指标进行分类。并通过粗糙集方法、Logistic 二元回归方法与分类回归树方法对影像学资料进行研究。具体粗糙集方法:将决策表导入专门的Rosetta 软件,通过软件对病例进行规则约简与属性约简。在条件属性核产生的基础上,得到决策规则库,通过规则库过滤,达到知识的精简。通过10 折交叉验证方式测试胶质瘤数据,通过测试结果的诊断灵敏性、覆盖率、阳性预测值、特异度、阴性预测值等提取诊断性能,绘制ROC 曲线。结果显示,粗糙集方法的诊断准确性为85.2%,特异度为92.7%; 决策树方法诊断准确性为83.0%,特异度为91.3%;Logistic 二元回归方法诊断准确性为83.2%,特异度为85.6%。充分证实了,在临床影像学诊断中,粗糙集方法能够得到更多的确定性规则,进一步提高临床诊断准确率。

3 医学影像学诊断中粗糙集方法的应用的优点分析

3.1 粗糙集方法应用便捷、结果准确性高

粗糙集方法不需要预先设计概率、不需要建立相应的因变量函数关系,直接运算集合中的对象,直接获得不可分辨的矩阵,直接得出结论。通过粗糙集法分析,其结论呈现的方式是以IF….Then…的形式出现,呈现结果不仅具有非常高的价值,而且呈现形式非常明确。

3.2 粗糙集方法能客观地展现出海量数据信息以及高维资料的背后的真实情

这种基于数据集合的挖掘方法,在临床影像学诊断中,粗糙集方法能够发现隐藏在现象背后的知识。例如,在在对胶质瘤影像学资料进行规则提取以及属性约简时,整个过程都是客观的,不受外界因素、人为因素的干扰,获得的胶质瘤级别诊断比较容易理解、诊断规则比较清晰。Logistic 二元回归方法与分类回归树方法,是通过训练集方式生成一个新的测试函数,通过函数分析方法,计算不同对象的可能发生概率,进而预测对象的分类。Logistic 二元回归方法是基于数理统计基础上的,通过笔数比筛选具有价值、有统计学意义的不同变量,将这些变量通过模型方程形式进行计算,比较计算前后实际结果与预测结果两者的差异性,从而进一步确定自变量的入选,同时,还可以计算出自变量的重要价值。决策树方式是通过地规模与分层模式进行的,也就是根据不同的对象建立不同的树分支。在不同分支的子集中建立重复的分值和下层节点,从而生成了决策树。再对决策树剪枝,再对决策树进行规则处理。但是,这种基于概率的分类结果,是根据概率进行判定的,对于高级别胶质瘤的诊断率比较低,这种决策树分析方法很容易受到人为因素的影响,比如说决策树的修建、决策树的增长、选择父节点数以及子节点数等等,都会影响到分析结果的准确性。

4 结语

粗糙集方法是将观测到的庞大数据集加以分析研究,其目的是找的未知的关系及数据拥有者能够理解且有价值的新方法来总结数据,经粗糙集方法推导出的准确率较高,在临床医学影像诊断中应用价值较高。

[1]马常杰,陈守余.数据库中模糊关联规则挖掘研究进展[J].计算机工程与应用,2010,12(11):752-753.

[2]田军章.基于PACS 的结构化报告(SR)模块的设计与实现研究[D].第一军医大学,2011,4(09):141-142.

[3]王小凤,周明全,耿国华.一种基于模糊粗糙集理论的算法及其在医学影像中的应用[J].计算机应用研究,2012,11(5):369-371.

[4]王国胤.Rough 集理论在不完备信息系统中的扩充[J].计算机研究与发展,2012,5(17):13-15.

[5]庄传礼,杨萍,李道亮,傅泽田.基于神经网络和粗糙集规则的提取方法[J].计算机工程,2011,15(4):56-57.

[6]张超.数据挖掘中分类分析的策略研究及其生物医学应用[D].南方医科大学,2011,10(3):168-169.

猜你喜欢
粗糙集胶质瘤决策树
粗糙集与包络分析下舰船运行数据聚类算法
基于隶属函数的模糊覆盖粗糙集新模型
成人高级别脑胶质瘤术后复发相关因素分析
BFAR 在胶质瘤中的表达及其与胶质瘤预后的关系
恐惧应激对胶质瘤影响机制及干预研究进展
简述一种基于C4.5的随机决策树集成分类算法设计
多粒度犹豫模糊粗糙集*
粗糙集的Mallow’s Cp选择算法*
决策树和随机森林方法在管理决策中的应用
决策树学习的剪枝方法