数据挖掘技术在中医现代化研究中的运用

2010-04-03 06:03:19彭建华杨伟吉
长春中医药大学学报 2010年5期
关键词:老中医决策树数据挖掘

傅 斌,彭建华,陈 华,杨伟吉

(浙江中医药大学,浙江杭州310053)

中医是医学的奇葩,我国的瑰宝。其历史悠久,理论体系复杂,效果显著,是聚集了古代中国劳动人民智慧的医学科学。要探索其中的深刻奥秘,就需要我们运用现代先进的科学技术对其进行研究。21世纪以来,中医只有在对已有理论和经验传承和发扬的基础上,才能更好的实现中医现代化的目标。而名老中医通过在临床实践中与中医学理论相互印证、思考直至突破和创新,将中医传统基础理论与自己的独创心得体会融会贯通,积累了大量的学术思想和临证经验。这些思想、经验是发展中医的宝贵财富。但是长期以来计算机对名老中医的临床诊疗经验分析处理仍处于浅层次的、经验性的知识运用层面,应用现代科学技术对这些诊疗经验进行科学分析显得尤为迫切。数据挖掘是一种有效的数据分析处理技术,他的引入为中医现代化研究提供了一种方法,提炼出名老中医学术思想和临证经验,不仅能丰富中医的理论体系,还能对整个中医现代化的发展产生巨大的推动作用。

1 数据挖掘概述

数据挖掘 (DataMining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。首先,挖掘前要逐一对被挖掘的数据进行仔细检查,才能保证挖掘出来信息的可靠性;其次,要求发现的模式应该是从前未知的,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值;最后,知识将来有实际效用,这此信息或知识对于所讨论的业务或研究领域是有效的,是有实用价值和可实现的,常识性的结论或已被人们掌握的事实或无法实现的推测都是没有意义的。数据挖掘既不是把数据全部抽取,也不是一点儿也不抽取,而是抽取出隐含的、未知的、可能的、有用的信息。

2 基于数据挖掘技术的中医现代化的研究

名老中医经验既包括名老中医发表的论文、论著,亦包括名老中医过去的不少临证医案实录,更包括名老中医对承继者的机宜面授,甚至还包括了不少前瞻性研究结论。众多的信息源头反映出名老中医经验载体的丰富多彩,但众多的信息载体却容易造成经验总结、传承者把握信息时的困难。名老中医经验的总结离不开经验信息采集的方法,经验信息采集方法的优劣直接左右着名老中医经验挖掘的深度、广度。从信息学的角度观察,其实质就是信息的收集。通过采用数据挖掘技术,可以对这些信息进行科学的加工,全面解析其中的规律,分析名老中医个体化诊疗信息特征,提炼出临证经验中蕴藏的新理论、新方法、新知识,实现名老中医经验的传承。因此对当代名老中医学术思想临证经验的继承不仅能丰富中医的理论体系,还能对整个中医现代化的发展产生巨大的推动作用。

3 中医现代化研究中几种主要的数据挖掘技术

3.1 相关性分组或关联规则挖掘 相关性分组或关联规则挖掘是数据挖掘中的一个非常重要的研究领域,它通过几组特定的搜索算法,发现大量数据之间的关联或相关性。一个在中医领域应用的例子:采用基于关联规则的算法,分析挖掘“症状—方药”之间、“基本症状—证型”之间、“证型—方药”之间以及中药配伍之间的多重关联关系,总结归纳名老中医的辨证规律并模拟其诊断推理过程,还可以发现客观有用的新知识以丰富专家经验和中医理论。

3.2 决策树 决策树是用二叉树形图来表示处理逻辑的一种工具。可以直观、清晰地表达加工的逻辑要求。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。首先,通过名老中医的临证医案实录建立一棵决策树;然后,利用建好的决策树,建立一个模型,最后,对数据进行预测。决策树的建立过程可以看成是数据模型的生成过程,因此在继承名老中医的经验上,可根据决策树的结果,参照后续病人的病兆,病症,病理进行医治。

3.3 人工神经网络技术 在数据挖掘技术中,人工神经网络是近年来颇受关注的一种技术,由于其本身良好的鲁棒性、自组织适应性、并行处理、分布存储和高度容错等特性,它为解决复杂的问题提供了一种相对简单且有效的方法。一个在中医领域应用的例子:李建生等[1]提出了用于中医证候诊断的径向基神经网络,利用聚类分析确定RB神经网络隐层的参数,运用最小二乘确定RBF神经网络输出层的参数,进行中医现代化研究。

3.4 聚类分析技术 聚类是数据挖掘的前期工作之一,通过对有关数据的不同角度类分,为进一步分析提供证据。聚类是根据客体属性对一系列未分类客体进行类别的识别,把一组个体按照相似性归并成若干类别,即“物以类聚”。通过确定数据之间在预先制定的属性上的相似性来完成聚类任务,这样最相似的数据就聚集成簇。一个在中医领域应用的例子:高峰等[2]用聚类分析技术研究肾阳虚证辨证因子客观化、标准化的方法和思路,对出现率较高的症状进行聚类分析,寻找对肾阳虚证候诊断的贡献度。

4 结论

名老中医经验总结与传承关系到中医传统方法能否延续、中医理论能否发展的大计。数据挖掘技术的应用,有力地推动了中医现代化的进程。可以预料,随着数据挖掘理论研究的深入和实际应用技术的成熟,以及互联网技术的飞速发展,数据挖掘应用于中医现代化研究,将会对中医现代化研究的进程,中医生存空间的扩展产生巨大的推动作用。

[1]李建生,胡金亮,余学庆.基于聚类分析的径向基神经网络用于证候诊断的研究[J].中国中医基础医学杂志,2005,11(9).

[2]高峰,陆明,严石林,等.肾阳虚辨证因子的聚类分析探讨[J].现代中西医结合杂志,2007.

猜你喜欢
老中医决策树数据挖掘
探讨人工智能与数据挖掘发展趋势
一种针对不均衡数据集的SVM决策树算法
老中医教你睡眠养生
金桥(2018年2期)2018-12-06 09:30:40
老中医坐诊
特别健康(2018年9期)2018-09-26 05:45:30
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
基于决策树的出租车乘客出行目的识别
老中医
中外文摘(2016年4期)2016-03-25 12:46:53
一种基于Hadoop的大数据挖掘云服务及应用
基于肺癌CT的决策树模型在肺癌诊断中的应用