郭燕周,马建伟
数据挖掘技术在糖尿病中医证候及方药中的应用
郭燕周,马建伟
[摘要]数据挖掘是指从大量数据中挖掘有趣模式和知识的过程。它涉及多学科领域,包含多种挖掘方法,常用的有聚类分析、关联规则、无尺度网络分析等。现将近几年数据挖掘在糖尿病中医证候、方药规律研究领域的应用作一综述。文章分四部分内容:第一部分主要概述数据挖掘及其在糖尿病中医证候及方药规律研究方面使用的可能性;第二部分主要从糖尿病、糖尿病并发症、糖尿病合并症方面分别运用数据挖掘技术分析中医证候的情况;第三部分主要从文献、临床两个方面总结目前数据挖掘技术在糖尿病方药规律研究中的应用情况;第四部分通过总结各医家数据挖掘结果得出糖尿病中医证候大多以阴虚燥热、气阴两虚、阴阳两虚为主,且气阴两虚证较为常见,其常用药物有黄芪、生地、太子参、麦冬、丹参等,常用药对有黄芪、山药,黄芪、当归,山药、山茱萸等,同时分析了数据挖掘技术在中医药研究领域中的不足及其重要作用和意义。
[关键词]数据挖掘;糖尿病;证候;综述
[DOI]10.3969/j.issn.2095-140X.2015.09.008
随着信息时代的到来,数据呈爆炸式增长,来自商业、社会、科学、工程、医学以及日常生活的方方面面的数据注入计算机网络及各种数据存储设备,怎样从海量数据中发现有价值的信息,成为社会发展的迫切需要,数据挖掘技术由此应运而生。数据挖掘也称为数据中的知识发现,是指从大量数据中挖掘有趣模式和知识的过程[1]。与传统数据分析的区别在于,数据挖掘是在无明确假设的前提下去挖掘信息,发现隐含的、潜在的知识。数据挖掘涉及机器学习、数理统计、神经网络、数据库、模式识别、粗糙集等多学科领域,它包含许多种挖掘方法,常用的有聚类分析、关联规则、决策树、无尺度网络分析、粗糙集理论等。近年来,中医药蓬勃发展,每年有大量的临床研究成果及个人经验等文献发表,出现了百花齐放的局面,但在一些重要理论方面仍是众说纷纭,缺乏统一,且很多研究样本量小,标准制定不规范,主观性较强,如何客观、标准化地探索中医诊疗规律,总结经验,已成为中医发展迫在眉睫的问题。将数据挖掘技术引入到中医药领域中,无疑将对促进中医药科研、临床的健康发展产生重要影响。
1数据挖掘技术应用于中医证候及治疗研究的可行性
近年来,随着电子病历广泛应用,各大医院积累了大量的临床数据。这些数据在统计中具有多态性、不完整性、较强的时间性和冗余性,加之很多数据多为文本形式,且不够规范,这就使医疗数据更为复杂。以中医证候为例,临床中在描述同一个症状时,往往有不同的表述方法,如大便清稀、大便溏薄、每天大便2~3次、腹泻等,意思均相近,无本质区别,而中药方药中也存在此问题,如延胡索也可称为元胡索、玄胡索、元胡、延胡等。对于上述情况,传统的统计方法无法承担分析任务,它们大多只适用于具有数学特征、符合统计规律的数据,而数据挖掘技术在对上述数据进行预处理后不仅能够描述中医证候及方药分布的总体特征,而且能够从复杂的症状中归纳出中医证型,分析出症状与症状、症状与方药、症状与证型等之间潜在的关联规则。而在数量庞大的方药中应用数据挖掘技术甚至可以总结出配伍规律,发现潜在的药对、核心药物、核心处方等,这不仅为临床医生提供诊疗策略,而且对中医理论的创新性发展及其客观化、规范化研究均具有重要的推动作用。数据挖掘技术作为一种新的数据分析方法已逐渐引起医学界的广泛关注,它的应用为中医诊疗的规范化、标准化研究提供了一种新的途径。
2数据挖掘技术在糖尿病及其并发症、合并症中医证候研究中的应用
2.1数据挖掘技术在糖尿病证候中的应用李建生等[2]利用人工神经网络(artificial neural network, ANN)结合模糊系统(fuzzy system, FS),建立了糖尿病中医证候诊断模型,用该模型对1134例糖尿病住院患者临床资料进行数据挖掘,最终确定了气阴两虚证、肾阴亏虚证、血瘀证、肺燥津伤证等6个常见证候主症和次症诊断标准,与原中医证候诊断标准比较,符合率达86%。姜兆顺等[3]依托结构化糖尿病临床信息采集系统对多家医院的糖尿病住院患者症状进行数据挖掘,通过描述性统计发现糖尿病最常见的症状是乏力,其次是口渴多饮、视物模糊、肢体麻木、头晕等;常见的舌质多为黯、红、淡,舌苔多薄白,舌体多胖大,有齿痕。从以上分析可知,糖尿病辨证多以气虚、阴虚为主,且气虚以脾气虚多见;通过关联规则分析得出:与乏力相关且常同时出现的症状有口渴喜饮、舌黯红、视物模糊、头晕、肢体麻木、苔腻等,与口渴喜饮相关的症状有乏力、视物模糊、头晕、肢体麻木、苔薄,与多食易饥相关的症状有口渴喜饮、苔薄、乏力、尿频、肢体麻木。林兰等[4]收集了350例糖尿病患者的临床资料,首先通过聚类分析将样本聚类为6类,然后运用混合聚类法将6类样本症状提取出来,根据中医证候诊断标准,得出糖尿病的主要证候为阴虚热盛、气阴两虚、阴阳两虚,常见的兼证有湿热、血瘀、气滞;同时将全部样本按年龄及病程各分为3类,运用上述方法研究证候的动态演变规律,结果发现年龄在45岁以内或病程在5年以内的患者以阴虚热盛为主,年龄在 46~60岁或病程为5~15年的患者以气阴两虚为主,年龄在60岁以上或病程在15年以上的患者以阴阳两虚为主。方朝晖等[5]收集813例2型糖尿病患者的电子病历,对其中医证候进行数据挖掘,运用频数和构成比分析及Liquorice复杂网络节点度频度及点式互信息分析等统计方法进行研究,总结出2型糖尿病的中医证候以气阴两虚夹瘀为主要特征,其次为气阴两虚证、热盛伤津证、气虚血瘀证、阴阳两虚证。龚燕冰等[6]运用因子分析对2501例2型糖尿病患者的中医证候及病位、病性等进行数据挖掘,采用方差最大旋转法得出26个因子,对各因子进行证候的归纳、合并,最终得出糖尿病的主要证候是气虚、阴虚,其次为血瘀、阳虚,同时可兼夹热盛、气滞、内风;病位在肝、脾、肾。于彦与张敬锋[7]采用流行病学调查的方式对某院2型糖尿病门诊患者进行中医证候的数据挖掘,运用因子分析法获得15个共因子(各因子由相互关联的不同症状组成),经归纳总结并结合频数分析后发现2型糖尿病以阴虚证、痰瘀互结证最多见,其次为肝胃郁热证、阳虚证、气虚证、气滞证等。秦玉花等[8]对783例肾虚证糖尿病患者的症候辨证因子及其相关性进行调查研究,结果发现“小便黄赤”及“口渴饮水”两个因子频次最高,而证、舌、脉的相关性分析经提取因子载荷并进行聚类分析后最终指向3大类:第1类主要症状有面色淡白、精神萎靡、面目浮肿、舌质淡胖、白天尿频等,可归为肾阳虚类;第2类主要症状为尿后余沥、小便失禁、小便黄赤、小便涩少、大便失禁、面色暗黑等,可归为阴阳两虚类;第3类主要症状有潮热、心悸、舌上津少、行动不便、腰痛、痴呆等,可归为肾阴虚类。
2.2数据挖掘技术在糖尿病并发症证候中的应用尚莹莹等[9]调查200例糖尿病并胃轻瘫综合征患者的临床症状,在聚类分析的基础上进行主成分分析,获得4类证候群,依据证候判定规则归纳为4型:脾虚湿热、胃阴亏虚、脾虚气滞、肝胃不和。郑红[10]通过维普数据库检索出30篇有关糖尿病性周围神经病变的文献,通过频数分析、聚类分析等研究该病的组方诊治规律,结果发现使用频次较高的药物依次是黄芪、当归、川芎、丹参、地龙、赤芍等;而聚类后获得的药物可归纳为三大功效:益气活血、通络止痛、清热利湿,据此可推断该病的基本证候为气虚血瘀、湿热阻络。郑洪光等[11]应用描述性统计、聚类分析等数据挖掘方法对130例糖尿病肾病的中医证候特点及中医证型进行分析,研究结果表明该病症状以乏力、尿浊、口渴、肢体水肿、食欲不振、面目浮肿、腰膝酸软、潮热等较为常见。经聚类后归纳为4型:肝肾气阴两虚证、脾肾阳虚证、肝肾阴虚阳亢证、血瘀夹痰湿证。王颖辉等[12]利用因子分析及转移概率分析研究301例糖尿病肾病患者的中医证候演变规律,结果发现阳虚症患者有向阳虚夹痰湿转化的趋势,而阴虚者有向气阴两虚及阳虚的转化趋势,而血瘀症患者多相对稳定。
2.3数据挖掘技术在糖尿病合并症证候中的应用倪青等[13]通过多中心的结构化、规范化数据采集系统对1274例糖尿病合并冠心病住院患者中医证候进行数据挖掘,运用描述性统计方法得出糖尿病合并冠心病患者的主要症状为口干、多饮、乏力、胸闷、多尿,间接推论出阴虚、气虚、血瘀等为其基本病机,中医证候研究结果发现该病以气阴两虚最多,其次为痰湿、瘀血等证,为中医临床辨治提供了一些思路。陈世波等[14]将265例糖尿病合并代谢综合征的病历以发病病程分为3组,运用无尺度网络分析、描述性统计等数据挖掘方法对该病的症候特征、分布及演变趋势进行研究发现,病程<5年的患者常见症状为乏力、口干、视物模糊、口渴多饮、舌黯红、苔黄等,证候以阴虚、热盛为主要特征;病程5~10年者常见症状为视物模糊、口渴多饮、乏力、口干、舌黯红、苔腻等,证候以气阴两虚为主要特征;病程>10年者常见症状为口干、口渴、多饮、乏力、胸闷、肢体麻木、视物模糊、小便频、舌黯红、苔薄等,证候以气虚、血瘀为主要特征。据此得出气虚、阴虚是该病的基本病机,且贯穿病程始终。王佳笑等[15]收集了1287例2型糖尿病合并高血压病的临床病案资料,通过数据挖掘技术中的因子分析研究该病的中医证候要素,结果得到气虚、阴虚、阳虚、血瘀、阳亢、湿痰、热盛7个证候,与中医理论及临床实际基本符合。成杰辉等[16]采集309例糖尿病并急性脑梗死的临床资料,应用聚类分析等数据挖掘方法将该病中医证候聚为四种证型:气虚血瘀证、风痰上扰证、痰热腑实证、痰瘀阻络证,经统计学验证与专家辨证结果具有较好的一致性。
3数据挖掘技术在糖尿病中药用药规律研究中的应用
3.1基于文献的用药规律数据挖掘方朝晖等[17]为研究中医治疗糖尿病用药规律,检索了中国学术期刊网络出版总库、中国生物医学文献数据库等,搜集整理了112个中药处方,运用频数分析、关联规则分析等统计方法进行数据挖掘,结果发现糖尿病常用的中药依次为生地黄、当归、黄芪、熟地黄、葛根、茯苓、丹参、麦冬、丹皮、川芎等,常用药对配伍为生地黄、葛根,黄芪、生地黄,熟地黄、山药与山茱萸,生地、葛根与当归等。文玉敏等[18]为研究早期糖尿病肾病中医用药规律,检索了中国知网等5个文献数据库并整理出符合条件的134篇(方剂137首)进行数据挖掘,运用频数分析、关联规则等方法得出该病的核心药味是生黄芪、生地黄、丹参,间接推论出早期糖尿病肾病的基本病机为气阴两虚、血瘀;此外还发现常见的药对有黄芪、山药,黄芪、水蛭,黄芪、当归,川芎、茯苓等。高尔宁等[19]在中国期刊全文数据库筛选出关于2型糖尿病胰岛素抵抗的3947篇文献(共计115首方剂),运用改进关联度系数法、复杂系统熵聚类法等对中药数据进行研究,结果发现常用药物为黄芪、地黄、丹参、黄连、葛根、山药等;常用药对有柴胡、白术,甘草、细辛,白芍、猪苓,白芍、乌梅,黄连、桂枝等,常见的两味核心组合有丹参、黄芪,地黄、黄芪,山药、丹参等,3味核心组合有丹参、黄芪、黄连及地黄、黄芪、黄连等。郭东臣等[20]通过检索《新编国家中成药》、《中国药典》、《国家基本药物》等文献,运用频数分析、关联规则等统计方法对其中的中成药药物组方及配伍规律等进行调查分析,结果得出使用频次较高的药物依次是:黄芪、天花粉、地黄、人参、山药等,而经常出现的药对有生地、天花粉,黄芪、山药,黄芪、人参,天花粉、知母,山茱萸、山药等。陈莞苏等[21]搜集整理了190首国家级名老中医的糖尿病验方,首先依据病性将中药功效统一规范,然后运用因子分析对验方中的药物功效进行数据挖掘,经分析得到9个因子,其中滋阴的因子占50%,提示阴液不足是糖尿病的重要病机,其他各因子中扶正与祛邪药物共存,提示糖尿病病机复杂,滋补的同时不忘祛邪,如气血滋阴生津,利水祛湿同时补气益精等。唐文彦等[22]收集古今方415首进行数据挖掘,通过频数分析发现古今方中常用的药物依次是麦门冬、栝蒌根、黄芪、黄连、人参、甘草、生地等,其中古方常用的药物有麦门冬、黄连、甘草、栝蒌根、人参、茯苓等,今方常用的药物是黄芪、山药、生地、丹参、栝蒌根、山茱萸等,从古今药物对比可知,古方以滋阴清热药物较多,而今方以益气养阴药物为多。姚美村等[23]从文献中搜集整理了106首治疗消渴病的复方,运用关联规则研究其中的药对配伍规律,以单味药分析发现上消中以麦冬、知母为主,中消中以黄连、知母为主,下消中以茯苓、熟地和山茱萸为主;以两味药组合分析发现,上消常见药对有知母与石膏、知母与麦冬、知母与生地等;中消常见药对有人参与甘草、知母与人参等;下消常见的药对有茯苓与麦冬、熟地与黄芪等。
3.2基于临床的用药规律数据挖掘蔡莉[24]搜集整理了某院名老中医的门诊医案,对其中的2型糖尿病病历进行数据挖掘,通过数据预处理,运用描述性分析、关联规则中的Apriori算法等得出老中医常用的药物为生地黄、黄芪、苍术、麦冬、茯苓,常用的药对为生地黄、山茱萸,生地黄、苍术,黄芪、苍术。倪青等[25]运用无尺度网络分析等数据挖掘方法对2型糖尿病合并代谢综合征患者的中医用药规律、药证关系进行客观化研究,结果发现治疗该病以益气养阴药为主,代表药物是炙黄芪、太子参,与其相关联的药物有生地黄、五味子、川芎、当归等,以药推证可知,糖尿病合并代谢综合征的基本证候是气虚、阴虚;为进一步研究药证关系,作者对不同病程的药物关系分别进行了无尺度网络分析,病程在5年以内者常用药物是生地黄、麦冬、当归、赤芍,基本证候是阴虚、热盛、津伤、血瘀;病程5~10 年者常用药物以麦冬、丹参、知母、玄参、炙黄芪最为多见,基本证候是气虚、阴虚、热盛、津伤、血瘀;病程10年以上者常见药物是炙黄芪、当归、赤芍,基本证候是气虚、血瘀。周强等[26]基于SAS 9.2统计软件对仝小林教授治疗糖尿病肾病的门诊病历进行数据挖掘,通过药物频次分析获悉,仝教授在糖尿病肾病Ⅲ期患者的治疗中最常用的药物依次是黄连、水蛭粉、大黄、黄芩、干姜、葛根、红曲等;Ⅳ期患者常用的药物是大黄、水蛭粉、黄连、炙黄芪、生姜、黄芩、红曲等;Ⅴ期患者常用药物为大黄、炙黄芪、水蛭粉、制附片、丹参、生姜、茯苓等。李兰涛等[27]收集了经魏子孝教授诊治的88例糖尿病性周围神经病变患者的病案资料,运用关联规则分析发现所有医案的核心处方是红花、桃仁、地龙、鸡血藤、生黄芪、陈皮;同时利用互信息统计方法挖掘出魏教授常用的药对有杜仲、桑寄生,桃仁、红花,地龙、桃仁,红花、当归,生黄芪、红花,生黄芪、当归,红花、赤芍等。另外魏教授对治疗2型糖尿病合并冠心病也颇有心得,王泉蓉等[28]运用关联规则分析对其用药配伍规律进行数据挖掘,总结出以下药对:川芎、丹参,白芍、川芎,柴胡、枳壳,柴胡、丹参,丹参、枳壳,川芎、郁金,川芎、红花等;对魏教授药量配伍关系进行挖掘,得出苍术、白术与郁金、柴胡等量配伍,且常用量为12 g,丹参、柴胡与丹参、郁金配伍量关系常为20 g︰12 g等宝贵经验。龚燕冰等[29]从2501例2型糖尿病例中选取3首常用复方,运用关联规则分析方、症、证三者的关系,结果发现服用生脉饮的患者中口渴欲饮、口干口渴、倦怠乏力关联性高,且经常同时出现,它们体现了气阴两虚的表现,与生脉饮的主治功能如出一辙;而六味地黄汤和四君子汤经数据分析也论证了其方、症、证的高度一致性。臧东静等[30]收集了1009例老年糖尿病患者的临床资料并按不同年龄段将其分为3组,用关联规则算法分别对这3组中药配伍规律进行研究,通过数据挖掘发现60~65岁年龄组,中药以益气、养阴、清热、活血为主;66~70岁年龄组,所用中药以益气养阴、活血化瘀、健脾祛湿为主;大于70岁年龄组除了予益气养阴、活血化瘀中药治疗之外,温阳化湿也是一项重要的治法。
4总结与展望
目前糖尿病中医证候归纳分析常用的数据挖掘方法有聚类分析、因子分析、主成分分析等,而其分布情况,多用描述性分析、无尺度网络分析等方法。对方药的分析常用的是频数分析、关联规则分析等。在分析药药关系、药证关系、方证关系、证症关系等中医多维关系中,关联规则应用最为广泛。从分析糖尿病中医证候结果看,大多仍以阴虚燥热、气阴两虚、阴阳两虚为主,且气阴两虚证较为常见,在糖尿病并发症、合发症证候分析中,气虚、阴虚仍是其共同的病机。在方药分析中总结出常用药物有黄芪、生地、太子参、麦冬、丹参等,常用药对有黄芪、山药,黄芪、当归,山药、山茱萸等,绝大部分经统计方法与专家意见验证具有较好的一致性。这些均提示采用数据挖掘技术在一定程度上可以客观反映中医诊疗规律,对于中医的客观化辨证以及提升中医的标准化、现代化等具有现实意义。
目前数据挖掘技术在中医药中的应用尚处于起步阶段,仍存在一些亟待解决的问题:①数据不规范,如中医证候、证型、中药名等缺乏统一,存在描述重复、歧义、不确定性等问题;②数据挖掘方法缺乏统一应用标准,同一类型数据存在多种挖掘方法,影响数据挖掘结果的可靠性及可衡量性;③数据挖掘的结果具有一定的局限性,需与客观实际相结合。针对这些问题,在中医数据挖掘研究中,设计应力求严谨,考虑全面,在数据预处理时务必按中医相关标准名词统一化;在数据挖掘方法的选择上,应根据研究的对象特征选择最适合、最有效的方法,选择困难时,可综合多种方法联合应用;数据挖掘的结果需与中医理论、临床实际及名家经验相结合,反复论证其可靠性及合理性。虽然目前数据挖掘技术在中医研究中还存在较多问题,但随着理论和方法的不断改进,它必将具有广阔的发展前景,也必将更加有力地推动中医药现代化、信息化、规范化的进程。
[参考文献]
[1]Jiawei Han, Micheline Kamber, Jian Pei.数据挖掘:概念与技术[M].北京:机械工业出版社,2012:1-6.
[2]李建生,胡金亮,王永炎,等.基于2型糖尿病数据挖掘的中医证候诊断标准模型建立研究[J].中国中医基础医学杂志,2008,14(5):367-370.
[3]姜兆顺,倪青,林兰,等.基于结构化糖尿病临床信息采集系统对2型糖尿病症状的研究[J].中国中医药信息杂志,2007,14(10):19-21.
[4]林兰,倪青,庞健丽,等.基于数据挖掘技术的2型糖尿病辨证规范前瞻性研究[J].中国中医药信息杂志,2011,18(7):9-12.
[5]方朝晖,罗云,李中南,等.基于数据挖掘技术的2型糖尿病中医证候规律研究[J].中医药临床杂志,2013,25(8):663-665.
[6]龚燕冰,罗增刚,高思华,等.运用因子分析方法探索2型糖尿病证候要素及其靶位特征[J].中医杂志,2011,52(13):1100-1102.
[7]于彦,张敬锋.2型糖尿病的中医证候规律研究[J].中国中医基础医学杂志,2010,16(1):13-23.
[8]秦玉花,孙玉文,陈方超,等.2型糖尿病肾虚证量表调查及因子分析[J].中华中医药杂志,2013,28(11):3384-3386.
[9]尚莹莹,黄天生,李良,等.聚类分析和主成分分析在糖尿病胃轻瘫中医证型研究中的应用[J].辽宁中医杂志,2014,41(8):1567-1569.
[10]郑红.基于多元统计分析糖尿病性周围神经病变的组方证治规律[J].辽宁中医杂志,2010,37(1):36-37.
[11]郑洪光,李秀兰,石燕萍,等.糖尿病肾病130例中医证型分类研究[J].环球中医药,2012,5(10):783-784.
[12]王颖辉,赵进喜,王世东,等.基于因子分析及转移概率分析的糖尿病肾病证候演变规律研究[J].中医杂志,2014,55(15):1317-1322.
[13]倪青,于丽红,陈世波,等.1274例2型糖尿病合并冠心病证治规律数据挖掘[J].中国中医药信息杂志,2010,17(9):99-102.
[14]陈世波,倪青,魏子孝,等.基于个体化诊疗平台2型糖尿病合并代谢综合征证候规律研究[J].中国中医药信息杂志,2007,14(11):18-21.
[15]王佳笑,赵时鹏,倪青,等.运用因子分析法探索2型糖尿病合并高血压病中医证候要素分布特点[J].陕西中医,2015,36(2):155-157.
[16]成杰辉,刘志龙,陈昕,等.糖尿病并发急性脑梗死的症候研究[J].山西中医,2010,26(12):44-46.
[17]方朝晖,罗云,陆瑞敏,等.基于数据挖掘的中医药治疗糖尿病用药规律探析[J].中医药临床杂志,2013,25(8):670-671.
[18]文玉敏,董兴鲁,严美花,等.早期糖尿病肾病经验方用药规律[J].吉林中医药,2015,35(2):130-132.
[19]高尔宁,杨鸿,刘钊,等.治疗二型糖尿病胰岛素抵抗中药复方用药规律分析[J].环球中医药,2014,7(9):731-734.
[20]郭东臣,张慧敏,梁淑新,等.中成药治2型糖尿病证治-方药的调查分析[J].中成药,2015,37(2):442-456.
[21]陈莞苏,朱英,吴玉江,等.基于名老中医验方数据探讨2型糖尿病病机特点[J].辽宁中医杂志,2013,40(9):1818-1820.
[22]唐文彦,贾春华,赵晓红.古今治疗糖尿病用药规律的聚类分析研究[J].承德医学院学报,2000,17(1):135-138.
[23]姚美村,艾路,袁月梅,等.消渴病复方配伍规律的关联规则分析[J].北京中医药大学学报,2002,25(6):48-50.
[24]蔡莉.基于名老中医Ⅱ型糖尿病医案的数据挖掘研究[J].佳木斯教育学院学报,2013(11):447-448.
[25]倪青,陈世波,周雪忠,等.基于无尺度网络分析的2型糖尿病代谢综合征方-药-证关系[J].中国中医药信息杂志,2006,13(11):19-22.
[26]周强,仝小林,赵锡艳,等.仝小林教授治疗糖尿病肾病门诊病历数据挖掘[J].中医药信息,2013,30(1):37-41.
[27]李兰涛,张北华,高蕊,等.魏子孝教授糖尿病周围神经病变医案数据挖掘分析[J].中国中西医结合杂志,2010,30(9):986-988.
[28]王泉蓉,张广德,邵鑫,等.魏子孝教授治疗2型糖尿病合并冠心病医案数据挖掘分析[J].中国中医药现代远程教育,2014,12(6):20-22.
[29]龚燕冰,罗增刚,高思华,等.基于关联规则的2型糖尿病方证关系的横断面研究[J].中医杂志,2010,51(1):64-67.
[30]臧东静,王佳笑,刘瑜,等.基于关联规则的治疗老年糖尿病中药配伍初探[J].北京中医药,2014,33(11):846-848.
(收稿时间:2015-07-06修回时间:2015-07-20)
Data Mining Technique in Application of Syndromes and Prescriptions of Traditional Chinese Medicine for Diabetes
GUO Yan-zhou, MA Jian-wei
(Department of Traditional Chinese Medicine, General Hospital of Air Force, Beijing 100142, China)
[Abstract]Data Mining is a process of identifying the interesting mode and knowledge from mass data. It relates to many subjects and includes many mining methods such as clustering analysis, association rules, scale-free network analysis and etc. The article, which divided into four parts, reviewed applications of data mining technique in syndromes and prescriptions of traditional Chinese medicine (TCM) for diabetes in recent years. The first part was mainly about the possibility of applications on data mining technique in syndromes and prescriptions of TCM for diabetes. The second part was summarized the conditions that clinicians used data mining analyzed TCM syndromes from diabetes, diabetes complications and combination diseases of diabetes. The third part was summarized the application situation of data mining technique from literature and clinic. According to the results that clinicians had obtained by data mining, the last part was summarized that diabetes syndromes mainly were dryness-heat and Yin asthenia, deficiency of both Qi and Yin, and asthenia of both Yin and Yang, and the deficiency of both QI and YIN was the most one. Mongolian Milkvetch Root, Rehmannia Dride Rhizome, Radix Pseudostellariae, Ophiopogonis Japonicus and Salvia Miltiorrhiza Bunge were the most frequently used drugs in treatment of diabetes, and the common use of pair drugs were Mongolian Milkvetch Root and Dioscorea Batatas, Mongolian Milkvetch Root and Angelica, Dioscorea Batatas and Cornus Officinalis and etc. The article also analyzed the shortcomings, effect and significance of data mining technique in TCM research.
[Key words]Data mining; Diabetes mellitus; Symptom complex; Review
[文献标志码][中国图书资料分类号]R587.1;R255.4A
[文章编号]2095-140X(2015)09-0034-05
[通讯作者]马建伟,E-mail:mjw8166@163.com
[基金项目]首都医学发展基金(SF-2009-I-13);首都临床特色应用研究课题(Z121107001012011)
[作者单位]100036 北京,空军总医院中医科