李远,刘盼英,李海滨,李涛
(河北大学中医学院,河北 保定 071002)
运用数据处理技术探讨原发性血小板增多症的中医辨证和用药规律
李远,刘盼英,李海滨,李涛
(河北大学中医学院,河北 保定 071002)
目的 探讨原发性血小板增多症的中医辨证和用药立方规律。方法 收集中医治疗原发性血小板增多症的医案,运用数据挖掘软件,采用频数统计、关联规则分析、熵聚类等数据挖掘技术,分析中医治疗原发性血小板增多症的辨证和用药规律。结果 通过对57个相关医案进行分析,统计发现了医案中的基本证候、主要治法、常用药物出现频次,挖掘出主要药物之间的关联规则,发现了治疗本病的35个核心组合和6个新处方等新数据。结论 中医治疗原发性血小板增多症经验丰富并有规律可循,证型主要分为瘀血型、血热型、肝火型,常用清热、凉血、活血等类中药,具有较强的规律性。
原发性血小板增多症;关联规则;聚类算法;中医辨证用药规律
原发性血小板增多症系骨髓增生性疾患,其特征为出血倾向及血栓形成,骨髓中巨核细胞过度增生,血液中血小板数量异常增多[1]。中医对本病的研究尚处于探索阶段,主要以个案的形式报道,通过对治疗原发性血小板增多症医案的研究来认识本病的辨证用药立方规律有重要意义。本研究通过收集、整理中医治疗原发性血小板增多症医案,运用统计方法,分析医案中常见证型、主要治法以及常用药物的频次,在此基础上,采用关联规则和熵聚类方法等现代数据处理技术,挖掘药物之间的关联规则和治疗本病的潜在处方规律,为阐明中医对原发性血小板增多症辨证与用药规律提供参考。
1.1 医案来源
本研究以“血小板增多症”、“医案”、“病案”为检索词,以“全文”为检索条件,从中国知网逐一检索、下载1949年至2014年间所有中医文献,建立本病中医文献数据库。
1.2 纳入标准
(1)病例为中医诊疗;(2)原发性血小板增多症诊断明确;(3)医案理法方药记录完整,疗效判断有效。符合以上3条者,即可纳入本研究。
1.3 排除标准
不符合纳入标准之一者,即不纳入本研究。
通过逐篇阅读,从建立的中医文献数据库中选取符合纳入标准的医案57份。
1.4 统计与数据挖掘软件
“中医传承辅助系统(V2.5)”软件,由中国中医科学院中药研究所提供。
1.5 中医名词的规范化处理
依据《中医证候鉴别诊断学》[2]、《中药学》[3]等相关参考书,对本研究收集的57份医案中相关术语进行规范化处理。
1.6 医案的录入和核对
将上述筛选后的医案中与“诊断”、“证候”、“ 治法”、“用药”相关信息逐个输入软件,信息输入完成后,由两人分别审核数据,以保证数据的准确性。数据录完进行数据整理,确认无误后,锁定备用。
1.7 数据分析
包括数据统计和数据挖掘两部分。
1.7.1 提取数据源
在“西医疾病”项中输入“原发性血小板增多症”,提取出原发性血小板增多症的医案。
1.7.2 证型、治法与用药统计分析
通过软件中“统计报表系统”进行辨证、治法、用药频次的统计分析,并将“频次统计”结果导出。
1.7.3 组方规律分析
根据预判结果,在关联规则分析中,支持度设为12,置信度设为 0.8,通过“数据分析”模块中的“医案分析” 挖掘主要药物之间的关联规则。
1.7.4 药物核心组合与新方发现
通过“数据分析”模块中的“方剂分析”模块挖掘核心组合和发现新方。在分析前,根据预判结果,把“相关度”设为8,“惩罚度”设为2,然后点击“提取组合”按钮,即可发现治疗本病的药物之间的关联度、核心组合和新组方。
2.1 中医辨证原发性血小板增多症证型频次
根据57份医案辨证的统计分析结果,共有32种证型,证候频次前5位分别是瘀血证、肝郁化火证、气滞血瘀证、血热妄行证、瘀毒互结证。从表1可见,中医对原发性血小板增多症的多种证型相互重叠,以瘀血证、血热证、肝火(热)证等为多见。
表1 原发性血小板增多症医案中证候频次2次以上的分布情况
2.2 中医治疗原发性血小板增多症治法频次
根据统计分析结果,中医治疗原发性血小板增多症医案中,共有32种治法,治法频次前5位分别是活血化瘀法、清肝泄火法、清热凉血法、清热解毒法、补气活血法。从表2可见,中医对原发性血小板增多症的多种治法相互重叠,本病的治法主要集中在活血化瘀、清肝泄火、清热凉血三方面。
表2 原发性血小板增多症医案中治法频次2次以上的分布情况
2.3 中医治疗原发性血小板增多症用药频次
根据统计分析结果,中医治疗原发性血小板增多症医案中,共用药171种。从表3可见,原发性血小板增多症的用药主要是清热、凉血、活血等功效的中药。
表3 原发性血小板增多症医案中用药频次8次以上的分布情况
2.4 关联规则的组方规律分析
支持度个数指的是药物组合在所选处方中出现的频次(本参数≤处方总数)。置信度的含义为左边为A药物,右边为B药物,当A药物为主,B药物出现的概率。按设定的支持度和置信度,共获取18条组方规则,见表4。从表4和图1可见,用于治疗原发性血小板增多症的中药关联最为密切的药集中在赤芍、生地黄、牡丹皮、桃仁、红花、甘草等中药。
表4 原发性血小板增多症医案常用药物关联分析(支持度≥12,置信度≥0.8)
图1 关联规则网络展示(支持度≥12,置信度≥0.8)
2.5 基于熵聚类的医案组方规律分析
2.5.1 改进的互信息法的药物间关联度分析
按设定的相关度与惩罚度,进行聚类分析,得到医案中两两药物间的关联度,将关联系数0.03以上的药对列表,见表5。由表5可见,基于改进的互信息法的关联度较大的组合有:钩藤-茺蔚子、钩藤-金银花、泽兰-桂枝、泽兰-大腹皮、黄芩-白豆蔻等。
表5 改进的互信息法的药物间关联度分析结果
2.5.2 复杂系统熵聚类的药物核心组合分析
方剂或处方是由若干个药物组成的,药物之间必然存在一定的关联性,本文中相关度是根据改进的互信息算法的药物与药物之间的关联进行定量描述的一个参数。如相关度设置为“8”,表示仅取排序在前面的1~7(设计药物8味)的药物之间的关联度,然后进行聚类挖掘。惩罚度是为了减少负面数据信息干扰的一个参数。药物之间的关联有正相关和负相关。惩罚度就是将药物之间的负相关排除。如惩罚度为“2”,表示2个药物至少在已有的方剂或处方中同时出现,这样对于那些在所有处方中都没有同时出现的药物进行了排除。以药物间关联度分析结果为基础,按照设定的相关度与惩罚度,基于复杂系统熵聚类方法,得到3味药核心组合35组,见表6。由表6可见,通过聚类分析挖掘出了多组核心组合,如清肝凉血的青黛-赤芍-龙胆,补气活血的黄芪-水牛角-红花,凉血活血的水牛角-桃仁-牡丹皮等。每组核心组合都有其所治的病机,在临床上要求医者辨证论治,选择适合的药对。
表6 基于复杂系统熵聚类的核心组合
2.5.3 基于无监督熵层次聚类的新处方分析
在上述35组核心配伍的基础上,运用无监督熵层次聚类算法,得到6个新处方,见表7。由表7可见,6个新处方各有其相对应的证型。如方1、方5针对血热证和瘀血证者;方4、方6针对热毒偏甚者;方2针对肝火夹瘀者;方3针对热毒夹瘀夹虚者。
表7 基于熵层次聚类的新处方
原发性血小板增多症临床较为少见,中医少有对本病进行系统研究。本研究将不同医家对本病诊疗散在的个案报道进行“系统集成”,采用关联规则 Apriori 算法和复杂系统熵聚类方法系统分析了原发性血小板增多症的中医诊疗规律,对原发性血小板增多症的临床研究提供新的思路。
3.1 辨证与治法规律分析
研究显示中医对原发性血小板增多症的辨证具有一定规律性。经统计分析,中医对本病辨证的主要证型有瘀血证、肝郁化火证、气滞血瘀证、血热妄行证、瘀毒互结证等,基本揭示了原发性血小板增多症的证型分布规律,对于指导本病辨证有较好的参考价值。另外,经统计,本病的治法主要为活血化瘀法、清肝泄火法、清热凉血法、清热解毒法、补气活血法,与证型有较好的一致性,符合中医“法随证立”的观点。
3.2 用药规律分析
本研究较好地揭示了中医治疗原发性血小板增多症临床用药经验的规律性。研究显示中医治疗原发性血小板增多症常用的药物有赤芍、生地黄、丹参、牡丹皮、甘草、桃仁、当归、红花、牛膝、水蛭、川芎、黄芪等。这些药多数具有清热凉血、活血化瘀、补气等功效。本研究运用基于熵聚类的医案组方规律分析发现了中医治疗本病的核心药物组合,并得到6个新的处方。当然,从方法学层面来看,支持度、置信度、相关度和惩罚度等参数设为多大,需要结合相关的专业知识,否则很难得到理想的结果,新发现的核心药物组合与新处方还需进一步临床验证,医学数据挖掘结果能在一定程度上揭示用药规律,由于临床实践中的个体化差异,数据挖掘结果需要在临床实践中谨慎应用[4]。
3.3 研究方法评价
原发性血小板增多症是一种较为少见的病种,中医目前尚无规范的诊疗方案,本病散在的病案报道具有客观可信的特点,常可发现显性经验,但单纯个案很难有创新性的发现和认识。关联规则分析可从大量的数据中发现项集之间有价值的关联,关联规则用于研究药物使用规律,可以在不同层次发现药物的组合使用情况[5]。复杂系统的熵方法能自组织地从大量的数据中提取出信息量最大的组合,此方法特别适用于高度离散性类型的数据。中医个案报道的数据具有离散型,又有非线性和混合型的特点,因此,基于复杂系统的熵方法非常适合作为中医个案分析的研究[6]。中医传承辅助系统数据挖掘和统计功能强大,不仅有常规的频数统计分析、关联规则分析等发现显性辨证用药经验分析,还运用复杂系统的熵方法,发现隐性的组方规律分析[7-8]。当然,运用中医传承辅助系统平台研究中医群体经验,并不否认中医个人用药特点的价值,相反,某些中医的独特认识疾病经验也并非数据挖掘技术所能替代,如国医大师郭子光教授认为,原发性血小板增多症多为肝疏泄太过,肝火偏旺,常以清肝凉血药青黛作为治疗本病的主药[9],而这些独特用药经验容易被数据分析遗漏。因此,将中医传承辅助系统平台对中医群体经验的规律研究和个别中医独特经验结合起来,将更有利于全面深刻地从中医角度认识疾病的本质,更好地辨证用药。
[1] 庄静丽, 王宝珍. 骨髓增殖性肿瘤[M]∥陈灏珠, 林果为. 实用内科学. 13 版. 北京: 人民卫生出版社, 2009: 2531-2533.
[2] 姚乃礼. 中医证候鉴别诊断学[M]. 2 版. 北京: 人民卫生出版社, 2002.
[3] 陈蔚文. 中药学[M]. 2 版. 北京: 人民卫生出版社, 2012.
[4] 李文林, 赵国平, 陆建峰, 等. 关联规则在名医临证经验分析挖掘中的应用[J]. 南京中医药大学学报, 2008, 24(1): 21-24.
[5] 吴荣, 刘晛, 王阶, 等. 基于关联规则的名老中医冠心病用药规律研究[J]. 中国中药杂志, 2007, 32(17): 1786-1788.
[6] 刘铁钢, 陈建新, 张望, 等. 基于复杂系统熵方法的孔光一教授治疗月经病经验数据挖掘研究[J]. 中医杂志, 2013, 54(6): 481-483.
[7] 卢笑晖, 单崎玮. 基于中医传承辅助系统分析卢尚岭教授治疗头风病用药经验[J]. 中国实验方剂学杂志, 2012, 18 (9): 5.
[8] 吴嘉瑞, 张冰, 杨冰, 等. 基于关联规则和复杂系统熵聚类的颜正华教授治疗呃逆用药规律研究[J]. 中华中医药杂志, 2013, 28(11): 3416-3419.
[9] 常名空, 侯德健. 郭子光教授发挥肝主疏泄学说治疗血小板疾病[J]. 四川中医, 2007, 25(12): 3-4.
(责任编辑:刘俊华)
Analysis on traditional Chinese medicine’s medication rule in prescriptions for the primary thrombocytosis based on data mining
LI Yuan, LIU Panying, LI Haibin, LI Tao
(College of Traditional Chinese Medicine, Hebei University, Baoding 071002, China)
Objective To explore the traditional Chinese medicine for primary thrombocytosis evidence. Methods Collect the medical record of TCM treatment of primary thrombocytosis, based on the data mining software , such as frequency analysis,the rules of using the software integration analysis, improved mutual information method, the complex system entropy and entropy of unsupervised clustering hierarchy clustering data mining methods were used to analyze TCM syndromes and herbs for the treatment of primary thrombocytosis. Results Based on the 57 selected medical records, the appearance frequency of symptoms, treatment and the frequency of each herb and association rules among the herbs were computed, 35 core combinations and 6 new prescriptions were also mined from the database. Conclusion Chinese medicine has been accumulated experiences in the treatment of primary thrombocytosis and has rules to follow, mainly for the blood stasis syndrome differentiation of syndrome, blood heat, something the effect such as clear heat, cooling blood, invigorating the circulation,which has strong regularity.
primary thrombocytosis disease; apriori; clustering algorithm; traditional Chinese medicine’s medication rule
10.3969/j.issn.1674-490X.2015.05.008
R249
A
1674-490X(2015)05-0029-06
本文引用:李远, 刘盼英, 李海滨, 等. 运用数据处理技术探讨原发性血小板增多症的中医辨证和用药规律[J]. 医学研究与教育, 2015, 32(5): 29-34.
2015-09-21
李远(1975—),男,重庆人,副教授,博士,主要从事中医临床经验的系统研究。E-mail: liyuancdutcm@126.com