吴嘉瑞 金燕萍 张晓朦 张 冰 盛晓光
(北京中医药大学,北京,100102)
基于关联规则与熵聚类的清热类中成药组方规律研究
吴嘉瑞 金燕萍 张晓朦 张 冰 盛晓光
(北京中医药大学,北京,100102)
目的:探讨常用清热类中成药组方规律。方法:收录《新编国家中成药》中清热类中成药处方,采用关联规则Apriori算法和复杂系统熵聚类等方法,确定处方中药物的使用频次及药物之间的关联规则等。结果:高频次药物包括甘草、黄芩、冰片、金银花、大黄、连翘等;高频次药物组合包括“甘草、黄芩”“甘草、桔梗”“连翘、金银花”等;置信度较高的关联规则包括“牛黄->冰片”“桔梗->甘草”“朱砂->冰片”“栀子->黄芩”等。结论:处方用药中除常见的清热类中药外,尚包括具有清热作用的部分开窍药、安神药、泻下药及其他类药物。
清热药;关联规则;熵聚类
清热药是指以清解里热,治疗里热证为主的药物。根据药物来源及应用特点不同,清热类中药分为清热泻火、清热燥湿、清热凉血、清热解毒和清虚热药五类。清热类中成药种类繁多,其处方中除包含常见的清热泻火、清热解毒等五类清热药外,亦常配伍其他类别药物,配伍组合规律值得深入探讨。本研究收集《新编国家中成药》中的清热类中成药处方,在构建数据库的基础上,应用关联规则和熵聚类算法进行处方用药规律研究[1-3]。
1.1 处方来源与筛选 本研究以《新编国家中成药》(第二版)[4]为来源,共筛选出清热药处方1202首。
1.2 分析软件 “中医传承辅助系统(V2.0)”软件[5],中国中医科学院中药研究所提供。该软件集“数据录入—数据管理—数据查询—数据分析—网络可视化展示”为一体,可以有效实现病案、疾病、症候、中药、处方、四诊等信息的管理、查询、综合分析等功能,可用于处方组方规律分析及新药处方发现等领域[6-9]。
1.3 处方的录入与核对 将筛选后的处方录入“中医传承辅助系统(V2.0)”,录入完成后,由双人负责数据的审核,以确保数据的准确性。
1.4 数据分析
1.4.1 频次统计分析 将清热处方中每味药的出现频次从大到小排序,并将“频次统计”结果导出。
1.4.2 组方规律分析 经过预实验,确定在支持度(表示在所有药物中同时出现的次数)为60、置信度≥0.4条件下开展研究,按药物组合出现频次从大到小的顺序进行排序;利用软件中“规则分析”功能运算得关联规则。
1.4.3 新方分析 在相关度为8,惩罚度为4的条件下,应用改进的互信息法和复杂系统熵聚类方法发现核心组合与新组方,并实现网络可视化展示。
2.1 用药频次分析 将药物按使用频次从高到低进行排序,前三位分别是甘草、黄芩和冰片,频次前30位的药物情况见表1。
表1 处方中使用频次前30位的药物
表2 处方中高频次药物组合
2.2 基于关联规则分析的组方规律分析 按照药物组合出现频次由高到低排序,前3位分别是“甘草、黄芩”“甘草、桔梗”“连翘、金银花”。出现频次60次以上的药物组合见表2。在支持度为60,置信度≥0.4条件下,分析得药物关联规则,结果见表3,关联规则网络图见图1。
表3 处方中药物组合关联规则(置信度≥0.4)
图1支持度为60,置信度为0.4条件下的关联规则网络展示图2.3 基于熵聚类的组方规律分析
2.3.1 基于改进的互信息法的药物间关联度分析 依据处方数量,结合经验判断和不同参数提取数据的预读,设置相关度为8,惩罚度为4,进行聚类分析,得到处方中两两药物间的关联度,将关联系数0.015以上的药对列表。见表4。
表4 基于改进的互信息法的药物间关联度分析
2.3.2 基于复杂系统熵聚类的药物核心组合与新处方分析 以改进的互信息法的药物间关联度分析结果为基础,按照相关度与惩罚度约束,基于复杂系统熵聚类,演化出3~4味药物核心组合,具体见表5。在核心组合提取的基础上,运用无监督熵层次聚类算法,得到34个新处方,具体见表6。
表5 基于复杂系统熵聚类的药物核心组合
本研究应用关联规则和熵聚类算法系统分析了《新编国家中成药》中清热类中成药的用药规律。以下结合研究结果,对处方中高频次药物进行分析。甘草是出现频率最高的单味中药,味甘性平,归心脾肺胃经。功能补脾益气,祛痰止咳,缓急止痛,清热解毒,且在处方中,甘草常发挥调和药性的作用,可降低方中某些药物(如大黄)的峻烈之性[10-11],故其虽非典型清热药物,但却在处方中频次最高。黄芩出现频次仅次于甘草,其味苦性寒,归肺胆脾胃大小肠经,具有清热燥湿、泻火解毒、止血、安胎的功效,尤长于清中上焦湿热,可用于治疗湿温暑湿之证以及肺热壅遏所致咳嗽痰稠等。冰片味辛苦,微寒,归心脾肺经,能开窍醒神、清热止痛。金银花甘寒,有清热解毒,疏散风热之功,为治一切内痈外痈之要药。连翘苦,微寒,清热解毒,消肿散结,疏散风热,主入心经,清心火,解疮毒的同时能消散痈肿结聚,为“疮家圣药”[12]。
表6 基于熵层次聚类的新处方
本研究所得的药物间关联规则有助于分析药物间的关联程度,如“牛黄->冰片”(置信度为0.795 1)含义为,处方中有牛黄时,有冰片的概率为79.51%;“桔梗->甘草”(置信度为0.700 0)含义为,处方中有桔梗时,有甘草的概率为70%;“朱砂->冰片”(置信度为0.700 0)含义为,处方中有朱砂时,有冰片的概率为70%。又如关联规则网络图中共12味药物,其中除朱砂、金银花外,其余10味药均为名方牛黄上清丸[13]中的药物,可见中成药处方中高关联度药物组合与中医经典名方的一致性,这也在一定程度上体现了中医理论的传承与延续。
再者,本研究应用复杂系统熵聚类方法得出的新处方不乏启迪意义,如序号26的新处方“金银花、玄参、连翘、牛蒡子、淡豆豉、淡竹叶”,其中金银花清热解毒,玄参清热凉血,连翘消肿散结,牛蒡子疏散风热,淡豆豉宣发郁热,淡竹叶清热泻火,诸药合用既能清里热,又能解表邪,达到表里双解,祛邪扶正之功效。
综上,本研究应用数据挖掘方法对《新编国家中成药》中的清热类中成药组方规律进行了系统分析,研究所得结果如高频次药物、药物组合、高置信度关联规则等对于阐明中医清热类处方规律提供了参考,同时有助于清热类中药处方的优化与新药研发时的辅助设计。当然,应用关联规则和熵聚类所得的组方规则等还需进一步临床验证,数据挖掘方法亦有其局限性,需结合中医药理论与实践综合分析、评价[14-16]。
[1]李瑞奇,白明,苗明三.清热药的特点及现代研究[J].中医学报,2013,28(8):1003-1005.
[2]唐仕欢,陈建新,杨洪军,等.证-熵-方—中医药研究的新领域[J].中国中医基础医学杂志,2010,16(4):267-270.
[3]唐仕欢,杨洪军.中医组方用药规律研究进展述评[J].中国实验方剂学杂志,2013,19(5):359-363.
[4]宋民宪,杨明.新编国家中成药[M].2版.北京:人民卫生出版社,2011.
[5]卢朋,李健,唐仕欢,等.中医传承辅助系统软件开发与应用[J].中国实验方剂学杂志,2012,18(9):1-4.
[6]杨洪军,赵亚丽,唐仕欢,等.基于熵方法分析中风病处方中药物之间的关联度[J].中国中医基础医学杂志,2005,11(9):706-709.
[7]唐仕欢,陈建新,杨洪军,等.基于复杂系统熵聚类方法的中药新药处方发现研究思路[J].世界科学技术-中医药现代化,2009,11(2):225-228.
[8]吴嘉瑞,唐仕欢,郭位先,等.基于数据挖掘的名老中医经验传承研究述评[J].中国中药杂志,2014,39(4):614-617.
[9]盛倩,刘绍燕,庄曾渊,等.基于中医传承辅助系统的李东垣眼病方剂用药规律研究[J].中国中医眼科杂志,2014,24(3):177-180.
[10]苗明三,张玉林,杨亚蕾,等.基于中药药理作用的中药药性理论研究[J].时珍国医国药,2009,20(8):2013-2015.
[11]高学敏.中药学[M].2版.北京:中国中医药出版社,2009:432-433.
[12]孟长海,王治英.话说“疮家圣药”—连翘[J].环球中医药,2008,1(2):19-19.
[13]孙萍.四种上清丸在临床中的辨证应用[J].中医临床研究,2011,3(18):55-55.
[14]李健,卢朋,唐仕欢,等.基于中医传承辅助平台的治疗肺痈方剂组方规律分析[J].中国实验方剂学杂志,2012,18(2):254-254.
[15]卢笑晖,单崎玮.基于中医传承辅助平台分析卢尚岭教授治疗头风病用药经验[J].中国实验方剂学杂志,2012,18(9):5-5.
[16]吴嘉瑞,郭位先,张冰,等.基于数据挖掘的国医大师颜正华含陈皮处方用药规律研究[J].中国中药杂志,2014,39(4):618-622.
(2014-07-19收稿 责任编辑:张文婷)
Analysis on the Composition Rules of Chinese Patent Medicine with Heat-clearing Based on Association Rules and Clustering Algorithm
Wu Jiarui,Jin Yanping,Zhang Xiaomeng,Zhang Bing,Sheng Xiaoguang
(BeijingUniversityofChineseMedicine,Beijing100102)
Objective: To investigate composition rules of with heat-clearing Chinese patent medicine.Methods: The prescriptions of Chinese patent medicine with heat-clearing in “The new national Medicine” were collected to build a database of the methods of association rules with apriori algorithm and complex system entropy cluster were used to achieve the frequency of medicines and association rules between drugs.Results: Data-mining results indicated that in the prescriptions of Chinese patent drugs with heat-clearing,the most frequently used drugs were Radix Glycyrrhizae,Radix Scutellariae,Borneol,Flos Lonicerae Japonicae,Radix et Rhizoma Rhei,and Fructus Forsythiae.The most frequently used drug combinations were “Radix Glycyrrhizae with Radix Scutellariae”,“Radix Glycyrrhizae with Radix Platycodi”,and “Fructus Forsythiae with Flos Lonicerae Japonicae”,etc.Medicine with a high degree confidence coefficient of association rules include “Bezoar->Borneol”,“Radix Platycodi->Radix Glycyrrhizae”,“Cinnabis->borneol”,and “Fructus Gardeniae-> Radix Scutellariae”.Conclusion: In the prescriptions of Chinese patent drugs,there includes not only the drugs with heat-clearing property,but also that with resuscitation,calming,lapactic and other properties.
Chinese patent drugs; Heat-clearing; Association Rules; Entropy Clustering
国家科技支撑计划课题(编号:2007BAI10B01);北京市中医药科技发展基金课题(编号:JJ-2010-70);北京中医药大学科研创新团队项目资助(编号:2011-CXTD-14);北京中医药大学“重点学科”开放课题(编号:2013-ZDXKKF-19)
吴嘉瑞,副教授,博士,硕士研究生导师,研究方向:临床中药学,E-mail:exogamy@163.com
张冰(1959.8—),女,博士,教授,博士研究生导师,研究方向:临床中药学,E-mail:zhangbing@263.net
R289.9;R311
A
10.3969/j.issn.1673-7202.2015.03.034