关联规则在中医药方剂专利挖掘中的应用

2019-10-23 10:19:16
中华医学图书情报杂志 2019年7期
关键词:方剂制剂

数据挖掘(Data Mining)是应用一系列技术从大型数据库和数据仓库中提取人们事先未知而潜在有用的隐含信息和知识的过程[1]。常用的数据挖掘方法主要有关联规则、人工神经网络、决策树及聚类分析等[2]。在医学领域,关联规则常用来发现数据间隐含的关联关系,如疾病与症状间的关联规则[3]、疾病并发症的关联研究[4]、用药和方剂配伍规则研究[5]、“病症-辨证-处方”关联研究[6]、分析药物间的相互作用[7]、药品分类和剂型关联分析[8]、症状与药物间的关联关系[9]及利用关联规则辅助检测分析心理健康[10-11]等。近年来,中医药发展上升为国家战略,为全面振兴中医药,国家先后出台了一系列政策促进和激励经典名方的现代化开发、利用和保护。2016年发布的《中医药发展战略规划纲要(2016-2030年)》强调,要加强中医药传统知识保护与技术挖掘[12]。中医药专利中蕴含着大量有价值的信息,因此本文拟通过对治疗湿疹的中医药专利进行关联规则挖掘分析,探寻其用药规律,为湿疹的中医药治疗提供客观依据。

1 数据来源与研究方法

1.1 数据来源

1.1.1 检索策略

本文通过检索国家知识产权局专利数据库,得到基础数据,检索式为“申请日≥20100101 AND 发明名称=(湿疹) AND IPC分类号=(A61K36) AND 关键词=(方剂 OR 制剂 OR 组合物)”。

1.1.2 数据规范

本文主要参照《中药大辞典》[13],辅以药标网的《中国药典》2015年版为参考,对药方中的中药名称进行规范化、标准化处理,即异名、俗名等统一修改为中药正名,如将“生地”统一为“生地黄”,“双花”统一为“金银花”等。

1.2 研究方法与具体流程

1.2.1 关联规则与关联分析

关联规则指出现在同一事件中的不同项的相关性,是形如X→Y的蕴含表达式。关联规则的强度用支持度和置信度度量。支持度指关联规则在总体中发生的频率,反映规则出现的频繁程度;置信度表示构成关联规则的前项集X发生时,后项集Y的发生概率[14]。此外,本文引入提升度这一衡量指标,用来表示关联规则的准确度。提升度指置信度与后项集Y的比值,一般来讲,只有当比值大于1时,所产生的规则才有意义[15]。

1.2.2 Apriori算法

Apriori算法是由Agrawal等人[16]提出的。该算法采用层次顺序搜索的迭代方法来完成挖掘工作,具体过程是:首先找出符合支持度所设阈值的频繁1-项集,记为L1;在L1的基础上挖掘频繁2-项集,记为L2;重复上述步骤直到无法挖掘更多的频繁K-项集为止。每挖掘一层L1就需要将整个数据库扫描一遍[17]。

1.2.3 具体关联分析流程

摘录湿疹药方,将摘录的药方按标准筛选后,导入书目共现分析系统[18],对药用频次进行统计,生成词篇矩阵,导出至Excel表格,对数据进行转置,设置真值为T,反之为F,组成药物事实表。将该表导入到SPSS Clementine 12.0源中的“Excel”节点,选取字段选项中的“类型”节点连接到数据源,然后将该节点连接到建模中的“Apriori”节点以及图形中的“网络”节点等,形成数据流。按顺序执行数据流,得到关联规则结果。

2 结果与分析

2.1 药物频次统计结果及分析

本文将国家知识产权局数据库中检索到的治疗湿疹专利数据按照纳入、排除标准筛选后,共得药方497首、药物1 203味。药物使用总频次为5 887次,其中用药频次大于50次的药物共有20味,具体结果如表1所示。按照使用频次,前10味药依次为苦参、黄柏、白鲜皮、地肤子、甘草、蛇床子、防风、金银花、荆芥、蝉蜕。

表1 高频药物频次频率

2.2 药物类别频次统计结果及分析

参照《临床中药学》[19],按照功效对药物(频次≥40)进行分类(表2)。

表2 高频药物类别频次

由表2可知,清热药使用频次高居首位,包含清热燥湿药、清热解毒药、清热凉血药,具有清热、燥湿、解毒、凉血等功效。有效针对湿疹的病因,是有效治疗湿疹最常用的药类。

解表药有发散表邪之功效,依据主治病证的不同,又有发散风寒、发散风热之别。“痒自风而来”“止痒必先疏风”,表证夹湿者,宜选用兼有祛风胜湿作用的解表药,故诸方又多以防风、荆芥二者相配,以达祛风止痒之功效[20]。

由此可见,核心药物以清热药、解表药、利湿药为主,这与该病的清热、利湿、祛风三大重要治疗方法相符合。

湿疹之邪伤阴耗气,而且多用苦寒药物,容易伤及脾胃,伤津耗液,阴损及阳,往往导致气阴两虚,故而湿疹的治疗应以清热疏风利湿为主,兼顾补虚[21]。

2.3 药物关联规则结果及分析

设置最小支持度及最小置信度阈值,分别为10%、60%,最大前项数设为5,按顺序执行数据流,共得到51条药物关联规则,提升度均大于1,即所得规则都有意义。其中关联规则的含义为:当“→”左侧的药物出现时,右侧可能会出现的药物;“置信度”表示当“→”左侧的药物出现时,右侧药物出现的概率[22]。

2.3.1 两味中药关联规则

设置阈值后,一共得到了15条药对关联规则 (表3) 。

表3 两味中药关联规则

由表3可知,“黄柏→苦参”这一规则支持度最高,达到36.22%。二者同属清热燥湿药,苦参药性苦寒,有清热燥湿、杀虫止痒之功效;黄柏性味苦寒,有清热燥湿兼泻火解毒之功效。两味药相须而用以增强清热燥湿之功效,提高疗效[23]。置信度最高的关联规则为“蛇床子→苦参”,达到71.76%。

2.3.2 三味中药关联规则

设置阈值后,共得到30条三味中药关联规则(表4)。从表4中可知,支持度最高的规则有“白鲜皮+苦参→地肤子”、“白鲜皮+苦参→黄柏”,达到23.74%;置信度最高的规则为“地肤子+黄柏→白鲜皮”,达到85.14%。

表4 三味中药关联规则

蛇床子,性辛、苦、温燥,既善燥湿杀虫,又善祛风,风湿除,虫被灭,痒自可止,故对湿疹湿疮疗效甚佳。其性温,尤宜于风寒湿邪所致者。对于郁久化热或湿热所致者,须与清热燥湿解毒之品同用,以防其性温助热。苦参、黄柏为清热燥湿药,白鲜皮为清热解毒药。

在表4中,含有蛇床子的规则为“蛇床子+苦参→黄柏”“蛇床子+黄柏→苦参”“蛇床子+白鲜皮→苦参”“蛇床子+白鲜皮→地肤子”“蛇床子+地肤子→白鲜皮”“蛇床子+地肤子→苦参”,由此可知符合蛇床子用于治疗湿疹时的配伍特点。

地肤子,性辛、苦,寒,有清热利湿、祛风止痒之功效。地肤子能祛除皮肤中湿热与风邪而止痒,用于湿疹湿疮、风疹瘙痒,常与白鲜皮、荆芥、蝉蜕等清热燥湿、祛风止痒药配伍。由“白鲜皮+苦参→地肤子”“地肤子+苦参→白鲜皮”“地肤子+白鲜皮→苦参”“地肤子+黄柏→白鲜皮”“荆芥+苦参→地肤子”“荆芥+白鲜皮→地肤子”“蝉蜕+白鲜皮→地肤子”关联规则可知,本文所得药物关联规则符合地肤子的配伍特点。

2.3.3 四味中药关联规则

设置阈值后,共得到6条四味中药关联规则(表5)。从表5可知,“白鲜皮+黄柏+苦参→地肤子”这一关联规则支持度最高,达到14.49%;“蛇床子+地肤子+白鲜皮→苦参”这一关联规则置信度最高,达到78%。

表5 四味中药关联规则

2.3.4 药物关联网状图

网状图可对数据进行可视化挖掘,直观、形象地反映出药物之间的关联强度。其中粗线表示强链接,细线表示中等链接,虚线表示弱链接。图1显示,与苦参、黄柏、白鲜皮、地肤子等相关的链接较多,与通过Apriori模型挖掘出的药物关联规则结果相似。

图1 药物关联网状图

3 结论

本文通过对国家知识产权局数据库中治疗湿疹的方剂进行检索、挖掘、关联分析,得出在497首方剂中使用频次超过50次的药物20种、关联配伍规则51则。对中药的关联规律挖掘多达4味,即4-项集的挖掘分析,并按照功效对药物(频次≥40)进行分类,得出治疗湿疹的核心药物以清热药、解表药、利湿药为主,这与该病的清热、利湿、祛风三大重要治疗方法相符合。

在挖掘出的全部规则中,支持度最高的为“黄柏→苦参”,达到36.22%,说明黄柏、苦参常两两同时出现。该药对均为清热燥湿药,两味药相须而用,有助于增强清热燥湿效果;置信度最高的为“地肤子+黄柏→白鲜皮”,达到85.14%,说明当地肤子和黄柏被选入药方使用时,白鲜皮被选入的概率为85.14%,显示了较为密切的配伍关系。

在四味中药关联规则中,共涉及苦参、黄柏、白鲜皮、地肤子、蛇床子5味中药,说明这些药物在治疗湿疹中配伍相对固定、较为可靠。每项药物组合均含有苦参与白鲜皮这两味药,所属范畴分别是清热燥湿药、清热解毒药,说明治疗湿疹的药方常以清热药为主要药物。

4 结语

本文通过对高频药物药性及其关联规律进行分析,得出在治疗湿疹时最常使用的配伍药物,符合湿疹治疗的用药特点,由此验证了关联规则分析在中医药方剂专利挖掘中的有效性,为中医药传统知识保护与技术挖掘提供了可行性途径。

猜你喜欢
方剂制剂
中医医案方剂多维相似度算法设计与探索
中药方剂在治疗黄褐斑中的应用
《金匮要略》黄芪类方剂探析
中草药制剂育肥猪
今日农业(2020年18期)2020-12-14 19:08:44
拯救了无数人的抗菌制剂
论方剂的配伍环境
中成药(2018年6期)2018-07-11 03:01:24
元胡止痛系列制剂4种工艺比较
中成药(2017年4期)2017-05-17 06:09:48
甘草在方剂中的作用及配伍规律
《哲对宁诺尔》方剂数目统计研究
小猪疑似砷制剂中毒的诊治
兽医导刊(2015年13期)2015-12-16 16:35:57