基于数据挖掘的缺血性中风中医处方用药规律研究

2022-02-05 00:20黄辛迪丁长松苏啟后周德生涂海军
云南中医中药杂志 2022年1期
关键词:用药规律关联规则数据挖掘

黄辛迪 丁长松 苏啟后 周德生 涂海军

摘要:目的 基于數据挖掘技术分析研究《中风病良方大全》治疗缺血性中风用药规律。方法 遴选《中风病良方大全》治疗缺血性中风处方,对数据进行规范化处理,构建缺血性中风处方数据库;并借助Python数据分析对用药频次、药性频次分布、药物功效类别的频次及分布进行统计,应用Apriori关联规则算法等进行数据挖掘,构建高频药对药组关联组合模型,探索其用药趋向性和核心药物。结果 遴选948首治疗缺血性中风处方,共845味药材9616次总用频次。挖掘前50味高频常用药材,使用频次前10位的中药依次为川芎、甘草、当归、丹参、黄芪、地龙、红花、赤芍、石菖蒲、牛膝,川芎,其中以温32.8%、平27.2%、寒性26.1%为主,以甘48.7%、苦41.2%、辛味38.1%为主,以肝68.3%、脾40.5%、心经36.7%为主,用药功效中以补虚药25.29%、活血化瘀药23.14%、平肝息风药14.79%为主;基于用药药性属性,高频用药聚类得到8大类。当满足最小支持度5%且最小置信度60%时,关联规则分析结果得到药对关联规则18条,其中置信度前3位的药对规则为远志→石菖蒲、陈皮→半夏、红花→川芎;关联规则分析结果得到药对主要3味关联药组20条,其中置信度前3位的药对规则为桃仁+地龙→红花+桃仁 赤芍→红花、桃仁+当归→红花。结论 中医治疗缺血性中风辨证用药以补气补血、滋阴活血、化痰行气为法。基于数据挖掘技术分析缺血性中风用药规律,对于临床用药指导与应用具有重要价值。

关键词:数据挖掘;缺血性中风;Apriori 算法;关联规则;用药规律

中图分类号:R743.3   文献标志码:A   文章编号:1007-2349(2022)01-0023-06

Research on TCM Prescription Medication Rules of Ischemic Stroke Based on Data Mining

HUANG Xin-di1, DING Chang-song1, SU Qi-hou1, ZHOU De-sheng1, TU Hai-jun1

(1. School of Information Science and Engineering, Hunan University of Traditional Chinese Medicine, Changsha, 410208, China; 2. Hunan University of Traditional Chinese Medicine, Changsha, 410208, China; 3. The First Affiliated Hospital of Hunan University of Traditional Chinese Medicine, Changsha, 410208, China; 4. School of Biology, Hunan University, Changsha, 410208, China)

【Abstract】Objective: To analyze and study the medication rules of the treatment of ischemic stroke in A Complete Collection of Effective Prescription for Stroke by basing on data mining technology. Methods: The prescriptions for the treatment of ischemic stroke in the collection were selected to standardize data processing, and construct a database of ischemic stroke prescription. By using Python data analysis, the frequency of medication, the frequency distribution of drug properties and the frequency and distribution of drug efficacy categories were made statistically and by using Apriori association rule algorithm, the data mining was conducted to build a high-frequency drug-to-drug group association combination model and explore its drug trend and core drugs. Results: The first 948 prescriptions for the treatment of ischemic stroke were selected, and 845 medicinal materials were used with a total frequency of 9616 times. The top 50 high-frequency and commonly used medicinal materials were excavated. The top 10 used Chinese medicines were Ligustici, Licorice, Angelica, Salvia, Astragalus, Earthworm, Safflower, Red Peony, Acorus tatarinowii and Achyranthes bidentata, among which the warm property was 32.8, mild-nature 27.2%, cold 26.1%, mainly sweet 48.7%, bitter 41.2%, pungent 38.1%, and mainly for liver 68.3%, spleen 40.5% and heart meridian 36.7%. The efficacy of the medicine was 25.29 % of deficiency-tonic, 23.14% of activating blood and removing blood stasis drugs and 14.79% of calming liver and dispelling wind drugs. Based on the properties of the medications, the high-frequency medications clustered into 8 categories. When the minimum support degree was 5% and the minimum confidence degree was 60%, the association rule analysis results obtained 18 drug pair association rules, among which the top 3 drug pair rules of the confidence were Polygala→Acorus tatarinowii, Tangerine Peel→ Pinellia, Safflower→Ligustici. The association rule analysis results showed that there were 20 drug pairs related to the main 3 flavor drug groups, among which the top 3 drug pair rules of the confidence level were peach kernel + earthworm→safflower + peach kernel, red peony→safflower, peach kernel + angelica→safflower. Conclusion: The TCM treatment of ischemic stroke is based on the methods of invigorating qi and blood, nourishing yin and promoting blood circulation, resolving phlegm and promoting qi. The study is of great value for clinical medication guidance and application.

【Key words】Data Mining; Ischemic Stroke; Apriori Algorithm; Association Rules; Medication Rule

脑卒中是一种急性脑血管病,已经成为临床常见疾病,具有高发病率、高致残率、高致死率、高复发率的特点,严重影响患者的生命健康和生存状态[1]。脑卒中包括缺血性脑卒中和出血性脑卒中。其中缺血性脑卒中(Ischemic stroke,IS)也被称为缺血性中风(cerebral infarction,CI),指因颈动脉、椎动脉狭窄或堵塞致使脑供血不足而引起的大脑缺血、缺氧,最终导致脑组织的缺血性坏死[2]。我国卒中患者已超过千万,其中约70%为缺血性卒中患者,每年新发病例约240万,患病率达2.37%,且患病风险随着年龄而升高,每年因卒中死亡的人数也多达110万[3],故缺血性中风治疗已成为我国中风病防治研究的重中之重,探索有效其治疗方法具有重要的临床意义和社会价值。本研究基于《中风病良方大全》[4]中缺血性中风的中药处方,借助Python数据分析对用药及药性频次分布进行统计,运用Apriori关联规则算法进行挖掘分析,探讨中医用药规律,为中医治疗缺血性脑卒中临床组方用药提供科学参考,更好地服务于临床实践。

1 资料与方法

1.1 数据来源 方剂选择来源于《中风病良方大全》,此书内容涵盖中风病的中西医诊治概况,中风病的各种临床类型、危险因素、后遗症及其并发症,分为诊断要点、通用良方、辨证良方、对症良方等项。全面收集了古今治疗中风病的专科用方3000余首,遴选方剂完备,涵盖古方和近现代方,其中古方文献覆盖先秦两汉至明清时期,近现代方为国家级或省级中医药期刊杂志1981年-2015年所载中风治疗名中医效验方。

1.2 纳入标准 根据《中风病良方大全》中脑血管疾病诊断确定其中医治疗处方的出血或缺血类别。依据书中章节可划分方剂类别,如第2章短暂性脑缺血发作收录的为缺血类药方。从所有缺血类药方章节提取药方并标注其方名、组成和来源,不同章节中提取到的内容完全相同的处方去重后合并为1条记录。如补阳还五汤在第2章短暂性脑缺血发作、第4章脑栓塞、第`4章脊髓卒中的短暂性脊髓缺血发作等部分多处出现,该处方只保存为1条记录。另外,第17章并发症,第18章后遗症,第19章危险因素难以计入脑出血和缺血的直接治疗,暂时未纳入归类和分析。通过上述方式遴选出治疗缺血性中风处方共948首。

1.3 创建数据库 采用双人录入、第3人监督的方式,将数据输入至Excel 表格创建数据库。若存在不一致处则协商解决,以确保数据的准确性和规范性。

1.4 中药名称标准化 根据《中药学》[5]的目录,对中药名称进行标准化:(1)将药物俗称、别名、错字等统一成规范常用名称,如将旱莲草统一为墨旱莲,将仙灵脾统一为淫羊藿等。(2)暂不考虑炮制方法和药物产地对中药药性的影响,如杭白芍统一白芍,京玄参统一为玄参;中药炮制后功效类似者仍用原名,生黄芪、炙黄芪统一为黄芪,法半夏、半夏统一为半夏等。去除药方中每味药物所含的剂量和使用说明,如钩藤16 g(后下)、生龙骨15 g(捣碎)等。饮片炮制后前后无差异的统一用生品,在药性上有差异的则生熟分开,部分药物以不同药用部位入药而在药性上有差别时也应分开记录。

1.5 确定中药药性及功效 参照《中药学》[5]和《中华人民共和国药典》[6],将处方中涉及的所有中药进行整理,包括药材的四气、五味、归经,并确定药物的功效分类。

2 结果

2.1 高频用药频次及频率统计 纳入《中风病良方大全》[2]中治疗缺血性中风处方共948首,共涉及845味药,总用药频次9616次,其中前50味高频常用药材,累计频次6442次,占所有药物使用频次的66.99%,涉及所有948首方。将这些中药以使用频次由高到低排序,如表2所示,其中川芎的使用频次最高,达353次。

2.2 高频药物四气五味及归经统计分析 提取以上高频药物的中药药性及功效,将四气、五味、归经逐一进行记录和统计。其中药性中四气、功效类别为单值属性,而五味、归经为多值属性。单值属性的频率按其出现频次和常用50味药物总频次的比值计算,多值属性的频次按照多值中各个单项属性频次叠加计算,多值属性的频率依据单项属性值叠加计算的频次与常用50味药物总频次的比值计算。对应的中药将结果按照总频率由高到低排列。

2.2.1 藥物四气分析 前50味高频常用药材以温32.8%、平27.2%、微寒12.8%、寒性11.3%为主,药物四气分析结果,详见表3与图1。

2.2.2 高频药物五味分析 前50味高频常用药材以甘48.7%、苦41.2%、辛味38.1%为主,以肝68.3%、脾40.5%、心经36.7%为主,药物归经分析结果,详见表4与图2。

2.2.3 高频药物归经分析 前50味高频常用药材以肝68.3%、脾40.5%、心36.7%、肺经30.7%为主,药物归经分析结果,详见表5与图3。

2.3 中药功效分类统计 按照《中药学》[5]药物功用分类,按类别统计前50味高频常用中药的使用频次见表6、频率分布见图4。其中,使用频次最高的药物功用类别为补虚药,共1692次,占比为25.29%,又以补气、补血药为主,各总占比分别为12.71%和9.69%;频次次高的药物功用类别为活血化瘀药,共1581次,占比为23.14%;平肝息风药使用频次为953,占比为14.79%。

1.4 高频中药关联分析 关联规则,为两个或者多个变量的取值之间存在某种规律,主要含义为先导项出现时,后继项可能会出现的关联形式,表示为A→B。支持度是指A和B同时出现的概率,置信度是指出现A的情况下出现B的概率,用于衡量关联规则的可信程度。基于以上原则,可得出中医药治疗缺血性中风常见的药对、药组及中药之间的潜在共性规律。缺血性中风药对关联规则18条和3味药组关联规则20条分别见表7、8。基于药对药组关联规则构建核心用药关联组合模型见图5、图6。

3 讨论

总体用药分析显示,缺血性中风中医处方的用药甚广,但绝大部分集中在使用频数较多50位药。分类考察显示,其药谱涉及到活血化瘀、化痰宣窍、益气健脾、清热安神、平肝息风、养阴生津、补肾温阳、清热泻火、理气升阳等多种功效,反应了中医证情的复杂性,一方面也反映了中医运用中药经验的广泛性。

中医认为气血逆乱失衡是中风的病机特点,中医治疗缺血性脑卒中主要以补气益气、活血逐瘀、行气通窍、涤痰行气为法,与其主要病性血虚、气虚、痰、阳虚、气滞、阴虚等相符,药物大多归肝、脾、心经,与其主要病位相一致。选取用药频次前 10 的高频中药,其中活血化瘀药有5味(川芎、丹参、红花、牛膝),补虚药有 3 味(甘草、当归、黄芪),平肝息风药有 1 味(地龙),清热药有 1味(赤芍),开窍药有 1 味(石菖蒲)。对使用频数较高的前50位药的药谱分析,其配伍绝大部分涉及活血化瘀成方,以当归、川芎、桃仁、红花为核心,古方有身痛逐瘀汤、补阳还五汤等,其治法也广泛存在与现代方中。

川芎有活血行气、祛风止痛的功效,属活血化瘀药下属分类的活血止痛药。昔人谓川芎为血中之气药,有辛散、解郁、通达、止痛等功能。常见的药物组合有红花→川芎,黄芪+赤芍→川芎,桃仁+川芎→红花等。

甘草擅长补脾益气,也以清热解毒、祛痰止咳、调和诸药等功效常见于处方中。

当归有补血活血、调经止痛的功效。缺血性中风患者若为瘀血内阻,此时必须活血、补血。常见的药物组合有黄芪→当归,桃仁+当归→红花,地龙+当归→川芎。

黄芪升阳益气,益卫固表,利水消肿等,为补气之佳品,可以补气以行血。常见的药物组合有黄芪→川芎,黄芪→当归,黄芪+赤芍→川芎,地龙+黄芪→川芎。

地龙活血补血,通经络,清热定惊、通络、平喘、利尿的功效,故可帮缺血性中风患者疏通脑络、调整气血。常见的药物组合有鸡血藤→地龙,桃仁+地龙→红花,地龙+当归→川芎。

其他功效在成方中,宣窍安神成方以石菖蒲、远志、郁金为核心,石菖蒲、郁金用于语言意识障碍,远志用于祛痰宣窍和安神。代表成方有《古今名医临证金鉴·中风卷》的宣窍醒神汤,开窍药还常用各类具有行气作用的芳香类中药材。

平肝息风成方以天麻、地龙、全蝎、钩藤等为核心,常见配伍有地龙-天麻,地龙-僵蚕,钩藤-僵蚕等,平肝潜阳、滋阴息风止痉。另地龙常与水蛭联用,增强活血破瘀之功。

化痰息风通络成方以半夏、胆南星、白附子为主,化痰祛湿、通络除痉,白附子适用于寒湿头痛、四肢酸痛麻痹等症。

综上所述,本研究基于数据挖掘方法对《中风病良方大全》中缺血性脑卒中处方的用药频次进行统计,从药对、3味药组等多个角度进行关联规则分析,挖掘了中医药治疗缺血性脑卒中的组方配伍规律。本研究为从性味归经和功效深入挖掘缺血性脑卒中等的辨证用药规律,基于数据挖掘技术构建了缺血性脑卒中常用药物关联模型、用药聚类,方法科学有效,为临床辨证用药提供了可靠的依据,对于临床用药指导与应用具有重要价值。

参考文献:

[1]王隴德,刘建民,杨弋,等.我国脑卒中防治仍面临巨大挑战——《中国脑卒中防治报告2018》概要[J].中国循环杂志,2019,34(2):105-119.

[2]陈孝男,杨爱琳,赵亚楠,等.缺血性脑中风的发病机制及其常用治疗中药研究进展[J].中国中药杂志,2019,44(3):20-30.

[3]Guan T,Ma J,Li M,et al.Rapid transitions in the epidemiology of stroke and its risk factors in China from 2002 to 2013[J].Neurology,2017(89):53-61.

[4]周德生.中风病良方大全[M].太原:山西科学技术出版社,2016:80.

[5]钟赣生.中药学[M].北京:中国中医药出版社,2019.

[6]国家药典委员会.中华人民共和国药典[M].北京:中国医药科技出版社,2018:60.

(收稿日期:2021-09-22)

猜你喜欢
用药规律关联规则数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于数据挖掘的龙华医院风湿科治疗干燥综合征用药规律与特色分析
中医药治疗儿童过敏性紫癜辨证及用药规律分析
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书