基于数据挖掘和网络药理学的新冠肺炎预防方药组方规律和作用机制研究*

2020-06-20 05:09马丽娟暴正瀚雷乐庭王逸飞朱振宇乔延江郑燕飞吴志生
世界科学技术-中医药现代化 2020年3期
关键词:苍术藿香防风

马丽娟,暴正瀚,雷乐庭,王逸飞,朱振宇,王 济,王 琦,乔延江,郑燕飞**,吴志生**

(1.北京中医药大学中药学院 北京 102488;2.北京中医药大学房山医院北京 102400;3.北京中医药大学中医学院 北京 100029)

2019年12月,我国湖北省武汉市爆发了新型冠状病毒(2019-nCoV)感染的肺炎,截至2020年2月27日24时,全国确诊案例达78631例,人民健康、经济发展和社会稳定均受到严重威胁。如何有效救治新型冠状肺炎是当前亟待攻克的关键难题。主动健康是遵循国家中长期科技发展规划纲要的重要理念之一。国家卫生健康委员会针对此病症先后印发了6版《新型冠状病毒感染的肺炎诊疗方案》[1-4],在推荐采用中医药方剂进行新型冠状病毒肺炎的治疗的同时,也提供了多种预防方剂及中成药。全国各省市也相继出台了各自的诊疗方案及推荐处方。《中医药有效方剂筛选研究取得阶段性进展》中明确指出,中医治疗方案在山西、河北、黑龙江、陕西4个省份试点的总有效率可达90%以上,可见中医治疗该病疗效明确[5]。中国中医科学院张伯礼院士也明确指出,以整体观和辨证论治为特色的中医诊疗方案在病毒感染疾病治疗中的优势[6]。

数据挖掘[7]和网络药理学[8-9]方法在中医药组方规律和作用机制中应用广泛。周添奕等[10]采用数据挖掘方法发现中药治疗急性胃肠损伤以承气汤与香砂六君子汤为主,并且发现了治疗急性胃肠损伤的常用穴位。严瑶琦等[11]采用数据挖掘结合网络药理学方法研究了痛风湿热蕴结证用药规律和作用机制。尕藏措[12]采用数据挖掘的方法分析了藏族医治疗HAPC高频次使用藏族药,并进一步通过网络药理学研究了其作用机制。本研究拟以全国各省市针对新冠肺炎公布的预防方药为研究载体,采用数据挖掘及网络药理学方法,研究中医药预防新冠肺炎组方规律和作用机制,为2019-nCoV新冠肺炎的预防提供借鉴,同时为主动健康指导方针下的未病先防研究提供方法指导。

1 资料与方法

1.1 数据来源

本研究中的处方来自于国家卫生健康委员会以及各省市针对2019-nCoV所致的新型冠状病毒肺炎公布的各版《新型冠状病毒感染的肺炎诊疗方案》中包含的中医预防方剂和预防用中成药;全国各省市针对新冠肺炎官方公布的预防方剂和预防用中成药;国医大师王琦院士等主编的《新型冠状病毒肺炎中医诊疗手册》[13]中针对新冠肺炎拟定的预防方剂和预防用中成药,选取口服剂型,筛去注射剂,熏香剂等其他剂型。

1.2 数据整理

查询中成药所包含的中药药味,将整理好的方剂录入Excel表格,并对录入数据进行双人核对,保障数据的准确性。根据《中华人民共和国药典》规范药名,如将“银花”统一为“金银花”,“山银花”不计入“金银花”。对采用不同炮制方法的同一药物,均不计炮制方法,如“生黄芪”“炙黄芪”统一命名为“黄芪”。相同组分,不同剂型的方剂只录入一次,如“藿香正气水”“藿香正气胶囊”,按方剂组分只录入一次。

1.3 数据提取

将数据库中的方剂按一列单独提取出来,并对方剂中的每一味中药不计种类的罗列,以便于后续频数分析。将每一味中药按名称作为变量列,对每一个方剂进行二分类处理,即若方剂中含有某一味中药,就在与那味中药所在的变量列的对应的位置记为“T”,否则记为“F”,整理成方剂与其所含中药的二分类变量形式的表格格式数据。

1.4 基于关联规则的新冠肺炎预防方药组方规律研究

1.4.1 组方特点分析

本研究采用IBMSPSSStatistics 20.0软件,将整理过的新冠肺炎中药治疗方剂和治疗中成药的中药组分按用药频次逐个进行统计分析。并设计出现频次和出现频率两个指标综合分析新冠肺炎治疗方药组方规律,揭示新冠肺炎治疗方药内在中药配伍规律。进一步采用IBM SPSSStatistics 20.0软件对筛选过新冠肺炎治疗方药中单味中药出现在方剂中的频率,筛选出高频中药组分,并显示每一味药的出现频次,出现频率。在此基础上,依据《中华人民共和国药典》(2015版)对所得药味的性、味、归经规律进行分析。

1.4.2 网络图分析

关联性分析是针对两味及以上高频中药组分在配方中的配伍联系,故将提取到的二分类变量形式的表格格式数据进行重新整理,筛去经处理后仅剩一味中药的配方,同时删去高频中药组分以外的中药组分的变量列,再利用IBM SPSSModeler 18.0软件对筛选出来的高频中药组分进行关联网络图分析,分析高频中药之间的关联性。

1.4.3 关联规则分析

为了进一步揭示高频中药组分之间的关联规则,利用IBMSPSSModeler 18.0软件所提供的Apriori算法对筛选出的高频中药组分进行关联度分析。

1.5 基于网络药理学的新冠肺炎预防方药高频药物作用机制研究

1.5.1 高频药物化合物筛选和相应靶点收集

以通过关联规则得到的核心药对和药组为研究载体,采用BATMAN-TCM数据库,设定预测候选目标(包括已知目标)的得分不小于每个成分得分分界的20%,置信区间设置为95%,获取核心药味所含化合物及其相应靶点。

1.5.2 “疾病-成分-靶点”网络的构建

采用BATMAN-TCM在线分析系统,将核心高频药组的活性成分及其作用疾病和靶点信息作为“节点(node)”,以“边(edge)”作为活性成分和作用靶点的相互关系,构建核心高频药组的“疾病-成分-靶点”网络,可视化呈现靶点与靶点之间直接、间接的调控关系。

1.5.3 基因富集分析和通路注释研究

基因本体(gene ontology,GO)是注释基因及其表达产物的常用方法。通过GO分析可以帮助发现新的研究方向。京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)可对药物作用靶点或差异表达基因进行信号通路分析。采用BATMAN-TCM在线分析系统,通过GO富集和KEGG通路分析,研究核心药对和药组生物信号通路等生物学信息,阐明其作用机制。

2 结果与讨论

2.1 新冠肺炎预防方药用药频次分析

统计新冠肺炎预防方药63个预防方剂和中成药,其中涉及药物共105种,药物出现频次为475。使用频次大于10的药物一共14味,共出现278次,占总用药次数的58.5%,将这14味中药作为高频药物。依据《中华人民共和国药典》,表1展示了该14味中药的频数、频率,性、味,归经等基本信息。由表1可知,频率排名靠前的中药味为甘草、黄芪、金银花、藿香、苍术、防风、白术。

2.2 新冠肺炎预防方药性味归经研究

由表1可知,统计所含药味的性、味及归经信息,高频药味中除苍术、白术和防风外,归经中均包含肺经,其次是归脾、胃经,这符合现代医学中以肺为主的呼吸系统疾病。新冠肺炎归属中医“疫病”范畴,属中医温病学中感受疫、毒邪的一类传染疾病。病因主要归结于温燥之邪久伏于肺,再加寒湿之气袭肺,导致邪热壅肺、邪毒闭肺。据统计发现,新冠肺炎预防方药性味主要以“甘、辛、苦,温”为主。肺为人体气机运行的主要脏器,肺之气机,重在宣降,而预防则以补气为主,宣降为辅,主以甘味药以升正气,辛、苦药味一升一降、一开一泄,调和人体气机。研究表明,辛开苦降甘调常作为癌症晚期用于提高人体机能的组方思路。

2.3 基于关联规则的新冠肺炎预防方药组方规律研究

对整理后的二分类变量形式的表格格式数据进行关联网络图分析,结果如图1所示。为了展示高频中药组分之间的关联性强弱,分析新型冠状病毒肺炎预防机制的核心药对与核心药组,本次分析对关联网络图进行分层展示。鉴于14味高频中药组分关联频数的分布情况,将0~20的区间为包括全部关联频数的数据空间,并按高频中药组分的关联性将其分为三个层级,即显著性关联层、一般性关联层和非显著性关联层。其中,显著性关联层为关联性较强的60%~100%的数据空间(关联频数范围为12~20);一般性关联层为关联性较弱的20%~60%的数据空间(关联频数范围为4~12);非显著性关联层为关联性很弱的0~20%的数据空间(关联频数范围为0~4),且每个层级区间包括上限而不包括下限。由于非显著性关联层的实际意义不大,而且会对网络图中其他层级产生干扰,故将非显著性关联层滤去,并对显著关联与一般关联进行区分,分别以粗实线、细实线在网络图中表示。由此可得,以甘草和黄芪为核心的药物配伍关系,与其有显著性关联的药物涵盖了白术、桔梗、防风、金银花、连翘和藿香。另外,网络图也显示“防风、白术”和“藿香、苍术”,在无甘草和黄芪参与时仍为显著性相关的药物。

表1 新冠肺炎预防方药高频中药基本信息

图1 14味高频中药组分关联网络图

运用Apriori算法对整理后的二分类变量形式的表格格式数据进行关联规则分析。设置关联规则提取的条件支持度下限为20%,规则置信度下限为0.6,提升度下限为1。进一步进行提取关联规则中的中药药对规则和中药药组规则,得中药药对规则14条,中药药组规则15条。将分析结果按支持度降序排序,药对结果如表2所示,由表可知,所得支持度排名前五的是(防风→黄芪)、(黄芪→白术)、(防风→白术)、(甘草→白术)和(藿香→苍术)。防风与黄芪配伍常作为解表药物用于表证的治疗。防风得黄芪,驱邪不伤正;黄芪得防风,固表不留邪。防风和白术也常配伍使用,用于提高免疫力,如一些常见的过敏性疾病,鼻炎、哮喘等。藿香和苍术均为芳香中药,藿香味辛,性微温;苍术味辛、苦,性温,归肺、脾、胃经,两者合用,辛温解表,宣降气机,现代常配伍用于呼吸道疾病。

表3展示的是基于关联规则的新冠肺炎预防方药药组排序结果。由表3可知,综合支持度、置信度和提升度3项指标,考虑甘草调和诸药的作用,综合排名靠前的药组为防风→白术,黄芪。防风、白术和黄芪为中药经典方剂玉屏风散的组成成分,常用于解表。清代伤寒学家柯韵伯有云:“夫以防风之善驱风,得黄芪以固表,则外有所卫,得白术以固里,则内有所据。风邪去而不复来,此欲散风邪者,当倚如屏,珍如玉也。”研究表明,其对免疫系统具有重要调节作用,可作为预防药物提高机体免疫力,起到未病先防的功效。汪琼等对国医大师解表药的组方规律进行分析,发现防风常与白术、甘草、黄芪等药同用,据统计防风→黄芪、防风→白术、防风→甘草是高频次药对,频次最高的药组是白术→黄芪、白术、甘草。并且,研究显示黄芪和白术同时使用时,有100%的几率会同时出现防风[14]。

2.4 基于网络药理学的新冠肺炎预防方药高频药物作用机制研究

基于以上研究结果,发现防风、白术和黄芪不仅是高频药对,而且三者常作为药组出现。进一步基于BATMAN-TCM在线分析系统(http://bionet.ncpsb.org/batman-tcm/index.php),设定预测候选目标(包括已知目标)的得分不小于每个成分得分分界的20%,置信区间设置为95%,用于进一步的生物信息学分析。防风、黄芪和白术共涉及99个有结构信息的化合物,其中黄芪70个,其中35个无结构信息;防风71个,其中19个无结构信息;白术26个,其中15个无结构信息。设定调整P值小于0.05,防风、黄芪和白术三者所含化合物及其对应靶点的网络图如图2(a)所示,防风、黄芪和白术潜在靶点所涉及的疾病共9种,主要包括呼吸系统疾病(Respiratory diseases)、阿尔茨海默症、药物依赖、末梢疼痛(Pain,unspecified)等。

表2 基于关联规则的新冠肺炎预防方药高频药对

表3 基于关联规则的新冠肺炎预防方药高频药组

图2 “防风、黄芪和白术”作用机制

进一步进行KEGG分析,防风、黄芪和白术对应潜在靶点富集的生物通路39条,对应靶点数在20以上的有21条,如图2(b)所示,主要包括各种氨基酸代谢,如脯氨酸、络氨酸、丝氨酸、苏氨酸、亮氨酸、异亮氨酸、丙氨酸、天门冬氨酸和谷氨酸等的代谢,以及嘧啶代谢等基础代谢过程,从而提高机体免疫功能。此外,还参与体液调节,如钙信号通路等。图(c)和(d)分别展示的是防风、黄芪和白术所涉及的生物过程和分子功能,防风、黄芪和白术除共同参与一些基础代谢过程外,还可直接参与机体免疫功能调节过程,可见防风、黄芪和白术通过介导多个生物通路共同维持机体正常功能,其中以调节基础代谢为主。

除防风、白术、黄芪和甘草外,藿香和苍术是高频药对。采用Batman分析网站,设定预测候选目标(包括已知目标)的得分不小于每个成分得分分界的20%,置信区间设置为95%,用于进一步的生物信息学分析。苍术和藿香共涉及75个有结构信息的化合物,其中苍术26个,藿香49个,对应靶点共2339个。设定调整P值小于0.05,苍术和藿香化合物及其对应靶点的网络图如图3(a)所示,由图可知,苍术和藿香潜在靶点所涉及的疾病共4种,主要包括呼吸系统疾病(Respiratory diseases)、乳腺癌(Breast cancer,)、前列腺癌(Prostate cancer)、末梢疼痛(Pain,unspecified)等,结果与防风、黄芪和白术所涉及的疾病较为一致。

进一步进行KEGG分析,苍术和藿香对应潜在靶点富集的生物通路40条,对应靶点数在15及以上的有22条,如图3(b)所示,与防风、黄芪和白术相比,除包含一些基础代谢(氨基酸代谢)和体液代谢(钙信号通路)外,藿香和苍术药对还包括一些炎症信号通路,如炎症介质调控、AMPK通路、HIF-1通路等。这也与藿香和苍术常作为解表药物用于流行性感冒的预防和治疗相一致。图3(c)和3(d)分别展示的是苍术和藿香所设计的生物过程和分子功能,苍术和藿香涉及的生物过程和分子功能与防风、黄芪和白术结果较为一致,共同参与一些基础代谢过程外,还可直接参与机体免疫功能调节过程,可见苍术和藿香也是通过多个生物通路的介导共同维持机体正常功能,侧重于炎症反应的介导。

3 结论

图3 “苍术和藿香”作用机制

本研究采用数据挖掘和关联规则分析方法,研究63个官方公布的新冠肺炎预防方药,发现14味高频中药,除甘草外,排名靠前的是黄芪、金银花、藿香、苍术、防风和白术。综合评价14个高频药对和15个高频药组,显示“防风、白术和黄芪”和“藿香和苍术”为高频核心药组。网络图也显示“防风、白术”和“藿香、苍术”,在无甘草和黄芪参与时仍为显著性相关的药物。防风、白术和黄芪为中药经典方剂玉屏风散的组成成分,防风得黄芪,驱邪不伤正;黄芪得防风,固表不留邪,针对新冠肺炎的“湿邪犯肺、邪热壅肺、邪毒闭肺”病机,具有“扶正祛邪”之功。藿香和苍术均为芳香药物,辛散之功较强,可助肺气宣降,从而发挥预防新冠肺炎的作用。

进一步采用网络药理学方法,对两个高频核心药组作用机制进行分析,发现“防风、白术和黄芪”主要通过干预多种氨基酸(脯氨酸、络氨酸、丝氨酸、苏氨酸、亮氨酸、异亮氨酸、丙氨酸、天门冬氨酸和谷氨酸)代谢、嘌呤代谢等基础代谢途径发挥预防作用,而“藿香和苍术”除基础代谢外,还通过参与炎症相关生物过程(炎症介质调控、AMPK通路、HIF-1通路等)发挥预防治疗作用。本研究详细讲解了新冠肺炎预防方剂组方规律和核心高频药组,并阐释了其作用机制,拟进一步通过其他方法对所得核心高频药组和关键通路进行验证,为新冠肺炎的主动预防和治疗提供参考。

猜你喜欢
苍术藿香防风
中暑后别乱喝藿香正气水
基于指纹图谱及多成分含量测定快速筛查苍术混伪品*
港口大型机械防风安全发展形势及防风安全体系建立
藿香
有口臭用藿香煎汤漱口
大楼的防风攻略
有口臭用藿香煎汤漱口
HPLC测定苍术中的3种成分研究
Regularity of Wind-dispelling Medication Prescribed by LI Dong-Yuan: A Data Mining Technology-based Study
苍术行情疲软运行