王梦瑜,邵欣欣 ,李谨彤,韩 文,任 夏,付先军,4*
1山东中医药大学中医文献与文化研究院,济南 250355;2山东中医药大学青岛中医药科学院海洋中药研究中心,青岛 266000;3山东省中医药组学工程技术研究中心;4山东中医药大学中医药经典理论教育部重点实验室,济南 250355
近年来,中药抗菌研究受到国内外学者的广泛关注,文献报道显示,许多中草药在抗菌抗病毒以及逆转耐药性方面具有确定的活性作用[1,2],中药抗菌研究已经成为中药研究领域的热点之一,至2019年为止,国家针对中药在抗菌领域的研究投入资金约为1.185 3亿元,涉及多项面上项目及青年基金[3]。大部分中药抗菌活性研究主要集中于单味中药、中药的有效部位及成分抗菌活性的筛选,虽然有文献报道对抗菌中药的属性进行频数统计研究,初步发现具备苦寒属性的中药有较好的抗菌效果[4],但是并未明确抗菌中药属性分布规律以及物质基础和结构特征[2]。
因此,本研究拟采用文本挖掘及化学信息学的方法,进行抗菌中药分布规律及影响因素研究,以期明确抗菌中药属性及其相关成分的结构特征,为抗菌中药的活性筛选及实验研究提供思路及参考。
本研究以中国知网(CNKI)数据库为数据来源,以“(SU=‘抗菌’+‘抑菌’) and(KY=‘中药’+‘草药’)”为检索式。其中,文献的纳入标准:(1)必须是实验性论文;(2)实验步骤的各项信息较完整;(3)有明确的抑菌或抗菌指标,如抑菌圈直径、最小抑菌浓度等;(4)实验对象必须是中药,或者中药提取物。排除标准:(1)实验对象为中药复方或中西药联用的文献;(2)综述论文;(3)实验数据有错误。
数据预处理方法分为四步:第一步,将从CNKI中检索到的满足条件的文献保存到文件夹中,形成原始文献;第二步,创建Excel表格,设置编号、中药名、提取方法、提取溶剂、试验方法、菌种及数量、是否有效(有效无效依据原文数据标准判定)、抑菌圈直径、最小抑菌浓度、参考文献等字段,仔细阅读原始文献并将内容分类填入表格,形成原始数据;第三步,对中药名、提取方法、试验方法、菌种名等进行统一规范的标准化处理:①中药药名标准化及药性信息来源为《中华人民共和国药典》2015版[5]与《中华本草》[6],功效标准化参照《中药功效学》[7],将四字联合词组一分为二以区分直接功效与间接功效,使各功效独立,继而分类统计。②微生物的种属名称及革兰染色信息主要依据《伯杰氏细菌鉴定手册》第八版中文版[8]。③实验数据单位标准化为统一单位(抑菌直径统一为mm,最小抑菌浓度统一为mg/mL)。④第四步,将每条数据中药相关信息导入表格中,包括中药的来源、形态、生态环境、毒性、四气、五味、归经、功能主治、科属等。⑤将最终整理好的数据导入数据库,以供后期的数据挖掘与信息分析。根据上述方法,每条活性数据基本信息点包括:编号、中药名、提取方法、提取溶剂、试验方法、菌种及数量、是否有效、抑菌圈直径、最小抑菌浓度、科属、药性、参考文献等。
1.3.1 共现分析与频数分析
运用共现分析法研究有效抗菌中药药物属性的内在联系,将标准化的有效中药药物属性导入vosviewer1.6.13[9]进行共现与聚类分析,绘制有效中药药物属性的共现知识图谱。
1.3.2 网络可视化
将中药与菌种的关系导入网络可视化软件cytoscape3.4.0[10],构建中药-菌种的网络图。其中中药、菌种分类、菌种被表示为网络中的节点(node),它们之间的相互联系以边(edge)表示。
1.3.3 分子骨架的提取及分子描述符的计算
筛选出有效抗菌中药,从TCMD(2009)[11]与TCMSP(http://tcmspw.com/tcmsp.php)、TCMID(http://119.3.41.228:8000/tcmid/),获取有效中药的化学成分信息,从PubChem(https://pubchem.ncbi.nlm.nih.gov)中得到相关化学成分结构信息。
进一步采用DataWarrio V05[12]进行分子骨架的提取,DataWarrio是一个专门用作化学和生物数据可视化及分析的工具,能够将动态图形视图和交互式行过滤与化学智能相结合,且支持在创建进化库时枚举组合库。本研究中将相关中药成分smiles格式的分子骨架导入其中,基于结构片段的相似性比对(fragment-based similarity measure)计算其化学相似性并进行分子骨架的分析与提取,得到抗菌中药中所蕴含的抗菌成分的优势骨架。
1.3.4 分子对接
对含优势骨架的化合物采用discovery studio 2017R2[13]进行ADMET预测,得到Human Intestinal Absorption结果,筛选Absorption_Level为0与1,且Solubility_Level值最优的205个化合物,进行分子对接,探究抗菌机制。借助discovery studio 2017R2中Libdock算法将筛选出的化合物分别与细菌耐药性相关靶点蛋白β-内酰胺酶(PDB ID:1FCO,对接区域:76.942574、5.673936、29.677630、9.7)以及抗真菌靶点甾醇14α-脱甲基酶(PDB ID:1X8V,对接区域:-15.291555、-2.006965、70.111845、9.1)进行对接。设置:Number of Hotpots为100;Max Hits to Save设置为1;Docking tolerance 为0.25;minimum LibDockscore为50;Apolar SASA Cutoff 为15;Polar SASA Cutoff 为5;Surface Grid steps 为18;Conformation method 为FAST。
根据检索式,共检索出1 687篇文献,按照筛选标准共剔除文献1 073篇,满足条件纳入分析的文献共614篇,从文献中共整理出38 851条数据,涉及1 289种中药,其中有抗菌活性的中药为879种。分析其抗菌活性分布情况见图1,我们可以看出黄连的总条数最多,高达1 462条;其次是黄芩,达1 439条;再次是金银花,共867条;其余依次是四季青、连翘、大黄、黄柏、五倍子、鱼腥草、蒲公英。其中五倍子活性比例最高,达到96.65%,次之为黄连,为95.08%,第三是黄芩,为94.93%,其余依次为大黄、连翘、金银花、鱼腥草、蒲公英、黄柏、四季青。
图1 高频抗菌中药抗菌活性分布图Fig.1 Distribution of antibacterial activity of CMs with high frequency
革兰氏染色是一种常用于细菌镜检的染色方法,根据染色反应可分为革兰阳性菌和革兰阴性菌,染色反应反映了细菌细胞壁基本结构的差异,也与抗菌药物的敏感度及鉴定相关[14]。本文按照革兰氏染色法,对抗菌实验中的菌种数据进行分类,分析其活性分布情况(见表1),发现中药抗革兰阴性菌的实验条数最多,但是有活性占比最高的是对革兰阳性的实验数据,达到84.74%,最低的是真菌,只有35.40%。
表1 中药抗菌活性分类Table 1 Classification of antibacterial activity of CMs
为进一步挖掘抗菌中药与其对应菌种之间的关系,构建了中药-菌种的网络图(图2)。其中中药、菌种被表示为网络中的节点(node),它们之间的相互联系以边(edge)表示。结果显示,中药-菌种的网络图共有节点1 117个(中药相关节点845个,菌种相关节点272个),边6 999条,节点平均度为12.401,其中抗菌中药与革兰氏阴性菌之间边的条数最多,其次为真菌,再次为革兰氏阳性菌,与表1抗菌实验数据条数是一致的。
图2 抗菌中药活性分布图Fig.2 Antibacterial activity distribution map of traditional Chinese medicine注:节点大小代表度数高低Note:The node size represents the degree.
关键节点反映出各菌种与中药相关关系的强弱,由节点度数筛选得出排名前十的关键节点,包括金黄色葡萄球菌、大肠埃希菌、新型隐球菌、铜绿假单胞菌、福氏志贺菌、伤寒杆菌、白假丝酵母菌、结核分枝杆菌、变形杆菌(种不详)、宋内氏志贺菌(见表2),得到抗菌实验的代表菌种,进而筛选出抗菌活性频数前5的高频中药。总体而言,清热类中药如黄连、黄芩、金银花、连翘、白头翁对大多数代表菌都有良好的作用。除此之外,理气类中药如厚朴、丁香、月季花也展现出了广泛的抗菌效果。两种真菌的代表中药中,利湿功效的中药占比较大。
表2 代表菌种及高频有效中药分布Table 2 Representative strains and related antibacterial CMs with high frequency
根据抗菌中药活性条数中的有效数据,按照菌种分类将有效抗菌中药分为三类:抗革兰阴性菌有效中药、抗革兰阳性菌有效中药和抗真菌有效中药。将中药属性信息导入vosviewer得到有效抗菌中药的属性共现图。通过共现分析,挖掘中药的宏观属性之间的内在联系。各类抗菌中药的中药属性共现情况如图3所示。
图3 抗菌中药宏观属性共现图Fig.3 Co-occurrence map of antibacterial CM properties注:A:抗革兰阳性菌中药属性共现分布图; B:抗革兰阴性菌中药属性共现分布图;C:抗真菌中药属性共现分布图。节点为中药的性味、归经等药物属性,节点间连线表示各属性之间的关系。节点与字体的大小取决于节点的权重,权重越大,节点与字体就越大,节点之间的连线表明节点共现关系,节点之间的距离体现了共现关系的远近,节点的颜色表示不同的聚类关系。Note:A:Properties co-occurrence map of traditional Chinese medicine against Gram-positive bacteria;B:Properties co-occurrence map of traditional Chinese medicine against Gram-negetive bacteria;C:Properties co-occurrence map of traditional Chinese medicine against fungal.The nodes are the properties of traditional Chinese medicine,such as nature and flavour,channel tropism.And the edge represents the relationships between the properties.The size of the node and the font depends on the weight of the node.The greater the weight,the larger the node and the font.The edge between the nodes indicates the co-occurrence relationship of the nodes.The distance between the nodes reflects the distance of the co-occurrence relationship.The color of the node represents different clustering category.
在针对于抗菌中药的属性研究中发现,苦、肝两种属性是抗菌中药中的优势属性(见图3)。相比于抗革兰阳性菌和抗革兰阴性菌的中药属性的共现结果,发现抗真菌的中药属性辛味与祛风更为突出(见图3C)。其次,在抗革兰阳性菌中,寒性与清热解毒更为相关(见图3A),而在抗真菌中寒性与清热更为相关,与解毒的相关性次之(见图3C)。在抗革兰阴性菌的中药属性中,寒性与清热解度的共现较差,与利水更为相关(见图3B)。提示寒性在不同菌之间发挥着不同的作用,这与传统概念的“寒性-清热解毒”的关联思维稍有出入。
筛选出有效抗菌中药共845味相关的抗菌中药化学成分为13 802个。将收集到的化学成分进行基于结构片段的相似性比对(fragment-based similarity measure),计算其化学相似性并进行分子骨架的分析与提取,以相似度大于90%为阈值,选择相似个数大于25的化合物类别进行分析,发现化合物除却初生物质(氨基酸、长链脂肪酸),有关于中药抗菌初生物质之间的化合物主要集中于四环三萜,五环三萜以及黄酮类化合物(见图4)。化合物相似性比对结果发现,四环三萜,五环三萜以及黄酮类化合物是抗菌中药中存在相似度最高,且数量优势较高的化合物。
图4 化合物结构相似比对图Fig.4 Compound structural similarity comparison chart
为进一步探寻抗菌中药化学成分中所包含的优势骨架,将化合物进行Murcko scaffold特征骨架计算,计算完成进行汇总得到化合物的骨架特征信息如表3所示,可以发现化合物中top5的占比分别是黄酮骨架、芳烃、五环三萜、四环三萜以及香豆素类化合物,其中因涉及较多的氨基酸,脂肪酸等初生物质,导致苯环的占比量较高。
表3 化合物优势分子骨架Table 3 Advantage molecular skeleton of compound
分子对接结果数据显示(见图5,6),针对于细菌耐药靶点β-内酰胺酶(ampC),黄酮以及香豆素能与其结合,提示中药黄酮以及香豆素可能在逆转细菌耐药性方面能发挥一定作用,但是其数量以及能量上并不占优势,而三萜类化合物未能与其结合,提示三萜类骨架化合物可能并不是针对细菌耐药靶点β-内酰胺酶。
而针对于甾醇14α-脱甲基酶(cyp51),三萜类化合物对接结果较好,由于cyp51是真菌细胞膜生物合成中的关键酶,结果提示中药三萜类化合物可能具备较好的抗真菌活性。从能量打分值来看,中药化学成分中四环三萜以及五环三萜与cyp51结合能打分最高,黄酮次之,香豆素较差。
图5 中药化合物与cyp51分子对接结果图Fig.5 Molecular docking result of cyp51 and dominant compound注:A:CYP51、ampC与优势化合物分子对接结果的频数统计;B:CYP51分子对接结果能量打分;图C:黄酮类化合物与CYP51对接结果图;D:为香豆素类化合物与CYP51对接结果图;E:四环三萜类化合物与CYP51分子对接结果图;F:为五环三萜化合物与CYP51对接结果图。Note:A:Frequency statistics of molecular docking results of CYP51,ampC and dominant compounds;B:Energy score of CYP51 molecular docking result;C:Molecular docking diagram of flavonoids and CYP51;D:Molecular docking diagram of coumarins and CYP51;E:Molecular docking diagram of tetracyclic triterpenoid compounds and CYP51;F:Molecular docking diagram of pentacyclic triterpene compounds and CYP51.
植物之间存在的亲缘关系,同科属之间的初生物质以及次生物质之间具备较高的相似性[15]。结合分子相似性比对结果以及分子骨架分析结果,最终确定黄酮、四环三萜、五环三萜、香豆素为抗菌中药优势骨架,根据得到的分子骨架,对TCMD(2009)进行搜寻,并统计其植物来源,将植物来源进行科属标准化,导入Flourish进行可视化,得到“化合物骨架-科属”分布图。结果发现具备黄酮骨架的化合物主要分布于豆科,菊科,芸香科和唇形科;具备四环三萜骨架的化合物主要分布于百合科,葫芦科,萝藦科,毛茛科,夹竹桃科,豆科,茄科,薯蓣科,五加科;具备五环三萜类骨架的化合物主要分布于豆科,菊科,木通科;具备香豆素骨架的化合物主要分布于伞形科,芸香科,豆科。这些作为抗菌中药化学成分中的优势骨架,通过植物亲缘性出现规律性分布,这种规律性可用于指导抗菌中药的筛选与开发(图7)。
图6 中药化合物与ampC分子对接结果图Fig.6 Molecular docking result of ampC and dominant compound注:A:ampC与香豆素类化合物对接结果图;B:ampC与黄酮类化合物对接结果图。Note:B:Molecular docking diagram of ampC and coumarins; C:Molecular docking diagram of ampC and flavonoids.
图7 抗菌中药优势化合物科属分布图Fig.7 Distribution map of dominant compound from antibacterial of CMs in family genus
本研究发现具备抗菌活性的中药多为苦,寒,归肝经的中药,同时发现辛、祛风在抗真菌中药中具备突出地位,可能与中医理论中治疗真菌性的皮肤感染的用药规律一致[16]。通过化合物相似性比对以及药物优势骨架的统计与计算,发现具备黄酮、三萜、香豆素骨架的化合物在抗菌中药化合物中所占的比重最高,提示这三类物质可能具备突出的抗菌活性。进一步通过对优势分子骨架的筛选以及分子对接,发现相对于黄酮以及香豆素类化合物,三萜类化合物与抗真菌相关靶点甾醇14α-脱甲基酶(CYP51)打分值更高,结合度更好;而黄酮以及香豆素能与细菌耐药靶点β-内酰胺酶(ampC)结合。
中药抗菌机制主要有四个方面,分别是破坏细菌的结构、影响细菌内部物质的合成和抑制酶活性、以及逆转耐药性等[17]。β-内酰胺抗生素是临床常用的一类抗生素,由于临床长期、大量的使用,导致其β-内酰胺酶(ampC)在细菌中的表达量升高,从而诱发细菌耐药性出现[18,19]。本论文研究结果显示抗菌活性中药中黄酮以及香豆素成分可以与细菌耐药靶点β-内酰胺酶(ampC)结合,提示这两了中药成分可能在逆转细菌耐药性方面能发挥一定作用,但是其数量以及能量上并不占优势,需要进一步的实验结果进行验证。
甾醇14α-脱甲基酶(cyp51)是真菌细胞膜生物合成中的关键酶,催化甾醇前体14α-甲基羟基化反应,生成细胞膜的重要成分麦角甾醇,是抗真菌药物的主要作用靶点之一[20]。抗真菌药物通过含氮杂环上的N原子与靶蛋白上的血红素-铁活性中心配位结合,阻止血红素与氧原子结合,抑制羊毛甾醇 C14α位的甲基羟基化反应,从而阻止真菌细胞膜成分甾醇的合成,抑制了病原菌的生长[21]。分子对接结果数据显示,针对于甾醇14α-脱甲基酶(cyp51),三萜类化合物对接结果较好,提示中药三萜类化合物可能具备较好的抗真菌活性,能量打分值显示三萜类化合物中四环三萜以及五环三萜与cyp51结合能打分最高,这可以为今后从中药中筛选抗真菌活性成分提供线索和参考。
本研究发现,抗菌活性中药在中药属性、成分分子结构,尤其是优势骨架方面都具有一定的表征特征,植物类中药不同优势骨架成分在科属的分布上也具有一定的分布规律,这些规律为今后抗菌中药及成分的活性筛选,尤其是耐药菌的逆转研究和抗真菌创新药物的研发等方面提供参考。