姚 慧,孙 涛,徐君南
1辽宁中医药大学研究生院,沈阳 116620;2辽宁省肿瘤医院,沈阳 110042
据统计,2020年,女性乳腺癌首次超过肺癌,成为全球最常见的癌症,约占新发癌症病例的11.7%[1]。我国乳腺癌的发病率也呈逐年上升且年轻化态势。目前乳腺癌主要治疗手段有手术、化疗、放疗、靶向治疗等,均会产生不同程度的副反应,影响患者预后。而中医治疗以其不良反应小、有效改善患者生存质量、延长患者生存时间的优势,在乳腺癌治疗中起着举足轻重的作用。
乳香(frankincense)为橄榄科植物乳香树BoswelliacarteriiBirdw.及同属植物BoswelliabhaurdajianaBirdw.树皮渗出的树脂,性辛、温,味苦,归心、肝、脾经,具有活血止痛、消肿生肌之效。没药(myrrh)是橄榄科(Burseraceae)没药属CommiphoraEngl.植物地丁树CommiphoramyrrhEngl.或哈地丁树CommiphoramolmolEngl.的干燥树脂[2],性平,味辛、苦,归心、肝、脾经,散瘀止痛、消肿生肌之效佳。乳香、没药配伍应用最早出现在《证治准绳》中的“乳香止痛散”中,临床上二者常以药对形式出现,相须为用,协同增效,为活血化瘀类常用中药。
目前有乳香、没药针对关节炎、乳腺增生、癌性疼痛的网络药理学研究,这些研究只是直观反映了化合物的靶点及通路之间的生物过程,尚没有深层次的对乳香、没药治疗乳腺癌进行网络药理学及相关验证研究。本文通过查阅《肿瘤方剂大辞典》等中医书籍,收集乳腺癌相关临床诊疗数据,挖掘药物配伍规律、核心药物等关联规则,得出中医治疗乳腺癌所使用药物中置信度最高的为“乳香-没药”药对。进而对乳香-没药药对展开网络药理学及分子对接研究,进一步明确乳香、没药活性成分及作用靶点,并分析其治疗乳腺癌的分子机制。
查阅《中华人民共和国药典临床用药须知·中药成方制剂卷》(中国医药科技出版社)、《肿瘤方剂大辞典》(中医古籍出版社)、《肿瘤良方大全》(安徽科学技术出版社)、《肿瘤良方大全》(山西科学技术出版社)、《肿瘤治疗名方验方》(人民卫生出版社),筛选出主治乳腺癌的临床医案,检出乳腺癌内服方共351首。
纳入标准:所选方剂均为中医药治疗乳岩(即乳腺癌)的临床药方,符合《中医内科学》[3]乳岩诊断;治疗处方为中药内服制剂且有明确的药物组成、剂量;文献中认定此方剂内服之疗效确切;治疗方法以中药为主。排除标准:中医临床诊断非乳岩的医案;临床症状及方药记录不全者;以针灸、贴敷等其他治法治疗者。
运用Apriori关联规则算法挖掘药对所有数据采用双人原则录入WPS Excel表格,并进行筛选、规范化命名、核查等,例如将忍冬花、二花、双花统一为金银花,元胡、元胡索、延胡统一为延胡索,粉甘草、粉草统一为甘草等,建立目标数据库。运用SPSS Modeler软件处理目标数据库内的中药,运用Apriori关联规则算法建立数据挖掘模型,得出置信度最高的药对。
决策树算法是一种离散函数的逼近方法,通过归类来解决数据特征。经数据预读,选择乳香作为因变量,其余频次≥12的84个中药作为自变量进入决策树模型的筛选过程,运用SPSS Statistics 22.0软件中的CHAID、CRT、QUEST决策树方法进行决策树模型分析。
通过检索中药系统药理学分析平台(traditional Chinese medicine systems pharmacology database and analysis platform,TCMSP)(http://lsp.nwsuaf.edu.cn/tcmsp.php)检索乳香、没药的化学成分,结合口服生物利用度(oral bioavailability,OB)≥30%和药物相似性(drug likeness,DL)≥0.18作为筛选条件,时间截止至2021年5月10日,筛选出活性成分较高的化合物并收集靶蛋白,并查阅相关文献作为补充。将上面收集到的靶蛋白在数据库UniProt(https://www.uniprot.org/)中进行校正,选择物种为人,用靶蛋白的简写表示,建立药物的靶点蛋白数据库。
在人类基因数据库Genecards(https://www.genecards.org/)中以“breast cancer”为关键词,检索出乳腺癌的相关靶基因,并与药对中活性成分靶基因进行映射对比筛选出共同靶点,则为药对活性成分治疗乳腺癌的靶点。
运用Cytoscape 3.7.1软件构建乳香-没药“化合物-靶点”网络并进行可视化分析。网络中各节点(node)分别代表活性成分和关键靶点基因;网络中边(edge)用来连接活性成分与关键靶点基因;连接到网络的节点以度值(degree)为单位进行表示。某节点与其他节点连接的边数越多,则说明该节点在网络中扮演的角色越重要,度值也越大。
利用Cytoscape 3.7.1软件中Bisogenet插件分别对乳香-没药与乳腺癌关键靶点进行蛋白网络互做分析(protein-protein interaction,PPI),通过Merge功能取二者交集,再用CytoNCA插件对网络中所有点的拓扑参数度值(degree)、接近中心性(closeness centrality,CC)和介度中心性(betweenness centrality,BC)进行分析,借助网络拓扑理念筛选网络中的关键节点,筛选标准为degree大于所有节点的2倍degree中位数,CC、BC大于所有节点对应值的中位数。
将关键靶点上传至David 6.8(database for annotation,visualization and integrated discovery)数据库(https://david.ncifcrf.gov/,Version 6.8),以人类为研究对象,进行GO(gene ontology)分析以了解靶点主要的作用过程,主要包括生物过程(biological process,BP),细胞组成(cellular component,CC),分子功能(molecular function,MF)三方面,并且对关键靶点进行KEGG(kyoto encyclopedia of genes and genomes,https://www.kegg.jp/)富集分析,并使用微生信在线绘制柱状图和气泡图。
定义CytoNCA筛选后乳香-没药药对和乳腺癌相关疾病的核心交集靶点为受体,筛选整理后的乳香-没药重要活性成分为配体。检索RSCB PDB数据库(http://www.rcsb.org/pdb/home/home.do)并下载核心靶点的3D结构,检索并下载TCMSP数据库中乳香-没药活性成分的2D结构,利用PyMOL 2.4.0软件对乳腺癌靶蛋白进行去水、加氢等预处理。应用AutoDock Vina软件进行分子对接,最后运用PyMOL、LigPlot+软件对对接结果进行三维可视化分析。
351首处方涉及中药358味,用药总频次达4 298次,频率越高药物种类越少,以6∶3∶1分成高频药(频率>40%)、中频药(频率10%~40%)、低频药(频率<10%),得出高频药1种,中频药29种,低频药328种,高、中频药详见表1。
表1 治疗乳腺癌高、中频药物频次分布
取358味中药里频数大于平均数12的84味中药,运用SPSS Modeler中的Apriori进行建模,选取支持度>0.05,置信度>0.85,前项>18,进行二项关联分析(见图1、表2)。其中,置信度最高的且关联性强的药对是乳香-没药,在文献中有64个实例,置信度为96.364%,支持度为15.670%。在此次分析规则中,置信度较高的药对,可作为临床上治疗乳腺癌的常用药对。
图1 关联关系可视图Fig.1 Visual graph of association relationship
表2 治疗乳腺癌处方中药物的关联规则
经数据预读,选择乳香作为因变量,其余频次≥12的84个中药作为自变量进入决策树模型的筛选过程。采用SPSS Statistics 22.0软件中的CHAID、CRT、QUEST决策树方法进行识别规律的挖掘,使用10倍交叉验证方法进行模式验证,统一将父节点数设定为100,子节点为50。三种决策树模型的最佳识别中药均为没药,摘要见表3。
表3 CHAID、CRT、QUEST决策树模型摘要
在TCMSP中检索乳香-没药所有成分数据,设置口服生物利用度OB≥30%,药物相似性DL≥0.18,同时筛去无对应靶点的成分,最终筛选出乳香8个主要活性成分,没药45个主要活性成分,见表4。
表4 乳香-没药的有效活性成分
续表4(Continued Tab.4)
在TCMSP中以OB≥30%和DL≥0.18作为筛选条件,收集到乳香有效成分8个,没药有效成分45个,删除重复并去除假阳性,利用UniProt(http://www.uniprot.org)将蛋白质名称转换成Gene symbol,通过Cytoscape 3.7.1软件构建乳香-没药“化合物-靶点”的可视化网络图(见图2)。
图2 乳香-没药“化合物-靶点”的可视化网络图Fig.2 Visualization network diagram of “compound-target” of frankincense-myrrh 注:浅绿色为乳香;墨绿色为没药;粉色为基因靶点。Note:Light green is frankincense;Dark green is myrrh;Pink is the gene target.
利用GeneCards(http://www.genecards.org)收集乳腺癌靶点,通过多次截取参数Relevance score中位数法最终选取1 123个乳腺癌靶点。利用Cytoscape 3.7.1软件中Bisogenet插件分别构建药物和疾病靶基因PPI网络,并取交集进行蛋白网络互做分析,得到由5 633个节点和141 839个边组成的网络(见图3),再用CytoNCA插件对网络进行拓扑分析,选取degree大于所有节点的2倍degree中位数,CC、BC大于所有节点对应值的中位数,提取Hithubs网络,得到1 459个节点和63 918个边组成的网络(见图3),再次使用截取中位数法筛选,最终构建了1个具有81个节点和1 524条边的靶点网络(见图3)。这81个核心基因为药物与疾病中共同基因的核心部分,其中degree值评分较高的有酪氨酸3-单加氧酶/色氨酸5-单加氧酶活化蛋白(YWHAE)、cAMP反应元件结合蛋白(CREBBP)、生长因子受体结合蛋白2(GRB2)、酪氨酸3-单氧合酶/色氨酸5-单氧合酶激活蛋白γ肽(YWHAG)、核内不均一性核糖核蛋白K(HNRNPK)等,为后续进行GO功能富集、KEGG通路分析以及分子对接奠定基础。
图3 蛋白网络互作构建及拓扑分析Fig.3 Protein network interaction construction and topology analysis注:A有5 633个节点、141 839条边;B有1 459个节点、63 918条边;C有81个节点,1 524条边。Note:A contains 5 633 nodes and 141 839 edges;B contains 1 459 nodes and 63 918 edges;C contains 81 nodes and 1 524 edges.
将“2.6”中81个核心基因利用DAVID平台进行GO功能富集分析,包括3个分支:BP、CC和MF。设定阈值P<0.05(见图4)。BP分析可以看出这些靶点主要涉及positive regulation of transcription from RNA Pol-II、negative regulation of transcription from RNA Pol-II、transcription/DNA-template等248条生物过程。CC分析可以看出靶点主要涉及nucleus、nucleoplasm、cytoplasm等60条细胞组分。MF分析中可以看出,靶点主要涉及protein binding、poly(A) RNA binding、enzyme binding等94条分子功能。
图4 乳香-没药活性成分治疗乳腺癌靶点的GO富集分析Fig.4 GO enrichment analysis of frankincense-myrrh active ingredients for breast cancer target
利用DAVID平台进对81个核心基因进行KEGG通路分析,设定阈值为P<0.05,得到39条KEGG通路富集,并绘制气泡图,结合表5和图5,可知基因主要集中在病毒致癌作用(viral carcinogenesis)、癌症的途径(pathways in cancer)、PI3K-Akt信号通路(PI3K-Akt signaling pathway)、癌症中的微小核糖核酸(microRNAs in cancer)等通路上。
图5 KEGG通路富集分析气泡图Fig.5 Bubble diagram of KEGG pathway enrichment analysis
表5 KEGG通路富集分析(前20条)
在Cytoscape中使用cytoNCA插件对乳香、没药的有效成分进行分析,根据degree结果得出评分较高的活性成分有没药中的3-甲氧基呋喃酮-9-烯-8酮、槲皮素和乳香中的乳香酸等。运用PyMOL、AutoDock Vina等软件对关键成分及主要靶点进行分子对接(见图6),同时对主要有效成分作用于CREBBP、GRB2、HNRNPK、YWHAE、YWHAG的结合能进行了测定,一般认为配体与受体结合的构象稳定时能量越低,发生的作用可能性越大。本研究中与GRB2结合能最低的化合物为Boswellic acid(结合能为-9.1 kcal/mol),由此可见乳香-没药中的核心化学成分乳香酸与受体蛋白GRB2形成构象能量低,结构稳定,结合活性较高。
图6 乳香-没药活性成分与靶蛋白对接三维图(结合能 ≥ -9.1 kcal/mol)Fig.6 Three dimensional docking diagram of the active component of frankincense-myrrh and target protein (binding energy ≥ -9.1 kcal/mol)注:A~F分别为GRB2与乳香酸、HNRNPK与乳香酸、YWHAE与乳香酸、YWHAE与槲皮素、YWHAG与乳香酸、YWHAG与槲皮素的分子对接图。Note:A-F are the molecular docking diagrams of GRB2 and boswellic acid,HNRNPK and boswellic acid,YWHAE and boswellic acid,YWHAE and quercetin,YWHAG and boswellic acid,and YWHAG and quercetin,respectively.
表6 乳香-没药活性成分与靶点的结合能
通过Apriori关联规则分析目标数据库里的用药规律,得到乳香与没药同时配伍治疗乳腺癌置信度最高,置信度越高,没药与乳香配伍出现的可能性就越大。CHAID、CRT、QUEST是三种常用决策树预测方法。CHAID默认情况下使用多路拆分,使节点中的样本大小变薄,从而导致树的深度减少。CRT会执行二进制拆分(每个节点都拆分为两个子节点)。CHAID旨在与分类/离散的目标一起使用,CRT可以进行回归和分类。与CART相比,CHAID中的拆分变量和拆分点选择的混淆程度较小。QUEST节点可提供用于构建决策树的二元分类法,此方法的设计目的是减少大型CRT决策树分析所需的处理时间,同时减小分类树方法中常见的偏向类别较多预测变量的趋势。运算过程比CRT更简单有效,三种方法优势互补。决策树算法以乳香为因变量,CHAID、CRT、QUEST三种决策树算法均筛选出没药与乳香的配伍可能性更大,表明乳香、没药这一活血化瘀药对参与树模型构建组方意义较大。乳香最早记载于《明医别录》,性温味淡,气香而走窜,善理气活血。没药最早记载于宋代的《开宝本草》,性平,气薄味苦,重在化瘀理血[4],二者常相须为用,协同增效。
通过Cytoscape中的插件cytoNCA进一步挖掘乳香与没药中53个活性成分,根据参数degree排名,结合临床研究文献,发现3-甲氧基呋喃酮-9-烯-8-酮、乳香酸、槲皮素等成分发挥着重要的作用。现代研究表明,乳香中最具特征性、研究最为深入的成分为乳香酸类(例如乳香酸)成分,属于五环三萜类化合物,对肿瘤细胞有抗增殖、分化诱导和细胞凋亡等作用,特别是其中的乙酰乳香酸毒性低,是一个有前景的抗肿瘤药物和肿瘤转移抑制剂[5]。呋喃酮类也能在一定程度上能增强肿瘤细胞增殖抑制活性[6]。槲皮素是存在于多种水果与植物中的多酚类物质,具有抗氧化、抗炎、促凋亡等作用[7]。研究发现,槲皮素通过抑制TLR-4/NF-κB信号通路,间接抑制炎性因子白介素-1β(IL-1β)和肿瘤坏死因子(TNF-α)的表达[8]。
对关键靶点进行GO功能和KEGG通路富集分析,进一步探究乳香-没药治疗乳腺癌的作用机制,GO包含了基因参与的生物过程、所具有的细胞组分、发挥的分子功能三方面功能信息,结果发现,乳香-没药可能通过参与RNA聚合酶Ⅱ启动子转录的正/负调控、转录/DNA模板等248条生物过程,细胞核、核质、细胞质等60条细胞组分,蛋白质结合、聚(A)RNA结合、酶结合等94条分子反应,进而调控PI3K-Akt信号通路、Estrogen信号通路、MicroRNAs in cancer、MAPK信号通路、P53信号通路等发挥抗肿瘤作用。关键基因在乳香-没药治疗乳腺癌中具有重要意义,利用Cytoscape中的cytoHubba插件筛选出degree值排名前十的核心基因,根据参考相关文献和KEGG富集分析中的关键通路,筛选出2条有效作用通路MicroRNAs in cancer和MAPK信号通路,核心基因富集于这两条通路的有CREBBP、GRB2、HNRNPK、YWHAE、YWHAG。MicroRNAs in cancer通路中MicroRNAs的异常表达与乳腺癌血管形成、肿瘤细胞的转移、侵袭及肿瘤耐药性等过程有密切的关系[9],miRNAs可以用于乳腺癌的早期诊断指标[10],也有希望成为用于乳腺癌的有效治疗药物。研究证明,没药中的没药甾酮也可能通过调节miRNAs的表达进而影响某些关键靶蛋白的活性从而起到抗瘤作用[11]。MAPK是细胞内广泛存在的丝/苏氨酸蛋白激酶,MAPK signaling pathway(丝裂原活化蛋白激酶信号转导通路)参与细胞增殖、凋亡、自噬过程及调控耐药相关基因和蛋白的表达[12],干预MAPK信号通路,可以提高肿瘤对化疗药物的敏感性,从而逆转耐药[13],有研究表明,没药中的β-榄香烯也具有很好的抗肿瘤疗效,其对胶质母细胞瘤的抗增殖作用是通过激活MAPK信号通路实现[14]。YWHAE与肿瘤的发生、发展密切相关,主要在肿瘤细胞周期、生长凋亡、扩散迁移及信号转导等途径发挥作用[15]。CREBBP作为转录辅激活因子可参与多种细胞功能,同时有抑制肿瘤的作用,其突变能够导致卵巢癌、滤泡性淋巴癌及乳腺癌的发病率增加[16]。GRB2是一种在细胞中广泛表达的衔接蛋白,其异常表达或活化与肿瘤的发生息息相关,研究表明,它可以作为抗肿瘤治疗的分子靶点[17],因此GRB2抑制剂也就成了抗肿瘤药物的研发热点。YWHAG为酪氨酸3-单氧合酶/色氨酸5-单氧合酶激活蛋白γ肽(14-3-3γ),参与蛋白定位及运输、细胞内信号传导、细胞周期调控和细胞凋亡[18]。HNRNPK基因在细胞内可分布于细胞质和(或)细胞核,能与不同亚细胞结构中的多种蛋白相互作用[19],在肿瘤中参与调控多种癌基因及抑癌基因的表达。
为了进一步验证网络药理学结果的可靠性,利用分子对接技术将核心成分和关键靶点分别进行分子对接,结果发现,核心成分3-甲氧基呋喃鸟苷-9-烯-8-酮、乳香酸、槲皮素与靶点CREBBP、GRB2、HNRNPK、YWHAE、YWHAG的结合能均小于-5.0 kcal/mol,表明它们有较好的结合活性。其中乳香酸与GRB2的结合能为-9.1 kcal/mol,表明它们具有强烈的结合活性,提示GRB2是乳香-没药可能发挥治疗乳腺癌作用的重要靶点。
综上,本文采用网络药理学的方法构建“化合物-靶点-疾病”相关网络,从整体上分析乳香-没药成分、靶点、信号通路之间的相互作用关系,采用分子对接技术验证了乳香、没药抗乳腺癌作用机制,推测了乳香、没药可能通过3-甲氧基呋喃鸟苷-9-烯-8-酮、乳香酸、槲皮素等成分协同作用于CREBBP、GRB2、HNRNPK、YWHAE、YWHAG等靶点,通过MicroRNAs in cancer通路、MAPK信号通路参与细胞增殖、凋亡、自噬过程及调控耐药相关基因等,侧面展示了乳香、没药通过多成分、多靶点、多通路发挥抗癌作用的机制,后续可对乳香-没药药对进行实验研究,对本文分子靶向对接虚拟筛选研究的结果进行验证,深入探讨关键作用机制,为治疗乳腺癌药物的研发提供新的方向及依据。