王 茜,王 烨,李玉梅,王楚盈,杨 波
(长春中医药大学药学院·吉林 长春·130117)
沙苑子为豆科植物扁茎黄芪 (Astragalus complanatus R.Br)的干燥成熟种子,在我国具有悠久的用药历史, 始载于《神农本草经》,以蒺藜为名[1]。 属药食同源类药材,其味甘,性温,归肝经、肾经[2]。 主要用于治疗早泄、腰痛、肾虚、小便不尽、白浊带下等。现代药理学研究表明,其具有抗肿瘤、降压降脂、保肝、抗辐射等作用[3]。
目前,癌症(肿瘤疾病)已成为严重威胁人类健康和生命的一大疾病[4],中医学认为机体正气不足是癌症发生发展的根本原因之一,肾为先天之本,肾虚则一身正气亏虚[5]。现代研究表明沙苑子有抗肿瘤作用,但其发挥抗肿瘤的活性成分和作用机制尚不明确。沙苑子是补阳药的一种,近年来对其活性成分也有不少的研究,由于其成分复杂,故在作用机制方面还尚未完全清晰, 有待进一步研究来促进沙苑子的开发应用。 近年来网络药理学的快速发展,已成为中医药研究的热门工具, 以网络药理学为主题在知网上搜索,仅2021年就有2000 余篇。越来越多的中药或复方制剂通过网络药理学对“药物-疾病-靶点-通路”等复杂生物信息网络关系的分析与研究,对作用机制进行模拟分析、预测探讨,系统的表征药物对疾病的干预与影响,通过网络药理学方法进行研究有利于揭示中药的复杂作用机制[6]。 这种分析方法具有系统性和动态性的特点,与中药防病治病的理论一致,为中药现代化研究提供新的思路和方法[7]。因此,本研究致力于通过网络药理学方法,探讨沙苑子治疗肿瘤疾病的作用机制,系统的阐述沙苑子标志性成分作用与肿瘤疾病的作用机制,为深入开发利用中药沙苑子提供理论依据。
2.1 数据库网站和分析软件
本篇文章使用的数据库以及软件如下:
2.2 沙苑子的活性成分及其作用靶点的筛选
使用传统的中药药理平台数据库(TCMSP) (https://old.tcmsp-e.com/tcmsp.php)(中药系统药理数据库和分析平台)[8], 其数据库包括500 味常用中药,30069个中药化合物。该数据库自2012年面世以来,已引起学者们越来越多的重视,并被越来越多的医药研究工作者所使用。 TCMSP 能捕捉药物、靶标和疾病之间的关系,包括化学物质、靶点和药物靶点网络,以及相关的药物靶点网络,涉及口服生物利用度、药物相似度、肠上皮通透性、血脑屏障、水溶性等天然化合物的药代动力学特性。因此,学者们可以根据自己的需要,利用具有相关性的药物和吸收、 分布、 代谢、 排泄(ADME)等特征的复合物用于进行更深层次的研究。以沙苑子为关键词进行检索,筛选条件为口服利用度OB%≥30%和药物相似性DL≥0.18, 筛选出沙苑子的有效活性成分以及对应靶点[9]。 使用Uniprot[10](https://www. uniprot. org/)数据库中智人(英文选项)选项中的化合物数据库与从TCMSP 数据库中筛选出的沙苑子有效化合物靶点进行比对筛选,去除其化合物中非人源有效化合物靶点[11],以获取从TCMSP 得到的药物靶点基因符号和相关信息。
2.3 肿瘤疾病靶点的获取
以tumour 为关键词,分别在Genecards[12](https://www.genecards.org/),OMIM,Disgenent(DisGeNET - a database of gene-disease associations)以上三个数据库来检索获得所研究的相关肿瘤疾病靶点。 Genecards这个数据库是一个免费搜索的综合性网络数据资料库,提供所有注释和预测的人类基因信息。 Genecards自动整合来自约150 个以基因为中心的数据库资源,包括基因组学、转录组学、蛋白质组学、遗传学、临床和功能等多方面的信息。 Online Mendelian Inheritance in Man(OMIM)[13](https://omim.org/)中文意思是指“在线《人类孟德尔遗传》”和“网上《人类孟德尔遗传》”。 发布的这些年来一直在不断地更新着所有Human 的遗传基因和遗传紊乱的数据库,主要着眼于遗传性的基因疾病,包括文本信息、相关参考信息、基因序列和相关其他数据库。 Disgenent 整合了公共数据库、GWAS 目录、动物模型和科学文献的数据。同时这个数据库的收据还采用了统一的标准进行注释。除此之外,还提供了一些初始指数和标准,用来帮助研究人员确定表型与基因型关系的等级高低,同时也可以通过Cytoscape 应用程序、web 接口、几种编程语言和脚本来访问这些重要信息。 Disgenent 是一个具有多功能的平台,可用于不同的研究目的,包括特定的人类疾病的分子基础及其并发症的研究,致病基因特性分析,辅助构建药物治疗作用及药物不良反应假说,疾病候选基因的验证及文本挖掘方法的评价性能。
2.4 药物与疾病共同靶点的筛选与蛋白质相互作用网络的构建
将从三个疾病数据库中筛选得到的相关的肿瘤靶点与TCMSP 中获得的药物靶点来进行比对,在STRING 数据库中进行网络构建, 这个数据库是一个可以用来检索已经存在且被发现的目前蛋白和预测蛋白之间相互作用关系的数据库。除了可以对这些蛋白生成一目了然的PPI 图,还可以提供所传输的有关蛋白的解析,向数据库中导入上述所得沙苑子治疗肿瘤疾病的有关靶点,以获取这些蛋白质的相互作用有关内容信息。 STRING 数据库设置后可以评判打分,一般是根据每一个输入的蛋白质相互作用信息来进行,所评判的分值越高,则表明此蛋白质的相互作用置信度也就越高。为保证这个数据库所输出数据的可信度, 这个研究选取打分值高于高置信度的数据,由此标准来构建由导入基因表所表达产物组成的PPI网络, 并采用Cytoscape3.70 软件来进行网络分析和可视化处理。
2.5 KEGG 通路富集分析
将2.4 项下得到的沙苑子中有效成分治疗肿瘤疾病的基因靶点导入Metascape[15]平台进行富集分析,选择物种为“H. sapiens”,在分析出的前50 条通路里筛选肿瘤相关通路,并将筛选出的通路靶点进行整理。此时得到沙苑子治疗肿瘤疾病的相关通路及对应的靶点, 作为数据文件。 将得到的相关数据导入Cytoscape3.7.0 软件得到疾病通路-靶点图。 将上述得到的相关通路的富集名、 富集倍数、P 值和基因数整理好,应用于微生信网站的富集气泡图,即得到沙苑子治疗肿瘤疾病的核心靶点KEGG 通路富集分析图。
2.6 GO 富集分析
如2.4 项下所陈述, 将得到的基因靶点导入Metascape 平台进行GO 富集分析。GO 富集分析包括GO 分子功能 (Molecular Functions)、GO 细胞组成(Cellular Components)、GO 生物学过程(Biological Process)。 GO Biological Processes 富集分析可以描述基因产物可能行使的分子功能;GO Cellular Components 富集分析可以描述基因产物所处的细胞环境;GO Molecular Functions 富集分析作用是描述基因产物所参与的生物学过程。 按%InGO 排序分别取三种GO 富集分析的前10 名,整合处理。 将上述得到的三种GO 富集分析的GO term、分类、富集分数整理好,应用于微生信网站的BP CC MF 三合一图,得到沙苑子治疗肿瘤疾病的BP CC MF 三合一图。
3.1 沙苑子有效靶点筛选
使用TCMSP (https://old.tcmsp-e.com/tcmsp.php)(药理学数据库中药系统分析平台),可以得到沙苑子中所含的有效成分为358 种,再通过该中药系统药理学数据库分析平台以口服利用度OB%≥30%且药物相似性DL≥0.18 为条件, 筛选出沙苑子有效活性化合物以及对应靶点, 得到活性成分10 个: 芒柄花素(formononetin)、 槲皮素 (quercetin)、 山奈酚(Kaempferol)、杨酶酮(Myricanone)、毛蕊异黄酮(Calycosin)、β-谷甾醇 (beta-sitosterol)、 芳香素(Laricitrin)、a-D-吡喃葡萄糖苷(a-D-glucopyranoside)等,详见表1。 通过Uniport 数据库进行查找,去重,共得到276 个靶点蛋白。
表1 沙苑子有效成分及分子名称
3.2 沙苑子治疗肿瘤疾病靶点的收集
以tumour 为关键词, 分别在Genecards(https://www.genecards.org/), 人类孟德尔遗传数据库(Online Mendelian Inheritance in Man)(OMIM)(https://omim.org/),Disgenent(https://www.disgenet.org/browser/1/ 1/0/894/) 三个数据库中进行搜索获取相关肿瘤的疾病靶点。 在Genecards 中获得肿瘤疾病靶点10859 个,取评分0.70 以上的2743 个;OMIM 数据库中获得345 个;Disgenent 数据库中获得968 个靶点,与药物做交集得到126 个重复靶点,详见表2。
表2 沙苑子与肿瘤的126 个交集靶点
3.3 沙苑子-有效成分-靶点网络图的构建
将表2 得到的10 个药物有效成分,126 个作用靶点以Excel 文件格式分别定义数据和相关文件,导入Cytoscape 软件中绘制沙苑子-有效成分-靶点-肿瘤疾病网络图。 其中SYZ 代表沙苑子,和疾病有8 种有效成分含有共同靶点,详见图1。 由图1 可知,中药沙苑子治疗肿瘤疾病的关键成分有a-D-glucopyranoside(a-D-吡喃葡萄糖苷)、山奈酚(Kaempferol)、毛蕊异黄酮 (Calycosin)、 槲皮素(quercetin)、 杨酶酮(Myricanone)、Laricitrin(芳香素)、beta-sitosterol(β-谷甾醇)、芒柄花素(formononetin)。
图1 沙苑子有效成分-靶点-疾病网络图
3.4 PPI 网络及核心靶点筛选与分析
将3.2 项下经去重后所得到的药物与疾病的共同靶点导入到String 数据库来创建PPI 的网络通识图,把所得网络图导入Cytoscape 软件进行处理,详见图2。根据Degree 值筛选出前18 个关键靶点,详见表3, 分别为过氧化物酶体增生激活受体(PPARG)TP53、白细胞介素-6(IL6)、肿瘤坏死因子(TNF)、前列腺素内过氧化物合成酶2(PTGS2)、缺氧诱导因子-1A(HIF1A)、CASP3、蛋白激酶(AKT1)、重组人白介素8(CXCL8)、MYC、基质金属蛋白酶9(MMP9)、白细胞介素-1B(IL1B)、表皮细胞生长因子(EGF)、ESR1、人表皮生长因子受体 (EGFR)、 血管内皮生长因子A(VEGFA)。
图2 治疗肿瘤疾病的靶蛋白PPI 网络图
表3 关键靶点拓扑参数
3.5 KEGG 通路富集分析
KEGG 富集到188 条信号通路, 其主要参与IL-17 信号通路、 糖尿病并发症中的toll 样受体信号通路、T 细胞受体信号通路、AGE-RAGE 信号通路、NFkappa B 信号通路、c 型凝集素受体信号通路、肿瘤坏死因子信号通路,详见图3、表4。
图3 沙苑子治疗肿瘤疾病的作用靶点KEGG 通路富集分析
表4 10 条通路的KEGG 富集分析信息
3.6 GO 富集分析
应用Metascape 数据平台对沙苑子的124 个潜在靶点进行GO 基因富集分析。根据%InGO 筛选排名前10 位进行BP CC MF 三合一,多类型气泡图可视化处理。共得到生物学过程(biological process,BP)146 条功能条目,主要包括细胞增殖的负调控,细胞对脂质的反应,对营养水平层次的反应。细胞组成主要包括:膜微区、转录调节复合物、质膜蛋白复合物。 分子功能(molecular function,MF)共62 个,主要包括转录因子结合,蛋白结构域特异性结合,DNA 结合转录因子结合等。 选取这三种GO 分析过程排名前5 的列表,详见表5。 运用Cytoscape3.7.0 软件进行拓扑分析,构建通路-疾病靶点网络图,筛选关键靶点,详见图4。 用微生信数据可视化网站(www.bioinformatics.com.cn/)制作GO、KEGG 富集气泡图以及三合一柱状图。通过富集因子数值大小来分析沙苑子治疗肿瘤疾病的可能有效成分以及作用机制。
图4 沙苑子有效成分治疗肿瘤疾病的作用靶点GO 富集分析BP CC MF 三合一图
表5 3 个过程中排名前5 的GO 富集分析信息
GO 功能富集分析多类型气泡图,详见图5。 GO功能富集分析多类型气泡图中,count 代表主要活性成分富集在该通路下的靶点数目。 圆点越大,富集越多,P 值越小,表明该生物功能的富集显著性越可靠,颜色越红。通过气泡图表明中药沙苑子可以通过调控多种生物过程治疗肿瘤疾病。
图5 沙苑子有效成分治疗肿瘤疾病的作用靶点GO 富集分析多类型气泡图
4.1 目前来说,肿瘤在人类的漫长发展中不知不觉的成为危害人类生命安全健康的最严重的疾病之一,预计到2030年全球肿瘤导致死亡的病例将高达3000多万人,我们国家的肿瘤发病率也在逐年上升。 中医药在抗肿瘤方面的作用越来越占优势, 研究显示,沙苑子是补益肝肾的代表性药物之一,主要成分有黄酮类、有机酸、蛋白质、微量元素等成份。近年来,对沙苑子的药理作用研究报道很多, 但在作用机制方面很少,尤其抗肿瘤方面的作用机制尚不明确,所以此方面的研究具有重要意义。
4.2 本研究经数据库筛选得到沙苑子有效成分8 个,肿瘤疾病的对应靶点共276 个,映射后得到沙苑子有效成分用于肿瘤疾病的潜在靶点126 个。中药沙苑子治疗肿瘤疾病的关键成分有槲皮素(quercetin)、山奈酚(Kaempferol)、杨酶酮(Myricanone)、芒柄花素(formononetin)、毛蕊异黄酮(Calycosin)、β-谷甾醇(betasitosterol)、a-D-吡喃葡萄糖苷 (a-D-glucopyranoside)、芳香素(Laricitrin)。 槲皮素是一类具有多种生物活性的黄酮醇类化合物,能杀死自由基,防止机体脂质发生过氧化反应, 能够直接抑制肿瘤生长,同时, 也可能通过抑制STAT3 信号通路来抑制瘢痕疙瘩成纤维细胞的增殖[14,15]。山奈酚属于黄酮类化合物,沙苑子黄酮可以明显抑制血管瘤的生成,诱导人肝癌细胞的凋亡[16]。芒柄花黄素可能通过调节CyclinD1 使细胞周期停滞及减少Bcl-2 蛋白以诱导细胞凋亡,进而影响人体肿瘤细胞的生长与增殖[17]。 杨酶酮是从杨梅的树皮中提取的一种黄酮醇类化合物,具有强抗氧化作用,避免机体产生大量氧化中间产物妨碍创伤修复形成肿瘤细胞[18]。
4.3 本研究发现沙苑子治疗肿瘤疾病的关键靶点有蛋白激酶、TP53、肿瘤坏死因子、前列腺素内过氧化物合成酶2、血管内皮生长因子、白细胞介素-6、CASP3、EGFR、CXCL8、MYC、EGF、ESR1。TP53 又是一种抑癌有关基因,这个基因能够编码一种分子量为53kDa 的蛋白质。 MYC 基因包括N-MYC、C-MYC、R-MYC、L-MYC 共4 种。C-MYC 是最常见的活化原癌基因之一, 参与调控的癌症占人类所患癌症的五分之一左右,受C-MYC 原癌基因影响致死的癌症患者每年可达几十万。 MYC 是一种作用广泛的转录因子,它通过多种机制调节细胞的分化和增殖,包括靶基因的转录扩增。 MYC 调控细胞生长和增殖,因此也可以控制肿瘤的生长,表皮生长因子测定可用于诊断各种肿瘤和溃疡病[19]。 许多肿瘤中有EGF 及其受体的异常表达,且与肿瘤转移和患者预后有密切关系,如胃癌、肝癌、乳腺癌、黑色素瘤等。
4.4 KEGG 富集分析结果显示,沙苑子有效成分治疗肿瘤细胞的主要通路是信号通路AGE-RAGE、IL-17信号通路、TNF 受体信号通路等10 个通路。 IL-17 能有效地介导组织的炎症反应, 有研究表明通过抑制IL-17 信号通路可能直接影响细胞的活化、 增殖,进而影响肿瘤细胞的产生。 GO 富集分析显示沙苑子治疗肿瘤疾病的生物学过程 (biological process,BP)与146 条功能条目相关, 主要包括细胞增殖的负调控,细胞对脂质的反应,应对营养,对营养水平的反应,膜筏。 与细胞组成相关主要包括膜微区,转录调节复合物,质膜蛋白复合物,囊腔。与分子功能相关共62 个,主要包括激酶绑定,DNA 结合转录因子结合,蛋白结构域特异性结合,转录因子结合,蛋白激酶结合等。
4.5 综上所述,由本文可知沙苑子有效成分可能通过山奈酚、芒柄花素、槲皮素、β-谷甾醇等有效成分,作用于IL6、TNF、VEGFA 、AKT1 等靶点,涉及IL-17 信号通路、AGE-RAGE 信号通路、TNF 受体信号通路等通路来实现治疗肿瘤疾病的目的[20]。 本研究通过网络药理学方法确认沙苑子多个有效成分、关键靶点、通路对肿瘤疾病发挥治疗作用[21-24]。为后续沙苑子的研究提供了理论基础和依据, 可能对阐明沙苑子抗肿瘤的机制和识别潜在靶点提供帮助,未来需要进一步实验验证。但是基于理论技术方面和数据库信息的限制,本研究存在一定的局限性,有待进一步研究验证。