基于网络药理学和生物信息学探究黄芪抗非小细胞肺癌的关键靶点和分子机制

2020-11-02 09:12叶松山刘云鹤李文涛赵芷洁若于建春
实用药物与临床 2020年10期
关键词:黄芪靶点通路

叶松山,刘云鹤,李文涛,夏 颖,赵芷洁若,于建春*

0 引言

目前,肺癌仍是引起恶性肿瘤相关死亡的主要原因[1],其中非小细胞肺癌(Non-small-cell lung cancer,NSCLC)是主要的病理类型,占肺癌的80%~85%[2],其组织学类型包括腺癌、鳞癌及少见的大细胞肺癌等[3]。约2/3的NSCLC患者确诊时已处于中晚期,虽然化疗、靶向药物和免疫治疗等可缓解症状并提高生活质量,但患者5年生存率仍然很低,同时产生的毒副作用日渐明显[4],而中药在治疗肿瘤患者发挥增效减毒的治疗优势突显[5]。中医理论认为,肺癌由正气内虚、毒邪外侵加上痰湿内生、气滞、瘀血等造成,正气虚损为主要内因,强调扶正培本、补益去邪为治疗肿瘤的关键所在[6]。黄芪为传统中药,味甘性温,善补脾益肺,具有补气升阳、固表止汗、利水消肿和脱毒生肌等功效[7]。现代研究表明,黄芪通过促进肿瘤细胞凋亡、抑制增殖和迁移、调节免疫与逆转耐药等发挥抗肿瘤作用[8-9],但其具体机制尚未完全阐明。

传统的“一种疾病、单一药物、单个基因”的药物机制研究模式,无法体现中药及其复方多成分、多靶点、多途径综合调节的作用特点。网络药理学基于网络观点从系统水平识别“疾病—表型—基因—药物”的多层次关系,揭示中药不同成分之间的协同效应,与中医诊治疾病的理论和中药调控机体治疗疾病的整体观相吻合[10-11],目前被广泛应用于中药及复方研究中[12-13]。本研究应用网络药理学方法构建“黄芪—活性成分—靶点—NSCLC”网络模型,结合生物信息学研究方法,探索黄芪抗NSCLC的有效活性成分、潜在治疗靶点和作用机制,以期阐明黄芪抗NSCLC的物质基础和分子机制,为进一步深入研究黄芪治疗肿瘤提供新的思路。

1 材料与方法

1.1 材料 所用数据库:中药系统药理学数据库与分析平台 (TCMSP,http://tcmspw.com/tcmsp.php)[14],Uniprot (https://www.uniprot.org)[15],GeneCards (https://www.genecards.org)[16],DisGeNET (https://www.disgenet.org)[17],DigSee (http://210.107.182.61./geneSearch)[18],String (https://string-db.org)[19],DAVID (https://david.ncifcrf.gov)[20],UALCAN(http://ualcan.path.uab.edu/index.html)[21],KM plotter (http://kmplot.com//analysis)[22];所用软件:R软件(V3.6.2),Perl软件(V5.28.1),Cytoscape软件(V3.7.1)。各数据库检索时间截止到2020年1月15日。

1.2 方法

1.2.1 黄芪活性成分和作用靶点的筛选与收集 利用TCMSP数据库检索“黄芪”,选择“Ingredients”并设定口服生物利用度(OB)≥30%和类药性(DL)≥0.18得到黄芪活性成分[23],选择“Related Targets”获取黄芪活性成分所有靶点,通过UniProt 数据库下载人类相关蛋白及对应基因,经Perl脚本转化得到黄芪活性成分对应的人类基因靶点。

1.2.2 获取NSCLC相关疾病靶点 以“non-small cell lung cancer”、“non-small cell lung carcinoma”、“NSCLC”为关键词,分别检索GeneCards、DisGeNET和DigSee数据库并下载与NSCLC相关基因,合并各数据库检索到的前10%基因,去除重复和假阳性基因作为NSCLC相关研究靶点。使用R软件将“1.2.1”和“1.2.2”项所得靶点基因映射,得到黄芪抗NSCLC的靶点。

1.2.3 构建与分析“黄芪—活性成分—靶点—NSCLC”网络 将上述数据导入Cytoscape软件构建“黄芪—活性成分—靶点—NSCLC”关系网络。网络中节点(node)表示黄芪、活性成分、靶点基因与NSCLC,边(edge)表示四者之间的相互关系。网络拓扑参数使用Network Analyzer插件分析,每个节点的重要性通过拓扑参数自由度(Degree)和介数(Betweenness Centrality)评估,节点自由度和介数越大,说明该节点在网络中越重要。

1.2.4 靶标蛋白相互作用网络(PPI)的构建 将靶标蛋白导入String数据库,物种选择为“Homo sapiens”,置信度为0.400,获得蛋白互作关系,下载蛋白相互作用数据并导入Cytoscape软件绘制蛋白互作(PPI)网络图。设定网络中节点颜色深浅和大小来反映度值(Degree)大小,边的粗细反映结合率评分(Combine score)高低。

1.2.5 聚类模块筛选与分析 使用Cytoscape的MCODE插件对PPI 网络进行聚类分析,筛选功能聚类模块,根据模块分析结果,选择“MCODE Node Status”为“Seed”的靶点作为关键靶点。

1.2.6 GO和KEGG富集分析 将核心模块中的基因导入DAVID数据库,选择“Homo sapiens”,下载GO和KEGG富集结果数据。使用R软件“ggplot2”包,以P<0.05对核心模块中的基因进行GO与KEGG富集分析和展示。

1.2.7 关键基因在NSCLC中的表达情况及生存分析 通过UALCAN和KM plotter数据库分别分析关键基因在NSCLC中的表达及对患者总体生存率(Overall survival,OS)的影响。

2 结果

2.1 黄芪有效活性成分和作用靶点 TCMSP 数据库中筛选出16个黄芪有效活性成分和209个靶点,去重后得到97个作用靶点,见表1。

表1 黄芪活性成分和作用靶点情况

2.2 NSCLC相关疾病靶点 检索获得NSCLC相关基因820个并与97个黄芪活性成分靶点基因进行映射,除去无对应靶点的活性成分,得到黄芪抗NSCLC靶点44个和有效活性成分9个,见图1、图2。

图1 NSCLC相关基因与黄芪活性成分对应靶点映射

2.3 “黄芪—活性成分—靶点—NSCLC”网络构建与分析 将黄芪抗NSCLC的有效活性成分和靶点基因导入Cytoscape软件构建“黄芪—活性成分—靶点—NSCLC”关系网络,见图2,该网络包含55个节点和129条边(其中黄芪和NSCLC节点各1个,活性成分节点9个,靶点基因节点44个),黄芪活性成分作用于多个靶点,每个靶点也与多种活性成分相关,说明黄芪抗NSCLC的多成分、多靶点和整体协同相互作用的复杂网络关系。分析网络拓扑参数,度值在中位数以上的活性成分是槲皮素(Quercetin,Degree 42)、山柰酚(Kaempferol,Degree 14)、刺芒柄花素(Formononetin,Degree 6)和异鼠李素(Isorhamnetin,Degree 6)。

图2 黄芪—活性成分—靶点—NSCLC互作网络注:Ingredient A,(3S,8S,9S,10R,13R,14S,17R)-10,13-dimethyl-17-[(2R,5S)-5-propan-2-yloctan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1H-cyclopenta[a]phenanthren-3-ol;Ingredient B,3,9-di-O-methylnissolin;Ingredient C,7-O-methylisomucronulatol

2.4 靶标蛋白互作网络(PPI)构建与核心聚类模块的筛选 将靶标蛋白导入String 数据库获取蛋白质互作数据,利用Cytoscape绘制PPI网络,见图3,节点为蛋白,边为蛋白间的关联,网络中共44个节点和387个边。使用MCODE插件得到3个功能聚类模块(Module),见图4。模块1共20个节点和131条边,得分13.789;模块2共5个节点和10条边,得分5.00;模块3共13个节点和29条边,得分4.833;根据分析结果得到3个关键基因分别是PARP1、GSTP1和ESR2,选择得分最高的模块1作为核心模块进行后续分析。

图3 黄芪抗NSCLC靶标蛋白相互作用网络

图4 功能聚类模块注:A.Module 1,B.Module 2,C.Module 3

2.5 GO富集和KEGG通路分析 将核心模块中的20个基因作为黄芪抗NSCLC的潜在靶点进行GO与KEGG富集分析,根据P值排序并选择部分结果使用气泡图或条形图展示。其中富集到104个生物过程(Biological process,BP),主要参与RNA聚合酶Ⅱ启动子对转录的调控、凋亡过程的负调控、DNA模板转录正调控、细胞对DNA损伤的反应、基因表达正调控、细胞对机械刺激和缺氧的反应、对雌二醇的反应、NO生物合成的正调控、成纤维细胞和上皮细胞增殖的正调控、对钙离子的反应、肽酰-丝氨酸和蛋白质磷酸化的正调控、细胞对IL-1的反应、死亡结构域受体对外源性凋亡信号通路的负调控等,见图5。富集到细胞组分(Cellular component,CC)11个,主要涉及细胞核、胞浆、脂筏、细胞膜、黏着斑、细胞外间隙、线粒体和染色体端粒区等,见图6。富集到分子功能(Molecular function,MF)19个,主要是蛋白或同源蛋白结合、蛋白激酶结合和活性、酶结合、转录因子结合、组蛋白去乙酰化酶结合、泛素蛋白连接酶结合、蛋白丝氨酸/苏氨酸激酶活性、NO合酶调节因子活性、参与细胞凋亡过程的半胱氨酸型内肽酶活性、序列特异性DNA结合、MAPK激酶活性和蛋白质异二聚体活性等,见图7。富集到48条通路,除了涉及NSCLC、胰腺癌、膀胱癌、前列腺癌、结直肠癌和子宫内膜癌等癌症通路外,还和肿瘤蛋白多糖、PI3K-Akt信号通路、VEGF信号通路、P53信号通路、黏着斑、乙型肝炎、甲状腺激素信号通路、细胞周期、FoxO信号通路、病毒性心肌炎、催乳素信号途径、HTLV-I感染、癌症的中心碳代谢等通路有关,见图8。

图5 黄芪抗NSCLC潜在靶点的GO-BP富集分析

图6 黄芪抗NSCLC潜在靶点的GO-CC富集分析

图7 黄芪抗NSCLC潜在靶点的GO-MF富集分析

图8 黄芪抗NSCLC潜在靶点的KEGG通路富集

2.6 关键基因在NSCLC中的表达情况及对患者生存的影响 结合UALCAN数据库分析,发现关键基因PARP1、GSTP1和ESR2在肺腺癌(LUAD)及肺鳞癌(LUSC)和正常组织中表达差异均具有统计学意义(P<0.05),3个基因在肿瘤中均为高表达,见图9;KM Plotter数据库分析结果显示,基因表达量会影响患者总体生存率(P<0.05),相比低表达者,3个基因高表达者生存率较低,见图10,说明PARP1、GSTP1和ESR2低表达是NSCLC的保护因素。

图9 关键基因在正常组织和肺腺癌(LUAD)及肺鳞癌(LUSC)中的表达情况

图10 关键基因表达量对NSCLC患者总体生存(OS)的影响

3 讨论

中医药在治疗肺癌等恶性肿瘤方面发挥一定优势,许多具有抗肿瘤作用的中药成为研究热点[24]。中医理论认为“正气存内,邪不可干”、“邪之所凑,其气必虚”,肺癌之辨证,多属气虚[25]。黄芪作为传统补气要药,中医临床常将其单独或组方用于肺癌等各类癌症的治疗中[26-27]。现代药理学研究也证实,黄芪含有黄酮类、多糖类及皂苷类等多种抗肿瘤活性成分[8]。从本研究“黄芪—活性成分—靶点—NSCLC”网络(见图2)中可以看出黄芪抗癌的多成分和多靶点特征,网络拓扑分析结果显示,黄芪抗NSCLC主要的活性成分是槲皮素、山柰酚、刺芒柄花素和异鼠李素。研究表明,槲皮素可通过Stat3/Mcl-1等途径介导获得性耐药细胞PC9/GR凋亡,还可抑制肿瘤组织VEGF和耐药基因表达、破坏Caspase-3表达抑制肺癌、乳腺癌和肝癌等肿瘤细胞增殖与迁移[28-29]。山柰酚能下调rDNA的转录和上游结合因子磷酸化水平来抑制肺腺癌A549细胞的生长与增殖,还可以通过抑制PI3K-Akt途径、ERK途径和线粒体凋亡途径的活化促进肿瘤细胞凋亡和增加辐射敏感性[30-31]。刺芒柄花素可下调CyclinE1表达影响细胞周期来抑制细胞增殖,并调控Bax和Bcl-2表达促使NSCLC细胞凋亡,还可以抑制A549细胞EMT过程[32-33]。异鼠李素能抑制肺癌、乳腺癌和宫颈癌细胞等多种肿瘤细胞的增殖并诱导其凋亡,其可能和细胞自噬过程有关[34-35]。由上可知,黄芪中这些活性成分作用机制与肿瘤的发生发展关系密切,为本研究结果的可靠性提供了有力证据,能为挖掘黄芪潜在抗癌价值提供依据和参考。

从图3可见,通过构建黄芪抗NSCLC靶标PPI网络,靶标蛋白之间存在广泛而复杂的联系,为了给后续分析提供一个更加明确的方向,我们利用网络中蛋白之间固有的关系寻找基因簇,挖掘出 PPI 网络中所存在的3个功能聚类模块(图4)。其中核心模块潜在靶点GO富集结果显示(图5~图7),黄芪抗NSCLC的潜在靶点主要涉及转录调控、凋亡调控、细胞对刺激的反应、一氧化氮生物合成、细胞增殖、蛋白质修饰等生物过程,富集的细胞组分主要定位在细胞核、脂筏、胞浆、细胞外间隙、线粒体、染色体端粒区等,主要参与蛋白和酶结合、转录因子结合、增殖和凋亡相关激酶活性生物功能,表明黄芪是通过调节细胞增殖与凋亡、分化和迁移、能量代谢和基因表达等多个生物过程与功能发挥抗NSCLC作用,这在机制研究所涉及通路中都有体现。

由图8可见,KEGG富集主要涉及癌症通路、P53信号通路、甲状腺激素信号通路、细胞周期、FoxO信号通路、黏着斑、PI3K-Akt信号通路、VEGF信号通路、癌症的中心碳代谢等通路,这些通路都与NSCLC的形成与发展密切相关。研究表明,PI3K/Akt 信号通路与肿瘤增殖、生长、迁移和凋亡等密切相关,在多种癌症包括肺癌中存在异常活化,激活下游信号抑制细胞凋亡,药物干预可使ERK和p38磷酸化,同时轻度抑制p-JNK表达,从而诱导癌细胞发生凋亡。另有报道显示,黄芪多糖可通过下调PI3K/Akt信号通路的自噬而发挥抗癌作用[36]。P53信号通路激活可抑制 A549 细胞增殖并促进其凋亡,MiR-93-5p靶向P53调控STAT3信号通路的激活可能是其中的机制之一[37-38]。黏着斑由胞膜外黏附素、膜上整联蛋白和胞内细胞骨架蛋白等黏附而成,具有信号传导和机械支持功能,在调控肿瘤上皮间质转化和侵袭转移方面起到重要作用[39]。FoxO转录因子通过信号转导和转录调控在动物代谢、生理调节和细胞周期等方面起重要作用[40]。Hribal等[41]发现,FoxO1 蛋白在肌肉能量代谢方面发挥关键作用,提示黄芪可能通过FoxO通路影响肿瘤细胞能量代谢过程。中心碳代谢不仅是机体能量的主要来源,也提供其他代谢途径的前体物。细胞代谢在癌症发生和进展中起到核心作用,中心碳代谢异常导致代谢重编程造成有氧糖酵解和乳酸增加是恶性肿瘤细胞的重要特征,造成关键细胞调控通路改变,影响肿瘤的治疗效果[42]。本研究富集结果表明,黄芪活性成分的潜在靶点分布于多种生物过程和通路,其协同发挥抗癌作用,这与现代药理研究结果相互验证,可以作为后续研究的对象。

为了能够更准确快捷地找出黄芪抗NSCLC关键基因与肿瘤发生发展的相关性,本研究利用整合TCGA和GEO数据库数据的UALCAN和KM plotter数据库分析关键基因的表达情况及与预后的关系。根据功能聚类模块筛选出的3个关键基因PARP1、GSTP1和ESR2,他们在癌组织中均高表达,且高表达与较差预后相关(图9、图10),说明其在NSCLC发生发展中起到重要作用。PARP1基因是碱基切除修复(BER)通路的核心成员之一,在转移性NSCLC中表达较强,其表达与预后密切相关,除DNA损伤修复机制之外,PARP1还可以通过促进肺腺癌细胞侵袭、抗失巢凋亡、外渗、自我更新以及调节脑微环境等促进肺腺癌向脑和骨的转移和复发[43-44]。GSTP1是谷胱甘肽S-转移酶的同工酶,在维持细胞代谢分解致癌物、抗氧化损伤、抑制细胞癌变过程中起着重要作用,与肿瘤的发生密切相关,已有研究证实,GSTP1基因在肺癌组织中高表达量[45]。ESR2基因编码的雌激素受体蛋白2可以控制细胞信号转导并调控细胞周期,在肿瘤发展中起重要作用。研究发现,ESR2基因多态性与非吸烟女性肺癌的发生密切相关[46-47],众多研究也表明,NSCLC组织中ERβ(ESR2)的表达率高于癌旁肺组织及正常肺组织[48]。除此之外,关键基因还和黄芪抗NSCLC主要活性成分相互映射,如作用于PARP1的槲皮素,作用于GSTP1的槲皮素和山柰酚,作用于ESR2的刺芒柄花素和异鼠李素,进一步说明了黄芪抗NSCLC的多成分和多靶点交互特性及研究结果的可靠性,提示这3个基因有望作为黄芪抗NSCLC的关键靶点应用于临床实践。

网络药理学和生物信息学能高效快速地挖掘开放数据库中丰富的实验和临床资料。通过整合分析数据,以生物分子为切入点构建与疾病相关分子的作用网络。从药物、疾病与靶点间作用的系统性和整体性出发,揭示中药及复方的药理作用及机制,进而刻画中医药的整体特征。随着网络药理学和生物信息学的兴起,预测黄芪单药、对药或复方防治心脑血管疾病、糖尿病和肿瘤等疾病的药理作用和分子机制研究可以逐步开展[49-52]。对于单一癌种(如黄芪治疗肺癌)的潜在靶点和作用机制研究虽然较少,但也取得了一些初步结果[6],与本研究大部分结果一致,说明了本研究结果的可靠性。和以往研究不同的是,本研究一方面对疾病类型进行了细化,重点研究肺癌的最常见类型-NSCLC;另一方面,为了使研究方向更加明确和具有针对性,引入了功能聚类模块研究,同时通过肿瘤数据库进行预后分析,增加临床数据,验证了本预测的准确性,可为临床精准用药提供有力支撑。

网络药理学和生物信息学主要依托各种数据库和技术手段,尚存在一些亟待解决的问题[11,53-54]:①数据库的准确性和全面性不完善,如数据更新相对滞后,造成所筛选药物活性成分和靶点数量有限,不能揭示完整的药理作用;②活性成分和靶点筛选具有一定主观性,如部分中药活性成分与靶点相互作用是通过计算机模拟的,二者之间的调控关系不够明确;③未考虑中药配伍、用法用量及在体内代谢转化,不能有效结合药物动力学和药效学研究;④临床疾病数据库的基因芯片和RNA-seq数据来源于不同的研究,平台软件分析数据算法不同,很难进行样本间准确比较,可能会造成结果存在一定异质性。基于此,为保证研究结果的精准性,可在预测的基础上深入开展体内外实验和临床研究进行验证。

总之,本研究通过网络药理学和生物信息学方法,初步揭示了黄芪抗NSCLC的潜在作用机制和关键作用靶点,体现了中药多成分、多靶点、多通路协同作用的特点,为黄芪抗肿瘤药理研究及临床应用奠定了理论依据。同时,还可以利用细胞分子生物学和免疫学等实验手段进一步验证,以便深入研究黄芪抗NSCLC的作用机制,为后续研究提供了方向。

猜你喜欢
黄芪靶点通路
“补气之王”黄芪,你吃对了吗?
维生素D受体或是糖尿病治疗的新靶点
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
Instructions for Authors
肿瘤免疫治疗发现新潜在靶点
黄芪是个宝
心力衰竭的分子重构机制及其潜在的治疗靶点
SphK/S1P信号通路与肾脏炎症研究进展