基于竞争性内源RNA网络探讨豆甾醇干预肺鳞癌的作用机制

2020-12-04 09:59李经蕾
癌变·畸变·突变 2020年6期
关键词:共表达甾醇关键

李经蕾,侯 炜

(1.中国中医科学院广安门医院,北京 100053;2.北京中医药大学,北京 100029)

肺癌是世界上发病率和死亡率最高的癌症类型[1-2]。据估计,2020年肺癌将占全球癌症的12%,约1/4 的癌症死亡由肺癌导致,其中80%~85%的病理类型为非小细胞肺癌(non-small-cell lung cancer,NSCLC)[3-4]。由于肺癌早期症状不显著,许多患者在确诊时已处于晚期阶段,5 年总体存活率只有19%[3,5]。肺鳞癌(lung squamous cell carcinoma,LUSC)和肺腺癌(lung adenocarcinoma,LUAD)是NSCLC 的两大亚型。虽然LUSC 的进展速度快于LUAD,但是早期LUSC的5年生存率较高,预后相对较好,因此加强对LUSC 的早期诊断,探索更高效的治疗药物,对患者意义重大。

加权基因共表达网络分析(weighted gene coexpression network analysis,WGCNA)是从全基因组表达中了解基因功能和基因关联的一个重要方法,被用于寻找高度相关的基因模块,并将基因模块与临床特征结合,以筛选网络中的关键基因。这一方法可以用来识别潜在生物标志物或治疗靶点[6]。随着基因组测序技术和生物信息大数据的发展,学者有了更多机会了解肿瘤的发生发展机制。研究[7]表明,带有microRNA(miRNA)反应元件的lncRNA可以作为竞争性内 源RNA(competing endogenous RNA, ceRNA) 与mRNA 竞争结合miRNA,从而影响基因的表达水平。ceRNA 的异常调控与许多肿瘤有关,如肺癌[8]、乳腺癌[9]、胃癌[10]等。

中医药在防治肺癌方面具有独特优势。但由于中药成分复杂,靶点多,目前的作用机制尚不清楚。故以网络药理学为基础,利用分子对接技术,从生物学网络的角度阐释药物与靶点的相互作用规律和机制,这与中医药的整体观念和辨证论治的理念是一致的。现代中药学认为白花蛇舌草味微苦,性甘寒,归胃、大肠、小肠经,为清热解毒良药。研究表明,自白花蛇舌草提取出的化合物豆甾醇在胃癌[11]、胆管癌[12]中发挥重要作用,但在LUSC中研究较少。

本研究对肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)数据库(https://portal.gdc.cancer.gov/)中LUSC-RNAseq 数据进行了WGCNA 分析、差异表达分析,以获得差异共表达基因;通过基因本体(gene ontology,GO)分析、蛋白质相互作用网络(protein protein interaction network,PPI network)分析、生存分析确定关键基因;在此基础上构建LUSC-ceRNA 网络,通过分子对接,了解豆甾醇作用于LUSC 的机制,为进一步完善中医药治疗LUSC 的理论体系奠定基础。

1 材料与方法

1.1 原始数据处理

从TCGA 数据库中下载LUSC-RNAseq 数据(截止至2020 年9 月),该数据集中共有551 例样本,包括502 例LUSC 组织和49 例正常组织。利用R 4.0.2-Edger 的reads 中来自于某基因每1 000 个碱基长度的reads 数(reads per kilobase per million mapped reads,RPKM)函数(RPKM=样本映射到特定基因的外显子上的所有的reads÷样本的每百万所有reads 总和×外显子的长度,以kb 为单位)进行过滤后,共有15 143 个RPKM值的基因接受下一步分析。

1.2 WGCNA识别关键共表达模块

共表达网络促进了基于网络的基因筛选方法,这些方法可用于识别候选生物标志物和治疗靶点。本研究构建了TCGA-LUSC 的基因表达数据图谱,利用R 4.0.2-WGCNA构建基因表达网络,通过探索样本间高度相关的基因模块,将模块与外部样本性状相关联,将相似的基因表达划分为不同的基因共表达模块。为了进一步确定共表达网络中的功能模块,计算模块之间的模块-特性关联和临床特性信息系数,相关系数高的模块被认为是与临床特征相关的候选模块,并被选择用于后续分析。

1.3 差异表达分析及其与关键模块的交互

为了寻找LUSC 组织与正常组织之间的差异表达基因(differentially expressed gene,DEG)和差异表达lncRNA(differentially expressed lncRNA,DEL),利用R 4.0.2-limma 在TCGA-LUSC 中 筛 选DEG 和DEL(|log2FC|≥2,校正后P<0.05)。重叠DEG和共表达网络中关键模块的基因获得信度高的基因,利用R 4.0.2-Venn Diagram将其可视化为Venn图。

1.4 目标基因的富集与功能注释

通过R 4.0.2-Cluster Profiler 对Venn 图中信度高的基因进行GO 分析(P<0.05)。GO 注释包含生物过程(biological process,BP)、细胞组件(cellular component,CC)和分子功能(molecular function,MF),可以识别所有生物的基因和基因组的生物属性。

1.5 PPI网络的构建及关键基因的筛选

利用STRING 在线工具,构建选定基因的PPI 网络。选择得分≥0.9 的基因建立网络模型,通过Cytoscape(v3.8.0)可视化。通过Cytoscape-CytoHubba 寻找中枢节点,基于最大团中心性(maximal clique centrality,MCC)算法计算每个节点的MCC 值,选择MCC值最高的10个基因作为关键基因。

1.6 生存分析

将关键基因导入Kaplan-Meier Plotter 预后数据库(http://kmplot.com/analysis/),以P<0.05 为标准,筛选与预后相关的基因。

1.7 LUSC-ceRNA的构架

miRWalk数据库(http://mirwalk.umm.uni-heidelberg.de) 是一个综合性的miRNA 靶基因数据库,涵盖TargetScan Human、miRDB、miRTarBase 等靶基因数据库信息。利用miRWalk 筛选与关键基因相关的miRNA。筛选标准为:关键基因须同时与TargetScan Human、miRDB、miRTarBase 三个数据库关联。基于starBase(http://starbase.sysu.edu.cn/) 预测并筛选与miRNA 关联的lncRNAs。通过Cytoscape(v3.8.0)构建ceRNA网络。

1.8 网络药理学分析

通过中药系统药理学数据库与分析平台(Traditional Chinese Medicine Systems Pharmacology Database and Analysis Platform,TCMSP,http://tcmspw.com/tcmsp.php)检索中药“白花蛇舌草”,确定有效生物活性的分子(生物利用率≥30%,类药性≥0.18);PDB 蛋白质结构数据库(Protein Data Bank,PDB,http://www.rcsb.org/pdb)检索关键靶点蛋白,利用AutoDock Vina 对受体蛋白与配体小分子进行分子对接。AutoDock Vina 将结果以一种结合能形式输出,通过计算受体-配体复合物的空间效果、排斥作用、氢键、疏水相互作用以及分子的灵活性等值综合打分,评估其亲和力,最终给出最低结合能(docking score,DS)打分,这是衡量配体是否能与受体分子有效结合的重要指标,通常DS<-7 表示二者结合性强,能值越低,二者的结合效果越强。

2 结 果

2.1 加权共表达基因模块的构建

使用R 4.0.2-WGCNA,从TCGA-LUSC 中构建了基因共表达网络,共确定了TCGA 数据集中的7 个关键模块(图1A),通过绘制模块特征关系热图,确定了TCGA-LUSC 中与正常组织和肿瘤组织相关性最高的蓝绿色模块(MEturquoise)为关键模块(图1B)。

图1 TCGA-LUSC加权基因共表达网络分析

2.2 DEGs与共表达模块之间基因的鉴定

从TCGA 数据库中鉴定出DEGs 998 个,DELs 2 217个。共表达网络中,在TCGA数据集的蓝绿色模块发现了11 472个共表达基因。最终确定了801个信度高的重叠基因(图2)。

2.3 GO分析

GO分析(图3)显示,801个基因的生物过程(BP)主要在染色体分离和有丝分裂核分裂中富集。CC分析结果表明,这些基因主要涉及染色体着丝粒区域、浓缩染色体、染色体区域。MF 分析中,钠离子跨膜转运蛋白活性、肝素结合、糖胺聚糖结合与这801 个基因相关。

图2 差异表达基因和共表达模块中基因的维恩图

2.4 PPI网络构建与关键基因鉴定

基于PPI 网络(图4A),使用CytoHubba 的MCC 算法,从中选择得分最高的10个基因(图4B),主要包括CDC20、BUB1、CCNB2、BUB1B、CDK1、CCNB1、KIF2C、NDC80、CDCA8、CENPF基因。

图3 801个基因的GO分析

2.5 生存分析

通过分析PPI 网络中10个关键基因的预后,绘制了不同表达水平下的Kaplan-Meier(K-M)生存曲线(图5)。结果显示10个关键基因均与预后相关(P<0.05)。

2.6 ceRNA网络

在miRWalk 数据库中分别检索10个关键基因。依据“关键基因须同时与TargetScan Human、miRDB、miRTarBase三个数据库关联”的筛选标准,CDCA8被确定为唯一符合筛选标准的关键基因。miRWalk数据库同时筛选出hsa-let-7b-5p 为CDCA8 上游miRNA。基于miRNA,通过starBase 预测到14 个与之关联的lncRNAs(LINC00665、TMPO-AS1、AC090001.1、AF254983.1、AC007996.1、AC006206.1、AC133540.1、AL359924.1、SNHG4、 AC022075.1、 HOXA11-AS、 LINC00885、SLC9A3-AS1、 AL590666.2)。 基 于mRNA、 miRNA、lncRNA构建了LUSC-ceRNA网络(图6),通过Cytoscape(v3.8.0)可视化。

2.7 化合物分子-蛋白对接

AutoDock Vina 结果显示DS=-8.1 kcal/mol,表明CDCA8蛋白与豆甾醇化合物分子的亲和力强。图7所示氨基酸残基Lys15、Glu94与配体小分子形成氢键相互作用,氨基酸残基Arg18、Glu40、Ile74、Leu87、Lys90、Val89、Phe86、Phe93 与配体小分子形成疏水相互作用。

3 讨 论

虽然LUSC 患者在靶向治疗中广泛获益,但耐药性结局难以避免,加之患者早期缺乏明显症状,致使许多患者在晚期时才被确诊,故患者预后普遍较差。基于LUSC 的诊疗现状,我们亟需更高效的生物标志物和更有效的治疗药物,以提升LUSC 早期诊断率和有效治疗率。

本研究中,综合生物信息大数据分析,我们在TCGA 数据库中鉴定出801 个信度高的基因。GO 分析表明,这些基因主要富集在染色体相关区域,且与细胞增殖密切相关。此外,根据Cytoscape-CytoHubba的MCC 评分,筛选出与LUSC 相关的前10 个基因(CDC20、BUB1、CCNB2、BUB1B、CDK1、CCNB1、KIF2C、NDC80、CDCA8、CENPF),发现它们与LUSC的生存显著相关。经预测上游miRNA 及关联lncRNA构 建 了CDCA8、hsa-let-7b-5p 与14 个lncRNAs 的ceRNA网络。最后将受体蛋白CDCA8与豆甾醇配体进行分子对接,在一定程度上阐释了中药白花蛇舌草治疗LUSC的机制,为后续药物研究提供了新思路。

图4 蛋白互作网络和候选关键基因的可视化

细胞分裂在生命过程中起着重要作用[13]。许多研究表明,细胞分裂过程中的任何失调可能导致恶性肿瘤的发生[14-15]。CDCA 蛋白家族有8 个成员,即CDCA1~CDCA8。CDCA8 在有丝分裂[16]、交叉染色体分离和分裂的调控中起着重要作用[17]。CDCA8在大多数类型的肿瘤组织中高表达,在正常组织中低表达[18]。研究表明,CDCA8在调节肿瘤细胞生长过程中具有重要意义[19]。CDCA8的过度表达对肺癌和乳腺癌细胞的生长至关重要[20]。还与胰腺癌[21]、胃癌[22]和肾癌[23]患者的不良预后显著相关。虽然CDCA8 在LUSC中的作用机制研究较少,但其与患者生存期显著相关,可以作为肿瘤治疗的潜在分子靶点和预后生物标志物,这也为后续的研究提供了新的方向。hsa-let-7b-5p 已被证实可以作为肺癌预后相关生物标志物[24]。本研究中,14 个lncRNAs 通过竞争占有细胞内的hsa-let-7b-5p,缓冲并削减了hsa-let-7b-5p 抑制CDCA8 编码蛋白的能力,这成为LUSC 发生发展机制中的重要一环。

图5 关键基因的K-M生存曲线

图6 LUSC-ceRNA网络

图7 受体蛋白CDCA8与豆甾醇小分子配体之间的结合模式

由于LUSC 患者早期诊断率低,耐药结局难以避免,5 年生存率低等困扰仍未解决,中医药逐渐成为治疗LUSC 又一选择。中药通过多靶点,多途径协同影响肿瘤细胞的侵袭、发展和转移,但由于中药成分复杂,作用机制仍不明确。随着网络药理学与计算机科学技术的发展,阐明中药作用机制将成为可能。从清热解毒药白花蛇舌草中提取出的豆甾醇,已被证实可以通过抑制细胞迁移、细胞周期阻滞、线粒体介导的凋亡等途径,抑制胃癌的进展[11]。豆甾醇还可通过下调Jab1 蛋白诱导人胆囊癌细胞凋亡[25]。本研究通过分子对接技术明确了白花蛇舌草中的豆甾醇与LUSC预后相关的CDCA8蛋白亲和力强,其可能是白花蛇舌草抗肿瘤的主要物质基础,通过作用于关键基因CDCA8,从而干预LUSC 预后。因此豆甾醇有可能开发成具有抗肿瘤的中药单体或先导化合物,或推进含豆甾醇的中药应用于抗肿瘤领域。

综上所述,本研究最终确定了CDCA8 作为LUSC的预后相关生物标志物。分子对接技术为白花蛇舌草抗肿瘤活性成分的确定和分子机制研究提供了参考,为发现新型抗肿瘤中药单体和先导化合物提供了研究方向,也为进一步生物实验验证提供了理论依据。

猜你喜欢
共表达甾醇关键
硝酸甘油,用对是关键
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
高考考好是关键
高世代回交玉米矮秆种质的转录组分析
植物甾醇提取分离方法研究进展
植物甾醇提取分离方法研究进展
火龙果茎中3种主要甾醇的提取工艺研究①
植物甾醇的应用及提取工艺
两种半纤维素酶在毕赤酵母中的共表达