张洪也,程世龙,纪进立
(牡丹江医学院,黑龙江 牡丹江 157000)
食管鳞癌(Esophageal squamous cell carcinoma,ESCC)是食管癌最常见的病理类型,在全球癌症致死率中排名第四[1],肿瘤可侵入气管、支气管、形成食管、气管或支气管瘘,严重影响患者日常生活和工作,具有较高的发病率和死亡率。饮食、遗传、微生物感染等多种因素可引起疾病的发生[2]。ESCC缺乏早期临床症状,多在中晚期确诊,预后很差。因此恶性肿瘤患者的靶向治疗是目前肿瘤治疗的热点[3],寻找具有临床转化潜能的生物标志物,延长生存期,对改善ESCC患者的预后具有重要意义[4]。
环状RNA(circularRNA,circRNA)是一种真核细胞内广泛表达的闭合环状非编码RNA(Non-coding,ncRNA),是由mRNA前体反向剪切形成的,具有非线性构象,不具有5端的甲基鸟苷(m7GpppN)帽子结构和3端多聚腺苷酸(polyA)尾,具有稳定性高、特异性强、保守性好等特点,普遍存在于哺乳动物细胞,参与转录和转录后水平的基因表达调控[5]。近年来,随着对circRNA在各种疾病中的研究不断深入,circRNA逐渐成为提高疾病早诊率和生存率的突破点[6]。
本研究利用基因表达综合(GEO)数据库筛选获得ESCC中差异表达的circRNAs,并构建mRNA-miRNA-circRNA内源性竞争网络,对预测的靶mRNA进行功能和通路富集分析,探索相关信号转导通路,有望为ESCC的早期诊断和改善预后提供新的参考。
1.1 表达谱数据GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)获得GSE112496,GSE150476和GSE131969基因表达谱矩阵文件。GSE112496包括5例癌旁食管组织和5例食管鳞癌组织;GSE131969包括3例癌旁食管组织和3例食管鳞癌组织。GSE150476包括3例癌旁食管组织、3例转移的淋巴结组织、3例食管鳞癌组织,选取其中的癌旁食管组织和食管鳞癌组织进行对比分析。
1.2 circRNA的差异分析GEO2R对三个数据集进行差异分析,GSE150476、GSE112496和GSE131969数据集P<0.05和|logFC|>1确定为差异基因,三个数据集差异circRNAs取交集,利用Veen图进行数据可视化。
1.3 GO和KEGG富集分析DAVID数据库(https://david.ncifcrf.gov/)进行GO(gene ontology,GO)功能富集和KEGG(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,利用R语言的ggplot2进行数据可视化。P<0.05作为统计学标准。
1.4 ceRNA和PPI网络的构建CircInteractome(http://circinteractome.nia.nih.gov/)数据库预测circRNA-miRNA对,miRDB(http://www.mirdb.org)和mirWalk(http://mirwalk.umm.uni-heidelberg.de/)数据库预测miRNA的靶mRNA,同时在两个软件预测到的mRNA作为miRNA的潜在靶点,Cytoscape3.6.1软件对上述预测的circRNA、miRNA、mRNA构建ceRNA网络并进行可视化;使用Cytohubba插件提取hub基因。技术路线见图1。
图1 技术路线图
1.5 统计分析统计分析的结果由在线公共数据库自动计算产生,这些结果被认为是有统计学意义,*P< 0.05,**P<0.01,***P<0.001。所有数据处理和分析均由R软件(4.2.1版)完成。为了比较两组连续变量,使用独立t检验估计正态分布变量的统计显著性,使用Wilcoxon秩和检验分析非正态分布的变量之间的差异。GO和KEGG分析的统计结果通过多种癌症类型被纠正,用FDR、Bonferroni和Holm多重检验可以避免潜在的假阳性结果。P<0.05被认为具有统计学意义。
2.1 差异表达的circRNA及其靶miRNA和mRNA的预测GSE1150476数据集包含301个差异基因,其中50个上调,251个下调(图2A);GSE112496数据集中,ESCC样本和癌旁对照组之间共有42个差异circRNAs,6个上调,36个下调(图2B);GSE131969数据集包含697个差异基因,其中94个上调,603个下调(图2C)。取交集后,三个数据集的共同差异基因为hsa-circ-0000139(图2D)。intreactome寻找hsa-circ-0000139可能的靶点miRNA,预测出26个miRNA(表1)。根据miRDB和miWalk数据库寻找这26个miRNA的mRNA靶分子,预测出114个mRNA(表2)。
图2 食管鳞癌差异表达的circRNAs分析
表1 interactome预测的26个miRNA
表2 miRDB和mirWalk预测的114个mRNA
表2续表
2.2 mRNAs的GO和KEGG富集分析GO富集分析表明,生物进程主要富集在RNA聚合酶II启动子转录的调控过程、细胞增殖、细胞凋亡等(P<0.05)(图3A);细胞组分主要富集在核质、染色质、内质网、高尔基体、细胞核等(P<0.05)(图3B);分子功能主要富集在RNA聚合酶转录子序列特异性DNA结合、蛋白激酶结合、锌离子结合、蛋白质结合等(P<0.05)(图3C)。KEGG富集分析表明,主要富集在HIPPO、Wnt、cAMP、转录失调等信号通路(P<0.05)(图3D)。以上结果表明,食管鳞癌的发生发展可能与上述生物学功能相关。
图3 mRNA的GO和KEGG富集分析
2.3 PPI网络和ceRNA网络的构建采用STRING在线网站,置信度得分>0.4作为临界值,对118个mRNA进行蛋白质相互作用(PPI)网络的构建,删除不连接的节点和两个节点之间的重复连线,利用cytoscape3.6.1对PPI网络进行可视化,该网络由41个节点和54条边组成(图4A),cytoHubba插件计算前八个hub基因,算法为MCC,包括8个节点和16条边,hub基因为ETS1、SMAD2、YY1、NR3C1、RBBP4、NKX2-5、REL、MAF(图4B)。接着我们构建了一个circRNA-miRNA-HubmRNA调控网络(图4C)。
图4 PPI和ceRNA网络的构建
circRNA是一类以闭合环状为主要结构的内源性非编码RNA,被认为是一种新型的靶向生物标志物[8]。有研究表明,circ0023033可以作为肺癌的诊断生物标志物[9]。外泌体circRNA如hsa-circ-0087432在人脐静脉内皮细胞增殖和迁移过程中存在差异,在宫颈癌患者血清外泌体中显著高表达[10]。circRNA CPT1A在2型糖尿病患者外周血中的表达水平显著增高[12]。一些circRNA能够调节miRNA的表达[11],进而影响恶性肿瘤的发生发展。例如,circTNPO1通过下调miR-338-3p的表达促进骨肉瘤的增殖和转移[13],circSATB2通过上调miR-382-5p的表达抑制肺癌细胞的增殖和侵袭[14],circRNA EZH2通过上调miR-30c-5p促进前列腺癌LNCaP细胞的增殖和迁移[15]。进一步的研究发现,circRNA还能够竞争性地结合miRNA,从而调控miRNA的靶向mRNA的表达,参与恶性肿瘤的进展。如,circAPLP2通过竞争性结合miR-497-5p上调FGFR1促进结直肠癌的侵袭和转移,成为结直肠癌的诊治靶点[17]。
本研究选取GEO数据库中3个数据集做差异circRNAs分析后,取交集,得到一个共同差异的circRNA hsa-circ-0000139,接着预测出其靶向miRNAs和mRNAs,对预测的118个mRNA进行KEGG通路分析发现主要富集在HIPPO、Wnt、cAMP信号通路,这些信号通路不仅是食管鳞癌异常表达的基因富集通路,还在多囊卵巢综合征子宫内膜病变、骨肉瘤、结肠腺癌等[18]疾病中显著富集,表明这些疾病的发生发展可能存在某种内在的联系,还需要进一步的实验验证。
在118个mRNA中,经过筛选得到8个核心基因:ETS1、SMAD2、YY1、NR3C1、RBBP4、NKX2-5、REL、MAF。其中,SMAD2、YY1、REL已有文献报道参与食管癌的进展,SMAD2表达增加能够干预食管癌细胞的迁移和侵袭;YY1在新疆哈萨克族食管鳞状细胞癌中过表达,可能与食管癌的发生发展有关;REL是发现在食管鳞癌的表皮生长因子受体有关的过表达蛋白。此外,有文献报道Ets1的下调与乳腺癌的转移有关;NR3C1在肾透明细胞癌中表达增加;RBBP4在胃癌组织、结肠癌组织中表达明显异常;NKX2-5更多在心脏疾病如先天性心脏病、房颤中表达量显著下降,MAF多发现在肾脏疾病中过表达。
利用筛选后的hubmRNA,构建了circRNA-miRNA-mRNA网络,该调控网络可能在ESCC的发生发展中起关键作用,扩大了对ESCC的分子机制和生物学过程的理解。
综上,本研究确定了1个食管鳞癌相关的circRNA和8个核心基因,构建了PPI网络,并对预测的1个circRNA与其靶向的miRNA、mRNA建立了circRNA-miRNA-mRNA的ceRNA网络,有望为食管鳞癌的靶向诊断和治疗提供新的参考,但本研究缺乏细胞和动物实验,仍需进一步验证。