郑娴娴,高 明
1.合肥市第一人民医院南区滨湖医院检验科,安徽合肥 230000;2.安徽医科大学第二附属医院急诊外科,安徽合肥 230000
胃癌是消化道常见的恶性肿瘤,起源于胃黏膜上皮,作为世界位列第五的恶性肿瘤,超过70%的新发病例出现在亚洲,尤以我国更为明显[1-2]。目前,内镜结合病理检查是诊断胃癌的金标准,根治性手术切除是治疗的主要方式,然而,有些患者发现时已属晚期,姑息性切除严重影响患者生存时间。因此如何寻找胃癌的特异性血清标志物及在分子水平上为胃癌的治疗提供靶点尤为重要。环状RNA(circRNA)作为microRNA(miRNA)的“分子海绵”与miRNA互补结合,调控其生物学功能,与多种肿瘤的发生、发展、侵袭、迁移及耐药密切相关,已成为肿瘤领域研究的热点[3-4]。本研究基于微阵列数据,通过生物信息学和多个数据库的联合应用,构建胃癌相关竞争性内源RNA(ceRNA)调控网络,在人胃癌组织中进行初步验证,并分析其与临床特征之间的关系,期待为胃癌治疗提供潜在靶点。
1.1公共数据库资料 本研究使用美国国立生物技术信息中心(NCBI)的基因表达图谱数据库(GEO)(http://www.ncbi.nlm.nih.gov/gds/)中的基因芯片数据集构建ceRNA调控网络,GSE78092(3个胃癌肿瘤标本、3个配对的正常组织标本)用于筛选差异表达的circRNA(DECs)[5];GSE23739(40个胃癌肿瘤标本、40个正常组织标本)用于筛选差异表达的miRNA(DEMs)[6];GSE65801(32个胃癌肿瘤标本、32个配对的正常组织标本)用于筛选差异表达的mRNA(DEGs)[7]。癌症基因组图谱(TCGA)数据库中胃癌组织标本343个,正常组织标本30个,下载数据及临床资料后用于ceRNA网络中mRNA表达验证及临床资料分析。
1.2标本来源 标本来源于安徽医科大学第二附属医院急诊外科2020年1月至2022年5月行手术治疗的40例胃癌患者的胃癌组织及其配对的癌旁正常黏膜组织,入选标准为首次发现的胃癌患者,且术前未接受过化疗、中药等任何治疗措施,所有标本离体后立即留取胃癌组织及其配对的癌旁正常黏膜组织,置于液氮中保存,余下标本送病理学检查。所有入组患者均记录完整病例资料,包括性别、年龄、肿瘤最大径、肿瘤浸润深度、有无淋巴结转移及临床分期。本研究经安徽医科大学第二附属医院伦理委员会批准,所有患者均签署知情同意书,自愿参与本研究。
1.3方法
1.3.1circRNA、miRNA和mRNA的差异表达分析 首先对基因芯片数据集的原始数据进行背景校正和标准化处理,使用R语言(https://www.r-project.org/)“limma”[8]包筛选差异表达的circRNA、miRNA及mRNA,“pheatmap”包绘制热图。使用表达倍数(FC)比较差异表达大小。circRNA筛选标准为|logFC|>2和adj.P<0.05。miRNA和mRNA筛选标准为|logFC|>1,adj.P<0.05。
1.3.2ceRNA调控网络的构建 根据基因芯片数据集中circRNA差异表达分析结果,使用circBase(http:// www.circbase.org/)和CSCD数据库(http://http://gb.whu.edu.cn/CSCD/)预测 circRNA与miRNA之间的调控关系并与DEMs取交集。取交集后的miRNA分别使用miRTarBase和TargetScan数据库预测mRNA,同时出现在两个数据库中的mRNA纳入miRNA-mRNA调控对。同时满足以下条件构建ceRNA网络:(1)circRNA、miRNA、mRNA在各自数据集中均差异表达;(2)基于共享的miRNA构建circRNA-miRNA、miRNA-mRNA关系对;(3)circRNA-miRNA、miRNA-mRNA均成负向调控关系。最后利用Cytoscape软件(版本3.9.0)对调控网络进行可视化。
1.3.3GO和KEGG富集分析 采用R语言“clusterProfiler”[9]对DEGs进行基因本体论(GO)和京都基因与基因组百科全书数据库(KEGG)通路富集分析,并用“enrichplot”包对富集结果进行可视化,筛选条件为P<0.05。
1.3.4ceRNA网络中mRNA的表达验证及生存分析 下载TCGA数据库中胃腺癌临床资料及RNA转录组数据,利用“survival”包对数据进行生存分析,“survminer”包进行生存曲线的绘制。
1.3.5circ_0032821-miR936-CEP55调控轴在胃癌组织中的表达 (1)RNA提取:称取组织50~100 mg,剪碎,液氮研磨成粉末状,收集粉末,加入1 mL TRIzol(由Life technogies公司提供)裂解,裂解完全后,加入0.2 mL氯仿,剧烈振荡15 s,室温放置5 min,余下步骤按说明书进行。(2)cDNA第一链合成:根据PrimeScriptTMRT reagent Kit with gDNA Eraser反转录试剂盒(由TaKaRa公司提供)步骤进行,各监测指标及内参引物见表1,引物由上海生工生物工程(上海)股份有限公司合成,其中β-actin为circ_0032821和CEP55的内参基因,U6为miR936的内参基因。(3)实时荧光定量聚合酶链反应:依据Novostart SYBR qPCR SuperMix Plus荧光定量试剂盒(由近岸蛋白公司提供)步骤进行,循环参数如下:95 ℃ 1 min 预变性,95 ℃ 20 s、60 ℃ 1 min,扩增40个循环,应用2-ΔΔCt方法计算结果。
表1 各监测指标及内参引物信息
1.4统计学处理 采用SPSS26.0统计软件对数据进行分析,计数资料采用百分比(%)表示,组间比较采用Fisher确切概率法;计量资料的组间比较采用独立标本t检验;连续性变量之间的相关性分析采用Pearson相关性分析,Graphpad prism 9软件用于图表的绘制,P<0.05表示差异有统计学意义。
2.1circRNA、miRNA和mRNA的差异表达结果及ceRNA调控网络的构建 数据集GSE78092筛选得到DECs 32个,其中上调circRNA 6个,下调circRNA 26个(图1A);数据集GSE23739筛选得到DEMs 127个,其中上调miRNA 66个,下调miiRNA 61个(图1B);数据集GSE65801筛选得到DEGs 2 222个,其中上调mRNA 1 082个,下调mRNA 1 140个(图1C)。
注: A、B、C分别为差异表达circRNA、miRNA、mRNA热图,红色代表上调,蓝色代表下调;D为目标miRNA选取韦恩图(diff miRNA为GSE23739中差异表达的miRNA;MRE为DECs预测的miRNA);E为目标mRNA选取韦恩图(diff mRNA为GSE65801中差异表达的mRNA;miRNA target为DEMs预测的mRNA);F为circRNA-miRNA-mRNA调控网络,菱形、三角形、圆形分别代表circRNA、miRNA、mRNA;红色表示上调,黄色表示下调。
32个DECs经circBase和CSCD数据库预测后,circRNA与miRNA之间共有1 745个调控关系对,包含1 131个miRNA,与DEMs取交集后得到交叉miRNA 12个,见图1D。取交集后的miRNA经miRTarBase和TargetScan在线预测并取交集后得到mRNA 1 973个,与GSE65801数据集中的DEGs取交集,得到交叉mRNA 156个,见图1E。基于ceRNA构建理论,筛选出21个circRNA-miRNA-mRNA调控轴,其中circRNA 6个、miRNA 4个、mRNA 21个,Cytoscape软件可视化后见图1F。
2.2GO和KEGG富集分析结果 对156个交叉得到的DGEs进行功能分析。GO 分析显示mRNA参与腺体发育、胶原激活信号通路、异种刺激反应等生物过程;KEGG富集注释表明差异基因主要参与p53、PI3K-Akt、细胞黏附分子等信号通路,见图2A、B。
注:A、B分别为排名前5的GO分析及KEGG分析结果;C、D分别表示CCDC80及CEP55在TCGA数据库中的生存分析结果;E、F分别表示CCDC80及CEP55在TCGA数据库中差异表达;与正常组织比较,*P<0.05。
2.3ceRNA网络中mRNA表达验证及生存分析 TCGA数据库中有关胃癌肿瘤标本343个,正常组织标本30个,数据下载集整理后对ceRNA网络中的21个mRNA进行生存分析发现CCDC80和CEP55能够影响胃癌患者生存时间,差异有统计学意义(P<0.05)。见图2C、D。对以上两个基因再次进行表达量的验证后发现CCDC80在胃癌肿瘤标本及正常组织标本中比较差异无统计学意义(P>0.05),而CEP55在胃癌肿瘤标本中的表达显著高于正常组织标本中的表达,差异有统计学意义(P<0.05)。见图2E、F,最终确定circ_0032821-miR936-CEP55调控轴可能在疾病的发生、发展中具有调控作用。
2.4circ_0032821-miR936-CEP55调控轴在人胃癌组织中的表达及相关性分析 应用实时荧光定量聚合酶链反应的方法对40例胃癌组织及其癌旁正常黏膜组织中circ_0032821、miR936及CEP55的表达量进行检测,结果显示circ_0032821及CEP55在胃癌组织中高表达,而miR936在胃癌组织中低表达,差异有统计学意义(P<0.05)。见图3 A、B、C。相关性分析发现circ_0032821与miR-936、CEP55分别呈负相关和正相关(均P<0.05),而miR-936与CEP55之间无相关性(P=0.057)。见图3 D、E、F。上述结果验证了通过生信分析的方法筛选出的circ_0032821-miR936-CEP55调控轴在胃癌组织中的初步表达情况。
注:A~C表示 circ_0032821、miR-936、CEP55在胃癌组织及癌旁正常黏膜组织中表达;与癌旁正常黏膜组织比较,*P<0.05;D~F 表示circ_0032821、miR-936、CEP55相关性分析。
2.5circ_0032821与胃癌患者临床特征之间的相关性 根据circ_0032821分子表达水平的中位数,将40例胃癌患者分为高表达组和低表达组,每组各20例,分析circ_0032821与患者性别、年龄、肿瘤最大径、肿瘤浸润深度、有无淋巴结转移及临床分期之间的关系。经Fisher确切概率法检验后发现circ_0032821的表达与患者年龄、性别及肿瘤最大径无相关,与临床分期、浸润深度和有无淋巴结转移呈显著相关,见表2。
表2 circ_0032821的表达水平与临床特征之间的关系
环状RNA在分类上归属于非编码RNA,通过反向剪接方式形成既没有5′帽子也没有3′尾部的共价闭合环状结构,不易被核酸外切酶降解,因此结构稳定且高度保守[10]。作为竞争性内源RNA,circRNA可以充当miRNA的“分子海绵”与其互补结合,从而影响miRNA对其靶基因的调控功能。目前,国内外研究表明circRNA与人类多种恶性肿瘤的发生、发展及预后密切相关[11-14]。本研究首先通过生物信息学技术和GEO数据库的联合应用构建了胃癌中由circRNA介导的原始 ceRNA调控网络,并对GEO数据库中差异表达mRNA进行功能富集分析,以判断其行使的生物学功能,接着通过TCGA数据库对DEGs进行生存分析,挖掘胃癌预后相关基因,通过表达验证提取关键子网,确定可能影响胃癌患者预后的关键网络,最后通过人胃癌组织标本初步验证ceRNA调控网络的表达及与临床特征之间的关系。
miRTarBase和TargetScan数据库中同时出现的mRNA与GSE65801数据集中的DEGs取交集后经富集分析发现其中一些mRNA参与腺体发育、胶原激活信号通路、异种刺激反应等生物过程;KEGG富集注释表明差异基因主要参与p53、PI3K-Akt、细胞黏附分子等信号通路,而这些通路均在以往的研究中被证实在分子水平上参与了胃癌的发生发展[15-17]。基于ceRNA构建理论,筛选出 6个circRNA、4个miRNA 、21个mRNA用于构建circRNA-miRNA-mRNA调控网络,结合TCGA数据库中有关胃癌的数据资料,经生存分析及表达验证后最终确定circ_0032821-miR-936-CEP55调控轴可能是影响疾病发生、发展及预后的关键子网。
JIANG等[18]研究发现Circ_0032821通过激活MEK1/ERK1/2信号通路诱导人胃癌细胞增殖、上皮间质转化、迁移、侵袭和自噬抑制,表明circ_0032821在胃癌中具有致癌作用。LIU等[19]研究则证实过表达后的miR-936通过Akt相关信号通路靶向调控ERBB4抑制胃癌细胞增殖和侵袭并促进细胞凋亡,为miR-936/ERBB4调控轴治疗胃癌提供了新的见解。CEP55作为卷曲螺旋蛋白质家族中的一员,对细胞周期过程有重要的调控作用,加强了多种肿瘤细胞的迁移、侵袭能力[20-21],同时,TAO等[22]和HUANG等[23]团队的研究均证实CEP55与胃癌的不良预后密切相关。为了进一步证实生物信息学技术挖掘的科学性、可行性,收集了40例胃癌患者的胃癌组织及其配对的癌旁正常黏膜组织标本,利用实时荧光定量聚合酶链反应的方法检测两组标本中circ_0032821、miR936及CEP55的表达水平,结果显示circ_0032821及CEP55表达水平在胃癌组织中显著升高,而miR936明显降低,差异有统计学意义(P<0.05),初步验证了生信挖掘结果的科学性、可行性。目前有关circ_0032821、miR-936、CEP55与胃癌之间的关系已见报道,但三者之间是否存在circ_0032821-miR-936-CEP55调控关系尚未被证实,进一步通过相关性分析发现,circ_0032821与miR-936、CEP55分别呈负相关和正相关,差异有统计学意义(均P<0.05),然而miR-936与CEP55之间无相关性(P=0.057),究其原因可能与标本量偏小有关。结合生信分析及相关性分析结果,推断circ_0032821、miR-936、CEP55之间存在竞争性调控关系,未来拟通过细胞功能实验、裸鼠成瘤实验等进一步验证circ_0032821、miR-936、CEP55三者之间的分子调控机制。除此以外,还初步分析了circ_0032821与胃癌患者临床特征之间的关系,根据circ_0032821在胃癌组织中表达水平的中位数,将40例胃癌患者分为circ_0032821高表达组及低表达组,经Fisher确切概率法检验后发现circ_0032821的表达与患者年龄、性别及肿瘤最大径无相关性,与临床分期、浸润深度和有无淋巴结转移呈显著相关,而临床分期、浸润深度及淋巴结转移情况均是影响胃癌患者预后的因素,因此,circ_0032821的表达水平可能在分子水平上影响胃癌患者的预后。
本研究首先利用生物信息学技术分析了GEO数据库中有关circRNA、miRNA和mRNA的芯片数据,构建了circRNA-miRNA-mRNA调控网络,随后通过TCGA数据库验证并发现circ_0032821可能通过吸附hsa-miR-936上调CEP55促进胃癌发生发展。其次初步验证了circ_0032821-miR936-CEP55调控轴在人胃癌组织标本中的表达,并发现circ_0032821与影响胃癌预后密切相关,这可能为胃癌的早期诊断提供新的分子标志物,为分子治疗提供潜在靶点。