马 骞,朱 军,蔡梦珊,郝 俊,章屹然,陈 睿
(1.西安医学院,陕西 西安710021;2.空军军医大学西京医院,陕西 西安710032;3.空军军医大学基础医学院,陕西 西安 710032)
恶性肿瘤作为全球严峻的公共卫生问题之一,极大地危害着人类的健康,已成为世界范围内首要死因,占全世界死因的13%[1]。而结直肠癌(Colorectal carcinoma,CRC)是世界上第三大常见癌症,也是导致癌症死亡的第四大原因,在前期诊断、医疗保健费用和卫生服务利用等方面造成了沉重的公共卫生负担[2-3]。CRC发病率和病死率总体呈上升趋势,有效地实施筛查技术和减少接触高危因素是降低CRC发病的根本措施。虽然临床诊断和治疗技术不断提高,但由于缺乏有效的干预措施和早期诊断的特异性生物标志物,CRC患者预后不理想(尤其是晚期CRC患者)且5年生存率低的状况并没有明显改变[4-5]。因此,更好地探索CRC发病机制,寻找更敏感、更高效的诊断标志物是CRC领域的一个重要目标[6]。
组织活检是目前诊断肿瘤的金标准,但单个活检提供的肿瘤在空间和时间上的信息是有限的,无法反映肿瘤的异质性,因此需要寻找一种早期诊断、监测CRC发生和发展过程的新型诊断技术。液体活检可以提供所有癌症病变基因图谱(包括原发灶和转移灶),可作为组织活检的代替或者补充检测手段[7]。外泌体是液体活检的主要靶标之一,并且外泌体具有浓度高、易富集和生物学活性稳定的优势,因此外泌体在临床诊疗应用中具有很好的未来前景。外泌体是由所有细胞产生并存在于所有体液中的小细胞外囊泡[8],细胞释放多种不同大小的细胞外小泡,包括凋亡小体(1000~5000 nm)、中间微泡(200~1000 nm)和最小的外泌体(30~150 nm)[9]。肿瘤细胞比正常增殖细胞产生和分泌更多的外泌体,并且癌症患者血浆和其他体液中的外泌体水平普遍是升高的[10-11]。因此,外泌体内容物对癌症早期诊断以及治疗可能有着很好的帮助。
本研究通过exoRBase数据库获得CRC患者和正常人血浆样本RNA信息,应用生物信息学方法筛选CRC差异表达的外泌体RNA[包括信使RNA(mRNA)、长链非编码RNA(lncRNA)、环状RNA(circRNA)]表达谱,并构建CRC发生相关的竞争性内源RNA(Competing endogenous RNA,ceRNA)网络,分析与CRC相关的mRNA、lncRNA、circRNA,并对mRNA进行功能富集分析。将CRC患者血浆外泌体中多种功能RNA联合起来进行分析为挖掘出更多新的CRC肿瘤标志物提供了可能性,并且对CRC早发现、早诊断、早治疗有着指导意义,为临床医生治疗决策的选择提供了更多可能性。
1.1 资料下载 从exoRBase(http://www.exorbase.org/)下载CRC和正常人血标本外泌体RNA(包括mRNA、lncRNA、circRNA)表达谱,其中CRC患者血标本12例,正常人血标本32例,并对数据进行格式预处理。
1.2 差异表达基因(DEGs)筛选 使用“limma”和“sva”R包来鉴定DEGs。符合|log2FC|>0且P<0.05的RNA被筛选为DEGs(包括DEmRNAs、DElncRNAs、DEcircRNAs),并绘制相应的火山图。
1.3 微小RNA(miRNA)预测及ceRNA调控网络构建 本研究通过Target Scan Human 7.2(http://www.targetscan.org/vert_72/)和miRanda(http://cbio.mskcc.org/microrna_data/miRanda-aug2010.tar.gz)预测mRNA相对应的miRNA;使用ENCORI(http://starbase.sysu.edu.cn/)对circRNA进行预测得到其miRNA;在miRcode(http://www.mircode.org/)对lncRNA进行预测。最后,将相关mRNA、circRNA、lncRNA和其相对应的miRNA预测数据导入Cytoscape软件中,根据共同靶向miRNA构建miRNA相关的ceRNA调控网络。
1.4 功能富集分析 为了评估在外泌体中差异表达的mRNAs潜在生物学功能,我们用clusterProfiler、enrichplot和ggplot2软件包进行基因本体论(GO)注释和京都基因与基因组百科全书(KEGG)通路富集分析。GO富集分析主要包括生物学过程(BP)、细胞组分(CC)和分子功能(MF)三组,基于GO数据库进行显著性分析。KEGG富集分析依据 KEGG数据库对差异基因进行通路显著性分析。
1.5 统计学方法 所有的统计分析均在R 3.63统计学软件中完成。计量资料以均数±标准差表示,统计检验采用t检验或方差分析。P<0.05表示差异有统计学意义。
2.1 DEGs筛选结果 共筛选出125个差异表达的mRNAs(DEmRNAs)(上调基因118个,下调基因7个)、53个差异表达的lncRNAs(DElncRNAs)(均为下调基因)和81个差异表达的circRNAs(DEcircRNAs)(其中上调47个,下调34个)。DEGs火山图见图1。
图1 CRC患者与正常人血浆外泌体中三种差异RNAs火山图
2.2 miRNA相关ceRNA调控网络构建 基于CRC差异性表达的mRNA、lncRNA、circRNA及相对应的miRNA预测数据,本研究构建了ceRNA网络,共25个mRNA节点、16个lncRNA节点、13个circRNA节点和62个miRNA节点(图2)。已有研究发现,miR-15b、miR-17等可以辅助诊断CRC[12];miR-6家族成员可以作为诊断癌症的潜在生物标志物[13];miR-429失调参与了多种癌症上皮-间质转化、进展、侵袭、转移、凋亡和耐药等过程[14];miR-218、miR-497可以作为癌症预后标志物[15-16];miR-135可以作为一种新的消化道肿瘤标志物[17]。
图2 mRNA相关ceRNA调控网络
2.3 Go注释及KEGG通路富集分析 为了进一步检测ceRNA网络中所有差异表达mRNA在CRC中的潜在功能,我们进行了GO和KEGG功能富集分析。GO注释富集分析显示,外泌体mRNA主要富集在高尔基组织、高尔基体网、高尔基池、高尔基顺行池、高尔基堆、核孔、高尔基池膜、富含ficolin-1颗粒腔、黏着斑[18]、细胞基质黏附连接、细胞-基底连接、GTP结合蛋白RAN通路(图3)。KEGG通路富集分析显示,调控网络中差异表达的mRNAs主要富集在志贺菌病、FcγR介导的光细胞增多症、胰高血糖素信号通路、促分裂原活化蛋白激酶(MAPK)信号通路、血管内皮生长因子(VEGF)信号通路、多种寿命调节途径、肾细胞癌、沙门氏菌感染[19]、癌症中心碳代谢、胞吞作用、上皮细胞侵袭、胰腺癌通路(图4)。其中,GTP结合蛋白RAN与整体癌症风险相关[20];MAPK上调是CRC发展过程中的必需环节[21];VEGF对CRC患者生存率有重要影响[22];癌症中心碳代谢会在磷酸烯醇式丙酮酸羧激酶(PEPKC)协调下促进癌细胞生长[23]。上述结果表明,血浆外泌体中差异表达mRNA在CRC发生与发展中可能起着重要作用。
图3 GO注释富集分析柱状图(A)与气泡图(B)
图4 KEGG通路富集分析柱状图(A)与气泡图(B)
CRC是我国常见的消化道恶性肿瘤之一[24],预后与分期密不可分。CRC早期患者5年生存率可达90%,而晚期患者却不到10%,因此早发现、早诊断和早治疗对于CRC患者显得十分重要。目前已经进入精准医学新模式,从分子层面探索和发现CRC新的诊断标志物将有望为CRC的诊断提供新思路和新策略。
外泌体中富含多种生物活性物质,包括核酸、蛋白、脂质等,其中核酸包括miRNA、lncRNA、circRNA、mRNA、tRNA等[25],这为我们建立多种RNA联合的ceRNA调控网络提供了很好的数据来源。与传统液体活检所检测的细胞游离核酸相比,外泌体具有浓度高、易富集和生物学活性稳定的优势,因此外泌体在临床诊疗应用中具有很好的未来前景。已有研究发现,外泌体中miRNAs可以成为一种特别有前途的生物标志物候选物。miRNAs在细胞生长、分化、增殖、发育、凋亡和代谢等多种过程中发挥着重要作用[26],某些miRNA,如miR-21,被发现在实体瘤患者的血浆外泌体中高表达,如胶质母细胞瘤、卵巢癌、乳腺癌和前列腺癌[27],并且miR-21表达水平与疾病的存在、进展和对治疗的反应相关[28-29]。在非小细胞肺癌中,外泌性miRNA与无病生存率和总生存率相关。
ceRNA在包括CRC、前列腺癌、黑色素瘤、恶性胶质瘤、肝癌和乳腺癌等癌症的发生和发展中起着重要作用。各种类型的RNA分子,如mRNA、lncRNA、假基因和circRNA,通过共享共同的miRNA反应元件(MRE)形成一个相互调节的网络。根据ceRNA假说,共享一个或多个MRE的RNA分子可以充当ceRNA;两个RNA共享的MRE越多,它们之间的关系就越密切。ceRNA调控网络的假说为更全面地理解基因调控网络奠定了基础。基因突变、表观遗传修饰和染色体重排经常出现在肿瘤的非编码基因组中,由于mRNA中的3-UTR序列相对较短,MREs相对较小的突变或缺失可改变非编码RNA(ncRNA)的调控和转录后控制,进一步破坏ceRNA网络的平衡。反过来,ceRNA网络的不平衡可能促进肿瘤中多种恶性生物学行为。然而,目前对于CRC ceRNA网络的研究主要集中在lncRNA上,对假基因、circRNA或tRNA的研究相对较少。因此,本研究更全面地发现和整合了CRC ceRNA调控网络,将mRNA、lncRNA、circRNA和miRNA结合起来构建的调控网络有助于认识CRC发生、发展、诊断和治疗的调控分子机制,为将来CRC的精准医学治疗提供了借鉴和依据。
本研究共筛选出125个mRNAs、53个lncRNAs和81个circRNAs,并与其对应的miRNA预测数据构建ceRNA调控网络,再对ceRNA网络的25个共同差异表达mRNA进行富集分析。GO注释富集分析显示,CRC ceRNA网络中的外泌体mRNA与癌症相关通路主要富集在GTP结合蛋白RAN通路。KEGG通路富集分析显示主要富集于MAPK和VEGF信号通路。
综上所述,本研究确定了CRC发生相关的外泌体RNA并构建了相应的ceRNA网络,为进一步研究CRC转移、进展提供了分子基础,同时为CRC早期诊断提供了新型的液体活检生物学标志物。但是还存在以下不足:外泌体样本量少,需要进一步进行临床多中心验证;缺乏与其他数据库的联合分析;缺乏进一步的基础研究。