基于多数据库分析外泌体基因在肝细胞癌中的表达及其意义

2020-08-10 09:26席跃吴泽华徐文迪武杰孙传东
精准医学杂志 2020年4期
关键词:竞争性外泌体关键

席跃 吴泽华 徐文迪 武杰 孙传东

(青岛大学附属医院肝胆胰外科,山东 青岛 266003)

肝癌的发病率在我国高居第4位,病死率是所有癌症相关死亡的第5位,其中肝细胞癌(HCC)在所有肝癌中的构成比为75%~85%[1-2]。尽管近几年来临床影像诊断技术、外科手术方法及介入技术、药物靶向治疗等已经取得了突破性的发展,但晚期HCC患者的占比仍然较多,总体预后很差。因此,关于HCC发展的具体分子机制的研究是当前研究的热点和难点。竞争性内源性RNA(CeRNA)学说最早由SALMENA等[3]提出,该学说指出lncRNA或mRNA通过竞争性结合不少于1个miRNA,形成miRNA应答原件(MRE)和lncRNA-miRNA-mRNA调控网络,通过调控mRNA的表达调节体内的蛋白水平。研究表明,每个miRNA可以调节多种蛋白质的表达水平,并且每个mRNA都包含了不同的MRE,因此又可以被多个miRNA靶向调节[4-5]。最近,越来越多的研究证实lncRNA-miRNA-mRNA调控网络在多种肿瘤的发展机制中起着至关重要的作用[6-8],如lncRNA HULC可以通过与miR-372竞争性结合影响PRKACB基因表达[9],lncRNA MCM3AP-AS1可通过竞争性结合miR-194-5p影响FOXA1的表达[10],从而促进HCC的发展。外泌体是细胞通过质膜与多囊泡体(MVBs)融合而释放的小囊泡,可在细胞之间运输生物活性分子[8],通过多种生物分子(DNA、RNA或蛋白质)调节机体免疫及细胞微环境[9-10],并参与调节多种与癌症相关的生物学过程,在肿瘤细胞的增殖、血管生成以及肿瘤的转移中发挥着重要的作用[11-12]。因此肿瘤来源的外泌体包含大量与肿瘤相关的血清学标志物,可用于多种肿瘤如早期肝癌的检测[13-15]。本研究基于生物信息学方法,从多个数据库(GEO、TCGA、exoRBase数据库)中分析筛选出HCC癌组织与正常组织以及HCC患者血液与健康人血液中差异表达的外泌体基因,再筛选出与HCC预后关系密切的关键基因,并对这些关键基因通过CeRNA网络预测调控关系,探讨HCC发展的分子机制。

1 材料和方法

1.1 数据库中差异表达的外泌体基因的筛选

分别在GEO数据库(www.ncbi.nlm.nih.gov/geo)中的GSE10143、GSE17856、GSE54236 3个数据集以及TCGA数据库(portal.gdc.cancer.gov)、exoRBase数据库(www.exorbase.org/exoRBase)中检索HCC癌组织与正常组织以及HCC患者血液与健康人血液当中均差异表达的外泌体基因,应用limma R及SVA R包对检索结果进行矫正处理及差异分析,以|log2FC|>1及P<0.05作为筛选差异基因的过滤条件,筛选出HCC癌组织和正常组织以及HCC患者血液和健康人血液中的差异表达的基因,即lncRNA、miRNA及mRNA。取交集后得到在3个数据库中均存在的外泌体差异表达基因;利用Upset R包对交集中差异表达的基因进行可视化分析。

1.2 与预后密切相关的关键基因的筛选及可视化分析

在TCGA数据库中获取HCC患者的生存信息,利用Survival R包对3个数据库均差异表达的基因进行合并和生存分析,筛选出与预后相关的关键基因,以P<0.05为差异具有统计学意义。通过TargetScan数据库(http://www.targetscan.org/)预测与mRNA结合的miRNA,及通过miRcode数据库(www.mircode.org/)预测与lncRNA结合的miRNA。结合TCGA数据库中筛选出的关键基因,最后筛选出与预后密切相关的外泌体关键基因。随后利用Cytoscape软件对上述得到的外泌体关键基因构建CeRNA网络,可视化lncRNA-miRNA-mRNA的调控关系。

1.3 外泌体关键基因的功能富集分析

参考CeRNA调控关系网络节点中关键基因的表达水平,应用GSEA软件对关键基因进行功能富集分析。选择c5.bp.v7.1.symbols.gm作为参考基因集,截断值(Cut-off)为:基因大小≥100,|富集分数(ES)|>0.6和错误发现率(FDR)<0.01。

2 结 果

2.1 数据库中筛选出的差异表达的外泌体基因

自GEO数据库的GSE17856数据集中筛选出HCC癌组织与正常组织及HCC患者血液与健康人血液中均差异表达的外泌体mRNA 869个,lncRNA 268个,GSE10143数据集中筛选出差异表达的mRNA 1 210个,lncRNA 134个,GSE54236数据集中筛选出差异表达的mRNA 344个,lncRNA 78个;自TCGA数据中筛选出差异表达的mRNA 527个,lncRNA 168个,miRNA 274个;自exoRbase数据库中筛选出差异表达的mRNA 151个,lncRNA 60个。对3个数据库进行交集后共得到HCC患者癌组织和血液中均差异表达的外泌体mRNA 38个,lncRNA 23个,miRNA 274个。利用Upset R包对3个数据库交集中差异表达的基因进行可视化分析,图中各柱形的高度及数量反应了各数据库中均差异表达的外泌体基因情况(图1)。

A、B、C分别为3个数据库中均差异表达的外泌体lncRNA、mRNA及miRNA

2.2 差异表达的外泌体基因的预后分析结果

利用Survival R包将3个数据库中均差异表达的外泌体基因与TCGA数据库中HCC患者的生存信息进行合并和生存分析后,共筛选得到与预后相关的外泌体关键基因lncRNA 1个,miRNA 28个,mRNA 9个。通过TargetScan数据库和miRcode数据库预测与lncRNA和mRNA共结合的miRNA和mRNA,发现符合条件的基因有hsa-miR-23b-3p、hsa-miR-206、hsa-miR-613、PTMA、CDC42、HNRNPA3、STK4。结合上面筛选出的与预后相关的关键基因结果,最后确定与预后密切相关的8个关键基因为lncRNA GTF2IRD2P1、hsa-miR-23b-3p、hsa-miR-206、hsa-miR-613、HNRNPA3、CDC42、PTMA、STK4。随后使用Cytoscape软件构建8个关键基因CeRNA调控关系网络,图中清晰显示出lncRNA-miRNA-mRNA的调控关系,即hsa-miR-613可分别竞争性结合lncRNA GTF2IRD2P1、CDC42、PTMA、HNRNPA3;hsa-miR-206可竞争性结合lncRNA GTF2IRD2P1、CDC42、PTMA与HNRNPA3;hsa-miR-23b-3p可竞争性结合lncRNA GTF2IRD2P1与STK4(图2),其中红色节点为lncRNA,蓝色节点为miRNA,绿色节点为mRNA,节点之间的连线表示两者之间存在相互作用关系。

图2 关键基因的CeRNA调控关系网络图

2.3 关键基因的功能富集分析结果

通过GSEA软件对外泌体关键基因功能富集分析,结果显示这些关键基因主要与“器官或组织特异性免疫应答”和“囊泡内吞过程”功能相关(图3),其中GO_ORGAN_OR_TISSUE_SPECIFIC_IMMUNE_RESPONSE中ES值为0.73,NES为2.04,P值为0.001;GO_ENDOCYTIC_VESICLE_LUMEN中ES值为0.65,NES为1.91,P值为0.001。

A:器官或组织特异性免疫应答功能;B:囊泡内吞过程

3 讨 论

全世界范围内每年约有782 500例新发HCC患者,HCC居癌症死亡原因的第2位[12]。尽管目前HCC的治疗方法已经取得了长足的进步,但因多数HCC患者发现较晚,总体预后仍然不令人满意[13-15]。越来越多研究表明,非编码RNA参与了转录、转录后和表观遗传等的调控,参与多种疾病的发展过程[16-18],许多非编码RNA也是肿瘤密切相关的预后标志物。ROBINSON等[19]首次应用生物信息学方法系统构建了肠上皮细胞通路的miRNA-mRNA相互作用网络模型,对肠上皮细胞CeRNA调控机制进行了很好解释,通过鉴定CeRNA网络中的子网络(sub-network),挖掘出大量与癌细胞增殖相关的基因,如cyclinD和c-MYC。因此,应用生物信息学方法结合相关数据库中基因信息,探索肿瘤发展的分子生物学机制,可为恶性肿瘤的诊断和治疗提供新的研究方向[20-21]。

目前关于HCC患者预后的CeRNA调控机制研究较少。研究发现,lncRNA GTF2IRD2P1在口腔鳞状细胞癌组织和正常组织中表达存在差异,并与肿瘤细胞转移和患者预后密切相关[22]。因此推测lncRNA GTF2IRD2P1可能通过调节癌细胞的转移,对HCC的发展产生重要影响。已有研究发现,相较于正常人,miR-23b-3p在HCC患者的血清中表达下调,因此可以作为HCC诊断的血清标志物[23-24]。此外,研究发现miR-613可通过与SOX9基因结合发挥抑制HCC发展的作用[25],miR-206通过下调PTP1B基因抑制HCC细胞增殖、侵袭和迁移[26],但具体机制还需要进一步研究明确。作为CeRNA中下游分子,已经有研究证明CDC42在HCC癌组织中表达升高,并且可以通过JNK通路,影响HCC细胞的增殖、侵袭以及迁移[27]。此外,STK4通过与lncRNA H19竞争性结合miRNA-15b,促进HCC细胞的侵袭和转移[28]。PTMA可通过TLR通路,影响慢性炎症反应,促进HCC的进展[29]。本研究基于生物信息学方法筛选和确定了与HCC患者预后密切相关的8个外泌体关键基因,即lncRNA GTF2IRD2P1、hsa-miR-23b-3p、hsa-miR-206、hsa-miR-613、PTMA、CDC42、HNRNPA3以及STK4,并通过构建CeRNA网络,揭示了关键基因之间的相互作用的关系,发现lncRNA GTF2IRD2P1可能通过竞争性结合miR-23b-3p、miR-613和miR-206,达到抑制PTMA、CDC42、HNRNPA3、STK4基因表达的作用,从而从分子水平揭示了HCC的发展机制。同时利用GSEA富集分析,发现这些关键基因主要与“囊泡内吞过程”和“器官或组织特异性免疫应答”功能相关,为下一步实验研究提供了一定的思路和方向。

但CeRNA网络也有其一定的局限性,其只能揭示出相互之间可能具有一定的调控关系,而不能明确具体的调控机制以及之间的变化关系,需要通过具体实验进行验证。

猜你喜欢
竞争性外泌体关键
硝酸甘油,用对是关键
竞争性装备采购招标文件分析研究与对策
新形势下深化改革开放的关键一招
外泌体miRNA在肝细胞癌中的研究进展
高考考好是关键
间充质干细胞外泌体在口腔组织再生中的研究进展
负载化疗药物的外泌体对肝癌的靶向治疗研究
循环外泌体在心血管疾病中作用的研究进展
政府采购PPP项目的竞争性磋商文件要合法实用
PPP竞争性谈判与风险管控