陈聪 倪乐宜 陈育梅
卵巢子宫内膜样癌是来源于子宫内膜和卵巢表面上皮的卵巢上皮性恶性肿瘤,占卵巢上皮性肿瘤的10%[1]。子宫内膜异位症和上皮性卵巢癌之间的相关性一直有所报道,有学者认为子宫内膜异位症可能是上皮性卵巢癌的癌前病变[2];子宫内膜异位症患者的卵巢癌风险增加[3]。子宫内膜异位症是一种与免疫及炎症反应相关的慢性疾病,发生机制与多因素相关,其中涉及到癌基因的激活和抑癌基因的失活等[4]。近年来生物信息学分析方法为肿瘤发生机制、早期诊断、预后生物标志物和治疗靶标等研究提供了思路[5]。本研究通过高通量基因表达(gene expression databases,GEO)数据库识别由正常子宫内膜向卵巢子宫内膜样癌发展潜在的免疫相关生物标志物,进行生物学功能和信号通路分析,探讨其相互作用网络,以期为卵巢子宫内膜样癌的发病机制、早期诊断和预后提供理论依据。
1.1 芯片数据 从GEO数据库(http://www.ncbi.nlm.nih.gov/geo)搜索关键词“卵巢子宫内膜样癌”,样本满足以下条件:(1)使用从人体组织获得的样本;(2)芯片同时包含健康样本和卵巢子宫内膜样癌肿瘤组织;(3)样本总数≥10,且数据处理合格。获得满足条件的GSE57545芯片数据微阵列数据集,GSE57545数据集中包含29份正常子宫内膜样本和18份卵巢子宫内膜样癌样本。
1.3 差异表达基因生物信息学分析 本研究使用DAVID6.8在线数据分析平台(https://david.ncifcrf.gov/summary.jsp)[6]对差异表达基因进行基因本体(gene ontology,GO)和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)富集分析提高结果的可靠性,GO分析(http://geneontology.org)包括分子功能、生物学过程和细胞组成3个部分,KEGG(http://www.kegg.jp)是一个存储基因组、疾病、生物化学信息等大量数据的数据库,用来研究与差异表达基因相关的潜在信号通路,当P<0.05和节点数≥10认为具有统计学意义,表明基因呈显著富集。
1.4 蛋白互作(protein-protein interaction networks,PPI)网络构建 为研究差异表达基因之间关键通路的相互作用,利用STRING在线分析工具(https://string-db.org/)构建PPI网络,使用Cytoscape3.7.2软件计算连接度最高的10个基因作为关键基因。
1.5 差异表达基因富集途径分析 pathview(https://pathview.uncc.edu/analysis)可以将信号通路可视化,可基于KEGG富集分析结果将基因的表达、调控和相关功能带入路径中。
1.6 关键基因的生存分析 Kaplan-Meier绘图仪(http://kmplot.com/analysis/)生物信息分析平台中共含有1 435例卵巢癌患者的数据,随访时间为250个月,可基于对本研究筛选出的10个关键基因进行在线生存分析检验生物标志物,并计算出95%CI和P值,评估卵巢子宫内膜样癌的免疫相关关键基因的预后价值。
表1 卵巢子宫内膜样癌差异表达基因
2.2 差异表达基因的GO分析和KEGG富集分析结果 对差异表达基因进行GO分析(表2)和KEGG富集分析(表3),GO分析表明,差异表达基因主要富集在“免疫反应”“IFN-γ介导的信号通路”“炎症反应”“信号转导”“先天免疫反应”“细胞黏附”“RNA聚合酶Ⅱ启动子对转录的正向调控”的生物学过程中,细胞成分主要富集在“质膜外侧面”“质膜”“细胞外基质”“细胞表面”“膜”“原生质膜的组成成分”“细胞外泌体”“膜的整体成分”“细胞外区域”,分子功能主要富集在“受体结合”和“蛋白质结合”。KEGG富集分析表明差异基因主要在“结核病”“金黄色葡萄球菌感染”“吞噬体”“抗原处理和呈递”“Toll样受体信号通路”“细胞黏附分子”等信号通路富集。这些差异表达基因的富集途径表明它们主要参与机体的免疫与炎症反应。
表2 差异表达基因的G O富集分析
表3 差异表达基因的K EGG富集分析
2.3 差异表达基因的PPI分析结果 将筛选出的差异表达基因提交到STRING数据库,构建出具有84个节点和599条边的PPI网络(图1),并用Cytoscape进行可视化,基于该网络应用CytoHubba插件从PPI网络中筛选出连接度最高的10个关键基因,分别是细胞黏附分子1(intercellular cell adhesion molecule-1,ICAM1)、Toll样受体2(Toll-like receptor 2,TLR2)、C-X-C趋化因子配体8(C-X-C motif chemokine ligand 8,CXCL8)、甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-phosphate dehydrogenase,GAPDH)、C-X-C基序趋化因子配体10(C-XC motif chemokine ligand 10,CXCL10)、IL-18、C-X-C基序趋化因子配体1(C-X-C motif ligand 1,CXCL1)、C-X-C基序趋化因子配体2(C-X-C motif chemokine ligand 2,CXCL2)、C-X-C基序趋化因子配体12(C-X-C motif chemokine ligand 12,CXCL12)、前列腺素-内过氧化物合酶2(prostaglandin-endoperoxide synthase 2,PTGS2)(表4),根据关键基因确定差异表达基因之间的相互作用模式。
表4 10个连接度最高的关键基因蛋白互作网络中心节点分数
图1 差异表达基因的蛋白互作(PP I)网络图
2.4 富集途径中重叠差异表达基因的调控 使用pathview绘制富集途径,展现差异表达基因发挥的作用,“吞噬体”信号通路中TLR2等许多上调基因诱导了Toll样受体基因的活化(图2,见插页),从而激活“Toll样受体信号通路”中PI3K-Akt信号通路,引起免疫基因的高表达,CXCL12编码免疫调节和参与炎症过程有关的分泌蛋白IL-12,产生促炎症反应效应(图3,见插页)。“抗原处理和呈递”信号通路中免疫物质主要组织相容性复合体Ⅱ的高表达诱导产生细胞因子激活免疫细胞,通过T细胞受体信号通路活化CD4+T细胞(图4,见插页)。通过确定差异表达基因的全面途径和网络分析展示了导致炎症和免疫应答发生的路径。
2.5 10个关键基因的生存分析结果 为了确定10个关键基因的预后价值,使用Kaplan-Meier绘图仪生物信息分析平台评估1 435例卵巢癌患者的总生存时间和无复发生存时间,发现TLR2、CXCL10、CXCL12、IL-18的高表达与子宫内膜异位症相关性卵巢子宫内膜样癌患者预后不良相关,CXCL8、GAPDH、CXCL1的高表达是卵巢癌患者良好预后的相关因素,ICAM1、CXCL2、PTGS2于总体生存分析无统计学差异。
虽然有很多研究认为卵巢子宫内膜样癌与子宫内膜异位症相关,但其具体的分子机制仍需进一步研究。近年来随着基因组测序、高通量测序等技术的不断改进,生物信息学分析方法被广泛应用于对芯片数据集的分析。故探索卵巢子宫内膜样癌的潜在关键免疫基因和生物标志物为了解其发病机制,做到早期诊断和预后判断提供了有效的方法[7]。本研究通过对GSE57545数据集中18个卵巢子宫内膜样癌组织样本和29个正常子宫内膜组织样本分析,共筛选出了87个差异表达基因,其中54个上调基因和33个下调基因。通过GO富集分析显示免疫相关差异表达基因主要参与“免疫反应”“IFN-γ介导的信号通路”“炎症反应”“信号转导”“先天免疫反应”“细胞黏附”“RNA聚合酶Ⅱ启动子对转录的正向调控”等生物学过程,有研究表明免疫功能紊乱、细胞-基质黏附的变化可促进细胞的变异以及肿瘤微环境的形成[8],这可能与卵巢子宫内膜样癌的发生、发展密切相关。KEGG信号通路富集分析中差异表达基因主要涉及“吞噬体”“抗原处理和呈递”“Toll样受体信号通路”“细胞黏附分子”等信号通路,其中“Toll样受体信号通路”在多种癌症中起关键作用[9],“细胞黏附分子”信号通路在细胞的黏附、侵袭、转移、增生等过程中也发挥重要作用[10]。10个关键基因(ICAM1、TLR2、CXCL8、GAPDH、CXCL10、IL-18、CXCL1、CXCL2、CXCL12、PTGS2)在信号通路图中显示多条通路中多种细胞因子的异常表达可导致CD4+T细胞的激活。本研究主要涉及到TLR2和CXCL12免疫基因的异常表达,其中PI3K-Akt信号通路的激活引起卵巢癌的发生已在多项研究得到验证[11]。生存分析表明TLR2、CXCL10、CXCL12、IL-18的高表达和CXCL8、GAPDH、CXCL1的低表达可能是判断卵巢子宫内膜样癌预后的免疫相关生物标志物。
TLR2编码的蛋白质是Toll样受体家族的成员,研究表明TLR的激活会导致Toll样受体信号通路上调从而调节宿主的炎症反应[12];诱导TLR2的耐受可抑制自身免疫炎症[13]。也有文献报道指出上调TLR2的信号转导可能激活炎症过程的非经典途径并减弱肿瘤的免疫抑制作用,同时与IL-12结合可刺激产生与卵巢癌相关的CD4+和CD8+效应T细胞[14],与本研究信号通路中所涉及的关键基因相一致,因此推断TLR2的过表达形成肿瘤微环境的免疫抑制,促进了卵巢子宫内膜样癌的发生、发展。CXCL12编码间分泌家族的基质细胞衍生的α趋化因子成员,CXCL12及其受体的相互作用可激活下游信号传导途径,影响肿瘤血管生成,促进肿瘤细胞增殖,在免疫监视、炎症反应、组织稳态以及肿瘤生长和转移等许多不同的细胞功能中发挥作用[15],有文献报道CXCL12通过与其特异性受体CXCR4相互作用来介导炎症因子的作用,在子宫内膜异位症模型中CXCR4-CXCL12轴的激活会增加癌细胞的增殖、迁移和侵袭[16],由此推测CXCL12的高表达与卵巢子宫内膜样癌的发生、发展密切相关,为其治疗提供了新的方向。
综上所述,慢性炎症是肿瘤发生的重要影响因素之一,本研究所选用的数据集中在细胞外基质和细胞膜上异常表达的炎症、免疫相关基因,这些基因表达可能增加全身性炎症反应,细胞通过富集、黏附形成逃逸免疫的肿瘤微环境从而影响卵巢子宫内膜样癌发生、发展过程。本研究通过生物信息学方法筛选了87个差异表达基因并初步探索了与卵巢子宫内膜样癌发生、发展相关的生物标志物和信号通路;结果发现差异表达基因主要富集在“吞噬体”“抗原处理和呈递”“Toll样受体信号通路”“细胞黏附分子”等信号通路来调控卵巢子宫内膜样癌的发生、发展。尽管已经鉴定出几个关键基因可作为卵巢子宫内膜样癌判断发病机制、早期诊断和预后的生物标志物,但本研究仍有以下局限性,首先这是一项生物信息学分析研究,缺乏实验和临床验证;其次,无法消除不同组织学类型对结果的影响,不同样本之间的测量也可能存在差异。