马甜甜 柳家翠 段怡平 陈梁玥 朱翠雯 邹晓沨
结直肠癌(colorectal cancer,CRC)是全球第四大常见肿瘤,占全世界癌症相关死亡人数的8.5%。腺癌为CRC 中最常见的病理类型。CRC在我国的发病率不断上升,主要与经济发展带来的生活方式和环境的改变有关,如三高一低(高热量、高脂肪、高蛋白、低纤维)的西化生活方式[1]。早期CRC 患者的五年生存率可高达90%,由于缺乏早期诊断标志物,大多数CRC 患者诊断时已处于晚期阶段,其五年生存率降至70.4%[2]。因此,寻找CRC 发生发展相关的分子标志物,对于CRC的诊断、治疗及预后有着重要的意义。人类基因转录组仅有少数RNA 可作为蛋白质合成的模板,超过70%的RNA 为非编码RNA,对于细胞蛋白质的合成及增殖分化起着非常重要的作用。其中,长度超过200 个核苷酸的非编码RNA 称为长链非编码RNA(Long non⁃coding RNA,lncRNA)。研究表明,许多lncRNA 在各种癌症中表达失调,并与诊断和预后有关,例如,lncRNA HOXA⁃AS2在乳腺癌、胃癌等多种恶性肿瘤中均有异常表达[3],lncRNA DDX11⁃AS1在肝癌、结直肠癌等多种恶性肿瘤中出现高表达[4]。有研究表明,LINC00634通过miR⁃342⁃3p/Bcl2L1 轴在食管鳞状细胞癌中发挥致癌基因的作用[5],但是LINC00634在CRC 发生发展中的分子机制及与预后的关系尚未阐明。本研究通过分析TCGA 数据库,探索LINC00634在CRC 中的表达、免疫浸润及预后价值。
在TCGA 数据库官方网站(http://portal.gdc.cancer.gov/)下载结直肠RNA ⁃seq(level 3,HTSeq⁃FPKM)数据。其中包括CRC 组织样本473 例,正常结直肠组织样本41 例。对基因表达数据进行归一化处理,并Log2 转化后用于后续分析。在TCGA 数据库上下载并提取CRC 患者的临床病理特征信息,删除临床信息缺失的样本。
使用R 4.0.2 软件来筛选差异基因。将得到的差异基因绘制热图和火山图。
根据LINC00634在CRC 患者中表达值得中位数,将患者分为两组。利用卡方检验分析LINC00634与CRC 患者临床特征的关系。利用Kaplan⁃Meier 法比较两组之间总体生存的差异。使用Cox 回归分析LINC00634的预后价值。
采用基因富集分析(gene set enrichment analy⁃sis,GSEA)分析LINC00634在CRC 发生发展中参与的信号通路。从Broad Institute 网站(http://soft⁃ware.broadinstitute.org/gsea/index.jsp)下载GSEA 分析软件GSEA 4.1.0,分析通路来自Molecular Sig⁃nature Database(MsigDB)数据库中的c2.cp.kegg.v7.0.symbols.gmt 数据集。采用加权富集法分析,随机组合次数设为1 000 次,所有其他参数均按默认值设置。P值小于0.05 和错误发现率(false discovery rate,FDR)小于0.05 的基因集作为显著富集的基因。
使用R 4.0.2 软件评估LINC00634表达与肿瘤细胞免疫浸润丰度的相关性。将473 例肿瘤样本以中位数分为高、低表达组分析LINC00634对免疫系统微环境的影响。通过基于基因表达的反卷积算法CIBERSORT(http://cibersort.stanford.edu/)评估各组之间基因表达的相对变化。
采用软件SPSS 25.0 进行数据分析;计数资料以n(%)表示,行χ2检验;Wilcoxon 秩和检验,将CRC 患者的年龄、性别、TNM 分期等临床指标进行量化赋值,利用Cox 比例风险回归模型进行单因素和多因素分析;生存分析采用KM 法;P<0.05为差异有统计学意义。
筛选差异基因后共得到3 314 个差异表达基因(图1),其中包含1 933 个上调基因和1 381 个下调基因。
图1 差异表达基因Figure 1 Differentially expressed genes
CRC 中LINC00634的表达水平与正常组织相比,差异有统计学意义(P<0.05)。见图2。
图2 LINC00634 在CRC 组织中的表达分析Figure 2 Analysis of LINC00634 expression in colorectal cancer tissues
LINC00634的表达水平与患者的年龄、临床分期和淋巴结转移显著相关(P<0.05),见表1。临床Ⅱ期患者LINC00634的表达水平与Ⅲ期患者相比,差异有统计学意义(P<0.05)。见图3A。发生淋巴结转移患者组LINC00634表达水平与未发生远处转移组相比,差异有统计学意义(P<0.05),见图3B~D。
图3 LINC00634 表达量与CRC 患者临床病理特征相关性分析Figure 3 Correlation analysis between LINC00634 expression and clinicopathological characteristics of colorectal cancer patients
表1 LINC00634 表达与CRC 患者临床特征的相关性分析[n(%)]Table 1 Correlation analysis between LINC00634 expression and clinical characteristics of colorectal cancer patients[n(%)]
高表达LINC00634组中患者的总体生存率低于低表达组,差异有统计学意义(P<0.05)。见图4。
图4 LINC00634 的表达与CRC 患者预后的关系Figure 4 Expression and prognosis of LINC00634 in patients with colorectal cancer
年龄、Stage 分期、T 分期、M 分期、N 分期以及LINC00634均可作为预后因素,多因素Cox 回归分析提示,年龄、T 分期和LINC00634可以作为CRC患者的独立预后因素(P<0.05)。见表2。
表2 单因素和多因素Cox 回归分析Table 2 Univariate and multivariate Cox regression analysis
使用GSEA 功能富集进一步了解LINC00634在CRC 发生发展过程中参与的信号通路,富集结果。见图5。
图5 GSEA 功能富集分析Figure 5 GSEA functional enrichment analysi s
LINC00634表达与CD8+T 细胞、CD4+记忆T细胞、M1 型巨噬细胞和静止型NK 细胞正相关(R>0,P<0.05),与嗜酸性粒细胞呈负相关(R<0,P<0.05),见图6A。调节性T 细胞在LINC00634高表达组中含量增加,而CD4+记忆T 细胞和嗜酸性粒细胞含量减少,见图6B。相关性热图显示,在CRC 中,CD8+T 细胞与M0 型巨噬细胞存在显著的正相关性,而与CD4+记忆T 细胞存在显著的负相关性。见图6C。
图6 LINC00634 表达与免疫浸润Figure 6 Expression of LINC00634 and immune infiltration
CRC 是一种发病率和死亡率仅次于肺癌、胃癌、肝癌的恶性肿瘤,遗传和环境因素对CRC 的发生发展有重要的影响[6]。CRC 早期无症状,大多数患者就诊时已是晚期,治疗及预后效果不佳。检测外周血中的循环肿瘤细胞及其他与癌症有关的肿瘤标志物成本相对较低、侵入性更少,有利于CRC 的早期诊断[7]。已有研究表明mSEPT9、环状RNA 等在CRC 患者血浆中特异性表达,可作为肿瘤标志物用于CRC 的筛查和早期诊断[8⁃10]。
本研究结合多种生物信息学方法,发现LINC00634在CRC 组织中表达上调,其表达水平与患者的年龄、临床分期和淋巴结转移显著相关。KEGG 通路分析表明,上调的LINC00634主要参与了DNA 复制,核苷酸切除修复,碱基切除修复,嘌呤、嘧啶核苷酸代谢,磷酸戊糖途径,TGF 信号通路,ECM 受体相互作用通路等通路。DNA 损伤修复中核苷酸切除修复与碱基切除修复为重要的修复途径,其通路中基因表达改变及基因功能的缺失与多种肿瘤的发生发展密切相关[11]。肿瘤的发生发展涉及大量的病理生理及生化过程,异常的代谢途径,如嘌呤核苷酸代谢可通过调节信号转导通路影响基因和蛋白的表达,促进细胞恶性转化、侵袭和转移[12],TGF 信号通路参与多种疾病的发生,包括肝癌、乳腺癌等,ECM1 是一种分泌性糖蛋白,与肿瘤发生、血管生成和表皮分化等密切相关,通过与颗粒蛋白前体(PGRN)相互作用参与多种肿瘤的发生发展[13]。上调的LINC00634可能通过上述途径在CRC 发生发展中发挥作用,对癌症的不良预后产生影响。
同时,本研究揭示了LINC00634表达与CRC免疫浸润水平之间的联系。不同免疫细胞的基因标志物与LINC00634表达之间的关系暗示了LINC00634在调控结直肠肿瘤免疫微环境中的重要意义。结果显示LINC00634表达与CD8+T 细胞、CD4+记忆T 细胞、M1 型巨噬细胞和静止型NK 细胞正相关,而与嗜酸性粒细胞呈负相关。这揭示LINC00634可能通过调节T 细胞与NK 细胞进而影响CRC。研究表明肿瘤的转移与免疫系统相关,T 细胞免疫功能失衡的患者更容易发生转移[14],转移的结肠癌患者体内Th17 细胞增加,可以促进肿瘤细胞对免疫系统的耐受[15]。可以推断,LINC00634过表达可以促进T 细胞与NK 细胞的免疫反应和浸润,进而影响CRC 的转移与预后。
综上所述,LINC00634在CRC 组织中表达显著上调,调节了CRC 发生发展过程中免疫浸润细胞及各种途径中的蛋白质,并与CRC 患者的恶性进展相关,提示CRC 患者的不良总体生存预后,可以作为CRC 患者的独立预后因素。LINC00634有望成为CRC 新型分子标志物和肿瘤治疗的分子靶点。