昝雨欣,丁 妍
1. 湖北医药学院生物医药研究院(湖北十堰 442000)
2. 湖北医药学院附属太和医院生命科学研究所(湖北十堰 442000)
3. 胚胎干细胞研究湖北省重点实验室(湖北十堰 442000)
头颈鳞癌(head and neck squamous cell carcinoma, HNSCC)已在头部和颈部的各个区域检测到,诊断时存在远处转移,这与HNSCC 的高死亡率相关[1]。已有较多研究表明,基因甲基化影响HNSCC 的进展,如通过m7G 修饰的METTL1、m6A 修饰的RBM15及m5C 调控基因会促进或抑制HNSCC 细胞的侵袭、迁移和凋亡[2]。在成熟体细胞组织中,DNA 甲基化一般发生于CpG 双核苷酸(cg 位点)部位,促甲状腺激素释放激素基因cg01009664 位点在健康细胞和口腔鳞状癌细胞之间的甲基化水平差异最大,但关于HNSCC 其他亚类与cg 位点的研究较少[3]。
TBX2是T-box 家族成员之一,在多种癌症中过表达。其甲基化与缺血性脑卒中、非小细胞肺癌、横纹肌肉瘤等有密切联系,但较少有TBX2基因甲基化和HNSCC 相关性和预后的研究[4]。本文基于数据库研究阐明HNSCC 中TBX2基因表达与临床病理参数和预后价值的关联,进一步探索TBX2的甲基化cg 位点与HNSCC 预后的关系。
从UCSC Xena 数据库(http://xena.ucsc.edu/)[5]下载HNSCC 癌症样本和正常样本的mRNA 表达谱、相关临床数据和甲基化文件(TCGA-HNSC.methylation450.tsv);采用Perl软件从HNSCC 的HTSeq 中提取TBX2的mRNA 表达;从基因表达综合(Gene Expression Omnibus, GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)[6]下载GSE 6631、GSE 2379、GSE 83519 相关数据集,与健康对照相比;使用R 软件ggpubr 包计算HNSCC癌症样本和对照样本的TBX2mRNA的差异表达。
人类蛋白质图谱(Human Protein Atlas,HPA)数据库(https://www.Proteinatlas.org/)[7]包含有关人体组织和细胞的蛋白质分布信息,在该数据库输入目的基因TBX2,选择HNSCC 下的“单细胞”和“免疫组织化学”板块。分析TBX2在HNSCC 组织和细胞水平上的蛋白差异表达。
UALCAN(http://ualcan.path.uab.edu/)[8]是一个交互式门户网站,用于绘制生存曲线和进行临床病理差异分析。在网站输入目的基因TBX2,链接窗口下选择“生存”和“甲基化”板块,分析HNSCC 患者不同临床病理因素中TBX2mRNA表达与其预后的相关性。
UALCAN 用于研究HNSCC 中TBX2的启动子甲基化水平。采用Perl 软件分析“TCGA-HNSC.methylation450.tsv”文件中TBX2的甲基化水平。采用R 语言plyr 和ggpubr 包绘制甲基化箱线图;采用R 软件包dplyr 和ggpubr 分析TBX2DNA 启动子区域cg 位点的甲基化水平。
基于TBX2mRNA 表达和甲基化水平将HNSCC 患者分为高表达组和低表达组。采用R软件包survminer 和survival 对高表达组和低表达组进行生存分析。
以MSigDB 数据库(https://www.gsea-msigdb.org/gsea/msigdb/)[9]中的c2.cp.kegg.v7.5.1.symbols.gmt 和c5.go.v7.5.1.symbols.gmt 数据集作为功能基因集,对TBX2进行单基因功能和通路富集(错误发现率<0.05)。
采用R 软件(v4.1.3)对数据进行分析,采用Kaplan-Meier 分析计算HNSCC 高表达组和低表达组之间的生存差异,Spearman 相关性分析法计算TBX2基因甲基化水平和基因表达之间的关系。基于组间差异的卡方检验估计分类变量,采用Kruskal-Wallis 检验分析连续变量。以P<0.05为差异有统计学意义。
TBX2在HNSCC 肿瘤组中mRNA 表达高于对照组(P<0.001),见图1-A;通过GEO 数据库的RNA-seq 数据进一步分析发现,TBX2在肿瘤组中的表达明显升高(P<0.05),见图1-B;通过HPA 数据库分析发现,TBX2的蛋白表达在肿瘤组中升高,多集中于细胞核(图1-C),在HNSCC 细胞系中其多表达于RPMI-2650 细胞系(图1-D)。
图1 TBX2在HNSCC和正常组织中的表达Figure 1. Expression of TBX2 in HNSCC and normal tissues
通过Kaplan-Meier 分析评估TBX2表达与患者生存期之间的关系,未发现显著差异(P=0.53),见图2-A;在TBX2mRNA 表达水平与HNSCC 患者临床病理特征进展关系方面,随着年龄增长,其表达随之上升(图2-B);在临床分级中,肿瘤组中的1、2、3、4 级TBX2表达均高于对照组(P<0.001),在临床分期中,肿瘤组中的1、2、3、4 级TBX2表达均高于对照组(P<0.05),见图2-C、图2-D。
图2 TBX2的预后和临床病理特征Figure 2. Prognostic and clinicopathologic characteristics of TBX2
在UALCAN 数据库中,甲基化分析板块包含528 份HNSCC 样品和50 份正常样品。结果显示,与正常样本相比,HNSCC 组织中TBX2基因的甲基化程度较高(P<0.01),见图3-A。“TCGA-HNSC.methylation450.tsv”文件共包含580 份样品,TBX2基因中有22 个甲基化CG 位点(图3-B)。TBX2甲基化水平与mRNA 呈负相关(r=-0.19,P<0.001), 见图3-C。TBX2六个不同位点(cg11031701、cg19021197、cg27027242、cg12163132、cg10930156、cg02577108)甲基化水平与mRNA 呈显著负相关(P<0.05),见图3-D,与其他位点相关性差异不显著(P>0.05)。
图3 TBX2基因甲基化水平与mRNA表达的相关性Figure 3. Correlation between methylation level of TBX2 gene and mRNA expression
TBX2甲基化水平低的cg 位点(cg13274713、cg02577108、cg10492801、cg04304770、cg05162750、cg10930156)与不良OS相关(图4-A),TBX2的cg位点(cg13274713、cg04304770、cg02577108、cg21977256、cg26932779、cg27027242、cg10492801、cg22449107)的低甲基化水平与不良PFS 相关(图4-B),而其他甲基化cg 位点与HNSCC 患者的预后无关。
图4 TBX2基因甲基化与临床病理参数的关联Figure 4. Association of TBX2 gene methylation with clinicopathological parameters
采用基因富集分析(gene set enrichment analysis, GSEA)探究TBX2对HNSCC 主要生物学过程的影响。基因本体(gene ontology, GO)功能富集分析结果显示,TBX2主要富集于生物过程(biological process, BP)中非编码RNA3'端加工、小核RNA 代谢过程、翻译起始等;细胞组成(cellular component, CC)有免疫球蛋白复合物;分子功能(molecular function, MF)有翻译调节剂活性核酸结合等(图5-A)。从京都基因和基因组数据库(Kyoto Encyclopedia of Genes and Genomes, KEGG)基因集中富集到通路包括钙信号通路、黏着斑、黑色素瘤、神经活性配体与受体相互作用、蛋白酶体等(图5-B)。
图5 GSEA通路富集Figure 5. Enrichment of GSEA pathways
TBX2编码参与发育过程调控的转录因子可作为诊断和预后生物标志物,甚至是新的治疗靶点。目前仅有少量研究探索HNSCC 中TBX2表达与临床病理参数和预后的关系。在喉癌、甲状腺乳头状癌和鼻咽癌中,TBX2的mRNA 表达水平上调,且与淋巴结转移、分化程度相关,但在HNSCC 中鲜有报道[10]。本研究探讨了TBX2在HNSCC 中的表达和甲基化及其临床病理参数和预后的关系,发现TBX2mRNA 和蛋白表达显著高于邻近正常组织,不同TBX2表达水平HNSCC患者的OS 无明显差异,TBX2基因部分cg 位点甲基化水平与OS 和PFS 显著相关,TBX2是HNSCC 中重要的诊断和预后生物标志物。
异常的DNA 甲基化已被证实会改变肿瘤微环境,可用于疾病诊断和预后预测。甲基化谱对于鉴定基因的功能状态至关重要,因其表达依赖于DNA CpG 岛的甲基化状态。根据文献,某些基因的异常DNA 甲基化可能在HNSCC 病理生理和发展中起着关键作用[11]。DNA 甲基化异常可使与细胞增殖相关的基因表达异常,从而导致细胞增殖异常。早期研究表明,同源重组DNA 修复途径中XRCC3 c.722、Lig4 c.26 和Rad51 c.3429单核苷酸多态性与HNSCC 风险之间显著相关,而单核苷酸多态性在CG 序列上出现最为频繁[12]。本研究探讨了cg 位点的甲基化水平与预后之间的关联,结果显示,与健康对照组相比,HNSCC 中的TBX2表达较高,但甲基化同样较高。此外,TBX2甲基化水平低的cg 位点(cg13274713、cg02577108、cg10492801、cg04304770、cg05162750、cg10930156)与不良OS相关,TBX2cg位点(cg13274713、cg04304770、cg02577108、cg21977256、cg26932779、cg27027242、cg10492801、cg22449107)的低甲基化水平与不良PFS 有关, 提示cg13274713、cg02577108、cg10492801、cg04304770 这4 个位点是未来研究的重点,可能被用作HNSCC 的预后和治疗靶点。由于有关TBX2基因的cg 位点研究有限,现仅发现其在高血压中具有易感性[13]。
为进一步探讨TBX2导致肿瘤发生的具体机制,本研究采用GSEA 探究了TBX2对HNSCC 主要生物学过程的影响。GO 富集分析到分子功能翻译调节剂活性核酸结合。不论是非编码RNA相关n6-甲基腺苷对免疫球蛋白的识别和3'端加工,还是小核仁RNA 都已被证明通过28'-O-甲基化修饰在癌症发展中起着关键的调节作用,证实基因甲基化及其潜在的cg 位点在肿瘤预后中发挥着潜在作用[14-15]。从KEGG 基因集分析中富集到通路包括钙信号通路、神经活性配体与受体相互作用、蛋白酶体和细胞外基质。有研究指出蛋白酶体抑制剂硼替佐米治疗头颈癌,TBX2可诱导HAS2基因表达并增加透明质酸沉积,从而重塑肿瘤微环境[16]。早期有研究显示,原发癌细胞向远处器官的转移被认为是由上皮-间充质转化(epithelial-mesenchymal transition, EMT)诱导控制的,TBX2可能通过调节EMT 和转移前生态位的建立,在许多恶性肿瘤的转移中起着至关重要的作用,TBX2过表达通过EMT 和ERK 信号通路促进胃癌增殖和侵袭,E-钙黏蛋白增加可抑制细胞入侵[17]。研究表明TBX2抑制明显增加了E-钙黏蛋白的表达,并且抑制了体外鼻咽癌细胞的侵入与迁移[10]。生信结果与已有基础研究结果相互验证,但TBX2对HNSCC 的生物学过程还需要基础实验进一步验证。
本研究存在一定的局限性,尽管采用了生物信息分析,但缺乏了实际临床研究,降低了研究的可行性。综上所述,TBX2表达与HNSCC 患者的肿瘤分级分期有关,但与OS 无关。此外,与正常样本相比,HNSCC 组织中TBX2基因的甲基化程度较高,TBX2基因中某些cg 位点的低甲基化水平与不良的OS 和PFS 密切相关。整合甲基化和基因表达分析支持TBX2作为HNSCC 中的特异性诊断和预后生物标志物。