郑希望,薛绪亭,郭慧娜,张宇良,牛敏,张春明,2,吴勇延,3,高伟,3
1 山西医科大学第一医院耳鼻咽喉头颈肿瘤山西省重点实验室,太原 030001;2 山西医科大学第一医院耳鼻咽喉头颈外科;3 深圳市龙岗区耳鼻咽喉医院 深圳市耳鼻咽喉研究所
喉鳞癌是一种鳞状细胞癌,患者确诊时多为晚期,且易发生颈淋巴结转移,预后不佳,在过去40年里喉鳞癌患者的5年生存率呈现下降趋势[1-3]。相分离是指溶液中的生物大分子析出凝聚在一起,构成不溶于周围溶液的固体或凝胶的过程,该过程是可逆的[4]。相分离异常可造成蛋白质聚集异常,引起代谢、免疫和肿瘤等多种疾病[5]。相分离对肿瘤恶性进展具有潜在的调控关系,据报道,SPOP、TAZ 和ZAP70等多个相分离相关基因在肿瘤中发挥重要作用[6]。尽管相分离相关基因在癌症中的调控能力正逐渐受到关注,但其在喉鳞癌中的作用尚未明确。2019 年7 月—2021 年7 月,我们利用生物信息学方法,分析喉鳞癌组织与正常组织中相分离相关基因的差异表达情况,并筛选与患者生存时间相关的相分离基因,构建喉鳞癌预后预测模型,为临床治疗提供理论依据。
1.1 相分离相关基因数据来源 从Pubmed(https://pubmed.ncbi.nlm.nih.gov/)网站收录的公开文献以及4 个在线数据库PhaSepDB(http://db.phasep. pro/)、LLPSDB(http://bio-comp. org. cn/)、PhaSePro(https://phasepro. elte. hu/)、DrLLPS(http://llps. biocuckoo. cn/)收集1 501 个相分离相关基因。从TGCA 数据库(https://portal. gdc. cancer. gov/)下载111 例喉鳞癌与12 例癌旁正常组织的转录组测序数据作为TCGA 队列,以本实验室自有的107 例喉鳞癌及其对应癌旁正常组织转录组测序数据[7]作为自测队列。
1.2 相分离相关基因在喉鳞癌组织和正常组织中的差异表达基因筛选 使用R语言中的pheatmap程序绘制两个队列中相分离相关基因表达模式热图,进一步采用R 语言DESeq2 分析癌组织与正常组织的差异基因。以log2|FC|>1 且P<0.05 作为差异表达基因筛选的阈值,其中log2FC>1 为上调基因,log2FC<-1为下调基因。
1.3 喉鳞癌患者调控机制的分型 基于相分离相关基因表达谱,使用GSEA 软件,采用基因集富集分析预排名算法(GSEA Preranked)对TCGA 队列和自测队列患者分别进行个体水平的调控机制富集评分。根据调控机制富集评分进行基于一致性聚类的调控机制分型,机制分型运算由R 语言Consensus-ClusterPlus 程序完成。为了提取对调控机制分型具有关键作用的调控通路,本研究将调控机制分析结果中的基因本体论(GO)生物学过程相关的调控通路进行单独的热图分析。
1.4 差异表达的相分离相关蛋白质相互作用关系分析 采用蛋白质相互作用关系(PPI)网络将“1.2”分析获得的差异表达相分离相关基因导入在线数据库STRING(https://string-db.org/),选择人源数据,使用STRING 数据库默认参数构建PPI网络,观察蛋白之间的相互作用关系。
1.5 影响喉鳞癌患者生存时间的因素分析 采用单因素Cox 回归分析和Kaplan-Meier 曲线分析影响喉鳞癌患者总生存时间的基因。统计学分析采用Student's t检验,P<0.05为差异有统计学意义。
1.6 相分离相关基因预后预测模型的构建 将Cox 回归和Kaplan-Meier 曲线分析中满足P<0.05 的基因纳入相分离相关基因预后预测模型。使用最小绝对收缩和选择算法(LASSO)提取数据集代表性指征和构建相分离相关基因预后预测模型,由R 语言glmnet程序进行运算。使用相分离相关基因预后预测模型给予每位患者风险分数,计算公式为:其中CoLLPSi是预测模型中LLPSi 的风险系数,ExLLPSi是预测模型中LLPSi的表达水平,n 是预测模型中相分离相关基因的数量。根据总生存时间风险评分的中位值,将喉鳞癌患者分为高风险和低风险组,采用Kaplan-Meier曲线比较两组的总生存时间、无进展间隔率和疾病特异性生存率。
1.7 相分离相关基因预后预测模型的预测效能评价 采用时间依赖性受试者工作特征(ROC)曲线下面积(AUC)评价相分离相关基因预后预测模型对喉鳞癌患者1、3、5年总生存率的预测效能。使用基于R 语言的rms 程序构建由相分离相关基因预后预测模型和临床参数组成的诺莫图,以校准曲线和决策曲线评估预后预测模型通过诺莫图的形式在喉鳞癌临床预后预测使用的潜力。
2.1 相分离相关基因在喉鳞癌组织中的表达谱 1 501个相分离相关基因的表达热图显示,在自测队列和TCGA 队列中,与正常组织比较,喉鳞癌组织存在明显的相分离基因表达水平差异。在自测队列与TCGA 队列中共筛选出105 个差异表达的相分离相关基因,其中上调65个、下调40个(见OSID码图1)。
2.2 喉鳞癌患者调控机制分型结果 聚类结果显示,喉鳞癌患者基于不同的通路机制可分为3 个亚型,3 个亚型的相分离型关基因表达水平和富集分数明显不同(见OSID 码图2)。GO 分析显示,3 个亚型的生物学过程相关通路调控模式不同,亚型1 主要包括有氧呼吸、ATP代谢过程的调节、活性氧化物合成过程等通路;亚型2主要包括离子稳态、离子传输的调节、阴离子运输调节等通路;亚型3主要包括细胞老化调节、细胞衰老、白细胞介导的免疫调节和淋巴细胞介导的免疫调节等通路。
2.3 相分离相关蛋白的相互作用关系 以自测队列和TCGA 队列筛选出的105 个差异表达相分离相关基因构建蛋白质互作网络,结果显示,网络中的蛋白存在互作关系(见OSID码图3)。
2.4 相分离相关基因对喉鳞癌患者总生存时间的影响 Cox 单因素分析显示,SLC7A5(HR=1.90,95% CI 为1.03~3.45,P=0.039)、CPEB3(HR=0.49,95% CI为0.27~0.88,P=0.018)、KIF2C(HR=0.51,95% CI 为0.29~0.91,P=0.022)、ERPINH1(HR=1.80,95% CI 为 1.03~3.30,P=0.040)、PRKAA2(HR=2.40,95% CI 为1.34~4.44,P=0.004)、LGALS7B(HR=0.43,95% CI 为0.24~0.78,P=0.005)、PIWIL2(HR=0.42,95% CI为0.23~0.78,P=0.005)、TUBB3(HR=2.10,95% CI为1.16~3.74,P=0.014)是喉鳞癌患者总生存时间的独立影响因素(见OSID 码图4A)。Kaplan-Meier 分析显示,CPEB3、KIF2C、PRKAA2、LGALS7B、PIWIL2、TUBB3、TFRC、PIMREG、POU4F1、SLC7A2、SPANXC是喉鳞癌患者总生存时间的影响因素(P<0.05 或<0.01,见OSID码图4B)。将Cox单因素分析结果与Kaplan-Meier 结 果 合 并,TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PRKAA2、SLC3A2、LGALS7B、PIWIL2、SPANXC、TUBB3 等13个相分离相关基因是喉鳞癌患者总生存时间的影响因素。将上述13 种基因在喉鳞癌和正常组织中的表达进行比较,结果显示差异均有统计学意义(P均<0.01)。见表1。
表1 13个影响喉鳞癌患者生存时间的相分离相关基因 在喉鳞癌和癌旁正常组织中的表达比较( ± s)
表1 13个影响喉鳞癌患者生存时间的相分离相关基因 在喉鳞癌和癌旁正常组织中的表达比较( ± s)
基因名称TFRC SLC7A5 PIMREG KIF2C SERPINH1 POU4F1 SLC3A2 LGALS7B PIWIL2 SPANXC TUBB3 CPEB3 PRKAA2喉鳞癌组织(n=107)86.89 ± 95.23 28.22 ± 23.24 3.30 ± 2.36 7.33 ± 3.85 34.06 ± 30.71 0.16 ± 0.24 52.64 ± 23.31 135.33 ± 191.82 1.27 ± 2.78 0.11 ± 0.24 9.59 ± 10.62 1.21 ± 1.08 0.60 ± 0.78癌旁正常组织(n=107)32.47 ± 20.67 8.26 ± 10.70 1.70 ± 0.98 2.20 ± 1.58 8.88 ± 7.47 0.03 ± 0.08 22.10 ± 9.80 50.55 ± 86.71 0.24 ± 0.50 0.02 ± 0.06 1.85 ± 3.98 2.36 ± 0.91 1.39 ± 0.94 P 6.51E-08 2.17E-13 1.50E-09 2.20E-16 2.63E-13 4.62E-07 2.20E-16 5.26E-05 2.67E-04 2.04E-04 8.08E-11 7.05E-15 2.41E-10
2.5 喉鳞癌预后预测模型构建与验证结果 基于13 种对喉鳞癌患者生存时间具有显著影响的相分离相关基因,本研究构建了一个包含9 个相分离相关基因(TUBB3、SPANXC、PIWIL2、LGALS7B、SERPINH1、KIF2C、PIMREG、CPEB3 和TFRC)的喉鳞癌预后预测模型(另外4 个基因在LASSO 算法计算过程中系数为0,故舍弃)。使用相分离相关基因预后预测模型对TCGA 队列的111 例喉鳞癌患者进行危险因子评分,评分公式为:0.206 7×ExTUBB3+ 0.053 0×ExSPANXC+ (-0.012 9)×ExPIWIL2+ (-0.089 7)×ExLGALS7B+ 0.104 7×ExSERPINH1+(-0.103 2)×ExKIF2C+ (-0.062 6)×ExPIMREG+ (-0.174 4)×ExCPEB3+ 0.127 9×ExTFRC。根据危险因子评分中位值,将患者分为高、低风险组。高风险组总生存率低于低风险组(HR=5.47,95%CI为2.68~11.15,P<0.01,见OSID 码图5B)。ROC 曲线分析显示,模型风险评分对喉鳞癌患者1、2、5 年总生存率预测的AUC 分别为65.0%、79.4%和72.7%(见OSID 码图5C)。高风险组无进展 间 隔 率(HR=1.02,95%CI为1.00~1.04,P=0.036)和疾病特异性生存率(HR=1.02,95%CI为1.00~1.04,P=0.042)低于低风险组(见OSID 码图5D 和5F)。ROC 曲线分析显示,模型风险评分对喉鳞癌患者1、2、5年的无进展间隔率预测的AUC分别为69.70%、68.70%和77.10%,对疾病特异性生存率预测的AUC 分别为64.90%、65.40%和72.50%(见OSID码图5E和5G)。
整合模型风险评分和喉鳞癌患者临床参数构建诺莫图,评估预后预测模型通过诺莫图的形式在喉鳞癌患者临床预后预测使用中的潜力(见OSID码图5H)。校准曲线显示,诺莫图在1、2 和5 年内对喉鳞癌患者的生存时间具有良好的预测能力(见OSID码图5I)。决策曲线显示诺莫图和预后预测模型在预测喉鳞癌患者生存时间中具有良好的临床应用潜力(见OSID码图5J)。
喉鳞癌的发病机制目前尚未明确,其治疗以手术切除为主,易影响患者的呼吸和吞咽功能,导致患者生活质量严重下降。由于喉鳞癌患者在确诊时大多为晚期,往往错过了最佳治疗窗口。癌症病变过程中基因层面的变化早于病理宏观症状的显现,因此挖掘喉鳞癌组织中差异表达基因,寻找能够影响患者预后生存的标志基因是提高喉鳞癌诊断和预测预后生存的潜在策略。蛋白质异常相分离是前列腺癌、乳腺癌和白血病等恶性肿瘤发病的重要原因[8]。癌症是一种复杂且异质性的疾病,是由多基因协同作用导致的[9]。本研究通过分析相分离相关基因在喉鳞癌组织中的表达差异和对患者生存时间的影响,探讨相分离相关基因内在相互联系和在喉鳞癌发展过程的协调促进作用。在两组独立队列中,共鉴定出105 个在喉鳞癌组织中显著差异表达的相分离相关基因,并且作为整体,相分离相关基因在喉鳞癌和正常组织中具有明显不同的表达模式,其能够将癌组织和正常组织明显区分开。这表明相分离基因在喉鳞癌组织中的表达发生显著变化,具有作为喉鳞癌诊断标志物的潜力。
肿瘤的发生具有复杂的调控机制,同一种肿瘤的致癌癌基因和分子机制也可能存在着不同。为了研究喉鳞癌中患者个体水平的调控差异,我们使用GSEA Preranked 算法对每个患者进行调控机制评分。基于不同的调控机制,一致性聚类将喉鳞癌患者分为3 个亚型,其主要调控机制分别富集在有氧呼吸、离子稳态、免疫调节信号通路。这表明喉鳞癌患者的分子调控机制具有显著的异质性,基于分子水平的治疗应当考虑制定具有针对性的策略。此外,为了研究相分离相关基因作为整体在喉鳞癌中的调控通路,我们对全部1 501个相分离相关基因进行功能富集分析。相分离相关基因主要富集于PD-1/PD-L1 免疫检查点、肿瘤中心碳循环、表皮生长因子受体、表皮生长因子EGFR 受体耐药、缺氧诱导因子和多种特异肿瘤相关通路。程序性细胞死亡受体PD-1 是一种表达在免疫效应细胞表面的免疫检查点抑制蛋白,其由PD-L1 激活,PD-L1 异常是癌症主要的免疫逃逸机制之一[9]。肿瘤细胞能够利用糖酵解来维持自身的能量需求,并能够在无氧条件下将葡萄糖转化为乳酸,通过能量代谢的重构,改变了细胞中碳代谢路径[10]。表皮生长因子由EGFR、ErbB1、ErbB2、ErbB3 和ErbB45 等5 个成员组成,其在多种癌症中过表达或突变,并与肿瘤的预后不良、耐药和转移紧密相关[11]。低温诱导因子与血管形成、能量代谢和细胞存活等重要生物学过程密切相关,并且促进了多种肿瘤患者死亡率的增加。在临床研究中,抑制HIF-1 活性对肿瘤生长具有显著影响[12]。以上结果表明,相分离相关基因可能通过作用于不同的肿瘤通路调控喉鳞癌的进展。
本研究中,使用Cox 回归筛选出TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PRKAA2、SLC3A2、LGALS7B、PIWIL2、SPANXC 和TUBB3 共13 个对喉鳞癌患者总生存率具有显著影响的相分离相关基因。其中,TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PIWIL2 和TUBB3 对肿瘤的进展具有重要的调控作用[13-15]。多基因预后预测模型预测能力优于单基因模型[16]。基于上述13 相分离相关基因,建立了一个包含TUBB3、SPANXC、PIWIL2、LGALS7B、SERPINH1、KIF2C、PIMREG、CPEB3 和TFRC 等9 个基因的喉鳞癌预后预测模型。预后预测模型对喉鳞癌患者预后总生存、无进展间隔和疾病特异性生存具有显著不良影响。此外,我们建立了由相分离相关基因预后预测模型和临床参数组成的用于预测喉鳞癌预后生存时间的诺莫图,并表现出优异的性能。以上结果表明,相分离相关基因对喉鳞癌的预后生存具有显著的影响,进而具有对喉鳞癌患者预后预测潜在的临床应用能力。
综上所述,相分离相关基因在喉鳞癌和正常组织中存在表达差异,并且其可根据调控机制的不同将喉鳞癌患者分成有氧呼吸、离子稳态和免疫调节等通路相关的3 个不同机制亚型。TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PRKAA2、SLC3A2、LGALS7B、PIWIL2、SPANXC 和TUBB3 等13 个相分离相关基因对喉鳞癌患者的生存时间具有显著影响。最后,基于LASSO 算法,本研究构建了一个包含TUBB3、SPANXC、PIWIL2、LGALS7B、SERPINH1、KIF2C、PIMREG、CPEB3 和TFRC 等9 个相分离相关基因的喉鳞癌预后预测模型。该模型对喉鳞癌的总生存率、无进展间隔率和疾病特异性生存率具有良好的预测能力。深入研究相分离相关基因在喉鳞癌中的预后预测潜力和分子机制对未来喉鳞癌的临床诊断和预后预测具有十分重要的意义。