王嘉宁,林晨,沈一鸣,王嘉达,沈志森
头颈部鳞状细胞癌(HNSC)是一种非常多样化的恶性肿瘤,包括口腔癌、口咽癌、喉癌及下咽癌等,是全球第七大最常见的癌症,全球发病率和死亡率居高不下,2018 年新发病例约70 万,死亡病例为35万[1]。在过去的30 年里,大多采用以手术为基础结合化疗、放疗和免疫检查点抑制剂治疗的综合治疗策略,但HNSC 的5 年生存率,尤其是晚期患者的5年生存率仍不足50%,局部复发和远处转移是治疗失败的主要原因[2]。因此迫切需要一种稳定有效的临床相关生物标志物来预测患者的临床结局,帮助选择合适的治疗策略,改善预后。转化生长因子-(TGF- )信号通路在肿瘤细胞的侵袭、转移和耐药等多种生物学行为中发挥关键作用[3]。因此本研究结合TCGAHNSC队列构建一个与TGF- 信号通路基因(TRGs)相关的风险预后模型预测HNSC患者的预后,报道如下。
1.1 资料来源 从美国癌症基因组图谱(TCGA)数据库中下载HNSC 患者的转录组数据、突变数据及相应的临床信息作为训练组,排除转移肿瘤组织样本及重复样本后,从501 例患者中得到497 例原发肿瘤组织样本及44 例正常组织样本。TGF- 信号通路相关基因集包括54 个基因,来自于基因集数据库(Molecular Signatures Database,MSigDB)。从GEO数据库(Gene Expression Omnibus database)中下载GSE41613 作为测试组,该数据集包括97 例HNSC患者的基因表达及临床数据。
1.2 筛选差异表达基因 采用R 软件中的“DESeq2”包筛选出TCGA-HNSC 队列中肿瘤组织与正常组织间4 799 个差异表达的基因(P<0.05,|log2 FC|>1),使用R 软件中的“venn”、“ggpubr”和“ggplot”包进行可视化。
1.3 预后模型的构建及评估 采用R 中的“Survival”包筛选出影响患者生存最为重要的关键基因,基于关键基因的表达水平及对应权重的线性组合,构建预后风险评分计算公式。以风险评分中位数为截断值,将测试组和训练组中的患者分为高风险组和低风险组,并绘制两组的生存曲线。此外,采用R软件包中的“survival ROC”绘制ROC曲线来评价该模型的敏感性和特异性。使用“rms”包,整合生存时间、生存状态和风险评分绘制列线图,评估这些预后因子在测试组中的预后差异。
1.4 免疫分析 采用“ESTIMATE”函数分别计算高、低风险组的肿瘤免疫评分、基质评分、ESTIMAT评分及肿瘤纯度。基于“CIBERSORT”研究两组浸润免疫细胞的丰度差异,“Immunophenoscore”计算两组的免疫表型评分。
1.5 突变分析 通过R 软件中的“maftools”对高、低风险组的样本进行突变分析,并对两组中突变频率前20 的基因进行可视化。
1.6 统计方法 采用R软件(v4.0.4)进行数据分析,采用单因素和多因素Cox 回归筛选关键预后基因,计算该基因的风险比及95%CI,采用Kaplan-Meier法绘制生存曲线,并用log-rank 检验差异性,采用Wilcox 检验比较两组ESTIMATE 评分。P <0.05表示差异有统计学意义。
2.1 筛选差异基因 获得4 799 个差异表达基因,其中2 409 个基因上调,2 390 个基因下调,差异基因中有6 个基因属于TGF- 信号通路相关基因集,分别 为 TGFB1、PMEPA1、SERPINE1、SLC20A1、RAB31 和LEFTY2,PMEPA1、SERPINE1、SLC20A1这3 个基因在肿瘤组织中相对高表达(P <0.05),LEFTY2 在肿瘤组织中相对低表达(P <0.05)。
2.2 预后风险模型的建立和评估 单因素Cox 分析结果显示SERPINE1、SLC20A1 和TGFB1 与患者生存有关的候选TRGs(P <0.05,HR >1),K-M 曲线显示高表达SLC20A1、SERPINE1 和TGFB1 与患者较低的生存率有关(P <0.05)。利用多因素Cox回归分析确定主要危险因子SLC20A1 和SERPINE1,并构建风险评分,风险评分=SERPINE1 表达量×0.033+SLC20A1 表达量×0.067,结果显示高风险组的生存率低于低风险组(P <0.05),见封三彩图3。患者的生存状态图显示随着患者肿瘤组织中SERPINE1 及SLC20A1 的表达量上调,患者风险评分增加,死亡风险增大,生存率逐步下降。ROC 曲线结果显示1、3 和5 年的ROC 曲线下面积(AUC)分别为0.595、0.623 和0.558,见封三彩图3c。
将风险评分与其他临床病理特征(年龄、肿瘤临床分期)纳入单因素Cox 分析,结果显示HNSC 患者的临床预后与肿瘤临床分期、风险评分相关(P <0.05)。经多变量调整后,风险评分仍与总生存时间相关(P<0.05),提示由TRGs构建的风险评分可独立于其他临床特征(P <0.05),作为HNSC 患者的独立预后因子。此外,结合临床分期、肿瘤分期和风险评分绘制的列线图,可以对患者进行评分,从而直观地了解患者的1、3、5 年生存概率(均P <0.05),见图1a。
图1 验证TRGs 相关预后模型
生存曲线显示在测试组中高风险组HNSC患者的预后情况明显劣于低风险组(图1b)。测试组与训练组患者的生存状态图相类似,高表达SERPINE1及SLC20A1 的患者具有更高的风险评分,且死亡患者大多分布于高风险组,见图1c。ROC 曲线结果显示1、3、5年的AUC分别为0.82、0.84 和0.80,见图1d。
2.3 高、低风险组肿瘤免疫微环境特征分析 肿瘤微环境主要由肿瘤细胞、免疫细胞、基质细胞及非细胞成分(细胞因子、外泌体、细胞外基质等)构成,ESTIMATE分析发现高风险组具有更高的基质评分及综合评分(均P <0.05),两组免疫评分差异无统计学意义(P >0.05)。进一步分析显示两组总免疫表型评分、效应细胞评分及免疫检查点评分差异均无统计学意义(均P >0.05),但高风险组的MHC 评分较高,低风险组的抑制性细胞评分更高(均P <0.05)。CIBERSORT 结果显示高风险组高水平浸润M0 巨噬细胞、静息CD4+记忆T细胞、静息自然杀伤性细胞及激活肥大细胞,低风险组高水平浸润浆细胞、CD8 T细胞及负调节免疫细胞如Treg T 细胞、辅助T 细胞及耐受DC 细胞。
2.4 高、低风险组免疫治疗相关预测指标分析 瀑布图展示了每组突变频率前20 的基因在样本中的突变情况,高风险组共有96.31%的样本存在基因突变,而低风险组中88.31%的样本发生基因突变,见图2a。免疫检查点表达分析发现高风险组较低风险组高表达PD-L1 及PD-L2,见图2b。
图2 不同风险亚型与免疫治疗相关预测指标
图3 构建TRGs 相关预后模型
在肿瘤发生过程中,TGF- 作为促肿瘤因子,能够诱导肿瘤细胞进行上皮-间质转化,维持其干细胞特性,促进肿瘤血管生成,参与肿瘤细胞的侵袭和转移[4]。同时也有研究发现TGF- 在促进肿瘤免疫逃逸和免疫治疗抵抗中发挥关键作用,在转移性黑色素瘤中,当TGF- 1 表达水平较低时,通常表现为较高水平的细胞毒性T 细胞浸润,此时患者具有更高的存活率[5]。目前,TGF- 信号通路也广泛用于其他肿瘤的预后预测,如膀胱癌[6]、结肠直肠癌[7]等。有研究表明TGF- 信号通路与HNSC密切相关,如Chang等[8]发现CLDN1 在HNSC 细胞中通过AMPK/TGF-/Smad 级联反应诱导上皮间充质转化的发生,从而促进HNSC 的进展。李佳丽等[9]通过免疫组化方法检测43 例喉鳞癌组织和12 例癌旁组织中TGF- 1蛋白的表达情况,发现TGF- 1 在喉癌组织中阳性表达率较高,且TGF- 1 蛋白的表达与临床分期、淋巴结转移及病理分级有关。这些研究均证明TGF- 信号通路与HNSC 密切相关,在调节肿瘤生物学中具有治疗潜力。然而,之前的研究并未建立一个有效的TGF- 信号通路相关预后模型。
本研究基于TCGA-HNSC队列成功构建一个与TRGs 相关的风险模型,用于评估HNSCC 患者的预后。通过生物信息学方法共筛选出6 个在HNSC 中差异表达的TRGs,进一步单因素和多因素Cox 回归分析筛选出2 个与HNSC 预后密切相关的基因SERPINE1 及SLC20A1。SLC20A1 是溶质载体家族第20 家族的第1 个成员,属于磷酸钠共转运蛋白,其在各种组织中广泛表达,并在维持细胞磷平衡中起着关键作用,参与细胞代谢、信号转导以及核酸和脂质合成,可能在细胞外基质和软骨钙化以及血管钙化中发挥作用[10]。此外,SLC20A1 对细胞增殖和肿瘤细胞生长非常重要,且这不依赖于磷酸盐转运功能[11]。Arora 等[12]发现SLC20A1 可以作为许多癌症的通用生物标志物。SERPINE1 是丝氨酸蛋白酶抑制因子超家族成员,又被称为凝血酶原激活剂抑制剂-1,其是组织或尿激酶型纤溶酶原激活剂的主要抑制剂,也是纤维蛋白溶解的主要抑制剂,在肿瘤微环境中,其常表达在成纤维细胞或者内皮细胞上,参与肿瘤的生长、转移和侵袭,被认为是一种很有潜力的治疗靶点[13]。既往研究发现,SERPINE1 在胃癌[14]、口腔鳞状细胞癌[15]等多种癌症中的表达均有上调,且与患者的不良预后相关。因此,基于这两个基因构建的预后模型在测试组的ROC 曲线显示1、3 及5 年的AUC 值均大于0.8,这证明该模型在预测患者的生存上具有一定的可靠性。通过预后分析证明其可以独立于其他临床因素,作为HNSC 患者的预后因子。结合风险评分及肿瘤临床分级绘制列线图以预测患者1、3、5 年生存率,使预测模型的结果更具有可读性,方便对患者进行评估。
最近的临床试验表明,肿瘤免疫细胞浸润与免疫治疗敏感性可影响HNSC 的预后,高风险组中高水平浸润M0 巨噬细胞、静息CD4+记忆T 细胞、静息自然杀伤性细胞及激活肥大细胞,可能参与肿瘤的进展;同时低风险组中的免疫微环境构成复杂,既有更高水平的适应性免疫细胞,如浆细胞、CD8+T细胞的浸润,也有负调节免疫细胞的浸润,并具有更高的抑制性细胞评分。免疫细胞浸润程度、PD-L1 表达水平以及肿瘤突变负荷等是HNSC免疫治疗疗效的预测因素[16]。在HNSC 当前的治疗中,ICIs 单药或联合化疗方案已被国内外指南推荐用于复发/转移HNSC 的一线治疗,PD-L1 表达水平及肿瘤突变负荷等是筛选ICIs 获益患者的关键。高风险组患者具有更高的基因突变频率及PD-L1、PD-L2 表达水平,这提示高风险组可能从免疫治疗中获益较大。
利益冲突 所有作者声明无利益冲突
作者贡献声明 王嘉宁:实验操作、论文撰写;林晨、沈一鸣、王嘉达:数据整理、统计学分析;沈志森:研究指导、论文修改、经费支持