余长云,张倩倩,薛彬彬,张彩,张晨,李金映,曹华,吉倩婧
(郑州大学第一附属医院 耳鼻咽喉头颈外科,河南 郑州 450052)
口底鳞状细胞癌(简称口底鳞癌)系原发于口底黏膜的癌症,是口腔颌面部肿瘤中较为常见的恶性肿瘤之一,具有易发生局部浸润和颈淋巴结转移的特点[1-2]。目前,口底鳞癌的治疗方式是以手术切除为主,并辅以放疗、化疗、基因治疗的综合治疗。近年来,尽管诊断及治疗手段不断更新改进,口底鳞癌患者的生存率及生存质量并未得到显著提高,其中重要原因就是肿瘤的早期转移及复发[3-5]。研究表明,大部分患者就诊时已出现局部或远处转移,这部分患者容易复发,预后相对较差[6-7]。因此,探索新的对肿瘤预后有价值的检测指标,对提高口底鳞癌患者的生存率及生存质量将具有重要意义。
长链非编码 RNA(long non-coding RNA,lncRNA)是一类转录本长度超过200 nt、不编码蛋白的RNA,参与发育、分化、代谢等多方面的调控[8-9]。研究表明,lncRNA 在多种恶性肿瘤中异常表达,与肿瘤细胞生长、分化、上皮-间质转化、干细胞特性、转移等多种生物学行为相关[10-12]。近期,越来越多的证据表明,lncRNA可作为包括乳腺癌、肺癌、胃癌等多种恶性肿瘤诊断或预后标志物[13-15]。然而,目前lncRNA与口底鳞癌患者预后的关系并不十分清楚。在本研究中,以癌症基因组图谱(the cancer genome atlas,TCGA)数据库为基础,采用Cox回归分析构建新的具有预测价值的lncRNA风险模型,以期为口底鳞癌患者的生存预测提供新的思路。
1.1 资料下载本研究从TCGA数据库下载原始研究数据集(https://cancergenome.nih.gov/),并从中提取lncRNA表达矩阵。纳入标准:口底鳞癌患者;完整的lncRNA表达转录组数据和临床信息;完整的随访资料。本研究共纳入54例口底鳞癌样本及3例对应癌旁组织样本。
1.2 lncRNA差异表达谱分析将下载的原始口底鳞癌转录组数据(count)进行ID转换,并添加基因属性,提取lncRNA表达矩阵。在R语言软件中,采用edgeR包对下载的数据进行处理,先对表达量(count)进行校正,并计算变异数;然后根据筛选标准(P≤0.001,倍数变化≥2)筛选在口底鳞癌组织和对应癌旁组织样本中差异表达的lncRNA。
1.3 lncRNA风险预测模型的构建采用单变量Cox回归分析筛选与患者总生存率相关的差异表达lncRNA,将P<0.01的lncRNA纳入随后的多变量Cox回归分析中,并删除信息量重叠的lncRNA,建立lncRNA口底鳞癌预后模型。根据模型中lncRNA的表达量及表达系数计算口底鳞癌患者的风险评分(risk score,RS)。采用如下公式计算风险评分[16]:
S=ΣβiXi。
式中S为风险评分,βi为lncRNA的表达系数,Xi为lncRNA在口底鳞癌患者中的表达水平。
1.4 检测风险评分与口底鳞癌患者预后的相关性根据风险评分公式计算每例口底鳞患者的风险评分,按照中位风险值将口底鳞癌患者分为高风险组和低风险组(风险评分高于或等于中位风险值的患者为高风险组,风险评分低于中位风险值的患者为低风险组),绘制风险评分曲线、生存状态散点图及lncRNA的表达热图。Kaplan-Meier法绘制高、低风险组患者的生存曲线。绘制受试者工作特征(receiver operator characteristic,ROC)曲线以评估口底鳞癌患者风险评分对生存评估的灵敏度和特异度,曲线下面积(the area under curve,AUC)越接近1表明预测性能越好。
1.5 统计分析本研究中所有统计分析均在R软件(版本3.5.1)中进行。采用edgeR包筛选差异lncRNA;Survival包进行单变量和多变量Cox风险回归分析,并建立基于多个lncRNA的风险预测模型;Survival ROC包绘制ROC曲线,并计算AUC。所有检验均为双侧检验,P<0.05为差异有统计学意义。
2.1 差异表达lncRNA在口底鳞癌组织与对应癌旁组织中共识别出138个差异lncRNA,其中40个上调lncRNA和98个下调lncRNA,图1中热图和火山图显示上调和下调的差异lncRNA。根据倍数变化(fold change,FC)值排序前10位差异表达lncRNA,表1中显示前5位上调和下调的lncRNA。
A为热图;B为火山图。图1 138个差异表达lncRNA的热图和火山图
表1 前5位下调和上调的lncRNA
2.2 口底鳞癌患者lncRNA风险预测模型的建立对筛选出的40个上调lncRNA和98个下调lncRNA进行单变量Cox回归分析,确定与口底鳞癌患者总生存相关的lncRNA。根据筛选标准(P<0.01),纳入5个与总生存期相关的lncRNA(MIR1-1HG、HOXC13-AS、RAMP2-AS1、LINC02454、LINC00702),进一步使用多变量Cox回归对5个lncRNA与生存的关系进行分析,并删除信息量重叠的lncRNA,最终建立包含MIR1-1HG、HOXC13-AS、RAMP2-AS1的3个lncRNA的口底鳞癌患者风险预测模型,一致性系数(concordance index,CI)为0.77(表2,图3)。S=0.291X1+0.280X2-0.433X3,S为风险评分,X1为MIR1-1HG的表达水平,X2为HOXC13-AS的表达水平,X3为RAMP2-AS1的表达水平。风险系数显示MIR1-1HG、HOXC13-AS为危险因素(β>0),RAMP2-AS1为保护因素(β<0)(表2)。Kaplan-Meier生存曲线显示MIR1-1HG、HOXC13-AS高表达组患者生存率低于低表达组患者,RAMP2-AS1高表达组患者生存率高于低表达组患者(图2)。
表2 多变量Cox回归分析结果
图2 口底鳞癌患者预后相关lncRNA的Kaplan-Meier生存曲线
图3 多变量Cox回归模型中3个lncRNA森林图
2.3 lncRNA预测模型的评估风险评分曲线(图4)、生存状态散点图(图4)显示,随着风险评分的增高,患者死亡率也增高。风险基因表达热图(图4)显示,MIR1-1HG、HOXC13-AS在高风险口底鳞癌患者中表达相对较高,而RAMP2-AS1在低风险口底鳞癌患者中表达相对较高。Kaplan-Meier生存分析结果显示,高风险口底鳞癌患者的总生存率低于低风险口底鳞癌患者(P<0.001)(图5)。ROC曲线显示口底鳞癌预后相关lncRNA AUC为0.895,模型具有较好的灵敏度和特异度(图6)。
A为风险评分点图;B为生存时间点图;C为lncRNA表达热图。图4 风险评分与生存时间点图及相关lncRNA表达热图
图5 高、低风险组口底鳞癌患者的Kaplan-Meier生存分析
图6 多变量Cox分析模型ROC曲线
口底区域解剖结构复杂,有丰富的淋巴管,相对口腔其他部位,该部位肿瘤更易淋巴结转移[17],预后较口腔其他部位肿瘤差,患者生存质量及生存率均较低[18-19]。因此,口底鳞癌的早期筛查及早期干预至关重要。目前,TNM分期系统常用于临床确定治疗方案、评估治疗效果及预后。然而,TNM分期仅考虑肿瘤的临床特点,并未考虑肿瘤的分子特点,并不能精确反映肿瘤特征,尤其是早期肿瘤[20]。同一分期的肿瘤具有不同的进展正说明了这一点[4]。因此,急需寻找新的、有效的预后指标用于口底鳞癌患者预后评估及治疗方案的指导。
随着生物信息技术的发展,越来越多的研究人员开始关注lncRNA对肿瘤患者预后的意义。一些lncRNA具有组织特异性,在疾病发展过程中起着至关重要的作用。Zhang等[21]观察到在胃癌中,lncRNA AOC4P可通过上皮-间质转化促进肿瘤的发生和发展,进而促进胃癌不良预后。Bo等[22]的研究表明,lncRNA AFAP1-AS1在宫颈癌发生发展中发挥重要作用。Beltrán-Anaya等[23]的研究也证实lncRNA KLHDC7B的低表达与乳腺癌患者预后不良相关。
在本研究中,共筛选出138个差异lncRNA,其中40个上调lncRNA和98个下调lncRNA。通过单变量和多变量Cox回归分析,构建了一个基于3-lncRNA的风险模型预测口底鳞癌患者的预后,该模型的一致性系数为0.77。风险分层及ROC曲线分析结果显示,高风险组患者生存率及生存时间低于低风险组患者,ROC曲线下面积为0.895。这些表明,基于这3个lncRNA的风险预测模型具有很好的灵敏度和特异度,能为口底鳞癌患者提供一个很好的预测工具。
模型中3个lncRNA中仅HOXC13-AS、RAMP2-AS1在口底鳞癌及其他肿瘤中被研究过。Li等[24]研究表明,HOXC13-AS在乳腺癌中高表达,并通过miR-497-5p/PTEN通路促乳腺癌细胞增殖。一项鼻咽癌的研究表明,HOXC13-AS在鼻咽癌组织中高表达,并通过miR-383-3p/HMGA2通路促进鼻咽癌细胞增殖和侵袭[25]。在口腔鳞癌中,HOXC13-AS呈高表达,可作为竞争性内源RNA,通过miR-378g/HOXC13轴促进口腔鳞癌细胞增殖、侵袭及上皮-间质转化形成[26]。本研究中HOXC13-AS风险系数大于0,且高表达HOXC13-AS组患者生存率低于低表达组患者,这些提示HOXC13-AS在口底鳞癌发生发展中起促进作用。在舌鳞状细胞癌中,检测舌鳞状细胞癌中lncRNA表达,发现HOXC13-AS与患者预后呈负相关[27]。本研究中RAMP2-AS1风险系数小于0,且高表达RAMP2-AS1组患者生存率低于低表达组患者,提示RAMP2-AS1可抑制喉鳞癌发生发展。以上这些表明,本研究筛选出的lncRNA将为口底鳞癌研究提供新的生物指标。
本研究经过TCGA口底鳞癌表达谱数据库的挖掘,筛选出差异表达lncRNA,并成功构建一个基于3个lncRNA的新的口底鳞癌风险预测模型,为口底鳞癌风险分层及临床预后判断提供帮助,并为基础研究提供更多可供选择的生物标志物。该模型仅包含3个lncRNA,在临床应用中可操作性强。然而,一方面本研究纳入患者相对较少,模型的预测能力仍需大量临床试验证据证实;另一方面,纳入模型的lncRNA在口底鳞癌细胞及生物体内的功能尚不明确,其在口底鳞癌发生发展中起的作用尚缺乏实验证据的支持,仍需进一步的功能实验研究。