葛晓阳,梅璐,郑权
(郑州大学第五附属医院 消化内科,河南 郑州 450000)
结肠癌是世界最常见的癌症之一,2020年世界结直肠癌新发193万,在全球常见新发癌症中结直肠癌位居第三;因结直肠癌死亡人数达到93万,在全球常见癌症死亡原因中位居第二;中国新发结直肠癌55万,为国内新增癌症发病率第二位,新增结直肠癌死亡人数28万,为国内常见癌症死亡人数第五位,中国新发结直肠癌占世界新发人数的28.4%[1]。目前结肠癌最有效的治疗手段仍是手术治疗,尽管在放疗、辅助化疗、靶向治疗方面取得了一定成效,但患者的生存结局仍然较差[2],未能早期诊断以及预测预后是其死亡率高的主要原因[3]。相对于临床检查,生物标志物的检测更快速有效,因此,探索结肠癌的潜在生物标志物是非常必要的,有利于预测患者预后,指导治疗以延长患者总生存期。坏死性凋亡是一种新型程序性细胞死亡模式,表现为坏死和凋亡之间的中间特征,与坏死类似,表现为细胞肿胀和破裂,与凋亡类似,RIP1激酶和RIP3激酶是该通路的关键上游因子,通过多种磷酸化发挥复杂的调控作用,激活下游MLKL异位到质膜,增强膜的渗透性,从而导致细胞膜的破坏[4-6]。作为一种可调控的细胞死亡模式,坏死性凋亡相关通路的干预可能是抗癌药物研究的新方向。另有研究表明,MLKL磷酸化水平升高与结肠癌患者预后不良正相关[7],进一步探索坏死性凋亡相关的生物标志物对于预测结肠癌患者的疾病进展以及生存预后具有重要的意义。长链非编码RNA(long non-coding RNA,LncRNA)是指长度大于200个碱基对的非蛋白编码转录体,它们虽然不编码蛋白质,但可以通过调控染色质修饰、RNA剪切、细胞周期等多种途径影响肿瘤的进展[8]。有研究表明LncRNA在结肠癌预后的评估中发挥重要作用[9-10],而关于坏死性凋亡相关LncRNA对结肠癌预后影响的研究较少。本研究基于TCGA数据库构建并验证坏死性凋亡相关9-LncRNA预后模型,以期对结肠癌预后有更准确的评估,为结肠癌靶向分子的研究提供新思路。
1.1 坏死性凋亡相关LncRNA的筛选自美国癌症基因组图谱(the Cancer Genome Atlas,TCGA)数据库中获取结肠癌患者转录组数据及临床数据,包括473例癌组织转录组测序数据和相对应的452例患者的临床资料(年龄、性别、生存时间、生存状态、肿瘤分期)。从京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)数据库获取159个坏死性凋亡相关基因。使用Perl语言将转录组数据整理成行名为基因名、列名为样品名的表达矩阵,并区分为mRNA和LncRNA两个表达矩阵,引用R软件limma包,将上述159个坏死性凋亡相关基因和mRNA表达矩阵取交集,得到坏死性凋亡相关基因表达矩阵;对上述LncRNA和坏死性凋亡相关基因表达矩阵进行共表达分析(相关系数r>0.300且P<0.001)得到坏死性凋亡相关LncRNA表达矩阵。
1.2 坏死性凋亡相关LncRNA预后模型的构建将上述矩阵和临床数据合并,引用R软件survival包,采用Kaplan-Meier生存分析、单因素Cox回归分析,筛选得到结肠癌预后相关坏死性凋亡LncRNA,采用多因素Cox回归分析进一步筛选并构建风险评分模型,根据最小赤池信息量(Akaike information criterion,AIC)得到最优模型。并引用R软件ggplot2包和ggalluvial包绘制桑基图将结果可视化。
1.3 预后模型的评估得到LncRNA预后模型后,基于多因素Cox回归系数计算风险评分,根据风险评分中位值将患者分为高、低风险组并进行Kaplan-Meier生存分析,引用R软件survival包绘制结肠癌患者高、低风险组生存曲线。引用R软件survival ROC包,绘制1、3、5 a受试者工作特征曲线(receiver operator characteristic,ROC),评估该风险模型的灵敏度和特异性。为进一步评估该模型是否是独立预后因素,引用R软件survival包将其联合临床性状进行单因素和多因素Cox回归分析。
1.4 列线图的构建列线图可利用多种指标综合评估患者病情进展和预后,引用R软件“rms包”“survival包”将预后风险评分模型和年龄、性别、TMN分期纳入Cox回归模型,绘制临床列线图,预测1、3、5 a生存率,以拓展该预后模型的临床用途,计算一致性指数(consistency index,C指数)并绘制校准图检验列线图的准确性。
1.5 统计学分析采用R 4.1.2和perl 5.32.1.1进行数据处理和图形制作。采用Kaplan-Meier方法进行生存分析,log-rank检验计算P值。P<0.05为差异有统计学意义。
2.1 结肠癌坏死性凋亡相关LncRNA的获取从TCGA数据库得到结肠癌患者组织样本的转录组数据,识别出了14 142个LncRNA,从KEGG数据库获取159个坏死性凋亡相关基因,根据共表达的方法(相关系数r>0.300,P<0.001)筛选得到1 197个坏死性凋亡基因相关LncRNA表达矩阵。
2.2 构建结肠癌坏死性凋亡相关LncRNA的预后模型将上述表达矩阵和生存数据合并后,删去癌旁样本及数据不全样本,共得到372例结肠癌患者资料。采用Kaplan-Meier分析、单因素Cox回归分析(P<0.05)筛选出37个坏死性凋亡预后相关LncRNA,纳入多因素Cox回归模型,根据最小AIC得到最佳模型由9个LncRNA 组成,包括AC010973.2、LINC01011、AC027307.2、CD27-AS1、LINC02474、AC044802.2、LBX2-AS1、TNFRSF10A-AS1、B4GALT1-AS1。根据多因素Cox回归系数计算风险评分。对9种坏死性凋亡相关LncRNA在结肠癌中的功能进行可视化处理,绘制桑基图,清晰显示了46个mRNA和9个LncRNA及其与预后的关系。见图1。
图1 mRNA-lncRNA预后关系的桑基图
2.3 评估坏死性凋亡相关LncRNA预后模型
2.3.1基于预后模型的生存分析 基于坏死性凋亡相关LncRNA风险评分的中位值将患者分为高、低风险组,各186例。对高低风险组进行Kaplan-Meier生存分析显示,结肠癌高风险组的生存率低于低风险组(P<0.001)。风险曲线将结肠癌患者根据风险评分从低到高进行排序,散点图显示高风险组生存率低于低风险组,热图显示高、低风险结肠癌患者9种预后相关的LncRNA水平差异有统计学意义(P<0.05)。见图2、3。
图2 基于9-LncRNA预后模型的KM生存曲线
A为风险评分分布图;B为生存状态分布散点图;C为9-LncRNA表达热图。
2.3.2ROC曲线的绘制 利用ROC曲线评价预后模型的灵敏性和特异性,代表1、3、5 a生存率预测效果的ROC曲线下面积(area under the curve,AUC)分别为0.728、0.777、0.754,提示该模型对结肠癌高低风险组的分类效果及预后预测效能较好。见图4。
图4 9-LncRNA预后模型的1、3、5 a ROC曲线
2.3.3独立预后分析 单因素Cox回归和多因素Cox回归分析显示,年龄、T分期和预后模型是独立预后因素(P<0.05)。即排除临床混杂因素的影响,风险评分模型仍然是结肠癌预后不良的危险因素。见图5。
2.4 列线图的构建将性别、年龄、预后风险评分和T、M、N分期纳入Cox回归模型,利用R软件构建列线图预测1、3、5 a生存率,C指数>0.7时视为预测效能尚可,计算C指数为0.816,95%可信区间为0.77~0.87。绘制校准图,可见校准曲线和标准曲线贴合,说明该列线图对结肠癌的预后预测和实际预后相符合。见图6。
A为单因素Cox回归;B为多因素Cox回归。
A为列线图;B、C、D为1、3、5 a校准图
坏死性凋亡是一种新型程序性细胞死亡模式,近年在细胞死亡机制和癌症治疗策略研究中备受关注。Zhao等[11]进行动物实验证明了坏死性凋亡关键介质MLKL在结肠癌发生中的作用。Conev等[12]针对结肠癌患者5-氟尿嘧啶耐药问题,进行了临床回顾性研究,证明坏死性凋亡途径所依赖的RIPK3与患者预后相关,高表达患者总生存期显著延长,可能是一种有前景的预后标志物。Mishra等[13]研究表明人糖脂转移蛋白上调诱导结肠癌细胞坏死性凋亡,但保留正常细胞。这些研究表明,坏死性凋亡在调节结肠癌细胞生长和增殖中发挥重要作用,药物调节坏死性凋亡相关通路可能是治疗结肠癌的新策略。此外,既往研究已建立了结肠癌铁死亡相关、m6A相关LncRNA预后模型,显示出良好的预测效能[14-15]。Wang等[16]研究入组了95例结直肠腺瘤患者、128例结直肠腺癌患者和88例健康个体,结果显示LncRNA IFNG-AS1表达量在结肠腺癌中升高,它与肿瘤大小、TNM分期和患者的不良预后有关。随着对LncRNA的深入研究,LncRNA在结肠癌中的预测效能将不断提升。
鉴于坏死性凋亡和LncRNA都在结肠癌进展中发挥重要作用,本研究基于TCGA数据库分析坏死性凋亡相关LncRNA在结肠癌患者预后预测中的作用,构建了结肠癌坏死性凋亡相关9-LncRNA模型,包括AC010973.2、LINC01011、AC027307.2、CD27-AS1、LINC02474、AC044802.2、LBX2-AS1、TNFRSF10A-AS1、B4GALT1-AS1,根据风险评分将患者分为高、低风险组,进行生存分析,发现高风险组总生存期低于低风险组。绘制ROC曲线,计算1、3、5 a生存率预测效果的AUC值均大于0.7,说明该模型对于结肠癌患者生存时间预测效果良好。进行单因素、多因素Cox回归分析,结果表明,坏死性凋亡相关LncRNA预后模型是结肠癌患者的独立预后因素。将预后评分模型结合临床性状构建临床列线图并绘制校准曲线,计算C指数为0.816,且可见校准曲线和标准曲线基本一致,进一步表明该风险评分模型可较准确预测结肠癌预后,有望结合临床性状预测结肠癌患者预后。9种LncRNA中,AC044802.2是新发现的,未见相关报道,余8种均被报道和结肠癌预后相关[17-23]。值得一提的是,本研究中mRNA-LncRNA共表达网络中可见TNFRSF10A-AS1与多种坏死性凋亡mRNA相关。有研究表明其与细胞自噬相关,为结肠癌预后生存的保护因素[23],与本研究相符,该LncRNA同时参与细胞自噬和坏死性凋亡,可能对结肠癌的发生发展有重要作用,然而其发挥调控作用的具体通路有待进一步研究。目前对于LncRNA在坏死性凋亡中的作用机制相关报道较少,有研究表明某些LncRNA通过与miRNA 相互作用,上调或下调靶基因表达来调节坏死性凋亡。例如:在肝癌细胞中Linc00176结合多种肿瘤抑制因子miRNA,如miR-9和miR-185,当Linc00176缺失使相关miRNA释放,导致144个靶基因下调,抑制细胞增殖并诱导细胞坏死性凋亡[24]。此外,有一项研究表明,在葡萄糖饥饿条件下,p53直接上调人类肿瘤细胞中一种名为TRINGS的新型LncRNA,即葡萄糖饥饿条件下Tp53调节的坏死抑制剂,TRINGS与STRAP结合,抑制STRAP-GSK3β-NF-κB坏死信号,保护肿瘤细胞免于细胞死亡,这是一种不同于传统坏死途径(RIPK1-RIPK3-MLKL)的新型坏死性凋亡途径[25]。
总之,本研究建立并评估了结肠癌坏死性凋亡相关9-LncRNA预后预测模型,构建了坏死性凋亡相关mRNA-LncRNA共表达网络,并且进一步构建了临床列线图,期待优化结肠癌患者生存风险评估,促进个性化治疗,同时为结肠癌的治疗靶点提供新策略。但本文仍有一定局限性,9种LncRNA在结肠癌细胞中调控坏死性凋亡的详细机制仍需后续深入研究。靶向LncRNA往往比靶向单个基因对癌细胞产生更大的影响,是结肠癌十分有前景的研究方向。