RNA结合蛋白相关肝细胞癌预后模型的建立与验证

2021-10-11 12:50刘璇龚培贤刘金玮孙涛范正军
河南医学研究 2021年26期
关键词:肝癌建模分数

刘璇,龚培贤,刘金玮,孙涛,范正军

(郑州大学第一附属医院 肝胆外科,河南 郑州 450052)

肝细胞癌(hepatocellular carcinoma,HCC)是原发性肝癌的最常见的病理类型,病死率居全球第2位,居我国第3位。HCC的致病原因较多,但肝炎病毒,尤其是乙型肝炎病毒(hepatitis B,HBV)与HCC的发生发展密切相关。我国HBV的流行率为18%,HCC确诊病例中,约85%的患者合并HBV。

随着影像技术的发展,肝癌的早期发现、早期诊断和早期治疗情况有所改善,加之肝癌的病程、诊断和治疗概念得以更新,肝癌外科手术切除率提高、死亡率下降,术后1、3、5 a生存率分别为88.1%、71.9%和60.0%。但我国肝癌患者多合并慢性肝炎和肝硬化,肝功能代偿能力差,术后复发率约50%,预后较差。另外,HCC起病隐匿,早期无明显临床表现,多数患者确诊时已为中晚期,错过了最佳治疗时机,只能接受姑息性综合治疗以缓解症状、提高生活质量,总体预后极差。因此,寻找新的肝癌生物标志物对提高HCC早期诊断率和促进预后十分重要。

RNA结合蛋白(RNA-binding protein,RBP)是一类伴随RNA调控与代谢过程的与RNA相结合的蛋白质总称,其在基因的转录后调控中起着关键作用。通过全基因组筛选,已在人类基因组中鉴定出1 500多个RBP基因,几乎所有的RBP直接或间接地参与人体内蛋白质的生物合成。RBP通过各种途径来维持细胞生理的稳态,特别是在发育和应激反应中。传统RBS的功能取决于它们与靶RNA的结合和核糖核蛋白复合物的形成,而这些复合物和RNA的合成、加工和翻译等生物学行为相关。许多研究已经明确RBP参与人类恶性肿瘤的发生和发展[1],并与患者预后密切相关[2]。但RBP在HCC中的研究并不成熟,为了探究RBP在HCC发生发展中的作用,从癌症基因组图谱数据库(the Cancer Genome Atlas,TCGA)下载HCCRNA序列数据,通过生物信息学分析,借助相关软件筛选独立影响HCC患者预后的RBP,并构建预后模型,以期为肝癌的诊疗及预后评估提供新的观点。

1 资料与方法

1.1 资料通过TCGA数据库,下载50例正常肝组织和374例HCC肝组织的RNA测序数据集以及相应的临床数据。

1.2 方法借助R软件处理数据,利用LIMMA软件包找出正常肝组织和HCC组织中差异表达的RBP相关基因,通过STRING数据库构建差异RBP蛋白质互作网络。

1.3 统计学方法采用Strawberry Perl语言和R语言处理数据,应用Wilcox秩检验筛选差异表达RBP,单因素分析应用检验分析得出结果,应用logistic回归模型分析所得到的HCC预后相关RBP,进而得出独立影响HCC预后的RBP,利用R软件在多因素联合的基础上构建预后模型,应用Kaplan-Meier法和Log-rank检验进行生存分析。P<0.05表示差异有统计学意义。

2 结果

2.1 HCC患者正常组织和肿瘤组织中差异表达的RBP识别借助R软件,得出正常肝脏组织和HCC组织中差异表达的1 317个RBP,其中325个RBP满足筛查标准,上调RBP 203个,下调RBP 122个。

2.2 蛋白质互作网络构建通过STRING数据库,基于2.1得到的325个RBP构建蛋白质互作网络,删除孤立RBP,得到305个相互联系RBP。

2.3 预后相关RBP的筛选及预后模型的构建基于2.2中得到的305个差异表达RBP,进行单因素Cox回归分析,共筛选出46个与HCC预后显著相关的RBP(图1A)。所有样本随机分为建模组和验证组。针对建模组,将46个RBP进行多因素Cox回归分析,最终得到EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1 5个HCC独立预后RBP(图1B,表1)。基于不同样本中这5个RBP的表达量,计算所有样本风险分数,计算公式为:

S=(-0.713 21×φEIF2AK4)+(0.808 75×φPRKDC)+(-0.210 47×φDHX37)+(-0.379 71×φINTS8)+(0.426 27×φEEF1E1)。

式中:S为风险分数;φ为蛋白表达量。

A.单因素分析;B.多因素分析

表1 多因素Cox回归分析

2.4 模型预后评估能力分析根据所有样本风险值的中位值,将建模组样本和验证组样本分为高风险和低风险两组。生存分析结果显示,无论是建模组还是验证组,高风险组患者预后均差于低风险组患者(图2A、C),另外,受试者工作曲线(图2B、D)显示,建模组中曲线下面积为0.710,验证组中曲线下面积为0.660。

2.5 模型独立预后分析将模型风险分数和临床相关因素汇总进行单因素Cox回归分析,只有风险分数和T分期差异具有统计学意义(图3A),将分级、T、N、M分期和风险分数一并纳入多因素Cox回归分析之中,风险分数和T分期是HCC患者独立预后因素(图3B)。

A、B.建模组;C、D.验证组

A.单因素;B.多因素

2.6 模型相关列线图的绘制根据预后模型中每个RBP回归系数大小,绘制列线图(图4),能准确预估患者1、3、5 a的生存率。

图4 模型相关列线图

3 讨论

正常细胞发挥作用是通过一套完整的、较复杂的调控机制来完成的,包括表观遗传修饰、RNA转录后修饰和蛋白质组的转录后修饰。越来越多证据表明RNA转录后修饰和肿瘤的发生密切相关。RBP是一类能够结合单链或双链RNA并参与形成核糖核蛋白复合物的蛋白质。这些蛋白质影响RNA的结构和相互作用,并在其生物发生、稳定性、功能、转运和细胞定位中发挥关键作用。当RBP基因表达上调或者下调时,可导致正常细胞转录组和蛋白质表达组的全基因组改变,进而影响细胞的生长、增殖、侵袭和死亡。

为了研究RBP在HCC发生发展中的作用,从TCGA数据库下载50例正常肝脏组织样本和374例HCC组织样本的RNA测序数据集以及相应的临床数据,提取所有样本的RBP表达量。借助R软件,最终得到305个在正常肝脏组织和HCC组织差异表达的RBP相关基因。经过筛选,得到EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1为独立影响HCC预后的RBP。PRKDC是DNA依赖性蛋白激酶的一个亚基,它参与DNA双链断裂的修复过程[3-4],属于磷脂酰肌醇-3-激酶家族成员。当DNA发生断裂时,PRKDC被激活,并且形成具有DNA结合作用的DNAPK复合物,触发非同源末端连接DNA修复行为[5]。DHX37是一种高度保守的RNA解旋酶,参与核糖体的生物合成,同时也是CD8 T细胞的功能调节剂[6],可能是肿瘤免疫治疗的潜在靶标。INTS8是整合体复合物家族成员,参与肿瘤的发生和发展。Tong等[7]研究发现,在HCC中,INTS8通过上调TGF-β信号通路来加速EMT[8]过程,并且证明INTS8在肿瘤组织中高表达,而且和肿瘤的侵袭转移以及预后有关。EEF1E1属于真核生物延伸因子复合物家族,参与基因表达的翻译过程,Kim等[9]研究发现,在胃癌和大肠癌中,EEF1E1表达下调,并且可能是胃癌和大肠癌的抑癌基因。EIF2AK4属于真核翻译起始因子2α激酶家族,当细胞缺乏必需氨基酸时,EIF2AK4被激活,抑制翻译过程[10],从而避免出现异常翻译。前文已有所述,RBP通过表达上调或下调,影响细胞的生长、增殖、侵袭和死亡,未来可以通过靶向调节RBP的表达来实现HCC的诊断和治疗。

通过5个具有独立预后能力的RBP,构建的预后模型,无论是在建模组还是验证组,风险分数均和预后相关,而且高风险组预后明显差于低风险组,说明模型具有一定的预测预后能力。在单因素Cox回归分析中,只有风险分数和T分期差异具有统计学意义,结合临床实际,将分级、T、N、M分期和风险分数一并纳入多因素Cox回归分析之中,发现风险分数和T分期是独立影响HCC患者预后的因素,说明所建模型能实现独立预后分析。在受试者工作曲线中,建模组曲线下面积为0.71,验证组曲线下面积为0.66,说明模型具有良好的诊断与预后能力。另外,通过列线图较准确的预估患者1、3、5 a的存活率,可辅助临床医生对HCC患者进行个体化治疗。但此项研究仍有不足,首先,基于TCGA数据库构建的预后模型,虽然在TCGA数据库内部验证中取得了较理想的结果,但未在其他数据库中进行验证;其次,本项研究是在回顾性分析的基础上设计和进行的,未来需要进行前瞻性研究进一步来验证结果的准确性。

综上所述,本研究通过生物信息学方法,较系统地探讨了RBP在HCC表达及预后中的价值,筛选出EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1具有独立预后能力的RBP,并构建了预后模型。该模型具有良好的HCC鉴别与诊断能力。本研究有助于揭示HCC的发病机制,为开发新的治疗靶点和分子标志物提供参考。

猜你喜欢
肝癌建模分数
分数
——分之有“术”
基于FLUENT的下击暴流三维风场建模
XB130在肝癌组织中的表达及其对细胞侵袭、迁移的影响
分数的脚步
分数的由来
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
无限循环小数化为分数的反思
隐源性肝癌与病毒性肝癌临床特征比较
求距求值方程建模
基于PSS/E的风电场建模与动态分析