NCAPG对乙型肝炎病毒导致肝癌以及预后影响

2022-12-20 06:25马维杰
滨州医学院学报 2022年6期
关键词:激酶细胞周期肝癌

马维杰 李 伟 成 雨

滨州医学院第二临床医学院 山东 烟台 264000

原发性肝癌是世界上最常见的肿瘤之一,也是肿瘤致死的第四大病因[1]。原发性肝癌按照细胞分型主要分为肝细胞肝癌、胆管细胞型肝癌、混合型肝癌。其中肝细胞肝癌(hepatocellular carcinoma,HCC)为肝癌的主要类型,约占全部的75%[2]。肝癌预后较差,2018年全球肝癌发病率为9.3/100 000,相应死亡率为8.2%[1]。流行病学证据表明HCC的危险因素受地区的影响,在发展中国家,慢性乙肝病毒(hepatitis B virus,HBV)感染为导致肝细胞癌的主要影响因素[3]。HBV通过将自身DNA在癌症的早期阶段整合到宿主基因组中,诱导基因发生突变,使肝细胞对致癌因子敏感,同时HBV可能诱导体内免疫细胞的失衡从而导致肝癌的发生[4-5]。与未感染人群相比,慢性HBV携带者患肝癌的终生风险高10到25倍[6]。因此如何抑制HBV携带者发展为肝癌患者对预防HCC的发生及预后有着重要的意义。尽管许多参与肝癌发生发展和预后的相关基因和通路被广泛讨论,然而对各种基因和通路之间的机制关系仍然比较模糊。

本研究通过GEO数据库中选择GSE62232数据集,从而确定HBV与肝细胞癌的发展及预后相关的核心基因。通过GEO2R,分别获得正常组织和无病因肝癌、正常组织和HBV导致肝癌的DGES,利用string在线数据库、Cytoscape软件构建DEGS的蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络。通过Timer ualcan数据库发现NCAPG与肿瘤免疫浸润水平的关系。对NCAPG进行Kaplan-Meier总体生存分析和相关性分析,最后通过TCGA数据库筛选出NCAPG有关的肝细胞癌临床数据,证明NCAPG属于一个独立预后因素。

1 材料和方法

1.1 肝细胞癌微阵列数据集采集和处理 为了获得hcc的mRNA表达集,在GEO数据库中搜索“liver”和“智人”,通过目标方向筛选出所需要的数据集GSE62232[7](基于GPL570[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),其中包括10名正常人肝组织,10名HBV感染肝癌患者,15名无病因肝癌患者。其中所有数据均由公共数据库获取,本研究不涉及任何人体及动物实验。

1.2 差异基因的鉴别和分析 通过GRO2R分别鉴别正常肝组织和HBV肝癌患者、无病因肝癌患者之间的差异基因,P值和差异倍数(fold change,FC)选择默认数值,认为当P<0.05,∣log2FC∣>2时差异具有统计学意义。通过R软件和BioConductor软件包分别筛选之前的差异基因,随后通过Venn图检查交叉基因。从Venn图中找到目标差异基因(在HBV肝癌患者中独有的上调基因)117个。

1.3 PPI网络的构建以及hub基因的筛选 通过将筛选出的差异表达基因(differentially expressed genes, DEGs)导入string数据库中用于分析蛋白质网络复合体,提取出综合得分>0.9的所有蛋白相互作用(PPI)对,一般认为综合得分越高,基因越相似,PPI网络的稳定性越好。最后通过Cytoscape软件计算所得的文件,最终选出10个hub基因。

1.4hub基因的筛选 通过对选中的10个hub基因与癌症关联性以及对其药物敏感性的测定,初步选定将NCAPG作为本研究的关键基因。

1.5hub基因与肿瘤免疫浸润水平的关联 将选中的hub基因导入Timer中,从中发现hub基因是否与CD4+T细胞、CD8+T细胞、巨噬细胞、嗜中性粒细胞和树突状细胞的浸润水平有关。进一步筛选hub基因与其相关亚群浸润水平之间的关系。

1.6hub基因的调控因子 为明白hub基因在hcc中的生物学意义,通过Linked Omics数据库查找出与hub基因有关的相关基因,分析了NCAPG共表达基因的激酶、miRNA和转录因子(transcription factor,TF)的富集。

1.7 对hub基因的GSEA富集分析 通过TCGA-GDC数据库下载与LIHC有关的mRNA信息,筛选出所需要的hub基因,通过运用Java、perl、GSEA(4.1.0)绘制富集分析图,明确hub基因的功能。

1.8hub基因的生存分析 使用Kaplan-Meier在线数据库对hub基因进行生存分析,分别分析总生存期(overall survival,OS)、无进展生存期(progression free survival,PFS),并将其表达在曲线图中。

1.9hub基因的临床相关性分析 将hub基因导入UALCAN数据库,分别选择在不同种族、年龄、性别等方面表达量差别,进一步分析hub基因与肝癌生存分析的相关性。P<0.05为差异有统计学意义。

1.10hub基因的单、多因素COX回归 通过TCGA-GDC数据库下载与LIHC有关的临床信息,通过perl软件进行数据清理,随后通过perl软件、R语言对其进行单、多因素分析。P<0.05为差异有统计学意义。

2 结果

2.1 对DEG的筛选 通过对数据集GSE62232分析,成功从正常肝组织和HBV肝癌患者对照组中识别出495个DEGs,其中包括178个上调基因和317个下调基因。从正常肝组织和不患有HBV肝癌患者对照中识别出241个DEGs,其中包括68个上调基因和173个下调基因(表1)。利用在线数据库对GSE62232以P<0.05和|log2FC| >2为截断点,确定有统计学意义的DEGs进行分析,计算并绘制Venn图(图1)。通过Venn图中分析DEGs之间的交集,发现有117个DEGs只在HBV相关肝癌患者中高表达,156个DEGs只在HBV相关肝癌患者中低表达。有7个DEGs只在无病因肝癌患者中高表达,12个DEGs只在无病因肝癌患者中低表达。从中选择将117个DEGs作为下一步研究对象。

表1 不同表达基因的聚类

图1 不同基因之间的Venn图。

2.2 PPI网络的构建以及hub基因的筛选 使用string数据库来确定117个DEGs的蛋白质集合网络,通过设置综合得分>0.9从而得出115个节点和74条相互作用(图2A)。(PPI富集P值<1.0E-16)通过Cytoscape进行计算,找出10大hub基因分别为BUB1、CDC20、NDC80、BUB1B、CENPF、BIRC5、NUF2、TTK、NCAPG、MELK(图2B)。本研究通过GEPIA对这10个hub基因进行癌症组织和正常组织之间的分析(tumor=369,normal=160),发现除了TTK之外其余九个基因均在肿瘤组织中高表达,P<0.05(图2C)。本研究通过将10个hub基因导入GSCALIte中来发现与hub基因有关的药物敏感性与基因表达量之间的关系。本研究发现NCAPG药物敏感性较好(图2D),因此,把NCAPG作为本次研究的主要基因。

2.3NCAPG与肿瘤免疫浸润水平的关联 将选中的NCAPG导入Timer中,从中发现NCAPG基因的表达可能促进CD4+T细胞、巨噬细胞、嗜中性粒细胞和树突状细胞在肿瘤中浸润水平,而与CD8+T细胞无关(图3A)。同时本研究通过针对年龄、性别、种族和肿瘤阶段等因素进行了多元Cox回归,本研究确定了免疫细胞的浸润程度与患者的预后有关,其中CD4+T细胞浸润率最高的20%的患者的中位生存时间低于最低20%的患者。这表明,CD4+T细胞可能通过NCAPG在LICH肿瘤表达中起着重要的作用(图3B)。本研究探讨了细胞拷贝数与免疫浸润之间的关系,还发现当NCAPG处于高度扩增的状态下可以影响CD4+T细胞、巨噬细胞、CD8+T细胞的浸润情况(P<0.05)(图3C)。为进一步表明NCAPG与CD+T细胞之间的关系,运用R语言对其进行进一步筛选发现,NCAPG与CD4+T细胞中的Th2细胞具有高度正相关性,与DC、中性粒细胞、CD8+T细胞等呈负相关性(图3D)。

A. 是由117个DEGs通过设置综合得分>0.9从而得出115个节点和74条相互作用的蛋白质集合网;B. 用Cytoscape(v3.7.2)根据连接度筛选出PPI中的前10个hub基因。已鉴定的BUB1、CDC20、NDC80、BUBU1B、CENPF、BIRC5、NUF2、TTK、NCAPG和MELK等10个hub基因从(红色高度值到黄色低度值);C. 箱图表示所选基因在正常组织和肿瘤组织中的差异表达情况从左到右箱图分别表示BUB1、CDC20、NDC80、BUBU1B、CENPF、BIRC5、NUF2、TTK、NCAPG、MELK在肿瘤组织和正常组织之间的表达情况;D. CDC20、BUB1、CENPF、BUB1b、NCAPG、NDC80、TTK、MELK、BIRC5等10个hub基因与不同药物敏感性的关系。

A. 通过TIMER2.0对NCAPG进行相关免疫细胞浸润情况分析;B. NCAPG和相关浸润细胞对HCC预后的影响;C. NCAPG在深度缺失、臂水平缺失、二倍体/正常、臂水平增益和高扩增等情况下在HCC中免疫细胞浸润水平的比较;D. NCAPG与相关免疫细胞在HCC中的表达关联情况。

2.4 HCC中NCAPG的调控因子 为了进一步探索HCC中NCAPG的调控因子,本研究通过LinkedOmics数据库分析了NCAPG及其相关共表达基因的激酶,miRNA和转录因子(TF)的富集(表2)。前5个最重要的激酶主要与细胞周期蛋白依赖性激酶1(CDK1),polo样激酶1(PLK1),极光激酶B(AURKB),检查点激酶1(CHEK1)和细胞周期蛋白依赖性激酶2(CDK2)相关。除CDK2外,其余激酶基因均高度表达于肿瘤组织中。转录因子主要富集在E2F转录因子组中。miRNA并未发现明显富集。

表2 与NCAPG相关的激酶,miRNA和转录因子的富集

2.5NCAPG的GSEA富集分析 为明确NCAPG在体内的主要功能,通过GSEA软件对NCAPG进行富集分析。通过下载与LIHC有关的mRNA信息,绘制富集分析图(图4)。本研究发现NCAPG主要在细胞周期、RNA降解、剪接体、神经营养因子信号通路、胰岛素信号通路、核苷酸切除修复等通路中高表达,在补体与凝血反应、脂肪酸代谢、初级胆汁酸生物合成、药物代谢细胞色素p450、缬氨酸和亮氨酸降解、色氨酸代谢等通路中低表达。

2.6 Hub基因的生存分析 将NCAPG导入Kaplan-Meier数据库中获得预后信息。本研究发现NCAPG基因的异常表达水平与HCC的预后不良有关,在NCAPG高表达组中的OS、PFS均低于低表达组,P<0.05(图5A)。

图4 NCAPG的GSEA富集分析

A. TCGA LIHC 队列中的总生存期(OS)、无病生存期(DFS);B. 基于性别、年龄和其他标准 (UALCAN) 分层的 HCC 患者亚组中的NCAPG转录。箱图显示了NCAPG在 LIHC 样品亚组中的表达。从左到右分别显示正常个体或 1、2、3 或 4 期 LIHC 患者中NCAPG的相对表达。正常、高加索人、非裔美国人、亚洲 LIHC 患者中NCAPG的相对表达。正常个体或具有 1、2、3 或 4 级肿瘤的 LIHC 患者中NCAPG的相对表达。正常个体和男性或女性 LIHC 患者中NCAPG的相对表达。任何年龄的正常个体或 21~40、41~60、61~80 或 81~100岁的 LIHC 患者中NCAPG的相对表达。正常和 LIHC 样本中NCAPG的相对表达。中心标记是中位数;盒子的边缘是第 25个和第75个百分位数;C. 多因素Cox回归用于评估年龄、性别、登记、阶段、TNM分期以及NCAPG对于HCC预后影响。*P<0.05,**P<0.01,***P<0.001。

2.7NCAPG基因的临床相关性及其临床数据分析 在UALCAN数据库中分别选择在不同种族、年龄、性别、疾病阶段、甲基化等方面进行分析,发现在HCC患者组中NCAPG的表达量均高于正常对照组(图5B)。因此,本研究认为,NCAPG的表达可以作为一个潜在的HCC的诊断指标。由于单基因分析中可因人群分布差异从而导致假阳性结果,因此,通过COX回归进行临床样本的校正,排除相关差异。通过TCGA—GDC下载与LIHC有关的临床信息,从中得出377例文件,通过perl软件进行数据清理,从中得出HCC的377例临床数据,对数据进行整理,从中选择出231例所有信息均未失访的样品,随后通过perl软件、R语言对其进行单、多因素分析(图5C)。

3 讨论

NCAPG为编码凝缩蛋白复合物的亚基,负责有丝分裂和减数分裂过程中染色体的凝结和稳定[8]。编码蛋白的磷酸化激活凝缩蛋白复合物。先前的研究表明NCAPG为肝细胞癌的重要癌基因[9],但是对于导致NCAPG上调的病因以及其机制仍不清楚。在本研究中,主要通过生物信息分析技术从GEO数据库中找出正常组织和无病因肝癌、正常组织和HBV导致肝癌的DEGs图谱,并从中筛选出在HBV相关肝癌中表达的117个上调的DEGS和156个下调的DEGs,从上调的DEGS中通过PPI蛋白质聚合体网络中选择前10位的hub基因。通过KEGG富集分析本研究发现这10个hub基因最显著的富集途径为细胞周期。而细胞周期紊乱是导致癌细胞异常增殖的主要原因[10]。正常细胞的增殖依赖于接收到适当的有丝分裂信号,同时细胞只有在G1期结束时才进入细胞周期,细胞周期蛋白驱动正常细胞进入分裂周期,并通过激活细胞周期蛋白依赖性激酶来调控细胞凋亡,从而调控细胞生长。然而细胞周期蛋白的上移导致细胞生长周期紊乱以及细胞凋亡失调[11]。

此外,本研究发现NCAPG基因的表达可能促进CD4+T细胞、巨噬细胞、嗜中性粒细胞和树突状细胞在肿瘤中浸润水平,而与CD8+T细胞无关。肿瘤组织中的免疫细胞与临床预后密切相关,有可能作为药物靶标来提高患者的预后率。本研究发现,在肿瘤相关浸润细胞中CD4+T细胞高表达的预后较差。本研究是否可以认为NCAPG通过介导T细胞中的某一途径从而使T细胞免疫作用发生改变,从而促进肿瘤细胞的增殖分化,也有可能的解释是肝癌患者的宿主免疫系统将NCAPG识别为新抗原,从而导致T细胞聚集,但为何CD4+T细胞聚集却导致预后较差,这需要进一步实验验证。为了进一步确认NCAPG与免疫细胞之间的关系,本研究通过筛选实验数据对其进行分析发现,NCAPG在HCC中与Th2 细胞具有高度相关性、与CD8+T细胞具有负相关性且具有统计学意义。Th2细胞属于CD4+T细胞中的一种,是一种能够分泌Th2型细胞因子(如白细胞介素IL-4、IL-5、IL-10等)的T细胞亚型[12-14]。本研究发现,当NCAPG高表达时促进了Th2细胞的表达,抑制了Th1细胞的表达从而导致Th1/Th2失衡。Th1/Th2失衡可促进HBV转变为HCC的概率[15-16]。Budhu[17]等发现,在HBV+的HCC患者中,与孤立性HCC相比,存在静脉转移的HCC患者中促炎性Th1样细胞因子产生较少,抗炎性Th2样细胞因子产生较多,存在Th1/Th2失衡。这也可能是NCAPG高表达时预后较差的原因之一。CD8+T 细胞识别源自吞噬和蛋白水解裂解的 HBV 蛋白的病毒肽,激活 B 细胞,并分泌 IFN-γ 和 TNF-α,从而抑制 HBV 的复制和基因表达[5, 18]。Wang[19]等研究发现,在慢性乙肝病毒患者体内的HBV特异性CD8+T细胞存在功能耗竭的情况,当在急性免疫激活状态下再度感染HBV时,特异性CD8+T细胞不能有效的发挥抗病毒能力,表明衰竭的特异性CD8+T细胞与慢性HBV复制和由此进一步导致的疾病进展有关。本研究发现当NCAPG高表达时CD8+T细胞表达量减少,NCAPG可能在慢性肝炎的过程中诱导CD8+T 细胞的耗竭过程,从而促进HBV的复制,导致HCC的发生。本研究发现,抗PD-1抗体可恢复HCC中CD8+T细胞的功能[20],那抗PD-1抗体是否可以作用于NCAPG高表达的患者中从而降低HBV患者向HCC转换的比值,这需要进一步验证。Xiao[21]研究表明,NCAPG高表达与多种肿瘤如HCC、乳腺癌、肺癌或卵巢癌的不良生存密切相关。这是否可以认为NCAPG基因作用于这些癌症的共同通路中,这对研究NCAPG作用机制提供了一定的方向。

本研究通过研究NCAPG共表达网络的调控因子发现,NCAPG与包括CDK1,PLK1,AURKB,CHEK1和CDK2在内的激酶网络相关。这些激酶对于调节基因组稳定性、有丝分裂的进行、发展以及细胞周期具有重大意义,并在LIHC中存在差异表达和影响存活预后。实际上,CDK1除了调控细胞分裂以及细胞分化等功能外,还可以维持胚胎干细胞的表观遗传特性[22]。CDK1可作为有丝分裂期间巨噬细胞自噬的主要调节剂,在有丝分裂期间抑制巨噬细胞的自噬作用,从而维持基因组的稳定性[23]。本研究通过对NCAPG单独基因的GSEA分析发现,其基因高表达时可促进巨噬细胞内吞作用,可能会导致CDK1功能发生改变,进而影响DNA的复制、修复等方面。丙型肝炎病毒可诱导AURKB活性下降,导致HCV感染性增大[24]。本研究通过GSEA分析也发现了NCAPG上调可以影响剪切体形态,本研究有理由相信AURKB-Sv1可能是由于NCAPG高表达导致的。那么,本研究发现一个问题:当HBV感染时,是否可能通过影响NCAPG的基因表达进而影响下游的激酶网络,从而使细胞周期紊乱,进而导致HCC的发生。现在众多激酶拮抗剂的发现用于治疗各种癌症以及实体肿瘤,但是由于并不是所有癌症均与一种激酶有关,因此对于激酶拮抗剂的使用仍有限制。那本研究能否通过拮抗激酶上游的基因从而达到相同的作用,这需要进一步的研究来验证。本研究发现,E2F家族是构成NCAPG失调的主要转录因子。E2F在细胞增殖和细胞周期进程中起着关键性的作用[25-27]。E2F转录因子在多个癌种中高度富集,尤其是LICH和LUAD预后与E2F家族表达水平密切相关[25]。本研究认为NCAPG可能通过E2F来调节HCC的细胞周期和增殖能力。通过对NCAPG的药物敏感性的研究发现NCAPG高表达时对于曲美替尼、HSP90和RDEA119具有较高的耐药性,本研究发现NCAPG对于Navitoclax具有较高的药物敏感性。单因素COX分析发现在HCC的预后与疾病阶段、T、M与NCAPG有关。进一步通过多因素COX分析发现,只有NCAPG对HCC的预后有关。与此同时NCAPG对HCC的发生具有高风险值。这进一步表明,NCAPG可能作为一个独立的因素影响HCC的发生和其预后情况。

通过使用来自多个队列的数据集和综合生物信息学分析,本研究从患HBV的肝癌患者中找到117个DEG,经过进一步筛查找到NCAPG,随后发现NCAPG基因和途径,极大地丰富了本研究对肝癌发生、复发的认识,本研究发现NCAPG在HBV感染诱导肝癌的发生发展中起重要作用,HCC中NCAPG的上调可能对神经营养因子释放、RNA降解以及细胞周期的多个步骤产生深远的影响,为NCAPG作为HCC的生物标志物提供了多层次的证据,可能成为肝癌患者治疗的新靶点。

猜你喜欢
激酶细胞周期肝癌
蚓激酶对UUO大鼠肾组织NOX4、FAK、Src的影响
蚓激酶的药理作用研究进展
LCMT1在肝癌中的表达和预后的意义
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
NSCLC survivin表达特点及其与细胞周期的关系研究
X线照射剂量率对A549肺癌细胞周期的影响
黏着斑激酶和踝蛋白在黏着斑合成代谢中的作用
microRNA在肝癌发生发展及诊治中的作用
熊果酸对肺癌细胞株A549及SPCA1细胞周期的抑制作用
Rab27A和Rab27B在4种不同人肝癌细胞株中的表达