苏雨,田振华,罗丹丹,齐祥宇,刘鲁娜,管庆波
山东大学附属省立医院,济南250021
肝癌是常见的人类消化系统恶性肿瘤之一,其发病率在所有癌症中位居第七,是全球癌症相关的第四大死因[1]。在美国,肝癌的五年生存率约为18%,其致死性仅次于胰腺癌[2],在中国,肝癌的五年生存率更差,仅为12%[3]。肝细胞肝癌(HCC)为原发性肝癌的主要类型,早期HCC 可以接受潜在的治愈性治疗,包括手术治疗、射频消融和肝脏移植等[4],但由于其起病隐匿、高度恶性、早期即发生转移等特征,对于80%以上的患者,在诊断时通常已丧失良好的治疗机会[5]。因此,探索和寻找HCC 预后相关的生物标志物及潜在的治疗靶点对解决这一全球性健康问题尤为重要。DNAJC13 是热休克蛋白家族(Hsp40)成员之一,也被称为RME8,是早期在秀丽隐杆线虫的胞吞缺陷筛查中发现的一种含有DnaJ 结构域的蛋白质,在细胞内物质运输中发挥作用[6-7]。近年来,DNAJC13在肿瘤中的作用逐渐被发现,有研究报道,DNAJC13是ErbB2阳性乳腺癌的潜在调控靶标[8],DNAJC13 可作为miR-193b 的靶基因促进乳腺癌进展[9]。然而,DNAJC13 在HCC 中的作用目前仍未知。本研究利用生物信息学方法对癌症基因组图集(TCGA)数据库、国际癌症基因组联盟(ICGC)数据库、基因表达综合(GEO)数据库中DNAJC13 在HCC 中的mRNA 表达水平进行分析,对其表达与临床病理特征和预后的关系及潜在的生物信号通路进行深度挖掘,为HCC 的预后评价及治疗提供思路。
1.1 数据库资料获取 通过检索TCGA 数据库(https://portal. gdc. cancer. gov/)及ICGC 数 据 库(https://dcc.icgc.org/)下载HCC及其他26种癌症相关的表达数据、HCC 相关的临床资料,TCGA 数据库HCC 临床资料检索条件:TCGA-LIHC,共424个样本(包含50 个癌旁样本)用于表达分析,370 个病例用于临床相关分析,下载时间为2020年12月;ICGC 数据库临床资料检索选用ICGC-LIRI-JP 项目的资料,共431个样本(包含199个癌旁样本)用于表达分析,232 个病例用于临床相关分析,下载时间为2020 年12 月。同时,选取GEO 数据库(https://www. ncbi.nlm. nih. gov/geo/)中GSE25097(包含癌旁:289、癌:268 个)、GSE14520(包含癌旁:220 个、癌:225 个)数据集用于表达分析验证。数据整理及标准化矫正使用R(3.6.3)及Perl(5.26.3)。
1.2 基因富集分析(GSEA) 本研究中,首先利用GSEA 软件根据与DNAJC13表达的相关性生成所有基因的有序列表,然后进行基因富集来说明高、低DNAJC13 表达组之间存在的生存差异。富集分析基于从GSEA 官网下载的c2. cp. kegg. v7.2. sym‑bols. gmt 规范化通路基因集,每次分析对基因组进行1 000次排列。
1.3 统计学方法 采用R(3.6.3)及Graphpad(8.0.8)统计软件。两组间的差异比较使用非参数检验,非配对样本使用Mann-Whitney U 检验,配对样本使用Wilcoxon matched-pairs signed rank 检验。使用逻辑回归方法分析临床病理特征与DANJC13表达间的关系。生存分析采用Kaplan-Meier法,Logrank 检验计算P,最佳截断值使用R 语言中的“survminer”程序包确定。单因素和多因素Cox 风险比例回归模型用于分析DANJC13 及其他临床病理特征与生存率间的关系。P<0.05 为差异有统计学意义。
2.1 患者基本临床信息 本研究纳入的临床数据来自TCGA 数据库370 例原发性HCC 病例和ICGC数据库232 例原发性HCC 病例,患者临床特征包括年龄、性别、BMI、T 分期(T),淋巴结侵犯(N),远处转移(M),病理分期及分级、生存状态、癌症家族史、新的肿瘤事件等。来自TCGA 数据库的HCC 病例中,年龄分布在16~90 岁,中位年龄为61 岁,其中61~80 岁病例最多,为183 例(49.5%);男249 例(67.3%),女120 例(32.7%);病理分期Ⅰ期病例最多,为171 例(46.2%);病理分级G2级病例最多,为177 例(47.8%)。来自ICGC 数据库的HCC 病例中,年龄分布在31~89 岁,中位年龄68 岁,占比最多的在61~80 岁,为167 例(72.0%)例;男171 例(73,7%),女61 例(26.3%);病理分期Ⅱ期病例最多,为106 例(45.7%);病理分级G2级病例最多,为121 例(52.2%)。
2.2 DNAJC13 在肝癌及多种肿瘤组织中的表达通过对TCGA 数据库中的肝细胞肝癌表达数据进行非配对和配对分析,结果表明,相对于癌旁组织,DNAJC13 表达在肿瘤组织中上调(P 均<0.01)。IC‑GC 数据库、GSE25097 和GSE14520 数据库集中肝细胞癌表达数据分析结果与TCGA 数据库分析结果一致(P均<0.01)。
2.3 DNAJC13 高表达者病理分期和分级 来自TCGA 数据库的样本中,DANJC13 表达较高的患者病理分期和病理分级更高(P 均<0.05);来自ICGC数据库的样本中,DANJC13 表达较高的患者病理分期和病理分级更高(P 均<0.05)。逻辑回归分析的方法亦得出相似结果,见表1。
表1 DNAJC13 mRNA表达的临床相关性分析(逻辑回归)
2.4 DNAJC13高表达与HCC预后的关系 Kaplan-Meier 生存分析显示,在TCGA 队列中,DNAJC13 高表达组的总生存率(OS)(图1A,P<0.01)及无病生存率(DFS)(图1B,P<0.01)均相对于低表达组更差;在ICGC 队列中,DANJC13 高表达组总生存率(0S)更差(图1C,P<0.05)。对于TCGA 队列的单因素和多因素Cox风险比例回归分析提示DNAJC13可作为影响HCC 预后的独立危险因子(HR 分别为1.877、2.038,P均<0.01),见图1D。
2.5 DNAJC13 相关信号通路富集分析 在DNAJC13 高表达组出现adherens junction、endocyto‑sis、ERBB signaling pathway、pathways in cancer、ubiq‑uitin mediated proteolysis基因集的富集。
热休克蛋白(HSP)是细胞在应激条件下产生的一类蛋白质,因最初发现这些基因在热处理细胞中表达而得名,其被人们所熟知的功能是帮助蛋白质的折叠,是细胞中蛋白质稳态的守护者[10]。然而,并不是所有的HSP 都在应激诱导时才表达,有许多是组成性表达,并在细胞内具有管家基因功能[11]。随着研究的深入,HSP 在癌症中的作用逐渐走进人们的视线,HSP90 和HSP70 家族成员已被确定为癌症的重要因素,并被认为是真正的抗癌药物靶点[12]。
图1 DNAJC13高表达与HCC预后不良的关系
DNAJC13 是HSP40 成员之一[6],在该家族成员中,有许多蛋白已被证实参与肿瘤的发生和进展,在诸多肿瘤中发挥促癌或抑癌作用,如在恶性胶质瘤和前列腺癌中,DNAJA1 表达与肿瘤恶性程度及放疗耐受性相关[13];DNAJA3 被证明参与多种肿瘤的增殖、凋亡、迁移及转移调控[14];DNAJB4 可抑制肺癌的进展[15];在乳腺癌中,DNAJB6 通过抑制Wnt 信号通路抑制细胞迁移、侵袭和肿瘤发生[16];在转移性宫颈癌中,DNAJC9 表达上调[17];在神经母细胞瘤中,DNAJC10 过表达可增强对内质网应激诱导的凋亡敏感性[18];最近研究已证实DNAJC13 是ErbB2 阳性乳腺癌的潜在调控靶标[8],可作为miR-193b 的靶基因促进乳腺癌的进展[9]。这些结果提示HSP 家族在肿瘤中有较大的潜在研究价值。
近年来,高通量测序技术的发展和诸多大型数据库的建立为肿瘤潜在机制的研究提供了便利,本研究中我们利用生物信息学的方法探究DNAJC13在HCC 中的潜在作用。GSEA 是一种计算方法,可确定先验定义的一组基因是否在两个生物学状态之间显示出统计学上差异[19]。通过对TCGA 数据库、ICGC数据库、GEO数据库中肝癌及其他肿瘤表达谱的分析,我们发现,DNAJC13 在肝癌及多种肿瘤中的表达较正常或癌旁组织升高且有统计学差异。随后我们结合临床资料对其表达在TCGA 数据库和ICGC 数据库进行临床相关性分析,结果显示在这两个数据库中DNAJC13 高表达均与更高的病理分期和分级呈正相关关系。对TCGA 数据库的生存分析显示,在HCC患者中DNAJC13高表达组无论总生存率还是无病生存率均较低表达组差,对ICGC数据库的生存分析显示,在HCC患者中DNAJC13高表达组总生存率相对更差。TCGA 数据库资料进行的单因素和多因素Cox回归分析提示DNAJC13表达可作为影响HCC 患者总生存的独立危险因子,进一步说明DNAJC13对HCC 预后预测的可靠性。GSEA 结果显示adherens junction、endocytosis、ERBB signaling pathway、pathways in cancer、ubiquitin mediated prote‑olysis 五个基因集在两个数据库排名前20 个富集结果中均有出现且有统计学意义,这些通路与肿瘤发生有关,其中DNAJC13 通过ERBB 信号通路在乳腺癌中作用已被证实[8],提示DNAJC13 在HCC 中可能是一个致癌基因,并通过这些通路在HCC 中发挥作用,这将对后续的机制研究提供有力的理论支持和指导,提示DNAJC13 可能是一个潜在的HCC 治疗靶点。
本研究存在以下局限性。首先,这项研究是一项回顾性研究,将来应进行前瞻性研究以弥补该回顾性研究的局限性;其次,公共数据库中缺少例如患者用药和(或)手术治疗的具体细节,亦会影响患者的预后;最后,肝癌中DNAJC13 的蛋白及其在肝癌进展和转移中的直接作用仍有待体外验证。尽管这项研究有一定局限性,但确实为研究DNAJC13 在肝癌中的作用提供了线索,并为HCC 提供了可能的治疗靶标和潜在的预后标志物。
综上所述,DNAJC13表达升高可能是HCC 的一个可靠的独立预后生物标志物和治疗靶点。此外,黏附连接、内吞作用、ERBB 信号通路、泛素介导的蛋白水解作用可能是DNAJC13 参与HCC 发生和进展的关键通路。