莫秋燕 龚文锋 余红平 唐卫中
作者单位:530021 南宁 1广西医科大学附属肿瘤医院;2广西医科大学公共卫生学院
肝细胞癌(hepatocellular carcinoma,HCC)是全球常见的恶性肿瘤之一,其发生发展是一个多阶段、多步骤、多因素的复杂过程[1]。随着测序技术的快速发展,一些重要的信号通路在HCC发生发展中的作用得以阐明,这些通路显示出肿瘤代谢和肿瘤微环境在HCC发生发展过程中的重要性。此外,近年来研究发现了HCC中肿瘤干细胞不同的表面标志物,并提出除了伴随耐药和转移外,肿瘤干细胞的信号通路改变和表观遗传修饰也参与其中[2-4]。本文将从基因组学、转录组学、表观组学、蛋白质组学和代谢组学等多维度对HCC组学的研究进展进行综述,同时进行总结和展望。
基因组突变可分为种系突变和体细胞突变。种系突变通常是遗传的,存在于身体的所有细胞类型中。而体细胞突变通常存在于肿瘤组织或癌前组织中,并在肿瘤进展过程中积累。在开放阅读框的错义基因突变可以导致肿瘤抑制基因功能丧失或癌基因功能获得。此外,基因组非编码区突变也会影响癌症的发生风险和进展,因为它们可能改变基因产物的转录、翻译或稳定性。
1.1.1 种系突变 越来越多的证据表明,HCC的发生涉及遗传易感性和环境因素[5]。在过去10余年中,全基因组关联研究已经发现大量与HCC发病相关的易感基因位点[6]。这些易感基因多态性改变了致癌的生物途径[7],包括通过TNFA、IL1B或 TGFB基因引起炎症;SOD2或MPO基因引起氧化应激;铁代谢基因(HFE1)与酒精摄入对C282Y突变体的协同作用;DNA修复障碍(MTHFR、XRCC3);细胞周期改变(MDM2、TP53)等。基因多态性调节在HCC不同阶段的发生风险,包括风险因素(如病毒性肝炎、酒精摄入或肥胖)的易感性,慢性肝病的严重程度及其演变为肝硬化,恶性转化和肿瘤进展等。基因组中的单核苷酸变化对癌症进展有重要作用,被称为突变或变异的核苷酸变化可导致癌基因或抑癌基因功能获得或丧失。非编码核苷酸的改变也会影响基因转录和关键肿瘤相关基因的转录后调控,从而直接触发肿瘤发生或增加癌症发生风险。然而,目前所有与HCC发生风险相关的单核苷酸多态性还未显示足够的优势比,尚不足以作为预测指标而被引入临床实践。因此,需进一步加深对与HCC发生风险相关的单核苷酸多态性的研究,同时将遗传变异与临床特征相结合或将改善现有的HCC风险评估模型。
1.1.2 体细胞突变 体细胞突变在调控途径中的累积是HCC发生的主要促进因素。全外显子组/基因组测序描绘了HCC的突变格局,识别了新的癌症驱动基因和致癌途径,目前已经报告了HCC的50~70个非沉默突变[7-8]。大多数突变发生在乘客基因中,随机发生,没有功能性后果;而每个肿瘤有2~6个突变是驱动突变,对肿瘤进化有关键影响[9]。驱动突变主要影响以下6个重要的生物学途径:端粒维持、Wnt/βcatenin途径细胞周期控制、表观遗传调控、氧化应激以及AKT/mTOR和MAP激酶途径[10]。Wnt信号通路是HCC中最常见的改变。32.8%的HCC患者存在CTNNB1激活突变,AXIN1和APC的失活突变率分别为15.2%和1.6%。HCC的第二大改变途径是p53信号途径。20.8%的HCC患者存在p53失活突变,8%的患者存在CDKN2A突变。除了在癌症中经常发生突变的传统信号通路,最近一些研究报道染色体重塑复合物成分在包括HCC在内的多种癌症类型中也经常发生突变。在超过20%的HCC患者中检测到SWI/SNF染色质重塑复合物成分ARID1A突变。提示染色质重塑复合物可能在癌症的发生、发展中起重要作用。此外,不同研究中发现的驱动基因突变率的差异可能反映了不同人群致病风险因素的差异。比如,TP53的失活突变在HBV相关HCC以及暴露于黄曲霉毒素B1的患者中富集;TERT启动子突变、CTNNB1和ARID1A失活突变与酒精性肝病患者发生HCC有关[8]。
染色体不稳定性是HCC最常见的遗传改变,可能由有丝分裂过程中的错误或DNA复制和修复中断引起。染色体异常可表现为整条染色体臂的获得和丢失,也可表现为染色体小片段的扩增和缺失。最近,3个独立的研究通过比较配对HCC样本中全基因组和全外显子组测序产生的测序数据评估拷贝数变异[8,11-12]。结果显示,HCC 组织在 1q、5p、6p、8q、17q、20q 和 Xq染色体经常扩增,而在 1p、4p-q、6q、8p、13p-q、16p-q、17p、21p-q和22q染色体经常丢失。染色体不稳定性可能发生在HCC的早期,并在肿瘤进展过程中累积。因此,染色体不稳定性可能在HCC发生过程中激活某些癌症驱动基因。这些热点区域通常含有重要的癌基因或抑癌基因,HCC组织中的MET、MYC、TERT、CCND1和FGF19等癌基因常出现局部扩增,而PTEN、TP53、CDKN2A和CDKN2B等抑癌基因常出现局部缺失,这些基因变化均对肿瘤的发生发展有重要作用。
表观遗传调控不改变基因组序列,但影响染色质结构和基因表达转录。表观遗传调控在多个层面上影响基因产物,包括转录水平和转录后调控,这为基因调控网络增加了巨大的多样性。DNA甲基化、组蛋白修饰和miRNA是基因调控的主要形式。表观遗传调控机制的改变可能导致基因表达中断,也可能导致癌基因激活或抑癌基因失活[13]。基于系统阵列和下一代基因测序的研究表明,HCC组织大量基因靶点受到基因启动子区域异常DNA甲基化的影响,这直接增加或降低了下游基因转录活性[14]。
DNA 甲基转移酶(DNA methyltransferases,DNMTs)催化的DNA甲基化是DNA的一种化学修饰,通过甲基与胞嘧啶环的5′碳位结合而发生,对调节基因表达至关重要[15]。在癌症中,肿瘤抑制基因的表达经常被启动子区域的CpG岛高甲基化所沉默[16]。因此,DNMT上调促进了癌症发展[17]。研究报道DNMTs的mRNA水平,包括DNMT1、DNMT3a和DNMT3b在HCC组织中的表达均显著高于非肿瘤性肝组织[18]。此外,DNMTs表达增加被认为是HCC患者生存率低的预测因子[19]。迄今为止,大量研究已表明DNMT介导的表观遗传学改变可调控HCC转移、侵袭和进展[20]。
组蛋白修饰包括组蛋白甲基化、乙酰化和泛素化,通过在转录水平上调控癌基因和抑癌基因的转录水平而影响肿瘤进展过程[21-22]。组蛋白甲基转移酶和去甲基酶是研究抗癌药物开发分子靶点的主要焦点[23]。既往文献报道组蛋白甲基化与HCC转移和增殖相关基因上调和下调密切相关[24-28]。为了启动HCC转移,各种甲基转移酶和去甲基化酶使组蛋白H3赖氨酸(K)4和K36甲基化,从而引起构象变化,影响常染色质和异染色质的平衡和分布,导致上皮-间质转化(epithelial-mesenchymal transition,EMT)相关基因上调。相反,这些基因通过组蛋白H3K9和K27甲基化参与异染色质形成后EMT相关基因的下调[29]。
miRNA表达异常与肿瘤发生发展有关[30-31]。最近研究表明,miRNA介导的TGF-β/Smad信号通路异常调控可导致HCC发生。在HCC组织中,miR-542-3p和miR-142低表达,这两种miRNAs通过与3′-UTR结合直接调节 TGFB1转录物[32-33],从而负性调节TGF-β/Smad信号通路,促进 EMT和癌症转移。既往研究报道[34],TGF-β 信号转导抑制剂 Smad7也受miRNAs调控,miR-216a/217高表达通过靶向Smad7、PTEN基因促进EMT、细胞迁移、干细胞样特性和肝癌复发。此外,有研究显示,miRNAs也可以不通过Smad信号传导而实现对TGF-β信号传导下游基因的调控,如TGF-β1诱导的EMT被miR-300通过靶向调节EMT的黏着斑激酶(focal adhesion kinase,FAK)抑制[35]。另一项研究发现miR-199b-5p与其靶基因N-cadherin在HCC中的表达呈负相关,修复实验发现HCC中miR-199b-5p过度表达可抑制TGF-β1诱导的AKT磷酸化,而PI3K/AKT通路的抑制可阻断TGF-β1诱导的 N-cadherin过度表达[36]。还有研究报道miRNAs可被TGF-β信号正调控或负调控。例如,用重组TGF-β1治疗可增加HCC中miR-155和miR-181a的表达水平[37-38]。这些 miRNAs通过 TGF-β信号过度表达促进EMT,在体外用TGF-β治疗后,通过阻断E-cadherin和促进HCC中的Snail和ZEB1也观察到相似的表型。
高通量技术的最新进展使大规模的基因表达谱分析成为可能,但与基因组水平上的主动全序列分析相比,基于第二代测序技术开展的HCC全转录组测序不多。最新开展的一项全转录组测序研究[39]结果显示,除了既往研究[40-41]报道的 ALG1l、SERPINA11、TMEM82、GPC3、SPINK1 和 ESM1 表达失调外,CENPF和FOXM1等基因被发现是最重要的上调基因。CENPF是一种微管结合蛋白,是着丝点运动和有丝分裂分离必需的蛋白质,通过调节丙酮酸激酶M2磷酸化信号调节癌症代谢[42]。FOXM1是通过控制细胞增殖和DNA损伤修复的调节细胞周期的叉头框蛋白转录因子。最新研究显示,甲状腺激素通过抑制FOXM1表达抑制HCC进展[43]。这两种蛋白在HCC中同时上调也可能提示了潜在的功能协同作用。此外,HCC组织中C型凝集素家族的多个成员(CLEC4G、CLEC1B和CLEC4M)和促肾上腺皮质激素释放激素结合蛋白(corticotropin-releasing hormone bind protein,CRHBP)均表达下调。C型凝集素是一种钙依赖性多糖结合蛋白,是固有免疫系统中的重要模式识别受体[44]。C型凝集素表达下调可能与HCC发病有关。促肾上腺皮质激素释放因子(corticotropin-releasing factor,CRF)也已被证明在多种癌症中调节肿瘤进展和血管生成[45]。CRHBP作为CRF系统中的一员,其缺失也可能通过类似的机制参与HCC发生。
随着蛋白质组学研究的进展,越来越多研究表明蛋白质-蛋白质相互作用通过调节细胞内的多种生物过程而在恶性肿瘤发病机制中起关键作用[46]。蛋白质组学和磷酸化蛋白质组学数据为HCC生物学研究及治疗提供了新的见解。针对肿瘤和邻近肝脏样本的蛋白质组学研究也进一步揭示了HCC发生的关键信号通路的激活状态以及肝脏特异性代谢重编程。目前,多种蛋白质,如AGP1、A1AT和A2M等被报道为新的诊断生物标志物候选者,这些蛋白质未来可能或为HCC的治疗靶点[47-50]。但是这些蛋白分子标志物的敏感性和特异性较低,迄今为止还未发现对HCC完全特异的生物标志物。因此,对HCC新的肿瘤标志物的开发及其组合进行研究,以提高对HCC诊断和疗效评估的特异性和敏感性尤为迫切。
脂肪酸合成酶(fatty acid synthase,FASN)与多种致癌信号通路激活有关,包括PI3K/AKT丝氨酸/苏氨酸激酶、Wnt/β-catenin信号和TGF-β诱导的EMT通路[51]。最近两项研究显示,FASN在HCC组织和细胞中过表达,且可能通过影响EMT和MMPs的功能参与调控HCC侵袭和转移[52-53]。进一步研究显示,抑制FASN可降低IGFBP1和HIF-1α的表达进而抑制HCC细胞迁移和侵袭[52],显示了FASN成为HCC治疗靶标的巨大潜力。此外,一项HBV相关HCC的蛋白质组学研究显示,PYCR2和ADH1A是潜在的HCC预后预测生物标志物[54]。多项研究也报道PYCR2在多种癌症类型中均上调,且其上调可使肿瘤细胞能够应对代谢增强而产生的过多氧化物,并可能推动肿瘤细胞生长和转移[55-56]。另有研究发现PYCR2缺失可能导致氧化应激而触发细胞凋亡[57]。ADH1A主要存在于肝脏,可以把摄入体内的乙醇转化为致癌代谢物乙醛;ADH1A浓度下调会引发体内乙醇聚积,从而增强酒精诱导的肝损伤和癌变[58]。还有研究显示,ADH1A可以有效预测HCC发生和进展,其中较高的ADH1A表达水平与HCC患者较高的生存率及较低的侵袭性相关[59]。
众所周知,癌细胞经历代谢重编程以维持肿瘤发生和细胞增殖的代谢需要。癌症中最广为人知的代谢变化发生在中心代谢中,随着有氧葡萄糖代谢的增加,细胞葡萄糖输入增加,从而产生ATP和乳酸,这一过程称为“Warburg效应”[60]。另一个重要的代谢变化是谷氨酰胺摄取增加,这表明谷氨酰胺摄取增加发生在NADPH合成等重要途径中,并作为非必需氨基酸和核苷酸生物合成中的氮源[61]。癌症通常会引起显著的代谢改变以维持其生长,而代谢组学使癌症的早期诊断成为可能。此外,这些代谢变化还可导致代谢物驱动的基因调控和与肿瘤微环境的代谢相互作用发生改变,进而影响肿瘤进展和侵袭性。
肝脏是人体的代谢中枢,能调节许多代谢物的表达水平,因此代谢组学分析方法尤其适用于肝脏疾病研究。近年来对HCC组织的研究报道了许多不同的代谢物,提示在HCC的发生和发展过程中有重要的代谢变化,尤其是与正常肝功能相关基因的下调,如药物/异源代谢和氨基酸代谢[62-65]。目前的研究的一个共同发现是HCC的糖酵解表型[66-67],表明HCC中可能发生“Warburg效应”。细胞外信号调节激酶(extracellular signal-regulated kinase,ERK)通路可调节细胞生长,该通路在多种肿瘤类型中被上调,并被认为是肿瘤进展的中心驱动因素。目前临床上的激酶抑制剂,如索拉非尼和厄洛替尼都是通过阻断MAPK/ERK途径发挥作用。既往研究也证实,ERK通路在HCC中被高度激活并与耐药相关[68]。新近的一项研究结果显示,谷氨酰胺缺乏会触发HCC细胞严重的代谢改变和ERK通路激活,当新陈代谢严重改变时,阻断pERK会导致新陈代谢重编程并促进肿瘤细胞增殖[69]。这一发现为临床上理解HCC激酶抑制剂耐药以及根据患者代谢受损情况决定是否使用激酶抑制剂提供了有力证据。
综上所述,在多个分子水平上探讨HCC的发生可为其治疗提供线索,识别关键的分子事件和信号传导途径也为HCC的靶向疗法提供依据。转录组学与基因组学、蛋白质组学、表观组学及肿瘤免疫分析地结合将进一步提高对HCC发生分子机制的理解,推动HCC精准医疗进程。HCC多组学的研究提高了对HCC复杂性的认识,但也仍有许多问题有待探索。值得注意的是,大多数探索HCC异质性的研究都单纯分析了手术标本,而不是需要全身治疗的晚期肿瘤。此外,对肿瘤进行单次活检取样可能会限制特定肿瘤区域的靶向亚克隆改变的识别。但是有理由相信,随着技术的发展,使用液体活组织检查或其他技术对肿瘤进行分类的能力将越来越强大,对疾病的分子理解也将更加深入和全面,从而将对疾病的分子理解纳入治疗决策中;这些数据还有助于解析免疫疗法的耐药机制,并指导个性化用药,最终实现将肿瘤的基础研究成果转化应用于临床实践,改善患者的临床预后。