姜亚飞 华莹奇 蔡郑东
表观修饰在基因表达调控、细胞命运决定等众多生物学过程中发挥着关键的调控作用。组蛋白翻译后修饰是一类重要的表观遗传调控机制,调控着染色质层面的遗传信息解读。近年来的研究表明,组蛋白自身突变会导致癌症的发生,突变组蛋白因此被称为“癌组蛋白”( oncohistone )。笔者立足于骨与软组织肿瘤,围绕癌组蛋白的突变及其表观调控机制作一系统综述。现报告如下。
真核细胞中的基因表达涉及高度精密的调控过程,而染色体上结合的转录因子及相关的转录调控元件决定了基因的转录表达或抑制[1]。染色质由 DNA 和核小体组成,核小体是由核心组蛋白 H2A、H2B、H3 和 H4 的四个异二聚体组成的八聚体,DNA 包裹在八聚体周围并借助连接组蛋白 H1 包装折叠成紧密的染色质[2]。甲基化和乙酰化等表观修饰是组蛋白翻译后修饰的重要部分,这些修饰依赖于特定的表观修饰酶的催化,表观修饰通过改变染色质状态,参与调控基因的转录表达,从而在决定生物表型及细胞命运中起着至关重要的作用。鉴于染色质在调节基因表达方面的重要作用,许多表观修饰酶和染色质重塑复合物相继被发现对机体发育至关重要,它们的功能在许多疾病中受到影响[3-4]。
组蛋白 H3 包括经典的 H3.2、H3.1 及组蛋白变体H3.3。虽然 H3.3 在蛋白质一级结构上与经典组蛋白 H3.2和 H3.1 仅存在个别氨基酸残基的不同,但是 H3.3 在基因转录调控及细胞发育分化过程具有更加重要的功能[5]。研究表明,组蛋白 H3.3 的编码基因 H3F3A 和 H3F3B 错义点突变与神经系统及骨与软组织肿瘤的发生密切相关,包括小儿高级别胶质瘤 ( pediatric high-grade glioma,pHGGs )、骨巨细胞瘤 ( giant cell tumor of bone,GCTB ) 及软骨母细胞瘤等[6]。在一些病例中,组蛋白突变被发现是肿瘤中惟一确定的复发突变,这表明组蛋白突变在肿瘤发生中可能行使着驱动突变的重要作用[7]。已发现的突变多集中于特定的组蛋白编码基因的特定位点,并在肿瘤类型以及肿瘤的解剖位置上具有高度特异性,这表明癌组蛋白的突变与细胞的起源可能存在一定的相关性,但目前对于癌组蛋白突变在骨与软组织肿瘤中的致癌机制还不是很清楚。
组蛋白突变主要影响特定的组蛋白 H3 变体,2012 年Nature 发文首次报道了儿童高级别胶质瘤中癌症组蛋白H3 编码基因的突变,包括 Lys27Met ( K27M ) 和 Gly34Arg /Val ( G34R / V ) 等[7]。随后的相关研究陆续报道了软骨母细胞瘤中的 Lys36Met ( K36M ) 突变及骨巨细胞瘤中的Gly34Trp / Leu ( G34W / L ) 突变[8]。软骨母细胞瘤是一种罕见的良性骨肿瘤,主要影响 20 岁以下的儿童和青年。而 GCTB 是相对常见的交界性骨肿瘤,常见于成年人,表现为溶骨性骨破坏,随着疾病的进展,可以引发病理性骨折、肿瘤恶变转移等并发症。
尽管组蛋白 H3 表达依赖于多个基因,但突变组蛋白只出现在特定的基因中。H3.3 由 H3F3A 和 H3F3B 共同编码,K27M 和 G34R / V 突变发生只在 H3F3A,K36M 突变只发生在 H3F3B,而大多数 H3.1 K27M 的突变发生在HIST1H3B。整体上,除了少数发生在 H3.1 和 H3.2 中,癌症中已发现的组蛋白突变大部分发生在 H3.3。另外,虽然 H3F3A 和 H3F3B 编码相同的蛋白质,但它们的 5’ 和3’UTRs ( 非翻译区 ) 差异显著,因此,H3F3A 和 H3F3B 转录形成的 mRNA 可能受到不同的转录后调控,这将进一步导致 H3F3A 和 H3F3B 基因对不同组织中 H3.3 总量的贡献产生差异。评估 H3F3A 和 H3F3B 在不同发育阶段和不同组织中对总 H3.3 蛋白的贡献,或将有助于理解不同H3.3 编码基因的突变发生偏倚的原因。H3.1 和 H3.2 在染色体中的分布无显著特异性,而 H3.3 富集在包括转录活性区、调控元件、异染色质和端粒等在内的离散的基因组区域,因此,这种类型的组蛋白变异可能对细胞生物学表型产生较为明显的影响[9]。与此相对应,H3.1 和 H3.3 突变的肿瘤在临床表型和分子水平上均存在显著的差异。
在骨与软组织肿瘤中发现的三种突变体 ( K27、K36和 G34 ) 均位于组蛋白 H3 的 N 端尾部,该区域包含了许多不同类型的翻译后修饰,参与调控包括基因转录表达、DNA 修复等不同的生物学过程[10]。基于此,笔者将重点讨论骨与软组织肿瘤中已知的组蛋白突变体对于组蛋白H3 翻译后修饰模式、细胞功能及肿瘤发生的影响。
类似于 pHGGs 中的 H3 K27M 突变,组蛋白 H3 的K36M 突变也是一种肿瘤发生的驱动突变。研究表明超过 95% 的软骨母细胞瘤存在组蛋白 H3 K36M 突变,大多数 K36M 突变发生在编码 H3.3 的 H3F3B 基因,也有报道见于组蛋白 H3.1[11]。组蛋白 H3 上的 K36 残基可以在甲基转移酶的催化下发生单甲基化 ( H3K36me1 )、二甲基化 ( H3K36me2 ) 或三甲基化 ( H3K36me3 )[12]。哺乳动物中,行使该催化功能的甲基转移酶催化主要包括 NSD1、NSD2、NSD3、ASH1L 等,而 SETD2 是已知的惟一催化H3K36me2 转化为 H3K36me3 的酶[13-14]。H3K36me2 和H3K36me3 在转录活性基因的基因体上富集,抑制相关基因的转录表达。H3K36M 突变型软骨母细胞瘤显示出H3K36me2 / 3 的全局缺失,分析其原因发现,K36M 肽或K36M 单核小体可以显著抑制甲基转移酶 NSD2 和 SETD2的活性,而对 NSD1 和 ASH1L 无影响[15]。在间充质祖细胞 ( mesenchymal progenitor cells,MPCs ) 中过表达 H3.3 K36M,可以阻断 MPCs 向软骨细胞、脂肪细胞和骨细胞等不同谱系的分化,将表达 H3.3 K36M 的 MPCs 移植到免疫缺陷的小鼠体内后会产生肉瘤样改变[16]。以上结果表明,H3 K36M 突变可能是一种驱动 MPCs 的致癌蛋白。
K36M 突变通过抑制特定的组蛋白甲基转移酶( HMTs ),改变肿瘤基因组整体水平的表观修饰水平,参与肿瘤的形成和进展。同时,值得注意的是 K36M 突变型细胞的 HMTs 仍表现出部分剩余活性,这说明 K36M 突变体组蛋白 HMTs 活性的抑制并非完全。此外,在儿童肿瘤中尚未发现可以导致 HMTs 功能完全缺失的驱动突变,药物抑制 HMTs 也不能完全模拟 K36M 突变所引起的生物学表型[17]。这些结果表明,未来的研究需要确定 K36M 突变体抑制 HMTs 的实际模式,以进一步明确其中的分子调控机制,为靶向治疗指明方向。
全基因组富集分析表明,异位表达 H3K36M 可导致 MPCs 中 H3K36me2 / 3 修饰水平的整体降低,其中对H3K36me2 的影响最为明显[18]。H3K36me2 在 H3K36M 细胞的基因区域明显减少。此外,表达 H3K36M 的细胞基因体中的 H3K36me3 富集也显著减少,并由此导致下游靶基因的表达发生变化。在内源性 H3F3B 基因发生 H3K36M突变的永生软骨细胞中也得到了类似的结果[16]。通过免疫沉淀标记组蛋白或使用 H3K36M 特异性抗体分析组蛋白 H3 在表达 H3K36M 的原代细胞中的分布,结果显示组蛋白 H3 的分布不受 H3K36M 突变的影响,这表明该突变不影响核小体的位置。进一步研究发现,携带有 H3K36M突变的的原代细胞和软骨母细胞瘤细胞中,全基因组的H3K27me3 水平升高,因为 PRC2 的活性受到 H3K36 甲基化的抑制,当 H3K36 甲基化缺失时,便减弱了对 PRC2复合体的抑制作用,并为 PRC2 提供了新的核小体底物,增加了基因组的甲基化水平[15]。携带有 H3K36M 细胞中H3K27me3 的增加主要见于基因间区,并与基因区 PRC1富集的减少有关[19-20]。基于这些观察,Lu 等[15]提出H3K36M 细胞基因间区 H3K27me3 的增加导致 PRC1 在基因组上重新分布和稀释[21]。类似的模型也被提出来解释多发性骨髓瘤中染色质的变化,其 NSD2 活性的增加导致基因组水平 H3K36me2 水平的升高,同时抑制了 H3K27me3的水平。与此相反,另一项研究却并没有观察到表达携带有 H3K36M 突变的人类软骨细胞中 H3K27me3 水平的增加[16]。目前为止,造成这些研究存在差异的原因还不十分清楚。
GCTB 是一种局部侵袭性的原发性骨肿瘤,可以发生于全身任何骨骼中,但以股骨远端和胫骨近端为最常见好发部位,中轴骨中,近端骶骨为最常见的部位,GCTB 是少数可以偶尔转移到肺部的“良性”肿瘤之一[22]。由于肿瘤内的形态学异质性,包括继发性动脉瘤性骨囊肿样的改变,广泛的梗死伴成纤维细胞过度增生,使得 GCTB 在临床和影像学上的诊断面临很大的挑战。组织病理学检查,尤其是在较小的活组织检查中,可能很难作出明确的诊断。
近年来的系列研究均显示,超过 90% 的 GCTB 中存在组蛋白 H3.3 编码基因 H3F3A 基因突变,其中绝大多数以第 34 位氨基酸密码子的突变,包括 G34W / L / V / R 等。更为重要的是,突变的肿瘤成分局限于肿瘤基质细胞而非破骨样多核巨细胞。有研究应用抗组蛋白 H3.3 变异位点的单克隆抗体辅助 GCTB 的诊断[23],结果显示 H3.3 G34W、G34R 和 G34V 突变体特异性抗体是鉴别 GCTB 及非 GCTB病变的有力诊断工具,具有很好的应用价值[24-26]。
目前,关于 H3G34 突变表达的生物学效应的报道还很少,据文献报道,H3 的 Gly34 残基尚未被证明与任何表观遗传修饰有关,而且与 H3K27M 及 H3K36M 突变体不同,H3G34 位突变尚未被证明改变 H3 上任何氨基酸的翻译后表观修饰水平。然而 G34 位于 H3 尾部靠近 K36的位置,过表达 H3.3G34R / V 突变时,突变体核小体上H3K36me2 和 H3K36me3 水平降低,对含有野生型组蛋白的核小体没有影响,这表明 H3G34 位突变可能并不是主要的肿瘤驱动突变[27]。
对与 H3K36M 肽结合的 SETD2 甲基转移酶的晶体学研究,进一步揭示了 H3G34 突变体对于 H3K36 甲基化修饰水平的影响的分子机制。蛋白晶体结构研究表明H3G34 残基深埋在 SETD2 的狭窄的催化域内,没有空间容纳具有大侧链的氨基酸残基。而当在突变的细胞中导入 G34 突变会影响 H3K36me3 的修饰水平,最有可能是通过改变 SETD2 结构域的构型所致[28]。这些结果表明,H3G34R / V 或 H3G34W / L 突变体对 H3K36me3 修饰水平的影响并非特异性的,而可以被其它几种 H3G34 突变体模拟。H3G34R / V 突变体也被证明会削弱肿瘤抑制因子ZMYND11 与 H3.3K36me3 的特异性结合[29]。H3G34W / L是否同样影响 ZMYND11 的结合,致于 H3G34 突变如何干扰 ZMYND11 等因子与染色质结合,从而导致肿瘤的发生,目前尚不清楚。
近年来的研究通过建立来自 GCTB 患者的原代细胞系,分析对比野生型和 H3.3 G34W 突变型肿瘤生物学表型发现,H3.3 G34W 突变型原代细胞系的浸润和增殖能力较野生型均增加,呈典型的肿瘤样表型。原代细胞和肿瘤组织的转录组分析结果显示,突变型基因表达整体稍微下调,可能是由于染色质致密度增加所致。通过免疫沉淀和质谱鉴定了与 H3.3 G34W 相互作用的成分,其中最显著的是剪切相关的 hnRNPs,转录组分析进一步验证了染色体异常剪接的存在[30]。这些数据提示 H3.3 G34W 突变在染色质调控中的潜在作用,可能驱动了 GCTB 的致瘤过程。
骨肉瘤的基因组结构复杂,其染色体的高度不稳定性常导致非二倍体改变。变异的染色体区域往往含有细胞周期调控基因,如 TP53、RB1、c-MYC 等。这些基因的高频突变,进一步支持了其在骨肉瘤发生发展中发挥的重要作用[31-32]。
原发性骨肉瘤患者的肿瘤组织中同样检测出了 H3.3 G34W 突变,其总体上很少见,偶见于 30 岁以上的骨肉瘤患者。H3.3 突变骨肉瘤的临床表现、组织病理学特征和其它分子特征在很大程度上尚不清楚。基于此,有研究认为,伴有 H3.3 突变的原发性恶性骨肉瘤实际上是由恶性 GCTB 转化而来,虽然其在病理上未见良性 GCTB的组织成分。进一步研究运用甲基化芯片检测,将带有G34W 突变的骨肉瘤与 G34W 突变型 GCTB 以及 1 例带有K27M 突变的骨肉瘤相互比较,结果显示带有 G34W 突变的原发性骨肉瘤的 DNA 甲基化谱明显不同于 H3.3 野生型骨肉瘤,但与 GCTB 更加相似,提示 G34W 突变型骨肉瘤的细胞可能是源自于 GCTB。同时,与野生型相比,H3F3A G34 突变骨肉瘤启动子区域的甲基化水平更高。具体来说,研究发现 HIST1H2BB 基因启动子区和 KLLN /PTEN 基因启动子区在 H3F3A G34 突变骨肉瘤中甲基化水平显著升高,提示携带 H3F3A G34W / R 突变的骨肉瘤与KLLN / PTEN 和 HIST1H2BB 的表观遗传学失调有关[33]。
骨与软组织肿瘤中,靶向癌组蛋白的治疗目前应用的还很少,当下的研究主要集中携带组蛋白突变的 pHGG,并系列研究测试了不同表观遗传疗法的疗效。系列研究对于骨与软组织肿瘤中癌组蛋白突变的靶向治疗均具有指导意义,故本部分对相关内容作进一步阐述。
为了逆转 H3K27M 肿瘤中 H3K27me3 水平的降低,Mohammad 等[17]分析了 H3K27M 突变体对于 H3K27me3去甲基酶的抑制作用,发现 JMJD3 抑制剂 GSK-J4 可以显著抑制 H3K27me3 组蛋白去甲基化酶,导致 H3K27M 突变细胞系 H3K27me3 修饰水平的回复,并且证实 GSK-J4对表达 H3K27M 的 pHGGs 具有更加特异性的抗肿瘤活性,而对表达野生型或 G34V 突变体的细胞无明显影响。GSK-J4 挽救 H3K27M 细胞减少的 H3K27me3 水平的分子机制尚不清楚。在另一项研究对 DIPG 细胞系进行了药物筛选,发现 panobinostat 是一种体内外均有强烈抑制肿瘤生长的药物。panobinostat 是一种非选择性组蛋白去乙酰化酶 ( HDAC ) 抑制剂,已被批准用于治疗多发性骨髓瘤。有趣的是,panobinostat 处理后的 H3K27M DIPG 细胞乙酰化水平升高的同时,H3K27me3 水平也升高,从而挽救了部分 H3K27M 诱导的 H3K27me3 的下降[34]。机制上,目前尚不清楚 panobinostat 治疗如何影响 H3K27M 突变型肿瘤的 H3K27ac 水平,因此,panobinostat 影响肿瘤生长的机制尚不清楚。
在 GCTB 中,有研究选择性地敲除基质细胞中的H3.3-G34W 突变,结果显示肿瘤细胞的体外增殖和迁移受到了显著的抑制,同时敲除后的细胞体内成瘤后生长减慢,证实单一 H3.3-G34W 突变足以驱动 GCTB 的发生。同时,本研究观察到 H3.3G34W 敲除的基质细胞 RANKL表达降低,提示破骨细胞的形成和活性可能也会降低,从而有望延缓 GCTB 溶骨性骨破坏[35]。但基于癌组蛋白H3.3-G34W 作为 GCTB 溶骨性骨破坏的治疗靶点,尚需进一步深入研究。
近年来,表观遗传调控因子和染色体相关蛋白在肿瘤病因学中的作用越来越受到重视,在几乎所有类型癌症中都发现了频繁的编码表观遗传调控元件基因的突变。其中最新的研究揭示了组蛋白编码基因高频突变影响儿童肿瘤的染色体整体水平的表观修饰,这一重要发现进一步加强了表观遗传变化在肿瘤发育中的关键作用。
癌组蛋白介导肿瘤细胞分子变化及效应机制逐渐被揭示,这可能会为肿瘤的治疗策略带来新的发展方向。此外,深入研究癌组蛋白突变对于肿瘤分子表达谱的影响,将会为开发相应的靶向治疗药物指明方向,具有可观的临床转化前景和重要的意义。