王东升穆思宇王健岗谢龙飞钟翔宇
(哈尔滨医科大学附属第二医院胆胰外科,哈尔滨 150086)
近年来通过高通量测序技术对恶性肿瘤的表观基因组进行了大规模的系统研究,发现有不同程度的转录控制失调,主要包括DNA 甲基化、组蛋白修饰和非编码RNA 的异常表达等,与恶性肿瘤的发生发展密切相关[1]。随着表观遗传学的迅猛发展,一些未知的表观调节子相继被发现。1999 年,研究者通过双链寡核苷酸探针成功分离出一种新型编码人类 CpG 结合蛋白-CXXC 锌指蛋白 1(CXXC finger protein-1, CFP1)的cDNA,CFP1 基因位于人染色体18q21.1 区域,全长2487 bp,转录生成的蛋白由656 个氨基酸序列组成,定位于细胞核中[2]。在哺乳动物细胞内CFP1 蛋白只能与未甲基化的核苷酸序列结合,通过调控 DNA 甲基转移酶 1(DNMT1)参与胞嘧啶甲基化[3]。CFP1 也是组蛋白甲基转移酶Set1 的亚基,于H3 组蛋白4 号赖氨酸上进行三甲基化(H3K4me3),使染色质处于开放状态促进基因表达[4]。CFP1 在DNA 甲基化和组蛋白修饰中发挥重要作用,可能和恶性肿瘤的发生发展密切相关。研究发现CFP1 发生基因突变、异常表达和与DNMT1 结合障碍等对恶性肿瘤的发生发展有促进或抑制作用。本文简要综述CFP1 的基本功能及在恶性肿瘤中的研究进展,以期为后续研究新的肿瘤标志物和潜在的治疗靶点提供依据。
DNA 甲基化是在 DNA 甲基转移酶(DNA methyltransferases, DNMTs)催化作用下在基因组CpG 二核苷酸的胞嘧啶5 号碳原子上共价结合一个甲基基团,能引起 DNA 构象、DNA 稳定性及 DNA与蛋白质相互作用方式的改变,从而调控基因表达[5]。DNA 甲 基 转 移 酶 主 要 包 括 DNMT1、DNMT3a、DNMT3b,DNMT3a 和 DNMT3b 完成 DNA初始甲基化,DNMT1 维持DNA 的甲基化状态[6]。此外,研究发现DNMT1 在DNA 初始甲基化中同样发挥重要作用[7]。在许多哺乳动物细胞基因组中存在大量散在的甲基化的CpG 二核苷酸,而在某些区域,如基因的启动子处存在高度聚集的CpG 二核苷酸,它们被称为CpG 岛(CpG islands, CGIs),大约72%的人类基因启动子位于CGIs,它们的甲基化水平很低[8]。基因启动子区域CGIs 的甲基化与基因沉默密切相关,甲基化的DNA 可以招募甲基结合蛋白(methyl-binding domain proteins, MBDs)抑制转录因子的结合。而在肿瘤细胞中CGIs 往往呈高甲基化状态,这种高甲基化状态是导致抑癌基因失活的一个重要机制[9]。
CFP1 通过调控DNA 甲基转移酶1(DNMT1)参与胞嘧啶甲基化,Butler 等[10]研究发现缺乏CFP1 的小鼠胚胎干细胞(ES)整体基因组70%的胞嘧啶甲基化下降,并伴随着多聚核糖体水平降低, 导致翻译起始降低。尽管DNMT1 转录水平显著升高,但DNMT1蛋白合成减少。通过脉冲/chase 分析结果显示在CFP1 缺失的小鼠胚胎干细胞(ES)中DNMT1 蛋白半衰期也有一定程度的降低。基于以上结果,Tate等[11]进一步研究发现缺乏CFP1 的胚胎干细胞参与DNA 碱基切除修复的核酸内切酶(Apyrimidinic endonuclease/Redox factor-1, Ape1/Ref-1)蛋白表达下降,DNA 损伤增加。这些结果揭示了Cfp1 在翻译起始及DNA 损伤修复中的作用,表明CFP1 缺失会导致基因组胞嘧啶甲基化水平下降、DNMT1 蛋白合成和半衰期降低及DNA 损伤增加。
组蛋白与DNA 共同组成核小体,是染色质的基本结构单位,组蛋白氨基末端(N 端)结构域伸出核小体同其他调节蛋白和DNA 发生相互作用。其N端尾区可进行乙酰化、甲基化、磷酸化、泛素化、苏素化、ADP 核糖基化等修饰,可改变染色质的状态及调控基因的表达,进而引起肿瘤的发生发展[12]。
组蛋白甲基化修饰相关蛋白主要包含组蛋白甲基转移酶(HMTs) 和组蛋白去甲基转移酶(HDMTs)。组蛋白甲基化对基因表达的影响较为复杂,主要取决于被修饰的氨基酸位点,而甲基化程度又分为三个水平,分别为一甲基化、二甲基化、和三甲基化(me1/me2/me3)即分别在同一个氨基酸位点添加一个甲基、两个甲基和三个甲基[13]。某些被沉默的抑癌基因启动子区域均可发现H3K4me2/3 修饰的缺失以及 H3K9me2/3、H3K27me3 修饰的获得[14]。大多数组蛋白甲基转移酶都通过Set 结构域来发挥主要功能,CFP1 作为组蛋白H3K4 甲基转移酶Set1 的组成单位与未甲基化的CpG 岛结合定位H3K4me3 到染色质上,从而调控染色质的结构,促进基因表达[3]。
Yu 等[15]研究发现在卵母细胞中CFP1 修饰的H3K4me3 与基因启动子相关,并在发育过程中使启动子激活并转录。Sha 等[16]研究发现在成熟卵母细胞中CFP1 是H3K4me3 积累和沉积在染色质上所必要的蛋白,缺乏CFP1 将导致H3K4me3 降低,进一步导致转录活性下降、卵母细胞减数分裂障碍、受精后无法完全成熟。基于以上结果,Sha等[17]进一步研究发现卵母细胞缺失CFP1,直接破坏了基因表达模式,间接破坏了促黄体激素的作用和损害了促卵泡激素对颗粒细胞的基本信号通路,导致卵泡生长和排卵均受到影响。以上研究表明CFP1 对H3K4me3 的修饰对卵母细胞增值、减数分裂、基因表达、信号转导至关重要。
胃癌是一个全球性的健康问题,是癌症相关死亡的第三大主要原因,越来越多的研究表明胃癌的表观遗传异常可以促进癌变发生[18]。Sun 等[19]对84 例胃癌患者进行了研究,通过免疫组化方法检测胃癌组织中CFP1 与14-3-3 蛋白表达水平,并进行相关性分析。14-3-3 蛋白在哺乳动物中存在7 个亚型(α/β,γ,ε,ζ,η,σ 和 θ/τ),由不同的基因编码,可参与细胞内信号转导、细胞周期调控和细胞迁移、分化、凋亡等过程[20]。14-3-3σ 编码基因的甲基化会导致14-3-3σ 蛋白在肿瘤细胞中持续低表达,会对P53 产生负性调控作用,从而促进肿瘤细胞的增值[21]。研究发现,在同一视野中CFP1 的表达量与14-3-3 蛋白的表达呈负相关,CFP1 呈高表达的患者总体生存时间小于呈低表达的患者,而14-3-3 蛋白对患者生存时间的影响则与CFP1 相反。Mai 等[22]研究发现 CFP1 与 14-3-3 蛋白之间的相互作用与核因子κB(nuclear factor kappa-B,NF-κB)蛋白有关,在B 细胞中14-3-3 蛋白的表达依赖于 NF-κB 蛋白在 14-3-3 基因启动子区募集CFP1 蛋白,CFP1 是组蛋白甲基转移酶Set1 的指南针,使启动子特异性地富集了H3K4me3,使染色质处于开放状态,标志转录激活。因此可以推测CFP1与14-3-3 蛋白通过NF-κB 蛋白可能会影响胃癌细胞的细胞周期、细胞迁移及侵袭能力等,但仍需进一步实验证明。CFP1 可能会成为胃癌患者新的分子标志物及潜在的治疗靶点。
结直肠癌(Colorectal cancer, CRC)是世界范围内癌症相关死亡的主要原因之一,由于正常结肠上皮细胞一系列遗传和表观遗传改变的逐步积累,导致结直肠腺瘤和侵袭性腺癌的发生[23]。
相关研究报道,在60%~70%的大肠癌细胞中18q 染色体缺失,表明该区域可能含有与大肠癌发生有关的抑癌基因(TSGs)[24]。尽管18q 染色体缺失常影响染色体臂的大部分,但结肠癌基因(DCC)缺失的18q21 染色体最小区域已被确定,在同一4mb 染色体区域内还存在甲基 CpG 结合蛋白1(MBD1)、甲基 CpG 结合蛋白 2(MBD2)、CpG 结合蛋白(CFP1)、sma 和 mad 相关蛋白 4(SMAD4)。为了探究该区域是否存在抑癌基因,Derks 等[25]发现在结肠癌细胞中只有DCC基因启动子被高甲基化,导致表达沉默,而其它临近基因MBD1、MBD2、CFP1、SMAD4 不受影响。此外,Bader 等[26]研究表明CFP1 在结直肠癌细胞中突变率很低,常被认为是与结肠癌发生无关的突变。综上研究表明CFP1基因可能不是结直肠癌中潜在的抑癌基因,CFP1基因突变在结直肠癌中的作用有限。
在全球范围内,肺癌是最常见的恶性肿瘤,据报道表观遗传改变在肺癌的发生发展中起重要作用,DNA 甲基化、组蛋白修饰和RNA 表达在肺癌的早期发现、评估预后和治疗中具有重要意义[27]。
长链非编码RNA(Long non-coding RNAs, lnc RNA)与多种癌症的发生发展相关[28]。Tao 等[29]研究发现在肺癌中 lnc RNA P53RRA 表达下调,P53RRA 可以与RNA 结合蛋白(G3BP)结合,取代G3BP 复合物中的P53,导致P53 更多的保留在细胞核中,进而促进细胞凋亡,抑制肿瘤进展,发挥抑癌作用。Mao 等[30]通过对比肺癌细胞和正常细胞发现,CFP1 在癌细胞中与未甲基化的CpG 岛结合力降低,导致癌细胞 P53RRA 蛋白转录起始位点H3K4me3 降低、H3K27me3 显著升高,抑制 P53RRA蛋白表达。在肺癌细胞中诱导CFP1 过表达会增加P53RRA 的表达水平,发挥抑癌作用。
有研究表明肺泡巨噬细胞在肺癌早期起识别并清除肿瘤细胞的作用,随着肿瘤发展又在肿瘤细胞的生长、转移、侵袭过程中发挥重要作用[31]。Hui等[32]研究发现CFP1 缺失会导致粒细胞-巨噬细胞集落刺激因子(GM-CSF)的受体亚基Csf2rα 基因启动子区H3K4 的修饰减少,导致肺泡巨噬细胞的吞噬和杀菌活性降低。小鼠缺乏CFP1 容易受到细菌感染,在小鼠肺组织表现出自发的炎症症状,包括炎症细胞的侵润和表面活性磷脂蛋白的积累。恢复Csf2rα 的表达可以逆转肺泡巨噬细胞活性。肺癌发生发展过程中存在复杂的调节机制,适度的刺激CFP1 蛋白的表达可能是治疗肺癌的潜在靶点,但尚需进一步研究证实。
胶质瘤是最常见的原发性恶性脑瘤,以治疗耐药而闻名。在过去的十年中,表观调控基因的突变被认为是胶质瘤发生的关键驱动因素。在成人胶质母细胞瘤患者中,启动子甲基化导致的DNA 修复基因MGMT表观遗传沉默可以预测烷基化剂治疗的疗效。这些表观遗传改变被用作生物标记,并在胶质瘤的分类和治疗决定中发挥核心作用[33]。
Bronner 等[34]研究发现 CFP1 对 DNA 甲基化修饰是通过与DNMT1 相互作用实现的,抑制CFP1 表达后 DNMT1 活性明显降低,而 DNMT3a、DNMT3b活性无明显变化。DNA 甲基化是基因组的一个生物学过程,DNMT 水平升高而引起启动子和其他调控区域的局部高甲基化,从而使肿瘤抑制基因沉默,因此有研究者提出DNMT 抑制剂是表观遗传药物开发的潜在靶点,可能为胶质瘤治疗耐药患者提供新的治疗方案[35]。
有研究表明DNMT1 可能与癌基因或抑癌基因的沉默有关,DNMT 抑制剂的最初目的是促进被DNA 高甲基化的抑癌基因重新激活,而不促进其它癌基因的激活,因此理想的DNMT 抑制剂需要靶向特定的 DNMT 复合物[36]。Cheray 等[37]实验表明DNMT1/USP7、DNMT1/Cfp1、DNMT1/Stat3 复合物在脑、乳腺和肺肿瘤中表达明显增加。通过将U251细胞皮下注射到小鼠体内,然后使用替莫唑胺(TMZ)和针对三种复合物的抑制剂治疗,结果表明,TMZ 和DNMT1/CFP1 抑制剂治疗组,TMZ 抗胶质瘤细胞的死亡百分比明显增加,肿瘤生长效率明显降低。异种移植建立体内胶质瘤模型实验表明特异性抑制DNMT1/CFP1 复合物同样增加了胶质瘤细胞死亡的百分比,具有提高抗肿瘤疗效的作用。说明抑制CFP1 与DNMT1 的相互作用可提高化疗药物TMZ 的效果,但具体机制还有待于研究。
混合谱系白血病(mixed lineage leukemia.MLL)是一类恶性程度高、预后差的难治性急性白血病,因此急需开发特定的靶向治疗。MLL基因由急性白血病的染色体异位产生,编码产生白血病的MLL融合蛋白。研究发现Hoxa9 基因的表达对急性白血病的发生有促进作用,而MLL 融合蛋白的结构域中含有与DNA 结合的CXXC 结构域,能够与未甲基化的DNA 结合,使Hoxa9 基因位点的CpG 残基和组蛋白 H3K9 不发生甲基化,促进Hoxa9 基因的表达[38-39]。
Risner 等[40]寻找是否存在类似的MLL CXXC结构域,进行替换,以期寻找新的治疗靶点,研究者选择了 DNMT1、MBD1、CFP1 三种蛋白中的 CXXC结构域,用以替换MLL 融合蛋白的CXXC 结构域。首先比较与未甲基化DNA 结合的亲和力,结果:MLL CXXC 结构域与未甲基化的DNA 亲和力最强,CFP1 CXXC 结构域与未甲基化的DNA 亲和力比MLL CXXC 结构域低 7 倍。DNMT1 CXXC 结构域比 MLL CXXC 结构域低 34.4 倍,而 MBD1 CXXC 结构域与未甲基化的DNA 无亲和力。在骨髓集落复制实验和体内白血病实验表明只有DNMT1CXXC结构域能够功能性替代 MLL CXXC 结构域,使Hoxa9 基因位点的CpG 残基和组蛋白H3K9 不发生甲基化。虽然初步研究表明MLL 白血病中CFP1 CXXC 结构域不能功能性代替MLL CXXC 结构域,但是能否通过CFP1 调控DNMT1 用于治疗白血病仍值得进一步探索。
Young 等[41]研究发现,人类 PLB-985 细胞(人急性髓系白血病细胞)的正常增值分化需要CFP1蛋白。敲除CFP1 基因导致细胞存活率降低约50%,倍增时间延长,并且不能向单核细胞及粒细胞分化。由此可见CFP1 蛋白是PLB-985 细胞生存、增殖、分化的必要蛋白,能否通过调控CFP1 基因的表达来治疗白血病值得进一步研究探索。
综上研究表明,CFP1 主要调控 DNMT1 和H3K4me3 以外,还存在其它调节通路,参与表观遗传修饰,与多种恶性肿瘤的发生、治疗及不良预后密切相关,但其复杂的调节机制研究以及大样本队列研究加速其在临床中的应用仍处于初级阶段,亟待进一步的探索研究。随着表观遗传学的发展,CFP1 在临床方面的研究会越来越深入,期望CFP1在恶性肿瘤诊断、治疗及预后中成为新的突破点。