邱 颖 王红艳
(中国科学院上海生物化学与细胞生物学研究所,上海200031)
DNA甲基化是发生在DNA上的共价修饰,作为一种重要的表观遗传修饰,在基因表达调控方面起重要作用[1]。DNA的甲基化修饰广泛存在于古细菌、细菌和真核生物等物种中,而在酵母等生物中缺失。在哺乳动物中,DNA甲基化主要发生在胞嘧啶-鸟嘌呤二核苷酸(CpG) 位点上。此外,少量非CpG位点的甲基化修饰也存在于胚胎干细胞(Embryonic stem cells,ESCs)中。据统计,在人类基因组中,有70%~80%的CpG位点发生了甲基化修饰。未甲基化的CpG二核苷酸主要富集于基因启动子区域,通常成簇存在,被称为CpG岛(CpG islands,CGIs)。
在哺乳动物中负责DNA甲基化建立与维持的是DNA甲基转移酶(DNA methyltransferases,DNMTs)。哺乳动物 DNMT3 家族的成员,包括DNMT3A、DNMT3B和DNMT3L。其中,DNMT3A/3B 具有高度同源性,在体内和体外均能催化DNA的甲基化[2];而DNMT3L 不仅同源性相对较低,而且由于催化区域内重要结构域的缺失,不具备转移甲基基团的活性,但它能够直接结合 DNMT3A/3B 并提高两者的酶活,对配子早期发育过程中的甲基化模式的建立有着重要作用[3]。它们与DNA结合,以S-腺苷甲硫氨酸为甲基供体,催化生成5位胞嘧啶的甲基化(5-methylcytosine,5mC),在哺乳动物中,DNA甲基化修饰的生物学功能体现在如下几个方面:抑制基因组中转座子的活性[4];稳定X染色体的失活;维持亲代基因印记以及调控基因的表达[5]。 这一方面有利于保持整个基因组的稳定性,另一方面建立细胞记忆从而将细胞命运传递给子代细胞[6]。
尽管5-甲基胞嘧啶(5mC)是一种稳定的共价修饰,但它在生物体内仍处于一个动态变化过程,它可以通过两种方式去甲基化:主动去甲基化和 DNA复制依赖的被动去甲基化。典型的DNA复制依赖的被动去甲基化发生在受精卵雌原核基因组的去甲基化过程中。随着DNA复制,DNA双链数目剧增,原有的DNA甲基化修饰被逐渐稀释,呈现为被动的去甲基化过程。此外,由酶类催化5mC脱甲基的过程称为主动去甲基化;目前研究比较清楚的是TET去甲基化酶家族介导的DNA主动去甲基化过程。
2009年,人们在胚胎干细胞基因组中发现了一种新的碱基,即5-羟甲基胞嘧啶(5hmC),并且发现在小鼠的脑部组织,尤其是Purkinje神经元内也存在胞嘧啶的羟甲基化修饰[7]。 5hmC在细胞类型间有差异,例如,5hmC在免疫细胞中占5mC总量的1%,在胚胎干细胞中占5mC总数的5%~10%,在神经细胞中占总数5mC的40%[8]。然而,5-醛基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)的含量要少得多,仅占胚胎干细胞中5mC总量的0.03%和0.01%[9]。而后Anjana Rao 实验室发现人源双加氧酶TET1在 Fe2+和α-酮戊二酸存在的情况下可以将5mC氧化形成5hmC[10]。 TET蛋白功能的揭示为DNA主动去甲基化提供了一条途径:TET可以将5mC迭代氧化成5hmC、5fC和5caC,再通过DNA糖苷酶TDG介导的碱基切除修复(Base excision repairing,BER)途径将5mC重新变为未修饰的胞嘧啶[11]。
TET家族蛋白共有3个成员,分别为TET1、TET2 和 TET3。 这是一类依赖于 Fe2+和α-酮戊二酸的双加氧酶,其C端催化中心由双链β折叠结构域(Double-stranded β-folded domain,DSBH) 和半胱氨酸富集区(Cysteine-rich region,Cys-rich)组成。DSBH 结构域可以结合Fe2+和α-酮戊二酸,对5mC底物进行氧化,而Cys-rich结构域可以帮助稳定DSBH与 5mC的相互作用。全长的TET1和TET3的N端有一个CXXC结构域,CXXC 结构域存在于许多与染色质相关的蛋白中,在区分甲基化和未甲基化DNA 的过程中起到重要作用。TET2此部分结构丢失,推测在进化过程中5′端形成一个独立的基因-IDAX,也被称为CXXC4,可以介导TET2与DNA的相互作用[10]。如图1所示。
TET家族蛋白的3个成员都具有氧化5mC的活性,但其在细胞和各组织中的表达谱有很大差别,表明这3个蛋白在小鼠的发育中可能既有重叠、又有时空特异的生物学功能[12]。利用经典打靶技术得到 TET1 敲除(Kill out,KO)小鼠可以存活且可育,没有明显的形态缺陷和生长异常。但这种成年小鼠海马神经前体细胞增殖能力降低,成体神经发生过程受损,导致空间学习和短期记忆能力下降[13]。同时,TET1 KO使得参与神经前体细胞增殖及成体神经发生相关的基因的启动子区域发生异常高甲基化,从而使其表达水平降低。然而,利用基因捕获技术得到的TET1突变小鼠的表型与经典的TET1 KO小鼠表型还是有些差异,其中雌性TET1突变体表现为减数分裂过程中染色体联会存在缺陷,导致生殖细胞大量减少,生育力减弱,而雄性TET1突变体的表型与TET1 KO小鼠的类似[14,15]。
3.1CD4+T辅助细胞亚群(Th细胞) 静息期(Naïve)CD4+T细胞受到TCR信号和共刺激信号激活后,产生不同的效应T细胞,其辅助和调节功能取决于谱系特异性转录因子的表达和细胞因子的产生。比如Th1 (IFN-γ和T-bet),Th2 (IL-4和GATA3),Th17 (IL-17和RORγt),滤泡辅助T 细胞(Tfh) (IL-21和Bcl-6),还有调节性T 细胞(Treg) (IL-10和Foxp3)[16]。 在Naïve CD4+T细胞中,这些转录因子和细胞因子的基因不活跃或低水平表达。分化后,染色质的抑制单价结构被抹去或获得活性单价结构,从而起始转录[17]。 全基因组图谱揭示了在Th细胞中表观遗传修饰的特征,包括DNA甲基化、组蛋白修饰、DNase 1 超敏位点(DNase 1 Hypersensitive sites,DHS)和非编码RNA(non-coding RNAs,ncRNAs)的表达,通过表观遗传机制和多个转录因子(TFs)的组合作用,来驱动谱系特异性的基因表达程序,从而实现CD4+T细胞的谱系分化[18]。
图1 哺乳动物TET家族蛋白TET1、TET2、TET3结构示意图Fig.1 Schematic representation of domain structure of three mammalian ten-eleven translocation(TET)proteins TET1,TET2 and TET3
3.2DNA去甲基化对不同Th细胞分化的影响
3.2.1Th1和Th17细胞 DNA免疫沉淀结合高通量测序(DNA immunoprecipitation coupled with high-throughput sequencing,DIP-seq)分析CD4+T细胞全基因组5hmC的分布,发现5mC和5hmC在Th细胞亚群中的表达与其特异性基因的表达密切相关[19]。 Naïve CD4 T细胞中,5mC占据细胞因子基因位点的转录调控区(特别是在增强子区),这些区域经常与保守的非编码序列(Conserved non-coding sequence,CNS)重叠。这些细胞因子基因在Naïve CD4 T细胞中被沉默。5hmC与Ifng、Il4和Il17基因表达密切相关,特别是在某些CNS和某些启动子区域。在Naïve CD4 T细胞分化为效应T辅助细胞时,这些调控区的5mC被TET蛋白以谱系特异性的方式氧化为5hmC。 Ifng上CNS(6)是增强子,在Th1细胞中高度羟甲基化,而在其他Th细胞高度甲基化。TET2招募到Th1细胞Ifng位点CNS(6)依赖于关键转录因子T-bet。在Tbx 21缺失的Th1细胞中,被招募到Ifng上的5hmC和TET2量减少,由于TET2缺少CXXC区域,要在T-bet的帮助下才能结合到Ifng基因上[20]。TET2缺失的Th1细胞中,招募到Ifng上的T-bet减少,说明 TET2和T-bet可能协同调节Ifng表达。TET2对Ifng位点CNS(6)上的5 hmC修饰,对于该位点结合T-bet和p300、组蛋白修饰的改变、Ifng的转录都具有重要意义[19]。
Th17细胞特异性产生IL17A和IL17F细胞因子。编码Il17和Il17f的基因位于同一染色体上,中间相隔43.9 kb,向相反方向转录。顺式作用的调节元件保守性很高,并在T细胞分化调节中起到重要作用[21]。 通过序列对比发现:Il17-Il17f基因座中有8个CNS;而且Th17细胞的H3组蛋白呈高度乙酰化,是基因活化的标志[22]。CNS2 与Il17和Il17f基因启动子相互作用,调节其在Th17细胞中的选择性转录。CNS2缺陷的T细胞中IL17F细胞因子表达受损,可能是基因位点染色质重构缺陷有关,与CNS2介导的组蛋白乙酰化酶p300和JmjC结构域蛋白3(JMJD 3)的合成有关[23]。 CNS2在Th17细胞中高度羟甲基化,而在其他Th细胞中高度甲基化。TET2缺陷导致Th17细胞中Il17的CNS2和启动子区5hmC含量和RORγT结合的减少。除了Il17,对TET2+/+和TET2-/-Th17细胞进行微阵列分析,在197个Th17细胞特异表达基因中,还有5个基因(Ccl20、Il10、Gpr83、Emp1、Rbl2)受到TET2调控。
3.2.2Th2 细胞 Il4基因在T辅助细胞分化过程中经历甲基化和去甲基化的步骤。Il4基因的5′端在Naïve T细胞中高度甲基化,在Th2细胞中特异性去甲基化。Il4基因的5′端甲基化对于染色质重塑或转录不是必需的,但能促进分化的Th2细胞更高效、高水平地诱导Il4转录本的产生[24]。Il4基因的3′端在Naïve T细胞中低甲基化,在向Th1分化过程中被甲基化。
3.2.3Treg 细胞 调节性T细胞(Treg)是CD4+T细胞的一个独特的谱系,可以阻止自身免疫和维持免疫稳态[25,26]。 X染色体编码的转录因子Foxp3对调节性T细胞的发育和功能是必不可少的。在胸腺前体阶段, 表达Foxp3的Treg细胞称为胸腺源性Treg细胞(nTreg),而在体内发育出胸腺外的Treg细胞称为外周来源Treg细胞(iTreg)。或者,在体外经转化生长因子β(TGF-β)联合T细胞受体刺激Naïve T细胞,产生Foxp3,也称为诱导性Treg(iTreg)[27]。在Treg细胞分化过程中,Foxp3的表达受Foxp3基因外显子上游第一个内含子中三个CNS调控[28,29]。CNS2 缺失小鼠的Treg细胞在过继转移后,Foxp3表达不稳定,小鼠显示增加自身免疫性疾病的发生[28,29]。 在Treg细胞中,Foxp3 CNS2元件的CpG位点主要是非甲基化的(C/5fC/5caC),而在Naïve T细胞和iTreg中则是完全甲基化(5mC/5hmC)。 TET2和TET3功能冗余地在Treg细胞中维持多个调控区的去甲基状态,包括Foxp3基因中的CNS1和CNS2。与CNS2缺陷小鼠的T细胞相似,TET2/TET3双缺陷小鼠的Treg细胞中,Foxp3的稳定性明显受损[30]。H2S是Treg细胞分化和功能所必需的,H2S缺乏导致小鼠全身自身免疫性疾病。H2S通过巯基化核转录因子Y亚基β (NFYB)维持甲基胞嘧啶双加氧酶TET1和TET2的表达, TGF-β激活的SMAD3和白细胞介素2 (IL-2)激活的STAT5促进其与Foxp3结合,从而促进Treg细胞分化[31]。 TET1/2 DKO Treg细胞中5mC 和5hmC占总胞嘧啶的百分比增加,表明TET1/2活性有助于Treg细胞功能。事实上,在没有TET2和TET3的情况下,TET3 mRNA的表达水平略高一些,提示这三种TET蛋白都有助于CNS2去甲基化和Foxp3的稳定表达[30,31]。
3.2.4iNKT细胞 传统的T细胞是由MHCⅠ和MHCⅡ类分子呈递的多肽抗原经阳性和阴性选择产生的。iNKT细胞是通过识别非经典的MHCⅠ类蛋白CD1d递呈的脂类抗原,在胸腺中经阳性选择产生的[32],而iNKT细胞的分化是由强TCR信号通过激动剂诱导形成的[33]。 根据其识别抗原的不同以及TCR限制性的不同, NKT细胞被分为不同的亚群,其中经典的 NKT 细胞是Ⅰ型NKT细胞,可以识别 CD1d递呈的糖脂抗原α-GalCer,TCR重排具有高度的限制性,在小鼠中只表达Vα14-Jα18的TCR产物,由于其TCR的高度限制性,它也被称为iNKT细胞[34,35]。以特异性转录因子和细胞因子分类,iNKT可以分为以下几类:表达T-bet,并分泌干扰素-γ的iNKT细胞为NKT1细胞;表达GATA-3,并主要分泌IL-4的细胞为NKT2细胞;表达RORγt,并产生IL-17的细胞为NKT17细胞[36]。 T细胞中Tet2和Tet3的缺失导致了小鼠早期发生致命的淋巴增殖性疾病;其原因包括抗原刺激的T细胞不受控制的增殖,这类增殖的细胞主要是iNKT细胞,并且向iNKT17亚群偏移。在幼龄(3~4周龄)小鼠中,与野生型iNKT细胞相比,Tet2-Tet3 DKO的iNKT细胞表现出较高的Il17f、Rorc (编码Rorγt)和Eomes的表达,而Ifng、IL4、Tbx21(编码T-bet)和Zbtb7b(编码ThPOK)的表达较低。甲基化测序检测到编码T-bet和ThPOK的基因5hmC含量下降,甲基化程度高于野生型对照细胞。T-bet和ThPOK均抑制RORγt表达,T-bet缺陷使iNKT细胞向NKT2和NKT17细胞方向发展[36],而ThPOK表达降低与NKT17分化增强有关[37]。Tet2-Tet3 DKO iNKT细胞向iNKT17方向偏移,原因可能是关键转录因子RORγt编码基因Rorc的启动子和基因体(gene body)上染色质呈开放状态,更利于Rorc基因的转录和翻译[38]。TET蛋白参与CD4+T细胞基因调控如表1所示。
近年来DNA氧化去甲基化分子机制、生化原理以及生物学意义方面取得了很大的进展,TET去甲基化酶在T细胞分化过程中的功能研究也取得了一定成果。然而还有更多的问题亟待解决:①TET蛋白是否以及如何调控CD8+T细胞的功能,例如CD8+T细胞在向效应性T细胞和记忆性细胞转变过程中是否发挥关键作用;②CD4+T或CD8+T细胞中各谱系细胞中,TET家族成员的表达是如何被调控的;③α-酮戊二酸是TET去甲基化酶的底物之一,也是三羧酸循环的重要中间产物,CD4+或CD8+T细胞活化增殖或大量产生效应细胞因子时,代谢通路的改变与TET酶活改变是否有联系。
表1 TET蛋白在CD4+T细胞中发挥的功能
Tab.1 Summary of function of TET proteins in CD4+T cells
CD4+ T helpercells subsetInvolved TETproteinInfluencedgenesTh1TET2Ifng,Il2Th2UnknownunknownTh17TET2Il10,Il17,Il17f,RorcTregTET1,TET2,TET3FoxpiNKTTET2,TET3Il17,Il17f,Rorc