麻锦楠
(云南师范大学,昆明650092)
表观遗传修饰主要包括DNA甲基化、组蛋白修饰、RNA修饰和非编码RNA等。DNA甲基化作为一种被广泛研究的表观遗传修饰方式,是动物和其他真核生物共享的DNA修饰方式。DNA甲基化是指甲基基团在甲基转移酶的作用下,结合到基因组DNA分子上的生物学过程。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而调控基因表达(Jinet al.,2011);作为重要的基因组水平的化学修饰,参与了动物生长发育中许多关键过程。当原始生殖细胞向生殖脊转变时,首先通过重编程过程进行全基因组的去甲基化,之后再重新建立新的甲基化形式(Smith & Meissner,2013)。在胚胎发育过程中,也发现了大规模DNA甲基化遗传修饰的改变(Giffordet al.,2013;Xieet al.,2013;Wanget al.,2014)。此外,婴儿的发育过程同样存在DNA甲基化的动态改变,并且DNA甲基化的改变还会受到年龄、疾病、营养等的影响(Chenet al.,2018;Matherset al.,2018;Zhouet al.,2020;He,2022)。本文结合动物DNA甲基化研究文献,综述了DNA甲基化特征、DNA甲基化与基因表达调控、DNA甲基化的生物学意义,以及DNA甲基化检测技术等方面的研究进展。
DNA的4种碱基中,胞嘧啶和腺嘌呤都可以被甲基化,形成5mC和6mA的修饰。胞嘧啶甲基化在原核及真核生物中均广泛存在,但腺嘌呤甲基化主要存在于植物和细菌中(Yi,2017)。细菌中DNA甲基化可以将细菌自身基因组与噬菌体基因组区分开,噬菌体的DNA得以被宿主的限制性酶切割(Chinnusamy & Zhu,2009)。哺乳动物中,CG类型基序最常见,且脊椎动物体细胞中60%~80%的 CpG 位点都是高甲基化的(Schübeler,2015)。但在哺乳动物某些组织(胚胎干细胞、造血干细胞和神经细胞)中,非CG类型的甲基化占比更高(Ramsahoyeet al.,2000)。在植物中,DNA高甲基化作用发生在3种甲基化基序中,包括CG、CHG和CHH(H代表A、C或T),且大多数植物甲基化区域与非甲基化区域是交替出现的(Schübeler,2015)。DNA甲基化水平受生长发育和环境适应等因素的影响,处于动态变化的过程中。DNA甲基化变化可划分为3个阶段:建立、维持和去除。哺乳动物中,甲基化位点的建立在甲基转移酶3的调控下进行(Chen & Li,2004),发生部位通常是转录活性较弱的启动子区和转录活性较强的基因体区。这些区域往往包含了大量H3K4me3(Piunti & Shilatifard,2016)。甲基转移酶1可维持DNA复制过程CpG位点的对称性,避免由于复制造成的甲基化位点缺失。之前被认为是DNA甲基转移酶的DNMT2已被证实为一种tRNA甲基转移酶,并已更名为tRNA天冬氨酸甲基转移酶1(Gollet al.,2006)。此外,DNA甲基化是一种动态修饰过程,不仅因为其能通过酶来调控甲基化与去甲基化的作用,甲基化胞嘧啶还能自发地脱氨,导致基因位点突变频率的增加。5-甲基胞嘧啶在自发脱氨作用下转化为胸腺嘧啶,CpG二核苷酸转化为TpG二核苷酸,而未甲基化的胞嘧啶在自发脱氨作用下产生的尿嘧啶会很快被细胞识别并修复(Landeret al.,2001)。实际上,在进化过程中,许多甲基化CpG位点脱氨并稳定保存,这也解释了人类基因组中甲基化频率低于预期值的原因。
基因组上不同区域的甲基化对基因表达具有不同的调控作用。哺乳动物中存在富含CpG的区域,被称为CpG岛,其相对较小,平均约1 000 bp。人类和小鼠Mus musculu中30%~40%的CpG岛在正常组织中是甲基化的(Yi,2017)。人和小鼠的基因组中,绝大多数的CpG岛位于基因的启动子区,少数位于基因体区的可作为可替代启动子调节基因表达(Illingworthet al.,2010)。目前CpG岛的定义不统一,不同研究者对CpG岛的选取有一定差异,因此很多研究都将关注点集中于CpG岛最多的启动子区。启动子区高密度的甲基化可导致基因的沉默。CpG位点的甲基化能通过2种作用机制影响基因的表达。首先,CpG区的甲基化通过抑制转录因子与核苷酸的结合,影响基因的表达调控。6 bp区域中只要存在单个位点的甲基化修饰就能抑制转录因子的结合(Watt & Molloy,1988)。其次,甲基化的CpG区域能被含有甲基-CpG结合结构域的蛋白质家族识别。这些蛋白质家族通过不同的domain识别甲基化位点,招募组蛋白脱乙酰激酶HDACs和其他一些染色质重塑蛋白,改变组蛋白的结构,从而形成紧密闭合无活性的染色质,抑制转录的过程(Jones & Laird,1999)。越来越多的研究也将启动子区甲基化水平与基因表达进行联合分析,研究甲基化在介导生物组织器官发育(Waterlandet al.,2009;Liet al.,2012;Eharaet al.,2015;Maet al.,2022)、疾病发生(Brägelmannet al.,2021)等过程中的重要作用。
目前大多数研究已证实基因启动子区域的甲基化会抑制基因的表达,但是除启动子区域外的其他区域,如基因体区的甲基化功能还是未知的。Brenet等(2011)发现哺乳动物细胞系中首位外显子的甲基化与基因表达呈负相关性,且首位外显子的调控作用比启动子区更显著。首位内含子甲基化对基因表达同样存在调控作用:首位内含子与TSS位置较近,其甲基化通过影响转录起始位点来影响基因转录(Hartonoet al.,2015)。首位内含子的甲基化与基因表达相关性的实验已经在包括癌症细胞、胎儿及成年人组织、小鼠CD4+细胞、精神分裂症患者的白细胞等中进行了验证(Anastasiadiet al.,2018)。基因体甲基化除有部分调控基因表达的功能外,可能还在调控转录的准确性上起重要作用。Neri等(2017)在小鼠胚胎干细胞的研究中发现,DNA甲基转移酶Dnmt3b介导的甲基化过程可防止生物体内异常转录事件的发生,确保转录过程的准确性。如果Dnmt3a和Dnmt3b甲基化转移酶被抑制,胚胎会因转录因子的异常表达导致发育畸形而终止妊娠(Kinoshitaet al.,2021)。此外,位于外显子的DNA甲基化区可通过招募多功能蛋白MeCP2增强HDAC对外显子的识别,维持局部组蛋白低乙酰化,从而调节RNA的可变剪切(Maunakeaet al.,2013)。
DNA甲基化的改变与遗传水平的改变均反映了生物对外界环境的适应机制,但DNA甲基化改变机制的灵活性更高,且具可逆性(Norouzitallabet al.,2018)。DNA甲基化作用在生殖细胞发育阶段就已经出现,当原始生殖细胞向配子转变时,亲本特有的表观遗传印记会被清除,之后性别特异性DNA甲基化印记又在雄性和雌性配子体发育过程中重新建立(Sasaki & Matsui,2008)。而在由受精卵向早期胚胎的发育中,同样又循环了去甲基化与甲基化重构的过程(Smallwood & Kelsey,2012)。在胚胎发育过程中,母体环境(饮食结构、生存压力、生活习惯、行为方式等)会对胚胎发育和表观遗传信息造成影响。当母体受到不良因素诱导后,会造成新生儿体质量的改变,并可能导致后代罹患高血压、冠心病、骨质疏松、糖尿病等(Relton& Smith,2010)。此外,母体适应新环境的能力同样也决定了胚胎对环境变化的可塑性,这样的可塑性也能在种系间稳定地遗传(Devanapallyet al.,2015)。产后器官发育过程也同样受到甲基化调控。刚出生的幼体肝脏就能通过脂肪酸β氧化过程从母乳中摄取能量,但其中的机制却鲜为人知。Ehara等(2015)通过对出生前18.5 d和出生后2 d、16 d、28 d的小鼠肝脏组织甲基化情况进行比较分析,发现脂肪酸β氧化相关基因在出生后存在低甲基化高表达的现象,而这些低甲基化基因启动子区预测到许多氧化物酶体增殖剂激活受体(PPAR)结合基序。其中,PPARα受体在调控出生后小鼠肝脏脂肪酸β氧化相关基因的去甲基化过程中扮演了重要角色。Cannon等(2016)的研究也发现,出生后小鼠肝脏发育过程伴随着甲基化的改变,从E18.5到P20的6个时间点的甲基化组数据显示,DNA甲基化的改变发生在造血干细胞迁移后,与肝细胞的分化同时进行。除了模式物种外,非模式物种器官发育中甲基化的调控作用也引起了科学家的关注。Yang等(2021)通过绘制长白猪妊娠前33 d至出生后180 d共27个生长发育时间点的骨骼肌全基因组甲基化和转录组图谱,揭示DNA甲基化在调控猪骨骼肌生长发育中的重要作用。Ma等(2022)对大熊猫Ailuropoda melanoleuca未进食组、吃乳组和成年组的肝脏和胰脏进行DNA甲基化组测序,发现发育过程中肝脏和胰脏甲基化水平发生了动态变化,尤其是营养代谢关键基因的甲基化形式随食性改变发生了显著改变。
除了发育初期和胚胎阶段会发生表观遗传修饰外,发育完全的个体同样会受到环境因素引起的DNA甲基化修饰,导致表型改变。大量关于脊椎动物和无脊椎动物的研究发现,环境因素与表观遗传之间存在相关性,包括环境污染(如无机污染物、农药污染和抗菌物污染等)、饮食营养、父母行为等(Wang Tet al.,2017;Wang Yet al.,2017;Kelleyet al.,2021)。其中,营养作为最重要的DNA甲基化影响因子,在表观遗传标记建立和去除中起重要作用。在人类和小鼠中,高脂饮食导致大量基因启动子甲基化改变,影响器官发育和功能(Jacobsenet al.,2012;Zhanget al.,2015)。低营养饮食也对甲基化模式产生影响(Yaskolkaet al.,2021)。营养物质可能通过3种方式影响DNA甲基化模式(图1):(1)改变甲基化过程涉及的底物;(2)改变调节叶酸循环中酶的活性;(3)改变DNA甲基化过程中酶的活性(Zhang,2015)。SAM属于DNA和蛋白质甲基转移酶的主要供体,通过甲硫氨酸循环过程合成。以上方式可直接或间接影响SAM合成过程,导致体内整体DNA甲基化水平的改变(Niculescu,2012;Kadayifciet al.,2018)。
图1 营养物质影响DNA甲基化的方式(Zhang, 2015)Fig. 1 Possible nutritional ways that nutrition influences DNA methylation(Zhang, 2015)
环境诱导的DNA甲基化修饰通过改变基因表达,影响个体及其后代的表型,为后代适应新环境提供了有效保障。Norouzitallab等(2014)对孤雌生殖的雌性卤虫Artemia进行非致死性热休克刺激后,所有亲本个体产生了一系列响应机制,包括Hsp70表达水平提高,对热应激的耐受性增加及对致病性弧菌的抗病性增强等。值得注意的是,这些表型能够稳定、连续遗传到子三代。子代卤虫表型的改变与DNA甲基化有关,证实了表观遗传修饰产生的适应性表型的可遗传性。蚜虫Acyrthosiphon pisum的跨代实验也得到相似的结果,当蚜虫饲养环境中存在空间和食物资源竞争时,将诱发蚜虫从无翅个体转变为有翅个体,这样的转变往往发生在个体发育的早期阶段,并与蚜虫幼激素结合蛋白的甲基化有关(Walshet al.,2010)。在哺乳动物的研究中同样发现了DNA甲基化的可遗传性,Li等(2011)对连续6代的小鼠进行甲基饮食喂养后,甲基供体导致了小鼠基因组数千个位点甲基化的随机改变。随着世代的增加,个体间表观遗传变异也随之增加。此外,小鼠不同世代受甲基化影响较大的基因主要参与了基因表达、器官形成和细胞发育的过程。总之,由环境介导的、表观遗传修饰产生的表型改变可能独立于自然选择以外,这些表观遗传修饰可以让生物在短期环境的改变下快速进行适应性转变。而长期暴露于某一环境中的物种,其体内会产生持久的表观遗传变化,这些变化又通过增加5-甲基胞嘧啶的变异度促进可遗传突变的发生。
DNA甲基化修饰涉及到大量的生物学过程,异常的甲基化还会导致生物发育异常,甚至疾病的发生。肿瘤抑制基因(TSG)和癌基因的异常DNA甲基化在癌症的发病机制中起关键作用。多种癌症中,普遍存在TSG的超甲基化现象,包括P16/INK4基因(Parrellaet al.,2004)、CADM基因(Heet al.,2013)、RASSF1A基 因(Huanget al.,2016)等。TSG启动子区高甲基化后会导致细胞凋亡,细胞粘附性及血管生成过程的失调,诱导癌症的发生。此外,癌症中除了异常高甲基化修饰外,也存在整体去甲基化及原癌基因低甲基化的情况。甲基化水平降低会引发基因组的不稳定性,激活重复序列元件,导致基因组印记缺失及不可控的细胞增殖现象(Esteller,2007)。全基因组甲基化测序发现,原癌基因的高表达与CpG岛的低甲基化有关。Zhao等(2020)关于前列腺癌的研究发现,原癌基因附近转录因子和增强子结合位点的低甲基化,是驱动原癌基因表达的主要因素。Suzuki等(2014)研究发现,基因组的CpG位点甲基化的模式与癌症诊断和预后相关,某些基因簇中CpG岛的甲基化模式已被用于肿瘤的预后和分类。
在过去10年中,已开发许多DNA甲基化检测技术(Laird,2010)。部分方法集中于检测DNA甲基化区域,如甲基化DNA免疫沉淀法将基因组随机打断为300~600 bp的片段,使用抗5mC的抗体孵育后富集出甲基化片段,设计特异性引物检测目的基因甲基化水平(Jacintoet al.,2008);甲基化敏感限制性内切酶法利用甲基敏感性内切酶(HpaII、Hin6I和AciI)切割出含有甲基化CpG位点的序列,通过电泳分离对甲基化片段进行分析(Maunakeaet al.,2010);其他方法则集中对单一位点甲基化进行检测,主要步骤:用重亚硫酸盐将DNA中的C转化为U,经PCR后转化为T,而未甲基化的C位点不会发生变化,仍以C的形式存在(Frommeret al.,1992)。通过芯片技术及二代高通量测序技术即可将基因组所有C位点进行测序。此外,一些单分子测序技术采用合成寡核苷酸探针来直接鉴定甲基化胞嘧啶(Yanget al.,2015)。
在这些方法中,有2种方法被广泛用于评估单核胞嘧啶DNA甲基化水平,分别是简化重亚硫酸盐测序(RRBS)(Meissneret al.,2005)和全基因组重亚硫酸氢盐测序(WGBS,又称BS-seq、methyl-seq或methylC-seq)(Cokuset al.,2008)。这2种方法均需要将提取的DNA进行重亚硫酸盐处理。WGBS在基因组的覆盖范围更广,能用于检测每个C位点的甲基化水平,为了获得可信度高的甲基化值,该方法需保证每个位点的reads覆盖度达到5~10×,所以价格更高。RRBS需要限制性酶MspI消化DNA,并富集含CCGG位点的50~300 bp的片段。该方法只需要对基因组部分位置进行检测,其测序覆盖度较低。这些新技术的出现使更好、更全面认识DNA甲基化修饰成为可能,帮助我们从少量基因位点的研究扩大到基因组范围。
动物DNA甲基化研究涉及生长、发育、环境、营养等多个方面。DNA甲基化通过调控基因表达,影响真核细胞的发育、分化等过程,并在癌症、肿瘤等疾病发展中起到重要作用。越来越多的研究使用DNA甲基化作为生物标志物,用于疾病的识别和诊断、动物生长性状标记、酮体性状标记等。但目前的研究仍面临许多挑战,如某些疾病样本及动物组织样本获取困难;由于DNA甲基化的动态性及相对不稳定性,难以建立稳定的DNA甲基化参照模型等。随着后期DNA全基因组甲基化生物信息库的建立及DNA甲基化检测技术的发展,这些问题将会逐步得到解决。