杨婉冬,杨红春
(武汉大学生命科学学院/杂交水稻国家重点实验室(武汉大学),湖北 武汉 430072)
核小体是真核细胞染色质的基本组成单位,约147 bp的DNA缠绕核心组蛋白八聚体(核心组蛋白包括组蛋白H2A、H2B、H3和H4)约1.65圈后,在连接组蛋白H1的稳定作用下形成核小体[1,2]。组蛋白为核小体的基本组分,是构成真核生物染色质的基本结构蛋白,富含精氨酸和赖氨酸等碱性氨基酸,属于碱性蛋白质,能够与酸性的DNA紧密结合。在结构上,组蛋白包括2个不同的结构域:一是参与组蛋白与组蛋白相互作用的球形域;二是延伸在核小体表面的尾部结构域,尾部结构域具有多种修饰位点,可以进行甲基化、乙酰化、磷酸化、泛素化等多种组蛋白修饰,这些修饰以不同的方式改变核小体的构象与稳定性,影响染色质的紧密程度和可及性,决定基因的转录活性[3]。核小体结构是动态变化的,在不同的生命过程中,ATP依赖的染色质重塑复合体能够改变核小体的结构与其在基因启动子区的排列,影响转录因子与启动子的结合,从而改变基因的转录状态[4]。植物中组蛋白功能的研究起步较晚,许多具体的功能与分子机制仍不清楚,有待深入探索。对拟南芥中已知的组蛋白种类进行简要介绍,并对组蛋白的生物学功能进行系统综述,以期为拟南芥组蛋白功能的深入研究提供参考。
几乎所有真核生物都具有5种不同类型的组蛋白,分别是构成核小体组蛋白八聚体的核心组蛋白H2A、H2B、H3和H4,以及起稳定和连接作用的连接组蛋白H1。组蛋白八聚体由两分子的组蛋白H3、H4、H2A和H2B构成,包括2个H2A-H2B二聚体和1个(H3-H4)2四聚体[5]。DNA复制的过程也是核小体倍增的过程,基因组上存在着大量组蛋白基因,能够满足在DNA复制的同时合成足够的组蛋白。在进化上,组蛋白的序列十分保守,没有种属及组织特异性,在各物种间表现出结构与功能的高度类似。常规组蛋白在细胞周期的S期表达,通过复制依赖的方式在DNA复制过程中组装到核小体中[6,7]。
除常规组蛋白外,还有一类特殊状态染色质所需的核小体组分——组蛋白变体,它们具有与常规组蛋白不同的编码基因、氨基酸序列以及相关的生物学功能。组蛋白变体可以在相关伴侣蛋白的作用下,在染色质的特定位置替换常规组蛋白,改变核小体结构的稳定性,参与基因的转录调控、DNA损伤修复、异染色质沉默等生物学过程[8]。在植物中,H3、H2A和H1均有组蛋白变体,目前的研究报道多集中于H3的变体H3.3和CenH3,以及H2A的变体H2A.X、H2A.W和H2A.Z,这些组蛋白变体与常规组蛋白的氨基酸序列具有差异(图1)。
1.2.1 组蛋白H3变体拟南芥中,常规组蛋白H3(组蛋白H3.1)由HTR1、HTR2、HTR3、HTR9和HTR13这5个基因编码,组蛋白变体H3.3由HTR4、HTR5和HTR8这3个基因编码,HTR4编码的H3.3具有一段功能未知的N端序列,除此之外,H3.3与H3.1之间仅有4个氨基酸残基的差异(图1A)。复制依赖型组蛋白H3.1仅在S期DNA复制过程中组装进核小体,复制独立型组蛋白H3.3则可以在整个细胞周期中组装进核小体。H3.1在基因组的沉默区域富集,包括那些具有H3K27me(指组蛋白H3第27位赖氨酸残基的甲基化修饰)、H3K9me抑制性修饰的区域,H3.3在转录活跃的基因中富集,尤其在基因的3’转录终止位点高度富集,并且与H3K4me、H3K36me和H2Bub(指组蛋白H2B的泛素化修饰)等基因激活性修饰有关[7]。H3.3还通过保持最佳核小体密度和阻止H1在基因上的沉积,来维持适合转录的染色质结构[6]。CenH3由HTR12编码,是N端氨基酸残基保守性较差、定位于着丝粒区域的特异性H3变体,对着丝粒的建立与染色体的正常分离至关重要。CenH3核小体组装发生在有丝分裂G2期,CenH3的C端区域负责着丝粒的识别,组蛋白伴侣KNL2(KINETOCHORE NULL 2)和NASP(NUCLEAR AUTOANTIGENIC SPERM PROTEIN)介导CenH3的积累[9,10]。
1.2.2 组蛋白H2A变体拟南芥常规组蛋白H2A由HTA1、HTA2、HTA10和HTA13这4个基因编码,组蛋白变体H2A.X由HTA3和HTA5这2个基因编码,能够发生磷酸化,C端具有保守的SQEF基序(图1B)。当细胞出现DNA损伤时,磷酸化的H2A.X会在DNA断裂的地方替换H2A,参与DNA损伤修复与转录重启[11]。组蛋白变体H2A.W由HTA6、HTA7和HTA12这3个基因编码,C端含有保守的SPKK基序(图1B)。H2A.W主要位于异染色质区域,能够促进异染色质的凝缩,与异染色质修饰标记H3K9me2(指组蛋白H3第9位赖氨酸残基的二甲基化修饰)、DNA甲基化协同作用,维持异染色质沉默[12]。组蛋白变体H2A.Z由HTA8、HTA9和HTA11这3个基因编码,在基因的5’端高度富集,H2A.Z对基因的转录调控与其在染色质上的位置有关:H2A.Z分布在编码区会抑制转录,而分布在+1核小体位点则可以激活一些基因的转录,说明H2A.Z在基因的转录调控中具有双重作用[13]。
高等植物的细胞核非常小,DNA需要通过一系列的压缩折叠组装成具有高级结构的染色质储存于细胞核中,组蛋白是实现DNA压缩功能的基础,最终可以将DNA压缩成近0.01%。组蛋白分子伴侣介导组蛋白与DNA的结合,在DNA复制、转录与修复等过程中帮助核小体组装与去组装。在核小体组装过程中,首先H3-H4分子伴侣携带(H3-H4)2四聚体与DNA结合形成亚核小体结构,然后由H2A-H2B分子伴侣携带两分子的H2A-H2B二聚体与其结合形成具有组蛋白八聚体的核小体[14]。拟南芥中参与H3.1-H4组装的分子伴侣CAF-1(Chromatin Assembly Factor-1)的组分包括FAS1(FASCIATA1)、FAS2(FASCIATA2)以及MSI1(MULTICOPY SUPRESSOR OF IRA1)。介导H3.3-H4在核小体中累积的分子伴侣有ATRX(alpha thalassemia retardation syndrome Xlinked)和HIRA(histone regulatory homolog A)[15,16]。组装H2A-H2B的分子伴侣是具有多个成员的NAP1(Nucleosome Assembly Protein 1)家族蛋白[17]。连接组蛋白H1结合在组蛋白八聚体外锁住DNA的进出端,起稳定核小体的作用。核小体之间通过linker DNA连接,形成的“串珠”结构在连接组蛋白H1的帮助下再经过多级螺旋组装,最终形成具有高级结构的染色质[18]。
表观遗传是指在基因的DNA序列没有发生变化的情况下,基因表达却发生可遗传改变的一种区别于传统遗传学的方式,这类改变能通过有丝分裂或减数分裂在细胞或个体世代间遗传,主要通过组蛋白修饰、DNA修饰、非编码RNA等调控基因表达[19]。其中组蛋白修饰是真核生物表观遗传调控的重要方式之一,到目前为止,拟南芥中研究得比较清楚的是发生在组蛋白N端尾部结构域的修饰,包括甲基化、乙酰化、磷酸化、泛素化等,这些修饰以不同的方式改变染色质的结构、控制染色质的可及性、调节转录活性,进而调控基因的表达[3]。组蛋白修饰不仅发生在不同的修饰位点上,如H3K4、H3K9、H3K27、H3K36(分别指组蛋白H3第4位、第9位、第27位、第36位赖氨酸残基),还可以在同一个修饰位点发生不 同 程 度 的 修 饰,如H3K27me1、H3K27me2、H3K27me3(分别指组蛋白H3第27位赖氨酸残基的单甲基化、二甲基化和三甲基化修饰)。通常组蛋白的乙酰化、H3K4me3、H3K36me2/me3和H2Bub1(H2B单泛素化)与基因表达激活相关,而组蛋白的去乙酰化,H3K9me、H3K27me3抑制基因的表达[20]。
在多种组蛋白修饰类型中,目前对组蛋白甲基化的研究最为清楚和深入,甲基化修饰主要发生在H3的N端尾部结构域的赖氨酸(K)残基上。该过程是动态可逆的,包括甲基化和去甲基化2个过程,分别由组蛋白甲基转移酶(Histone methyltransferases,HMTs)和组蛋白去甲基化酶(Histone demethylases,HDMs)催化完成(表1)。组蛋白甲基转移酶大多是具有SET结构域的蛋白,组蛋白去甲基化酶包括赖氨酸特异性去甲基化酶1(Lsine-specific demethylase1,LSD1)和含有JmjC结构域的去甲基化酶(JmjC domain-containing histone demethylases,JHDM)[21,22]。已有研究表明,多种酶与复合体参与调控甲基化修饰的动态变化(表1),如甲基转移酶SDG2(SET DOMAIN GROUP 2)催化H3K4me3的形成,激活基因SPL/NZZ(SPOROCYTELESS/NOZZLE)的转录,从而促进雄蕊小孢子细胞和花药壁细胞的分化、胚珠发育中近远端模式的形成、细胞增殖和早期孢子的发生[23]。PRC2(Polycomb Repressive Complex 2)复合体催化H3K27me3的形成,在春化过程中诱导开花抑制基因FLC(FLOWERING LOCUS C)的转录抑制,从而促进开花[24]。去甲基化酶JMJ16(JUMONJI 16)通过降低叶片衰老正调控因子WRKY53和SAG201(SENESCENCE-ASSOCIATED GENE 201)上H3K4me3的水平来抑制它们在成熟叶片中的表达,抑制叶片衰老[25]。
表1 拟南芥组蛋白H3尾部结构域的赖氨酸修饰Table 1 Lysine modification of the tail domain of histone H3 in A.thaliana
组蛋白的乙酰化由乙酰转移酶HATs(histone acetyltransferases)和 去 乙 酰 化 酶HDACs(histone deacetylases)动态调控。植物中组蛋白乙酰转移酶分为4个家族,包括GNAT(GCN5-related N-Acetyl Transferase)、MYST(MOZ、YBF2/SAS3、SAS2/TIP60)、p300/CBP(cAMP-responsive element-Binding Protein)和TAFII-250(TATA-binding protein-associated factor)家族[48]。去乙酰化酶分为3个家族,包括RPD3/HDA1(Reduced Potassium Dependency 3/Histone DeAcetylase 1)、SIR2(Silent Information Regulator 2)和HD2(the plant-specific Histone Deacetylase 2)家族[48]。组蛋白乙酰化水平能够影响染色质的紧密程度,乙酰化修饰程度越高,染色质结构越松散,越有利于转录因子的结合;而乙酰化修饰程度越低,染色质结构越致密,越阻碍转录因子的结合。组蛋白的磷酸化发生在丝氨酸、苏氨酸和酪氨酸残基位点上,组蛋白H3的磷酸化修饰主要存在于第10位和第28位的丝氨酸(H3S10ph和H3S28ph)以及第3位和第11位的苏氨酸(H3T3ph和H3T11ph)上,组蛋白的磷酸化修饰与有丝分裂和减数分裂中染色质的凝缩、细胞凋亡有关[49]。组蛋白的泛素化修饰主要发生在H2A和H2B上,泛素化修饰的动态变化过程需要泛素、泛素激活酶E1、泛素结合酶E2、泛素连接酶E3、去泛素化酶DUB(deubiquitinase)的参与,进而参与光形态建成、生物钟节律、细胞周期调节、激素信号传递等生理过程[50]。组蛋白的多种修饰之间还会形成更加复杂的调节网络,共同参与基因表达调控,通过激活或者抑制发育进程中的基因,调控植物发育过程。
核小体在包装压缩DNA的同时也妨碍了转录因子的结合,给基因表达造成障碍,而通过染色质重塑能够打破这种障碍。染色质重塑是指染色质重塑复合体利用ATP水解产生的能量驱动核小体在DNA上滑动、移除、或者进行组蛋白变体的替换而改变核小体状态的现象。染色质重塑能够改变核小体的结构及其在启动子区的分布,改变转录复合体和启动子的可接近性,调节基因的表达。染色质重塑复合体根据其核心ATPase亚基结构域的特性,分为SWI/SNF(mating type switching/sucrose nonfermenting)、ISWI(imitation SWI)、CHD(chromodomain helicase DNA binding)和INO80(inositol autotroph 80)四类[4]。
拟南芥中,SWI/SNF家族包括SYD(SPLAYED)、BRM(BRAHMA)、CHR12(CHROMATIN REMOD ELING 12)和CHR23[51],其中研究较多的是SYD和BRM。SYD调控拟南芥的生长发育以及胁迫响应,可以结合到WUS(WUSCHEL)的启动子区,促进其转录表达,使茎尖分生组织中的干细胞保持未分化状态,维持茎尖分生组织结构和功能的完整性[52];还可以通过调控茉莉酸和乙烯信号通路下游基因的表达,在抗病、环境胁迫响应等过程中发挥作用[53]。BRM能与SWI3C和BSH(BUSHY)相互结合形成复合体,共同抑制胚性基因在叶组织中的表达[54,55];还参与调控花器官决定基因以及开花途径转录因子的表达[55]。CHR11及其同源蛋白CHR17是ISWI家族成员,CHR11、CHR17通过与RLT1(RINGLET1)和RLT2相互作用来抑制FT(FLOWERING LOCUS T)、
SEP1(SEPALLATA 1)、SEP3、FUL(FRUITFULL)和SOC1(SUPPRESSOR OF CONSTANS OVEREXPRESSION 1)的表达,并促进FLC在叶片中的表达,从而维持拟南芥的营养生长,避免早花[56]。RNA干扰下调CHR11表达的拟南芥中,植株具有细胞变小、雌配子发育停滞的生长缺陷[57]。PKL(PICKLE)是CHD家族的成员,在拟南芥中的同源蛋白PKR1和PKR2,能够直接结合在AP3(APETALA3)、AG(AGAMOUS)、FLC等PcG下游基因上并激活其表达[58]。PIE1(PHOTOPERIOD-INDEPENDENT EARLY FLOWERING 1)是INO80家族的主要成员,能够促进组蛋白变体H2A.Z替换常规组蛋白H2A,INO80可以与ARP6(ACTIN-RELATED PROTEIN 6)结合形成复合体,促进组蛋白H2A.Z在FLC染色质上富集,激活FLC表达抑制植物开花[59]。
组蛋白作为染色质的结构蛋白,在维持染色质结构的同时,还通过核小体组装与去组装、组蛋白修饰、染色质重塑等一系列动态变化调控拟南芥生长发育。已有研究初步揭示了拟南芥中组蛋白的种类及其生物学功能,但研究结果还十分有限,许多具体的功能与调节机制还不清楚,如组蛋白变体分别具有怎样的生物学功能;常规组蛋白与组蛋白变体、组蛋白变体与组蛋白变体之间通过什么样的机制完成替换;组蛋白尾部的修饰还有哪些种类、发挥什么作用,这些问题仍有待深入研究。