张洪亚,杨红春
(杂交水稻国家重点实验室(武汉),武汉大学生命科学学院,湖北 武汉 430072)
真核生物基因组的遗传信息,储存在以核小体为基本单位的染色质中。染色质的高级结构在压缩细胞核DNA的同时,其致密结构也严重影响DNA复制、基因表达等细胞过程[1]。因此,生物体进化出一系列的染色质重塑酶类和相关蛋白因子,调节局部染色质的开放性,使转录因子等蛋白能够直接结合核小体DNA,保障这些生命活动的顺利进行。这种动态调控染色质结构的过程称为染色质重塑(chromatin remodeling)。
真核生物中广泛存在一类染色质重塑复合体(chromatin remodeling complex),通过水解ATP获得能量,调节染色质的结构。该类复合体一般是由4-17个亚基组成,其核心亚基为Snf2蛋白家族的染色质重塑因子(chromatin remodeler)[2],具有保守的ATPase催化结构域,该结构域包含SNF2_N(DEADc)和HELICc 两个部分,具有ATP结合位点和水解ATP的催化中心[3]。染色质重塑复合体通过核小体滑动、移除、组蛋白变体替换等方式参与DNA复制、损伤修复、细胞周期维持等过程[4]。拟南芥基因组中有41个染色质重塑因子,目前有功能研究的不足10个,并且只有极少数的研究将生化活性和功能联系了起来。拟南芥中染色质重塑复合体的功能具有多样性,全面的解析复合体的组成、各亚基的功能以及亚基间的相互关系、并把功能和生化活性联系起来,已经成为表观遗传学研究的热点和难点。
利用生物信息学的方法,在54种真核生物、24种古细菌和269种原核生物基因组中共鉴定到1306个具有保守ATPase催化结构域的Snf2家族成员,分为24个亚家族,其中11个亚家族在真核生物中普遍存在[2]。拟南芥基因组中的41个染色质重塑因子,可以分为18个亚家族(见图1)。但染色质重塑因子往往还包含其他的功能结构域,并在复合体中发挥功能,因此这种分类方法不能很好的体现其功能特征,也不利于预测其功能。根据真核生物中染色质重塑复合体的功能特性,并结合核心亚基的ATPase结构域及邻近结构域的特征,又可以分为四个家族:SWI/SNF(mating type switching/sucrose nonfermenting)家族包含一个Bromodomain或一个HAS(helicase-SANT)结构域;ISWI(imitation switch)家族含有一个SANT-SLIDE结构域模块;CHD(chromodomain helicase DNA-binding)家族含有Chromodomain结构域;INO80(inositol autotroph 80)家族的显著特征是DEADc和HELICc结构域之间有约300个氨基酸的连接序列[4,5]。
染色质重塑因子通过与特异的组蛋白修饰酶类相互作用,调节相应的组蛋白修饰。BRM(CHR2,BRAHMA)与植物特异的H3K27去甲基酶REF6(RELATIVE OF EARLY FLOWERING 6)相互作用,作为复合体发挥功能[6]。SOC1(SUPPRESSOR OF OVEREXPRESSION OF CONSTANS 1)能招募REF6和BRM结合到TFS1(TARGET OF FLC AND SVP 1)染色质上,去除H3K27me3修饰,并降低TFS1基因3’端的SOC1、REF6和BRM结合位点附近的核小体占有率,使染色质更容易被转录因子和其他蛋白结合,从而促进TFS1的转录[7]。同时BRM可以作为TrxG蛋白拮抗PRC2(Polycomb Repressive Complex 2)的功能,从而动态调控H3K4me3和H3K27me3在靶基因上的水平和分布[8,9]。PKL(CHR6,PICKLE)也具有TrxG类似的功能,可与H3K4甲基转移酶ATX1(ARABIDOPSIS HOMOLOG OF TRITHRIX 1)相互作用,通过提高FT(FLOWERING LOCUS T)上H3K4me3的修饰,促进FT的表达[10]。研究也发现DDM1(CHR1,DECREASE IN DNA METHYLATION 1)具有维持异染色质区域H3K9甲基化,介导H4K16去乙酰化的作用[11]。染色质重塑复合体可以调节特定基因上组蛋白修饰水平、不同修饰类型的相互转换,调节基因表达,但要明确二者之间的相互关系、作用机制,需要系统地鉴定染色质重塑复合体的亚基、起桥梁作用的中间因子和分析靶基因的特征,从而解析其调节机制。
核小体是真核生物染色质的基本组成单元,其分布特性决定局部染色质的开放程度,从而调节基因转录[12]。染色质重塑因子能够改变核小体位置、占有率(在特定位置形成核小体结构的比例),从而调节基因的表达。ISWI家族通过移动核小体,调节核小体在基因上的分布和核小体间隔。拟南芥ISWI家族的CHR11(CHROMATIN REMODELING 11)、CHR17在体外能将DNA片段末端的核小体移动到中间位置[13],在chr11 chr17双突变体中,核小体在基因体(gene body)的分布模式改变,但密度不变[12]。PKL在动物中的同源蛋白Mi-2与组蛋白去乙酰化酶HDAC(Histone Deacetylase)形成稳定的复合体发挥作用,但在拟南芥中以单体形式存在,具有ATP依赖的核小体移动能力。体外实验条表明PKL能结合双链DNA和单核小体,但只有单核小体可以激活其ATPase活性,将DNA链末端的核小体移动到中心位置,而一般不移动中心位置的核小体[14]。DDM1有PKL类似的核小体移动特性,但效率较低,暗示可能需要在完整复合体背景中才能发挥最大的活性[15]。BRM通过提高基因转录起始位点(TSS,transcription start site)附近区域核小体的占有率,使染色质结构较为紧密,抑制基因表达,例如,提高ABI5(ABA INSENSITIVE 5)的TSS下游+1核小体占有率抑制基因表达[16]。相反,CHR5在全基因组的水平上降低启动子区域的核小体占有率,使局部染色质处于易于被调节因子结合的开放状态,促进基因的表达[17]。
经典组蛋白由多个序列高度相似的基因编码,主要在细胞周期的DNA合成期(S期)表达,与DNA复制密切相关。组蛋白变体的氨基酸序列和物理性质不同于经典组蛋白,在整个细胞周期中表达。因此组蛋白变体可以在整个细胞周期中插入染色质的特定区域,参与调节各个时期的生长发育[18]。Ino80和Swr1是INO80家族的ATPase活性亚基,酵母INO80复合体催化核小体的滑动、移除启动子上未乙酰化的组蛋白变体H2A.Z,维持基因组稳定[19]。拟南芥INO80(CHR21)调节众多的生长发育和环境响应相关的基因,这些基因上都富含H2A.Z变体,INO80直接与H2A.Z相互作用,促进H2A.Z在开花抑制因子FLC、MAF4/5(MADS AFFECTING FLOWERING 4/5)基因上的分布,这与酵母中的情况有所区别[20]。SWR1复合体促进H2A.Z/H2B二聚体替换TSS +1核小体上的H2A /H2B二聚体[19]。H2A.Z组蛋白变体替换是逐级、单向进行的,核小体结构和H2A.Z/H2B二聚体都可以激活SWR1复合体ATPase活性,既是其底物又是产物[21]。SWR1复合体在拟南芥与酵母中有众多同源亚基,通过对含有ATPase的核心亚基PIE1(PHOTOPERIOD INDEPENDENT EARLY FLOWERING 1,CHR13)突变体和编码H2A.Z组蛋白变体的hta8 hta9 hta11三突变体的遗传分析发现,拟南芥SWR1复合体也催化H2A.Z/H2B取代H2A/H2B。同时hta8 hta9 hta11的表型要强于pie1,暗示可能存在PIE1以外的机制将H2A.Z插入核小体[22]。拟南芥SWR1复合体的组分SWC4能够识别TSS附近没有核小体的DNA区域(NFR,nucleosome-free DNA region)的AT-rich序列,招募PIE1蛋白复合体,并促进H2A.Z插入+1核小体,从而调节染色质的状态,促进发育相关和环境响应基因的正确表达,而不是单一地发挥促进或者抑制转录的功能[23]。在酵母和动物中,H2A.Z同时在+1和-1核小体富集,暗示拟南芥SWR1复合体对H2A.Z的插入具有特异的调节作用。同时拟南芥SWR1复合体也有特异的亚基:包括含有CpG甲基化结合结构域的MBD9、ISWI染色质重塑蛋白CHR11和CHR17、组蛋白乙酰转移酶NuA4复合体的亚基TRA1a和TRA1b,暗示组蛋白变体H2A.Z的插入、核小体移动、组蛋白乙酰化协同作用,共同调节基因表达和生长发育[13]。除了H2A.Z,组蛋白H2A还有其他的变体,染色质重塑复合体是否也调节这些变体的分布和置换、采用什么样的调节机制,还有待进一步的研究。我们相信解析H2A.Z的分布和置换的详细机制对于解决这些问题有重要的参考意义。
RNA依赖的DNA甲基化(RdDM,RNA-dependent DNA methylation),能够抑制转座子和重复序列的表达,保持基因组的完整性。在RdDM中,Pol Ⅳ(Polymerase IV)产生的siRNA(small interfering RNA)装载到AGO4(ARGONAUTE 4)蛋白上,同时Pol Ⅴ结合到靶基因上转录lncRNA(long noncoding RNA),招募AGO4-siRNA复合体,siRNA通过互补序列结合到靶基因,并招募DNA甲基化酶,实现基因的甲基化[24],染色质重塑因子也是RdDM的重要组成部分。CLSY(CLASSY)家族的成员:CLSY1(CHR38)、CLSY2(CHR42)、CLSY3(CHR31)、CLSY4(CHR40)与Pol Ⅳ结合,调节Pol Ⅳ与靶基因的结合,以及siRNA 的转录[25]。DRD1(CHR35,DEFECTIVE IN RNADIRECTED DNA METHYLATION 1)与RdDM中的另外两个蛋白:DMS3(DEFECTIVE IN MERISTEM SILENCING 3)和 RDM1(RNA-DIRECTED DNA METHYLATION 1)形成DDR复合体,招募Pol Ⅴ到靶基因上[26]。PKL则与Pol Ⅴ协同作用,稳定特定靶基因位点的核小体结构并促进lncRNA转录[27]。CHR19、CHR27、CHR28与SUVR2互相作用,维持特定靶基因上由Pol Ⅴ稳定的核小体结构,SUVR2还与SUVR1形成复合体,共同促进DNA甲基化和基因沉默[28]。DDM1协助DNA甲基转移酶克服核小体结构和连接组蛋白H1的阻碍,帮助甲基转移酶接触核小体DNA,从而促进转座子的DNA甲基化[29]。还有研究表明,lncRNA能通过IDN2(INVOLVED IN DE NOVO 2)招募包含SWI3B亚基的染色质重塑复合体,从而改变靶基因的核小体结构,促进其DNA甲基化[30]。
在拟南芥中,RdDM与ROS1(REPRESSOR OF SILENCING 1)依赖的DNA去甲基化,动态调节特异位点的DNA甲基化。对CLSY各成员的突变体分析表明,CLSY可能参与ROS1依赖的特定位点的DNA去甲基化[31]。SWR1复合体被IDM1(INCREASED DNA METHYLATION 1)招募到甲基化的基因上,将H2A.Z组蛋白变体插入靶基因,而H2A.Z与ROS1互相作用,促进DNA的去甲基化[32]。
这些研究表明,染色质重塑因子在不同的层面上调节DNA甲基化,既可以通过RdDM调节DNA甲基化;也可以与ROS1相互作用,调节DNA的去甲基化,暗示染色质重塑因子在调节DNA甲基化的动态平衡中起重要作用。
miRNA(MicroRNA)是一系列21nt 的非编码RNA,通过剪切靶基因mRNA或抑制其翻译,调节基因表达,参与植物生长发育的调控[33]。染色质重塑因子可以调节miRNA基因的表达、pri-miRNA(primary microRNA precursor)的剪切等过程,调节miRNA的积累。例如BRM可以直接结合MIR156A启动子,降低TSS附近-2和+1核小体占有率,拮抗PRC2的功能,降低H3K27me3的修饰水平,促进MIR156A的表达和miR156的积累[34]。相反,PKL结合MIR156A、MIR156C的启动子,促进PRC2与基因的结合,提高H3K27me3修饰水平和+1核小体占有率,从而抑制miR156的积累[35]。SWR1复合体通过促进H2A.Z的富集,促进MIR156A、MIR156C基因上H3K4me3的水平,促进种子萌发时miR156的积累[36]。这些结果暗示不同的染色质重塑因子可以通过控制核小体占有率和染色质的修饰,调节miRNA基因的表达,控制其功能。BRM除了调节miRNA基因的表达,还可调控pri-miRNA的剪切。研究发现BRM与miRNA剪切组分SE(SERRATE)相互作用,利用ATPase的活性改变pri-miRNA的二级结构,抑制剪切复合体的活性,从而降低miRNA的积累[37]。这项研究也表明pri-miRNA可以作为染色质重塑因子的底物,暗示染色质重塑因子除了调控染色质的结构,还可能通过调控DNA或者RNA的二级机构,调节基因的功能。
不同的染色质重塑复合物通过响应不同的激素信号因子和感知因子,调节激素合成和信号途径中的基因表达,参与激素响应。PKL通过与PIF3(PHYTOCHROME-INTERACTING FACTOR 3)和BZR1(BRASSINAZOLERESISTANT 1)的相互作用,整合光、油菜素内酯(BR)和赤霉素(GA)信号调节下胚轴伸长。在暗环境中,PIF3和BZR1招募PKL到细胞伸长相关的基因上,抑制H3K27me3积累,促进相关基因的表达,从而促进细胞的伸长。在光照条件下,光信号降低GA的水平,促进DELLA蛋白积累,DELLA蛋白与PKL结合,削弱其与PIF3和BZR1的结合能力,负调控细胞伸长[38]。PKL还控制幼苗中80%响应GA信号并参与调节细胞伸长、细胞分裂、生长时期转换的相关基因的表达[39]。BRM通过调节ABI5基因的表达响应脱落酸(ABA),当遭遇干旱胁迫时,SNRK2(SNF1-RELATED PROTEIN KINASE 2)磷酸化BRM,抑制其活性,ABI5活跃表达,植物响应脱落酸,暂时停滞生长以保护细胞和组织不受损伤;度过逆境后,PP2C(PHOSPHATASES TYPE 2C)将BRM去磷酸化激活,抑制ABI5参与的脱落酸响应[40]。BRM也是GA响应的正向调节因子,细胞分裂素响应的负调控因子,还调节生长素信号在根的分布[41,42]。水杨酸合成和代谢相关基因的表达受到DDM1的调节,ddm1-F1(ddm1与不同背景野生型杂交的F1代)植株体内最适的水杨酸水平改变,杂种优势丢失[43]。
植物在整个生活周期中都可能遭遇不同的逆境胁迫,而染色质重塑复合体能够调控各类逆境响应基因的表达,在逆境响应中既有积极作用也有消极影响。在brm突变体中,ABI5活跃表达,因此具有更强的抗旱能力[40]。同时,brm对盐和高浓度硼胁迫,都具有更强的耐性[44,45]。说明BRM对这三种逆境胁迫更为敏感。在寒冷胁迫下,PKL调节低温响应的关键因子CBF3(C-REPEAT BINDING FACTOR 3)的表达,从而调节一系列寒冷响应基因的表达,增强植物对寒冷环境的耐性;PKL还参与植物盐胁迫耐性的调控[46]。在高温(37℃、42℃)、干旱、盐胁迫下,CHR12暂时地抑制植物的生长发育从而躲避不利环境[47]。低钾抑制生长素转运因子PIN3的表达,引起生长素响应抑制因子IAA27(INDOLE-3-ACETIC ACID INDUCIBLE 27)的降解和生长素信号途径的缺陷,抑制植物侧根形成。此时CLSY1通过RdDM抑制IAA27的转录,从而促进生长素响应基因的转录,作为一个独立的后备途径促进侧根发育[48]。SWR1复合体组分PIE1或SWC6(SWR1 COMPLEX SUBUNIT 6)在拟南芥抵抗病原菌入侵中是正调控因子,而APR6(ACTIN-RELATED PROTEIN 6)是负调控因子[49],表明染色质重塑复合体的不同组分对特定的过程有不同的调控作用,暗示这些组分可能有独立的功能。在生物胁迫和非生物逆境中,染色质重塑复合体不具有广谱抗性,而是参与特定类型的逆境响应,深入解析相关作用机制,将有利于在农业生产上培育抵抗特定逆境的优良作物。
染色质重塑复合体调节的基因类型众多,涉及植物生命周期的各个阶段,对拟南芥完成生活史具有重要意义。目前研究最为广泛的BRM,主要分布在分生组织、器官原基等细胞活跃分裂的组织中,在植物营养生长、胚胎发育、生殖发育和干细胞维持过程中发挥重要作用。brm突变体植株变小、叶片小而卷曲、根长显著变短、花药育性降低、花期提前[50]。PKL调节与GA信号途径相关的幼年期向成年期转变、营养生长向生殖生长的转变,还促进孢子体和配子体世代之间的信号交流[51,52]。与PKL同源的CHR4参与自主开花途径,促进开花[53]。与酵母、动物中类似,ISWI家族的CHR11、CHR17的SLIDE结构域可以与包含DDT结构域的大多数蛋白结合,与RLT1(RINGLET 1)和RLT2的相互作用维持拟南芥的营养生长[54,55]。ARP6和CHR11调节雌配子体中特定基因的时空表达,ARP6促进雌配子体减数分裂相关基因的表达,在体细胞中则抑制相关基因的表达[56]。CHR11在雌配子体形成过程中,促进单倍体细胞核的繁殖;在孢子体发育过程中,促进细胞的数量增加[57]。CHR12和CHR23在拟南芥中研究甚少,单基因突变植株无明显生长缺陷,双突变体胚胎致死[58]。
染色质重塑复合体通过改变、修饰染色质的结构,或者与转录因子相互作用或识别特定的组蛋白修饰被招募到靶位点[32,38],调节基因转录,并参与逆境响应,从而保障植物正常生长发育。其核心亚基能够调节特定染色质的结构,其他的亚基也能够响应不同的信号,从而共同参与复杂的基因互作网络,为复合体作用方式和功能的多样性提供了基础。在植物中,研究和鉴定更多类型的招募因子和直接靶基因,有助于解析目前未被研究的染色质重塑因子的功能,也有利于更加准确、全面的阐释染色质重塑复合体的招募和调节机制。
研究还发现染色质重塑复合体的活性受到诸多因素的调节,例如激活ATPase活性所需核酸类型因ATPase催化结构域而异,无核小体结构的DNA和核小体DNA可以同等的激活SWI/SNF家族的酶活性,而完全激活ISWI家族则需要核小体DNA[59]。在植物中,BRM的活性还受到磷酸化、苏素化(SUMOylation)修饰的调节[40,60]。因此阐释染色质重塑复合体活性调节方式,并建立活性与功能的关系,将为其调控网络赋予新的含义。同时鉴定各个复合体的亚基组成、阐述各亚基的功能、以及亚基之间的相互关系,这些都将是未来研究的重点和难点。