谢文浩 ,李成章,俞 瑜
(复旦大学 生命科学学院/遗传工程国家重点实验室, 上海 200438)
植物固着生长在不断变化的环境中,不能通过移动来规避周围不良环境,需要根据环境灵活地调整自身生长状况进行应对。植物通过多种复杂的机制感知各种环境因素,并做出相应的反应,已经确定多种转录因子、转运蛋白等分子成分参与植物的胁迫响应[1-2]。在响应环境变化时,植物可以通过染色质结构的变化(包括DNA 甲基化、组蛋白修饰、组蛋白变体、染色质重塑、非编码RNA 等)来调控不同的生物学进程,从而适应外界环境的变化[3-4]。
H3K27me3 是一种重要的组蛋白修饰,是一种抑制性的表观遗传标记,由Polycomb repressive complex 2(PRC2)复合物催化建立[5]。PRC2 属于多梳家族蛋白(Polycomb group, PcG),PcG 在表观遗传的调控方面起重要的作用,其最先在果蝇中被发现,参与许多重要的细胞活动和发育过程,具体包括干细胞多能性和可塑性、基因组印迹、X 染色体失活等多种表观遗传过程[6-8]。在果蝇中PRC2 的核心组分是一个含有SET 结构域的甲基转移酶E[z](Enhancer of zeste),具有催化H3K27me3 建立的活性[5]。
PRC2 在果蝇、哺乳动物和植物中高度保守[9],拟南芥中存在和果蝇PRC2 复合物核心亚基高度相似的蛋白,其中CURLY LEAF(CLF)、MEDEA(MEA)、SWINGER(SWN)是E[z]的同源蛋白[10-12]。在拟南芥生长发育过程中PRC2 对调控基因的表达至关重要,涉及从种子萌发到胚形成的整个生命周期[13]。CLF 和SWN 主要在营养期起作用,而MEA 主要在生殖期起作用[9,13]。
拟南芥中CLF 蛋白是PRC2 蛋白复合物的重要组分,是H3K27me3 甲基转移酶,CLF 的突变会使H3K27me3 的水平降低[14]。CLF 影响植物叶片、花序、种子和根的发育,具体表现为:clf突变体叶片窄小而卷曲,叶片的细胞伸长长度和细胞数量显著减少[10,15];萼片弯曲不足,不能包裹花蕾,导致早花表型,在短日照条件下开花时间比野生型早约3 周,在长日照条件下开花时间比野生型早约2 d[10];种子更大,含油量更高[16-17];主根长度伸长,侧根的数目增加[18]。CLF 影响拟南芥生长发育过程的多个方面,调控植物的多种性状。
温度是控制植物生长发育、分布和季节行为的关键因素,植物的整个生命周期都受到环境温度的影响,植物通过优化生长发育,不断适应自然季节温度的变化[19]。植物对温度非常敏感,甚至能感知到1 ℃的温差[20]。极端高温和低温都会对拟南芥的生长造成胁迫,导致生长缓慢、形态异常、种子产量降低[21]。在温和高温条件下,拟南芥表现出早花、下胚轴伸长、叶柄伸长、叶片变薄等性状[22];而在温和低温条件下,拟南芥表现出晚花、下胚轴变短等表型[20,23]。本研究通过在不同温度条件(16、22 ℃)下,对野生型与clf-29突变体进行表型分析和差异表达基因分析,探索拟南芥表观遗传调控因子CLF 在响应环境温度和温度形态建成中的作用。
本研究使用的拟南芥植株为哥伦比亚(Col-0)生态型,其中clf-29(SALK_021003)为T-DNA 插入突变体,鉴定突变体和RT-qPCR 验证所需的引物见表1。
表1 本研究用到的引物Table 1 Primers used in this study
拟南芥种子先用75%(φ)乙醇溶液消毒12 min,再用95%(φ)乙醇溶液继续消毒10 min 后,在4 ℃冰箱避光放置2 d,然后在22 或16 ℃长日照(16 h光∶8 h 暗)条件下生长。22 ℃条件下,取用生长18 d的植株拍摄表型;16 ℃条件下,取用生长36 d 的植株拍摄表型。
取0.1~0.2 g 植物材料迅速用液氮预冷,于研钵中研磨成粉末后使用植物总RNA 提取试剂盒(Tiangen Biotech,Beijing,China)进行RNA 提取,每个样品3 次重复。链特异性RNA-seq 文库的构建参照KAPA stranded mRNA-seq kit(Illumina®Platforms,KR0960-v5.17)进行。构建好的文库进行琼脂糖凝胶电泳,选取250~500 bp 的片段进行回收纯化。文库送到上海逆耳生物科技有限公司用Illumina Hiseq 6000 测序仪测序,测序模式为双端150 bp。
使用cutadapt(v3.5) 去除接头和测序质量低于Q20的碱基[24],再用HISAT2(v2.1.0)将筛选后的reads 比对到拟南芥基因组(tair10)[25],通过SAMtools(v1.9)筛选出高比对质量的reads 进行后续分析[26]。每个基因的reads 数目通过featureCounts(v1.6.2) 进行计算[27],并使用R 包DESeq2(v1.34.0) 以|log2(Fold change,FC)|≥log21.5 和P<0.05 的条件鉴定差异基因[28]。此外使用deeptools(v3.5.1) 的bamCoverage 工具将reads 进行标准化处理生成bigwig 文件[29],并使用IGV(v2.11.2)进行可视化[30]。分析基因的GO 功能注释时使用了R 包clusterProfiler(v4.2.2)[31]。
取0.1~0.2 g 植物材料迅速用液氮预冷,于研钵中研磨成粉末后使用TRIzol(Invitrogen,15596026)进行RNA 提取,每个样品3 次重复。利用反转录试剂盒(TaKaRa,RR047A)将提取的RNA 反转录成cDNA,之后利用设计好的引物(表1)进行RTqPCR,以ACTIN2作为内参基因,根据3 次生物学重复计算平均值和标准差。
我们分别在22 和16 ℃条件下种植拟南芥Col-0 和clf-29突变体,使用三引物法对T-DNA 插入材料进行鉴定,PCR 结果显示,clf-29仅在TDNA 边界引物+右侧基因组引物(BP+RP)组合中才出现特异性条带,并且未出现Col-0 中左侧基因组引物+右侧基因组引物(LP+RP)组合的特异性条带(图1),说明所用植物材料为纯合突变体。
图1 Col-0 和clf-29 基因型鉴定Fig. 1 Genotype identification of Col-0 and clf-29
16 ℃条件下,clf-29突变体植株比Col-0 稍小,但整体差异不大,叶片正常伸展,略小;而在22 ℃条件下,clf-29突变体与Col-0 差异明显,植株更小,叶片卷曲而且显著减小(图2、3a)。无论在22 ℃还是16 ℃,相比Col-0,clf-29突变体都表现为抽苔时间提前和莲座叶数目减少,在16 和22 ℃条件下,抽苔时间分别提前6 和3 d,叶片数目分别减少4 和1 片(图3b、3c)。clf-29突变体在不同温度条件下的形态差异,说明CLF 参与叶片形态、植株大小等发育进程,暗示CLF 参与调控了拟南芥的温度形态建成。
图2 Col-0 和clf-29 植株(a、b)和叶片(c、d)表型展示Fig. 2 Phenotypic display of plant (a, b) and leaf (c, d) for Col-0 and clf-29
图3 Col-0 和clf-29 在不同温度条件的表型统计Fig. 3 Phenotypic statistics of Col-0 and clf-29 at different temperatures
为了更深刻及全面地了解温度对clf-29突变体形态建成的调控机制,我们进行了高通量RNAseq 测序分析。使用在22 ℃培养箱生长18 d 和在16 ℃培养箱生长36 d 的整株植物材料进行取样、建库、测序,每个样品各有3 次重复。筛选出碱基质量高的reads 比对到拟南芥基因组,保留仅比对到染色质且比对质量较高的reads 进行后续分析。结果显示,所有样品的原始Reads 都在2 000 万条以上,比对率都在97%以上,表明所建的RNA-seq文库的数据质量较高(表2)。为确定样品材料无误,查看了CLF基因的转录水平,在clf-29突变体中,CLF的表达量显著下降,而其邻近基因AT2G23370的表达量未受影响,说明试验材料是正确无误的(图4a)。此外转录组数据之间的相关性显示,每个样品的3 次重复各自聚在一起,数据有良好的重复性(图4b)。
图4 RNA-seq 数据的准确性(a)和相关性分析(b)Fig. 4 Accuracy (a) and correlation analyses (b) of RNA-seq data
表2 RNA-seq 数据统计1)Table 2 Statistical analyses of RNA-seq data
为了探究温度对CLF 的影响,以|log2FC|≥log21.5 和P<0.05 为筛选条件,对转录组数据进行差异基因分析。我们鉴定到了Col-0、clf-29各自在16 ℃相较于22 ℃的差异基因,其中Col-0 表达上调和下调的基因分别有2 284 和1 628 个,clf-29突变体分别是2 345 和2 077 个(图5a、5b),Col-0 和clf-29在响应温度变化时改变的基因数目相近。我们还鉴定到了相比于Col-0,clf-29突变体分别在22 和16 ℃的差异基因,22 ℃条件下clf-29突变体相比野生型上调801 个基因、下调688 个基因,而在16 ℃条件下clf-29突变体相比野生型上调574 个基因、下调1 012 个基因(图5c、5d),说明CLF 的缺失会导致大量基因异常表达。
图5 不同温度条件下Col-0 和clf-29 的差异表达基因Fig. 5 Differentially expressed genes of Col-0 and clf-29 at different temperatures
将Col-0 在16、22 ℃的差异基因和clf-29在16、22 ℃的差异基因做交集。结果发现,对于上调基因,两者的交集是1 326 个基因,仅在Col-0 的是958 个基因,仅在clf-29的是1 019 个基因;对于下调基因,两者的交集是919 个基因,仅在Col-0 的是709 个基因,仅在clf-29的是1 158 个基因(图6a、6b)。在不同温度条件下,Col-0 和clf-29有很多基因是共同改变的(图7),而那些仅在Col-0 或者仅在clf-29变化的基因更为重要。我们对这些基因进行GO 富集分析,发现仅在Col-0 上调的基因更多地富集在环境响应、物质转运等途径(图8a);仅在clf-29上调的基因主要富集在响应刺激、激素运输、细胞壁生长等途径(图8b);仅在Col-0 下调的基因富集在物质合成、物质代谢等途径(图8c);仅在clf-29下调的基因富集在刺激响应、合成代谢调控等途径(图8d)。
图6 相比于22 ℃,16 ℃条件下Col-0 和clf-29 的差异上调(a)和差异下调(b)基因的交集Fig. 6 Intersection of differentially up-regulated (a) and down-regualted (b) genes at 16 ℃ compared to 22 ℃
图7 相比于22 ℃,16 ℃条件下Col-0 和clf-29 差异表达基因的相关性Fig. 7 Correlation of differentially expressed genes between Col-0 and clf-29 at 16 ℃ compared to 22 ℃
图8 相比于22 ℃,16 ℃条件下Col-0 和clf-29 各自差异表达基因的GO 分析Fig. 8 GO analyses of differentially expressed genes in Col-0 and clf-29 respectively at 16 ℃ compared to 22 ℃
温度的变化造成了clf-29突变体的不同表型,因此我们找到了上述4 类差异表达基因(图6),相比于22 ℃,在16 ℃条件下在Col-0 显著上调而在clf-29中未显著上调的,称之为Col-0 上调,同样得到了clf-29上调、Col-0 下调、clf-29下调,通过GO 注释在这4 类基因中寻找与温度响应相关的基因进行分析。有19 个基因仅在Col-0 上调表达,有14 个基因仅在clf-29上调表达(图9a);仅在Col-0 下调的是26 个基因,仅在clf-29下调的是37 个基因(图9b)。在这4 类基因中各选取特定基因SUCROSESYNTHASE1(SUS1)、PHOTOSYSTEMⅠLIGHTHARVESTINGCOMPLEXGENE1(LHCA1)、BYPASS1-LIKE(B1L)、DARKINDUCIBLE10(DIN10) 进行RT-qPCR 验证(材料情况与构建RNA-seq 文库一致),相比于clf-29,SUS1在Col-0上调更加显著,与之类似,LHCA1在clf-29上调更加显著,B1L在Col-0、DIN10在clf-29的下调程度更高(图10),这与热图结果基本一致。Col-0 材料在12 ℃处理1、3、5、10 h 后LHCA1表达量上升,处理24 h 后表达量下降[32],我们的结果与短时间处理一致;Col-0 材料在4 ℃处理1、3、6、12 h后B1L表达量上升[33],处理24 h 后表达量下降,我们的结果与处理24 h 一致。我们的结果与其他已发表文章结果的差异,可能是处理温度与处理时间都存在差别而共同导致的。综上,CLF 的缺失造成了大量温度响应基因表达改变,造成一系列的表型差异,证明了CLF 在不同温度条件下调控生长发育的重要作用。
图9 相比于22 ℃,16 ℃条件下Col-0 和clf-29 各自温度响应基因的热图Fig. 9 Heatmap of temperature-responsive genes in Col-0 and clf-29 respectively at 16 ℃ compared to 22 ℃
图10 特定温度响应基因的RT-qPCR 验证Fig. 10 RT-qPCR verifiction of specific temperature-responsive genes
拟南芥中的CLF 是PRC2 复合物的重要亚基,是H3K27me3 甲基转移酶,CLF 蛋白结构保守,在多种植物如水稻、番茄中都报道过CLF 的同源蛋白[34-35]。CLF 调控植物生长发育的多个阶段,在拟南芥中鉴定到6 854 个H3K27me3 富集的基因,这些基因都是潜在的CLF 可以调控的靶基因,涉及多种生长发育、响应刺激相关的通路,暗示CLF 对植物的正常生长起至关重要的作用[14]。本研究发现不同温度条件下clf-29突变体的形态建成存在差异,并且找到了多类可能导致表型差异的重要基因,其中仅在Col-0 响应而在clf-29突变体未响应的基因说明CLF 的缺失使突变体无法正常发挥功能,仅在clf-29响应的差异基因说明缺失CLF 使其产生了更多的变化,并找到了多个和温度相关的基因,其发生明显的表达变化,这些结果说明CLF 是参与拟南芥温度形态建成的重要表观调控因子。
不同温度条件下clf-29突变体的形态差异,极有可能是因为在不同温度下CLF 介导的H3K27 甲基化在基因组上的不同丰度造成的。温度是一种重要的环境影响因子,低温会影响拟南芥H3K27me3的富集。在低温条件(4 ℃) 下,低温响应基因COR15A和ATGOLS3的H3K27me3 水平会降低从而导致基因表达的变化[36-37]。温度变化也可以通过改变开花抑制基因FLOWERINGLOCUS C(FLC)的H3K27me3 水平来调控FLC的活性,从而调控植物开花时间[38-39]。然而温度如何影响甲基转移酶CLF 介导的H3K27 甲基化的分布,是需要进一步探索的问题。
除了H3K27 甲基化以外,其他的表观遗传标记也参与植物对环境温度的适应性调控,当植物生长环境的温度较低时,组蛋白变体H2A.Z 会富集在DNA 上,抑制基因的表达,当温度升高时,H2A.Z 富集程度降低,使基因正常表达[20]。因此,在不同温度条件下,H3K27me3 与其他的表观遗传标记会产生怎样的偶联反应也是值得深思和深入探究的问题。