小麦MBD基因家族的鉴定和特征分析

2021-06-22 00:46张新宁邢真真范姗姗孟凡荣
西北植物学报 2021年5期
关键词:亚类甲基化基因组

张新宁,邢真真,李 静,范姗姗,孟凡荣*

(1 河南农业大学 生命科学学院,郑州 450002;2 河南农业大学 农学院,郑州 450046)

DNA甲基化是植物表观遗传修饰的主要形式之一,在转座子沉默、维持基因组稳定性、基因表达调控及基因组印记等过程中发挥重要功能[1]。研究发现,甲基结合蛋白(methyl-binding domain protein,MBD)能够特异识别并结合DNA甲基化位点,参与了核小体重塑因子和组蛋白去乙酰化酶的招募及转录抑制复合体的形成过程,通过表观修饰调控基因表达[2-3]。MBD蛋白中与甲基化DNA特异结合的最小区域为85个氨基酸,该区域能够形成由β折叠和α螺旋等组成的特殊楔形结构,其中位于β折叠区的Val、Arg、Tyr和Ser残基是识别甲基化DNA关键位点[4]。近年来,关于植物MBD蛋白的功能有了新的发现,例如拟南芥(ArabidopsisthalianaL.)的AtMBD6蛋白参与了RNA介导的基因沉默[5],AtMBD7蛋白特异识别甲基化DNA位点,AtMBD9蛋白通过特异识别组蛋白乙酰化位点与AtMBD7蛋白共同参与了植物主动去甲基化的分子调控过程[6-7]。

植物MBD基因家族包含多个家族成员,已从拟南芥、水稻(OryzasativaL.)和玉米(ZeamaysL.)中分别鉴定到13、17和14个MBD基因[8]。根据氨基酸的相似性可以将拟南芥MBD蛋白分为8个亚类,其中第Ⅳ和Ⅵ亚类为双子叶植物所特有,水稻和玉米的MBD蛋白分属于其余6个亚类[9]。研究发现,MBD基因在植物生长发育过程中发挥着重要调控功能。例如,拟南芥的AtMBD8参与了开花基因FT和SOC1的表达调控[10],AtMBD9与开花抑制因子FLC的表达调控密切相关[11-12],AtMBD11的表达抑制也导致了拟南芥的育性下降和发育异常现象[13]。对玉米中MBD蛋白的研究发现,ZmMBD101蛋白通过与甲基化DNA的结合参与了组蛋白修饰调控及转座子沉默过程[14],而且一些ZmMBD基因受干旱和盐胁迫的诱导而呈现特定的响应模式[15]。在水稻中发现,OsMBD707基因过表达后水稻分蘖角度变大,而且影响到了FT开花调控途径中相关基因的表达,进而导致转基因水稻对光周期的敏感性显著降低[16]。

课题组前期研究中,分离鉴定了小麦(TriticumaestivumL.)的6个TaMBD基因,并初步分析了其时空表达特性[17];其中,TaMBD1、TaMBD4和TaMBD5在成熟种子和萌发过程的胚乳中具有较高的表达水平,在干旱胁迫条件下TaMBD5和TaMBD6呈上调表达趋势。本研究中,通过对小麦全基因组比对系统分析了小麦MBD家族成员的组成、染色体分布、序列特征和表达模式,为进一步探讨小麦MBD基因的功能奠定基础。

1 材料和方法

1.1 材 料

本实验所用小麦品种为‘中国春’,分别对萌发48 h的胚和胚乳、一叶一心期的根和叶、五叶期的茎、幼穗和成熟种子进行取样,用于TaMBD6和TaMBD9基因的表达模式分析。所有样品取样后放入液氮速冻后于-80 ℃保存。

1.2 方 法

1.2.1 小麦MBD基因家族成员的鉴定利用Pfam数据库(http://pfam.xfam.org)中的MBD保守域氨基酸序列(PF01429)进行小麦基因组数据库比对(http://plants.ensembl.org/Triticum_aestivum/Tools/Blast),获得候选小麦MBD基因序列。同时,将已报道拟南芥、玉米和水稻的MBD蛋白序列进行小麦基因组数据库比对(网址同上),获得小麦候选MBD基因序列。将上述所有小麦候选MBD基因序列进行本地比对,并利用NCBI的 CDD(https://www.ncbi.nlm.nih.gov/cdd)进行MBD保守域的注释,最终确定小麦MBD基因家族成员,小麦MBD基因的染色体定位使用MG2C(http://mg2c.iask.in/mg2c_v2.1)绘制。

1.2.2 小麦MBD蛋白的比对和聚类分析依据拟南芥MBD蛋白家族成员分类标准,同时参考玉米和水稻MBD蛋白的分布特性[9]对小麦的MBD蛋白成员进行亚类的划分;聚类分析通过MEGA6软件的NJ法进行,蛋白质的理化特性采用DNAMAN软件进行分析;利用Cluster X软件分析小麦MBD结构域的保守氨基酸位点,并使用Genedoc软件作图。

1.2.3 小麦MBD家族成员的基因组结构分析从Ensemble Plant(http://plants.ensembl. org/index.html)下载小麦MBD基因家族的DNA序列和CDS序列,使用GSDS(http://gsds.cbi.pku.edu.cn)绘制基因结构图。

1.2.4 小麦MBD基因启动子序列特征分析利用小麦MBD基因起始密码子上游2 000 bp的序列,通过PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) 进行转录调控元件的预测分析,并利用TBtools软件进行绘图。

1.2.5 小麦MBD基因的表达模式分析利用WheatEXP(http://wheat.pw.usda.gov/WheatExp)转录组数据进行小麦MBD基因表达模式的分析。其中包括根、茎、叶、穗和种子的组织表达数据,胁迫数据来自于干旱胁迫处理后1 和6 h的小麦叶片,热胁迫处理1 和6 h的小麦叶片以及干旱和热胁迫同时处理1 和6 h后的叶片。热胁迫温度为40 ℃,干旱胁迫采用20% PEG溶液,表达模式分析采用HemI软件绘制热图。

实时定量表达分析的总RNA提取使用TransGen公司TransZol Plant试剂盒,cDNA反转录采用TaKaRa公司PrimeScript RT Reagent Kit试剂盒,均按照说明书进行实验操作。实时定量PCR所用特异引物序列详见表1,实时定量qRT-PCR采用20 μL反应体系,其中包括2×SYBR GreenⅡ 10 μL,上下游引物(10 μmol/L)各0.8 μL,cDNA 1 μL,ddH2O 7.4 μL。PCR程序为:95 ℃预变性30 s;95 ℃变性5 s;60 ℃退火30 s,72 ℃延伸10 s,40个循环;以小麦β-Actin为内参基因,设置3个重复,相对表达量采用2-ΔΔCt方法计算。

2 结果与分析

2.1 小麦MBD基因家族成员的鉴定

通过对小麦全基因组分析,共鉴定到16个小麦MBD基因家族成员,其中包含44个基因位点(表2)。对小麦MBD蛋白理化特性分析显示,小麦MBD的氨基酸长度在家族成员间差异较大,最小的蛋白仅119个氨基酸(13.4 kD),而最大的蛋白包含2 092个氨基酸(231.8 kD);理论等电点的范围在4.12~9.77之间。对小麦MBD基因家族成员的染色体定位分析发现,MBD基因成员在基因组中的分布较为分散,主要集中在第1、2、5、6和7号染色体群上,其中第7号染色体群上的MBD基因位点最多,为16个(图1)。

2.2 小麦MBD蛋白的分类

利用拟南芥、玉米、水稻和小麦的MBD蛋白(分别为13、10、12和44个)进行聚类分析显示,拟南芥MBD家族成员共分为8个亚类(Ⅰ~Ⅷ),禾本科作物的MBD蛋白分布在除第Ⅳ亚类(以AtMBD5和AtMBD6为代表)和第Ⅵ亚类(以AtMBD7为代表)外的其余6个亚类中(图2),小麦MBD成员最多是第Ⅷ亚类,包括5个小麦MBD成员(TaMBD3、TaMBD7、TaMBD13、TaMBD15和TaMBD16)、7个水稻MBD(OsMBD705、OsMBD712、OsMBD713、OsMBD714、OsMBD716、OsMBD717、OsMBD718)和2个玉米MBD(ZmMBD113和ZmMBD114)。其次是第Ⅲ亚类,包括3个小麦MBD(TaMBD2、TaMBD10和TaMBD14);第Ⅱ亚类中,包含了3个小麦MBD(TaMBD1、TaMBD4和TaMBD5);小麦TaMBD6和TaMBD11与水稻OsMBD707属于第Ⅰ亚类,其中TaMBD6与水稻OsMBD707同源性最高;TaMBD8和TaMBD12属于第Ⅶ亚类;第Ⅴ亚类成员最少,仅包括小麦的 TaMBD9和玉米的ZmMBD116。小麦MBD家族成员较多,而且多数成员具有3个分别位于A、B和D基因组的同源基因,推测这些成员间存在一定的功能冗余现象。

表1 实时定量PCR引物

表2 小麦MBD基因家族成员信息

图1 小麦MBD基因的染色体定位Fig.1 Chromosome location of wheat MBD genes

结构域分析显示(图3),第Ⅰ亚类成员含有与转录调控相关的结构域PRK05901,第Ⅱ和Ⅲ亚类成员含有结合DNA和促进蛋白互作的Zf-CW结构域[18]。第Ⅴ亚类成员含有PHD、FYRN、Bromodomain、PHD1_ Lid2p_like、WHIM1和WSD结构域,其中PHD参与了染色质介导的转录调控[19],Bro结构域能够识别组蛋白的乙酰化修饰[20],PHD1_Lid2p_like结构域与组蛋白H3K4和H3K9的甲基化修饰具有互作功能[21],WHIM1和WSD结构域在调控两个相邻核小体的间距方面发挥功能[22-23],这预示着该亚类MBD在依赖于表观遗传的基因表达调控过程中发挥重要功能。第Ⅷ类MBD成员中,含有TAF12保守域,该结构域可以与TATA结合蛋白互作参与转录复合物的形成和基因表达调控过程[24]。

对小麦MBD蛋白保守结构域内甲基化DNA结合位点分析发现(图4),第Ⅰ亚类MBD成员中具有4个与甲基化DNA结合的关键氨基酸位点,第Ⅱ、Ⅲ和Ⅷ亚类成员中均含有5个,其中,Ⅷ亚类包含2个MBD保守域的TaMBD13、TaMBD15和TaMBD16,其1个MBD结构域的与甲基化DNA结合的关键氨基酸残基全部缺失;第Ⅴ和Ⅶ亚类成员缺失了3个。

2.3 TaMBDs的基因组结构分析

对小麦MBD基因家族成员的基因组结构分析显示(图5),同一亚类内MBD基因家族成员间具有相似的基因组结构,而不同亚类间的基因组结构差异较大。第Ⅰ(TaMBD6和TaMBD11)和Ⅱ(TaMBD1、TaMBD4和TaMBD5)亚类MBD基因家族成员的内含子数量较少(1~3个),且具有相似的基因组结构。第Ⅲ(TaMBD2、TaMBD10和TaMBD14)和Ⅶ(TaMBD8和TaMBD12)亚类的内含子数在3~5个之间,第Ⅷ(TaMBD3、TaMBD7、TaMBD13、TaMBD15和TaMBD16)亚类成员的内含子数在4~9个之间;而TaMBD9含有10个内含子,且内含子均较长,特别是第一内含子达到10 000 bp以上。

2.4 TaMBD基因启动子的顺式作用元件分析

对小麦MBD基因启动子区域的序列分析发现,除了转录调控元件TATA-box和CAAT-box外,还发现了4种植物激素响应元件,包括茉莉酸甲酯(MeJA)、脱落酸(abscisic acid)、生长素(auxin)和赤霉素(gibberellin)的响应元件;另外,一些与环境响应相关的转录调控元件也包含其中,例如一些与光响应(light responsive)、缺氧胁迫响应(anaerobic induction/GC-motif)、干旱胁迫响应(drought-inducibility)、盐胁迫响应(salt stresses)和低温胁迫响应(low-temperature responsive)相关的调控元件等(图6)。小麦MBD基因启动子区域普遍含有光响应元件和ABA响应元件。第Ⅰ亚类成员都含有生长素响应元件和干旱胁迫响应元件。第Ⅲ和第Ⅶ亚类成员包含有赤霉素响应元件,在TaMBD8-B和TaMBD12-D的启动子区还发现了盐胁迫响应元件。在TaMBD9-B/D的转录调控区包含有干旱胁迫响应元件,TaMBD9-D中还有低温响应元件,TaMBD9-A的启动子区还检测到水杨酸响应元件,推测该基因的3个部分同源基因间在转录调控水平存在一定的差异,预示着它们在环境胁迫响应过程中发挥不同的调控功能。

拟南芥、小麦、玉米和水稻MBD蛋白成员分别用AtMBDs、 TaMBDs、ZmMBDs和OsMBDs表示图2 小麦MBD蛋白的系统发育分析Arabidopsis, wheat, maize and rice MBD protein members are represented by AtMBDs, TaMBDs, ZmMBDs and OsMBDs, respectivelyFig.2 Phylogenetic analysis of wheat MBD proteins

2.5 小麦MBD基因的表达特性分析

对小麦MBD基因的组织表达特性分析显示(图7,A),在穗和籽粒中MBD基因家族的整体表达水平较高,分别有40和22个基因位点在这2个组织中高表达,在穗发育的早期(spike_z32),除了TaMBD1-1A/1D、TaMBD4-1A/1D、TaMBD5-1D、TaMBD10-7B、TaMBD15-7B/7D和TaMBD16-7D之外,其余31个MBD基因位点的表达量均比其他组织高,表明MBD家族的不同成员在小麦穗发育的早期发挥重要功能;在种子发育过程中,TaMBD9-6A/6B/6D、TaMBD14-7D、TaMBD15-7B/7D和TaMBD16-7D这7个基因位点在花后2 d籽粒中(grain_z71)表达量最高,之后呈下调表达趋势;TaMBD1-1A/1B/1D、TaMBD2-5A/5B/5D、TaMBD4-1A/1B/1D、TaMBD5-1D、TaMBD7-7A/7D、TaMBD8-5A/5B/5D、TaMBD11-5B、TaMBD12-7A/7B/7D共19个基因位点在花后30 d籽粒中(grain_z85)表达量最高;表明不同MBD家族成员在种子发育过程中可能发挥不同的调控功能;在叶片和根中,除了TaMBD10-7B和TaMBD13-2A外,其他MBD家族成员表达量均很低。在小麦苗期茎中部分MBD基因位点有表达,但随着发育进程,到开花期的茎中(stem_z65),除了TaMBD3-2A/2B外,其余家族成员表达量很低。这表明不同MBD家族成员在小麦生长发育的不同时期、不同组织发挥着调控功能。

图3 小麦MBD蛋白的结构域分析Fig.3 Domain analysis of wheat MBD proteins

α、β、L分别代表MBD保守域的二级结构α螺旋、β转角、Loop结构;※表示与甲基化DNA结合的关键氨基酸残基图4 小麦MBD结构域的保守位点分析α, β, and L represent the secondary structure of α helix, β turn, and Loop structure, respectively; The key amino acid residues that bind to methylated DNA are indicated by ※Fig.4 Analysis of conserved sites of wheat MBD domains

对干旱及热胁迫后MBD家族基因的表达结果分析显示(图7,B),干旱胁迫后TaMBD1-1B、TaMBD3-2A/2B/2D、TaMBD4-1B、TaMBD6-5B、TaMBD7-7A/7D、TaMBD9-6A/6D、TaMBD13-2B/2D共12个位点在干旱胁迫6 h上调表达;TaMBD1-1D、TaMBD4-1D、TaMBD5-1D这3个位点在干旱胁迫后下调表达;在热胁迫条件下,大多数MBD成员在热胁迫6 h上调表达,而TaMBD3-2A/2B/2D、TaMBD9-6A/6B/6D、TaMBD11-5B、TaMBD13-2A/2B/2D共10个位点是热胁迫后下调表达,部分MBD家族成员(如TaMBD9-6A/6D、TaMBD13-2B/2D等)在干旱胁迫和热胁迫条件下模式完全相反;表达模式分析显示,小麦MBD基因在干旱和高温双重胁迫下的响应模式和单独热胁迫的响应模式更为接近,推测小麦MBD基因对热胁迫更加敏感。

图5 小麦MBD基因的基因组结构Fig.5 Genomic structures of wheat MBD genes

z10.一叶期;z13.三叶期;z23.分蘖早期;z30.起身期;z32.拔节早期;z39.拔节晚期;z65.开花中期;z71.花后2 d; z75.花后10 d;z85.花后30 d。颜色代表表达水平的高(红色)和低(绿色)图7 小麦MBD基因在不同组织(A)和胁迫(干旱胁迫、热胁迫和干热胁迫)下的表达模式(B) z10. One-leaf stage; z13. Three-leaf stage; z23. Early tiller stage; z30. Rise stage; z32. Early jointing stage; z39. Late jointing stage; z65. Mid-flowering; z71. 2 days after flowering; z75. 10 days after flowering; z85. 30 days after flower. The color represents the high (red) and low (green) expression levelsFig.7 The expression patterns of wheat MBD genes in different tissues (A) and stress including drought stress, heat stress and dry heat stress (B)

图8 TaMBD6和TaMBD9的ABD部分同源基因的组织表达分析Fig.8 Tissue expression analysis of ABD homologous genes of TaMBD6 and TaMBD9 genes

研究发现,拟南芥AtMBD9基因与开花调控和分支发育调控密切相关[11],而水稻OsMBD707基因也在发育调控过程中发挥重要功能,该基因过表达后转基因水稻的分蘖角变大[16]。对小麦MBD蛋白成员的聚类分析显示,TaMBD6和TaMBD9分别与水稻的OsMBD707和拟南芥的AtMBD9蛋白质序列高度相似,因此将这2个小麦的MBD基因作为后续研究的重点。对TaMBD6和TaMBD9两个基因的组织表达特性分析结果(图8)显示,TaMBD6和TaMBD9的3个部分同源基因不同组织间存在表达差异,但均在幼穗中表达量最高,除了幼穗的高表达外,TaMBD6-A在根和叶中的表达次之,而在萌发过程的胚乳中表达水平最低;TaMBD6-B则在茎中的表达水平高于根、叶和萌发过程的胚,在种子和萌发过程中的胚乳中表达很低;TaMBD6-D的整体表达水平要低于TaMBD6-A和TaMBD6-B,在茎和萌发过程胚中的表达量相对其他组织而言略高。从上述差异表达模式推测,TaMBD6基因可能在小麦组织器官的发育调控过程中发挥功能。对TaMBD9的组织表达特性分析发现,该基因的3个部分同源基因在根、茎和叶中均具有较高的表达水平,推测该基因在营养器官的发育调控过程中发挥功能;在成熟种子及萌发过程的种子中TaMBD9-B的表达水平要低于另外2个来源于A和D基因组的部分同源基因,推测TaMBD9-B在种子中发挥的功能较弱。

3 讨 论

植物MBD基因家族成员较多,这预示着该类基因在植物生长发育调控过程中具有重要功能,从聚类分析来看各成员间蛋白序列及保守功能域差异较大,推测各成员间的具体生物学功能也存在一定差异。本研究中,鉴定了小麦的16个MBD基因,由于小麦异源六倍体的基因组特性导致多数基因都存在3个部分同源的基因位点,所以小麦基因组中共检测到44个MBD基因位点。不过,TaMBD5和TaMBD16仅在D基因组存在单个位点,从序列相似性来看,这两个位点分别与TaMBD4和TaMBD15高度相似,推测可能是在进化过程中基因的跳跃或片段复制所致[25]。从基因位点的分布特征来看,TaMBD1、TaMBD4和TaMBD5在染色体上呈集中串联分布,这种染色体上紧密排列形成的基因簇很可能与基因家族成员间功能上的协同密切相关[26]。通过对小麦全基因组鉴定,没有发现第Ⅳ和Ⅵ亚类的MBD蛋白成员的存在,这与前人关于第Ⅳ和Ⅵ亚类MBD成员为双子叶植物所特有的结论相一致[27]。在第Ⅲ、Ⅶ和Ⅷ亚类MBD基因中,含有数量较多的内含子,这就增加了转录后mRNA加工的复杂性和可变剪切发生的可能性,推测内含子的插入可能促进了小麦MBD基因家族的进化和功能的分化[28-29]。

MBD蛋白是一类能够特异识别甲基化DNA的调控因子,在基因表达调控及依赖于表观遗传学的发育调控过程中发挥重要功能。在鉴定的小麦MBD蛋白家族成员中,均检测到与甲基化DNA或染色体修饰互作的多个保守结构域,其中第Ⅰ、Ⅱ、Ⅲ和Ⅷ亚类小麦MBD成员可能参与了依赖于DNA甲基化的基因表达调控,而第Ⅴ亚类MBD成员可能与依赖于组蛋白修饰的基因表达调控有关[14]。目前,已有证据表明植物的MBD蛋白直接参与了发育进程的分子调控过程。例如,拟南芥AtMBD8通过对组蛋白修饰的识别参与了开花基因FT和SOC1的表达调控[10],AtMBD9参与了依赖于染色质重塑的开花基因FLC的表达调控[11-12],TaMBD9与拟南芥的AtMBD9高度相似,研究发现拟南芥AtMBD9与开花调控和分支发育调控密切相关,AtMBD9可以通过调节DNA的甲基化和组蛋白的乙酰化等过程参与开花进程的分子调控,小麦TaMBD9与AtMBD9同源性最高,但与其相比,都包含PHD、Bromodomain、PHD1_Lid2p_like等与组蛋白修饰相关的保守域,但又比AtMBD9少了1个MBD保守域,推测其可能在小麦生长发育过程中可以通过组蛋白修饰参与基因表达调控;AtMBD11基因抑制表达后导致种子育性下降和叶片形态异常[13]。OsMBD707过表达后[16],转基因水稻的分蘖角度变大,小麦TaMBD6与拟南芥AtMBD11、水稻OsMBD707同属于一个亚类,可能在小麦中也发挥着相似的功能;另外,研究还发现拟南芥AtMBD4蛋白与磷酸盐转运蛋白基因启动子区域的超甲基化调控相关,进而参与了磷素吸收利用的分子调控过程[30]。本研究中也发现,小麦MBD基因的启动子区域存在多种与环境响应密切相关的调控元件,比如与光响应、生长素(ABA、茉莉酸甲酯和赤霉素)响应和非生物胁迫响应有关的调控元件等,预示着小麦MBD基因可能与生长发育和非生物胁迫响应相关基因的表达调控有关。干旱和高温胁迫响应模式分析发现,TaMBD6和TaMBD9在干旱处理或者高温处理后相对于未处理的表达有差异,推测其可能参与小麦对非生物胁迫的调控过程。同时,受到异源六倍体基因组复杂性的影响,小麦MBD基因家族成员间可能存在功能冗余现象,来源于3个基因组的部分同源基因之间存在时空表达特性的差异,这增加了开展小麦MBD家族成员功能研究的难度[31]。

猜你喜欢
亚类甲基化基因组
基于草原综合顺序分类法的中国山地草地亚类分类研究
牛参考基因组中发现被忽视基因
免疫球蛋白G亚型检测在小儿反复呼吸道感染中的应用
鼻咽癌组织中SYK基因启动子区的甲基化分析
胃癌DNA甲基化研究进展
Evaluation of antidepressant polypharmacy and other interventions for treatment-resistant depression
系统性硬化症患者血清IgG亚类特点
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组
全甲基化没食子儿茶素没食子酸酯的制备