张文慧,杜吉到,贺登美,谷心茹,黄 勇,国凤双
(黑龙江八一农垦大学农学院,黑龙江 大庆 163319)
【研究意义】绿豆(Vignaradiate),豆科作物,在我国有两千多年的栽培历史。由于绿豆具有药用、保健、营养等价值,近年来人们对绿豆的需求呈上升的态势,但在我国北方一些绿豆主产区受土壤盐渍化、干旱等环境条件限制,绿豆产量维持在较低水平。因此,对绿豆的转录因子基因家族基因进行分析,明确基因家族的结构特点、探究其在绿豆生长发育及抗逆方面的功能非常必要。植物在生长发育过程中能够感受盐碱、低温、干旱等外界环境以及体内细胞发育的信号,通过一系列的信号传递启动下游相关功能基因的转录表达,最后通过基因产物对各种信号在生理生化等方面做出适当的调节反应,因此,转录因子激活或抑制下游相关基因的表达是植物胁迫应答反应及调节自身生长发育的重要过程。Dof(DNA binding with one finger)家族是一个具有典型锌指结构域的转录因子家族,是植物中特有的一类转录因子[1-3]。它的DNA结合域是由52个氨基酸组成的C2-C2型锌指结构,可以特异性的识别并结合下游基因启动子中核心序列为“T/AAAAG”的元件,激活或抑制下游基因的表达[4-5]。Dof蛋白的羧基端序列保守程度很低,不同成员之间差异很大,可以不同的方式调控蛋白互作,增加了Dof蛋白功能的多样性[6-7]。【前人研究进展】目前,Dof家族基因已经在拟南芥、水稻、大豆、玉米、甜瓜、番茄等多种植物中被分离鉴定出来[8-12]。Dof基因对植物的生长发育、碳水化合物的代谢、细胞的防御反应、激素信号转导、种子萌发等方面都具有调控作用[13]。研究表明,甜瓜CmDof6、CmDof10和CmDof17基因可以被 PEG 胁迫显著诱导[11];转番茄基因SlCDF1和SlCDF3的拟南芥植株提高了对盐和干旱胁迫的抗性[14];过表达OsDof12基因的水稻株系在长日照条件下会导致花期提前[15];玉米Dof家族基因参与玉米的生理发育过程,并且对氮代谢调控起着重要作用[10]。【本研究切入点】目前,对Dof家族进行了研究的作物主要包括水稻、玉米、大豆、高粱等,对绿豆Dof基因的研究则未见报道。【拟解决的关键问题】本研究在绿豆转录组数据的基础上,对绿豆Dof家族基因进行鉴定,通过生物信息学的方法对Dof基因的染色体定位、基因结构、系统进化、盐胁迫下的表达模式等进行分析。此研究为进一步探究Dof基因在绿豆生长发育及抗逆方面的功能提供理论依据。
本实验是在对吉绿10号进行转录组测序的基础上进行的。在转录组数据中搜索Dof基因,获得Dof基因的Gene ID,利用Gene ID在NCBI的绿豆基因组数据库中搜索获得Dof基因序列。利用NCBI的保守结构域查找软件https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi确定Dof蛋白的保守结构域,使用Bioedit软件进行多序列比对。通过网站http://web.expasy.org/protparam/分析Dof蛋白的理化性质;通过网站https://www.genscript.com/wolf-psort.html和http://kinasephos.mbc.nctu.edu.tw/分别预测ERF蛋白的亚细胞定位和磷酸化位点数目及种类;通过网站http://meme-suite.org/tools/meme 对Dof蛋白motif进行预测;利用TBtools软件构建绿豆Dof家族蛋白的系统进化树、分析Dof基因结构,并将系统进化、基因结构、蛋白基序分析结果可视化作图。
从 TAIR数据库(https://www.arabidopsis.org/)获得拟南芥Dof蛋白序列,用MEGA7.0软件的邻接法对绿豆和拟南芥Dof蛋白进行系统进化分析,Bootstrap 值设置为 1000,其他参数均为默认值。根据本实验室的转录组测序结果中Dof家族基因的FPKM值分析Dof家族基因在盐胁迫下6、12和24 h的表达模式,并用R语言绘制热图。
图1显示,根据转录组数据中Dof家族基因的Gene ID在NCBI绿豆基因组数据库中获得41个绿豆Dof基因序列,用BioEdit软件对Dof蛋白的结构域进行分析,发现41个绿豆Dof的结构域高度保守,且均含有1个CX2CX21CX2C基序,可进一步形成C2-C2单锌指结构。因此,可以确定搜索到的41条基因均为绿豆Dof家族基因。按照这些基因在染色体上的位置,依次命名为VrDof1~VrDof41。
图1 绿豆Dof基因保守结构域多序列比对
由表1显示,对41条绿豆Dof家族基因在染色体上的位置及理化性质等进行分析,Dof基因不均匀的分布在除6号染色体外的1~11号染色体上,1号染色体只有1条Dof基因、2号染色体包含3条、3号染色体2条、4号染色体5条、5号染色体2条、7号染色体10条、8号染色体2条、9号染色体2条、10号染色体5条,11号染色体3条,还有6条Dof基因没有被定位在染色体上;Dof基因的CDS分布范围为498~1506 bp,编码的氨基酸数目在165~501之间,包含氨基酸残基数目最少的为VrDof29(165个),最多的是VrDof10(501个);分子量大小在19.23~54.60 Kd;等电点在5.44~9.99。
表1 绿豆Dof家族基因的基本信息
由表2显示,41个绿豆Dof蛋白的磷酸化位点数目分布在5~28之间,不同蛋白磷酸化位点数目差异很大,从3种磷酸化位点的数目上看,丝氨酸磷酸化位点数目最多,苏氨酸磷酸化位点次之,酪氨酸最少。亚细胞定位方面,所有41个Dof蛋白都定位在细胞核里。
表2 绿豆Dof蛋白的亚细胞定位和磷酸化位点分析
参考Lijavetzky等(2003)对拟南芥和水稻Dof家族基因的分类方法[8],用MEGA7.0软件对鉴定出的41条绿豆Dof蛋白序列和分布在Dof各组的25条拟南芥蛋白序列进行多序列比对及系统进化分析(图2)。与拟南芥的分类结果略有不同,绿豆Dof家族蛋白可以被分为A、B1、B2、C1、C2.1、C2.2、D1和D2共8个组,没有Dof成员和拟南芥的C3组蛋白聚集在一起(图1)。不同组间成员分布不均,聚集到D1组的成员数目最多,共有11个绿豆Dof蛋白,其次是B2 组,包含8个绿豆Dof蛋白,最少的是D2组,只包含1个绿豆Dof蛋白。另外,A组包含4个绿豆Dof蛋白、B1组包含5个、C1组5个、C2.1组4个、C2.2组3个。拟南芥共有36个Dof蛋白,分布在D1组的成员最多,其次是B1组,分别为7个和5个,在整个拟南芥Dof家族中占比为19.4%和13.9%,与绿豆相似,绿豆成员最多的也是D1组,占比为26.8%,高于拟南芥的比例,其次是 B2组,占比为19.5%。
图2 绿豆和拟南芥Dof家族蛋白的系统进化树
通过TBtools软件对绿豆Dof家族蛋白进行系统进化分析(图3-A)与图结果一致,将绿豆Dof基因分为8个组。通过MEME对绿豆Dof家族蛋白的保守基序进行分析(图3-B),结果鉴定出15个保守基序。其中,Motif1是Dof家族蛋白的结构域,为绿豆Dof家族成员共有,可形成C2-C2单锌指结构。A组成员包含Motif1、9、11和12;B1组包含Motif1、6、10、14、15,其中Motif6不存在于其它组,为B1组特有;B2组成员主要含有Motif1和Motif11;C1组成员含有Motif1、10、13、14、15,其中13为C1组特有;C2.1组成员含有Motif1、10、12;C2.2组成员含有Motif1、12;14;D1组成员含有Motif1、2、3、4、5、7、8、9、12,除了Motif1和Motif12外,其余的7种Motif均为D1组特有;D2组只有1个成员,与B2组类似,只含有Motif1。结合系统进化分类来看,同一组别内的成员含有的保守基序种类、数目和排列顺序相似,不同组别之间包含的基序不同,大多数组别都有区别于其它组别的基序。
图3 绿豆Dof家族蛋白的系统进化(A)、基因结构(B)及保守基序(C)分析
利用TBtools软件对绿豆Dof家族基因的结构进行分析(图3-C),聚类在同一组中的Dof基因具有相似的基因结构。绿豆Dof家族基因的外显子在1~3个之间,除VrDof1和VrDof15外显子数目为3个外,其余基因的外显子都为1~2个。绿豆Dof家族基因的内含子在0~2个之间,VrDof1和VrDof15含有2个内含子,19个Dof基因含有1个内含子,其余20个基因不含有内含子。
在本实验室测得的绿豆在盐胁迫下的转录组数据中查找Dof家族基因表达的FPKM值,利用R软件的pheatmap软件包绘制基因表达热图(图4)。由于VrDof20在正常条件下和盐胁迫下都没有表达,因此对除VrDof20外的40个基因表达情况进行分析。从图4中可以看出,不同Dof基因在盐胁迫下的表达模式存在差异,从不同基因表达情况的聚类分析来看,同一组中的Dof基因表达模式存在一定程度的相似性。如VrDof27、VrDof8和VrDof11在系统进化分析中都划分在B1组,而且它们在盐胁迫下表达模式相似;VrDof35、VrDof6、VrDof15和VrDof22同属于D1组成员,也有相似的表达模式;C2.2组的3个成员VrDof5、VrDof24和VrDof36表达模式相似。
CK:正常生长条件;T6:NaCl胁迫6 h;T12:NaCl胁迫12 h;T24:NaCl胁迫24 h
本研究从绿豆转录组数据库中共筛选到41条完整的绿豆Dof家族蛋白用于生物信息学分析。目前在拟南芥和水稻中分别鉴定出Dof家族蛋白36和30条、大豆78条、玉米46条、甜瓜34条、番茄34条[8-12],而粗山羊草中只鉴定出10条[16],说明不同物种间存在较大差异,绿豆Dof家族蛋白的数量居中。选择拟南芥Dof家族蛋白和绿豆Dof蛋白进行系统进化分析,绿豆Dof家族蛋白的聚类结果和拟南芥相似,可以分为A、B1、B2、C1、C2.1、C2.2、D1和D2共8个组,较拟南芥少了C3组,这一结果与Lijavetzky等(2003)对水稻Dof家族基因系统进化分析结果相似,水稻中也没有C3组Dof成员[8]。对绿豆Dof基因进行结构分析发现,这些Dof基因的结构相对简单,都有1~3个外显子和0~2个内含子,这一结果与前人对甜瓜、马铃薯等的研究结果相似[11, 17],说明不同物种的Dof家族基因具有高度的保守性。结合系统进化分类来看,同一组别内的成员含有的保守基序种类、数目和排列顺序相似,并且同组内的成员在基因结构上也具有较高的保守性,因此,推测它们执行相似的生物学功能。
蛋白的磷酸化是调节和控制蛋白质活力和功能的重要机制,在细胞信号转导过程中起着重要作用,前人的研究结果表明ERF蛋白及其它转录因子蛋白都可以通过磷酸化提高植物的抗逆能力[18-19]。本研究中41个蛋白含有5~28个磷酸化位点,说明每个Dof蛋白都可能被特定的蛋白激酶磷酸化,从而激活相关基因的表达。对41个蛋白的亚细胞定位进行预测,发现它们都定位于细胞核上,说明绿豆Dof蛋白都是在细胞核中对下游基因进行转录调控,以适应外界的环境变化。
Dof基因是植物特有的一类转录因子,在植物的生长发育、开花调控、应答逆境胁迫和碳氮代谢调控方面发挥重要作用[20]。在大豆中,过表达大豆GmDof11基因可以提高大豆植株的分枝数和百粒重,同时也增加了大豆籽粒的含油量及产量[21];研究表明水稻OsDof12基因参与调控水稻植株结构的建成[22];拟南芥AtDof4.1基因是转录抑制子,在拟南芥的开花和生殖器官的发育等方面起抑制作用[23];拟南芥CDF3基因可以被高盐、高温和干旱等非生物胁迫诱导表达,CDF3基因的过表达可以提高拟南芥对渗透胁迫、低温等的抗性[24];番茄的SlCDF1-SlCDF5基因与拟南芥的CDF基因属于同源基因,可以被盐、干旱、低温等非生物胁迫诱导表达,说明这些基因参与了番茄的非生物胁迫响应,而且SICDF1和SICDF3基因可以提高拟南芥植株的抗旱能力[25]。本文对绿豆Dof基因在NaCl胁迫下的表达情况进行分析,发现除了VrDof20没有表达外,其余40个基因在正常情况和盐胁迫条件下都有不同程度的表达,但表达模式并不相同,呈现出上调和下调两种不同的模式,说明绿豆Dof基因响应盐胁迫,但不同表达模式的基因对盐胁迫的调控机制可能存在差异。
前人的研究结果表明,系统进化树可以对不同物种中的同类基因的功能预测提供有价值的理论依据,即系统进化中聚类在同一组的基因在基因结构、蛋白的保守基序、基因的表达模式等方面都是相对保守的,因此,同组中的基因可能具有相似的生物学功能[26-27]。研究发现拟南芥A组的Dof成员AtDOF5.4/OBP4(AT5G60850)对拟南芥的细胞周期和细胞生长起负调控的作用,我们可以根据这一结果可以预测绿豆A组与AtDOF5.4同源性高的基因在细胞周期和细胞生长方面的生物学功能[28]。拟南芥ATDOF5.8(AT5G66940)属于D2组成员,对盐和干旱胁迫有明显响应,过量表达ATDOF5.8提高了拟南芥对非生物胁迫的抗性[29],而绿豆D2组成员VrDof16可以响应盐胁迫,推测VrDof16可能对非生物胁迫有抗性,但需通过进一步实验来验证。