张恺恺,杨立莹,丰美静,,张林凤,陈段芬,邱德有,杨艳芳*
(1.中国林业科学研究院林业研究所,林木遗传育种国家重点实验室,国家林业和草原局林木培育重点实验室,北京 100091;2.河北农业大学园艺学院,河北保定 071001;3.中国花卉协会,北京 100020)
红豆杉(Taxusspp.)是举世公认的珍贵林木,在全世界一共有11 种,我国存在4 种和1 变种,即东北红豆杉(T.cuspidataSieb.et Zucc.)、西藏红豆杉(T.wallichianaZucc.)、云南红豆杉(T.yunnanensisCheng et L.K.Fu)、中国红豆杉(T.chinensis(Pilger) Rehd.)以及南方红豆杉(T.chinensisvar.mairei(Lemeee et Levl)Cheng et L.K.Fu)[1]。曼地亚红豆杉(Taxus×mediaRehder)为一种天然杂交种,于上世纪90 年代由美国或加拿大引种于我国。
NAC (NAM/ATAF/CUC)是植物中最常见的转录因子家族之一,在植物生长发育过程中起到重要的调控作用,如响应非生物胁迫、调控器官生长发育以及参与激素信号转导等[2-4]。研究发现,水稻OsNAC2 蛋白能够通过影响植物生长素和细胞分裂素(cytokinin)反应基因来调控根的发育[5],而拟南芥ANAC092 可以与生长素应答因子ARF8和PIN4 的启动子相结合,通过控制生长素信号途径来影响拟南芥根系的发育[6-8]。此外,在拟南芥中异源表达BnNAC14、GmNAC109、CiNAC3和CiNAC4等其他物种的NAC基因,也可以对侧根的形成起到促进作用[8-11]。这些研究结果表明,NAC 转录因子在植物根系的形成过程中扮演重要角色。
近年来,人们为了缓解红豆杉开发与利用的矛盾,在红豆杉人工种植研究上取得了巨大进展,但仍存在红豆杉扦插繁殖生根较慢(大约需要45~60 d)的技术瓶颈。并且,目前关于红豆杉生根的分子机制研究也较为少见。本研究从曼地亚红豆杉三代全长转录组数据中鉴定出了44 个NAC转录因子基因,并对该基因家族进行了系统生物信息学及组织表达分析,为探索NAC 转录因子调控红豆杉根系的形成奠定理论基础,有助于今后利用分子手段调控其根系生长、缩短扦插育苗时间。
通过隐马可夫模型HMM(PF02365) (TBtools v1.064[12])从课题组曼地亚红豆杉三代全长转录组数据(未发表)中获取NAC 蛋白序列。利用在线工具CD-HIT Suite 进行去冗余[13],利用NCBI CD Search 工具进行结构域预测,并筛选结构域完整的序列进行后续分析。
利用ExPASy 在线工具ProtParam(https://web.expasy.org/protparam/)分析TmNAC 蛋白理化特性。根据进化树结果,每个亚家族选取一个TmNAC 蛋白作为代表,利用phyre2 在线网站(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)进行三级结构建模。
拟南芥NAC 蛋白序列下载于Plant TFDB (http://planttfdb.cbi.pku.edu.cn/)数据库。从138 个拟南芥NAC 蛋白质序列中随机选取6 个序列,用ClustalX2 软件将其与44 个TmNAC 序列进行多序列比对,比对结果利用EsPript 3.0 (http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)进行美化。利用MEGA 7 软件中的NJ(Neighbor-Joining)法构建进化树,重复1 000 次,其他参数为默认值。iTOL(https://itol.embl.de/)在线网站美化进化树。
利用 MEME 在线网站对TmNAC 蛋白进行保守基序(Motif)分析[14],最大motif 检索数为10,其余为默认参数,将结果通过TBtoolsv1.064软件进行可视化处理[12]。
利用云南红豆杉植株根、茎和叶的RNA-seq数据(SRP127697)和TBtools v1.064 软件绘制TmNACs 基因在根、茎和叶组织中的表达热图,对NAC 成员基因表达量FPKM 值使用log2 (FPKM +1)对数转化处理[12]。
本研究共获得44 条NAC 蛋白序列,命名为TmNAC1~TmNAC44。对获得的44 个TmNAC蛋白序列进行理化性质分析,发现TmNAC38 序列最长,含有1 010 个氨基酸残基,而TmNAC9序列最短,含有154 个氨基酸残基;这些TmNAC蛋白等电点为 4.70~9.60,相对分子质量为18.13~113.57 kDa,GRAVY 值均为负值,表明TmNAC蛋白均为亲水蛋白。
系统进化树结果显示,44 个TmNAC 蛋白被分为NAM 等7 个亚家族,其他NAC1、ONAC22和SEUN5 等拟南芥9 个NAC 亚家族中无TmNACs蛋白分布(图1)。
从图1 中可以看出,各TmNAC 成员的三级结构十分相似,但也存在些许差异,如TmNAC1 蛋白比其他蛋白多了一个β-折叠,TmNAC16 和TmNAC21 蛋白比其他蛋白多一个α 螺旋(图2)。
图1 曼地亚红豆杉与拟南芥NAC 家族进化树分析Fig.1 Phylogenetic relationship among NAC superfamily genes of of Taxus × media and Arabidopsis thaliana
图2 TmNAC 蛋白的三级结构分析Fig.2 3D structures of TmNAC proteins
多序列比对结果发现,所有的NAC 蛋白在N 端均具有保守的NAC 结构域(图3),其结果与拟南芥和水稻NAC 转录因子家族分析结果相似[15]。此外,TmNAC7 和TmNAC42 蛋白具有不完整的亚结构域D 与E (图3),其余蛋白均具有5 个保守的亚结构域(A~E)。
图3 曼地亚红豆杉和拟南芥NAC 蛋白保守结构域分析Fig.3 Analysis of conserved domains of the NAC proteins of Taxus × media and Arabidopsis thaliana
基序分析结果发现motif 2、4、5 几乎存在于所有的NAC 蛋白成员中。另外,有的亚家族具有或缺失某些蛋白基序,如motif 8、10 仅存在于ANAC011 亚家族中,motif 7 仅存在于NAM 与ATAF 亚家族中;而ANAC011 亚家族中的TmNAC36 和TmNAC15 则分别缺少motif 2 和motif 5 (图4)。
图4 曼地亚红豆杉TmNAC 蛋白motif 分析Fig.4 Motif analysis of TmNAC proteins of Taxus × media
组织表达分析结果显示,TmNAC15、16、18、21、22、29、39、40、41和44在根中均有较高的表达量,而在叶和茎中的表达量都相对较低。另外,TmNAC2、3、8、17、25和42在根与叶中表达量相近,而TmNAC27和TmNAC43在茎中表达量最高,在叶和根中的表达量均较低(图5)。
图5 TmNAC 基因在根、茎和叶中表达模式Fig.5 The expression patterns of TmNAC genes in roots, leaves and stems
NAC基因家族具有保守的结构域和功能域,对植物的生长发育具有重要的作用[15-17]。本研究从曼地亚红豆杉转录组数据中鉴定出 44 个NAC 转录因子,数目明显少于拟南芥和水稻基因组中的138 个和140 个[18-19]。究其原因,很有可能是由于本研究的NAC 来源于三代全长转录组测序数据,也有可能是因为物种不同造成。目前,已经有西藏红豆杉和南方红豆杉基因组发表[20-21],未来可以利用这些基因组信息对NAC 基因家族进一步进行分析,红豆杉NAC 家族的完整性可以得到进一步完善和确定。
研究表明NAC 蛋白具有典型结构特征,均含有NAC 功能域,且NAC 区域包含 A~E 共5 个NAC 亚结构域。本研究蛋白多序列比对结果显示,44 个TmNAC 蛋白在N 端均含有 NAC 结构域,但TmNAC7 和TmNAC42 蛋白具有不完整的D 和E 亚结构域。这5 个亚结构域的保守性顺序为A>C>D>B>E,亚结构域A 与C 对蛋白质的稳定发挥着重要作用。此外,亚结构域 E 是NAC 蛋白中一个重要的 DNA 结合区域,可能参与了发育时期调控,并且前人也推测存在由亚结构域D 和E 组成的DNA 结合区[22]。蛋白的功能与其结构密切相关,由此可以推测,TmNAC 家族有很大可能与其他植物的NAC 蛋白功能相似,而TmNAC7和TmNAC42 蛋白功能则极其可能与其他TmNAC蛋白功能有所不同。
进化树分析显示红豆杉TmNAC 成员与大多数拟南芥NAC 家族各亚家族成员具有较高同源性,表明NAC 家族在物种间进化保守。因此,可以通过其他物种NAC 蛋白功能来预测红豆杉NAC 同源蛋白的功能。此外,拟南芥中NAC1、ONAC22和SEUN5 等9 个亚家族并不包含红豆杉NAC 同源蛋白,这些情况可能是由于曼地亚红豆杉的NAC家族序列是从转录组数据中获得,并未全部获取到基因组中其他亚家族NAC 蛋白序列所造成。
多序列比对、motif 及蛋白质三级结构分析均发现,44 个曼地亚红豆杉NAC 蛋白具有较高的相似性和保守性,该结果与桃树、蓖麻、茶树、番茄中的报道相类似,说明其在进化上非常保守[23-26]。值得注意的是,TmNAC1、TmNAC16 和TmNAC21三者所在的亚家族与其他亚家族成员结构上存在显著差异,且不同亚家族或同一亚家族不同成员之间motif 类型和数目也存在差异,这些结构差异是否导致它们功能发生变异尚不清楚,值得研究人员进一步深入研究。
研究表明,不同的物种间同源基因在进化过程中会保留相同或相似的功能,而基因的组织表达模式往往与其功能密切相关[27]。拟南芥和水稻的一些NAC 转录因子的功能已经得到验证,这为预测红豆杉TmNAC 转录因子的功能提供了线索。TmNAC 家族TmNAC15、16、18、21、22、29、39、40、41和44基因在红豆杉根中表达量较高,同时TmNAC21、30、39、40 和44 蛋白与拟南芥AtNAC2/AT3G15510 蛋白在系统发育树中聚为一支,而AtNAC2恰恰参与侧根的形成与发育[28];TmNAC5、11、14、22、24、34 和37 蛋白与拟南芥AtNAC1/AT3G15170 蛋白在系统发育树中聚为一支,AtNAC1介导生长素信号以促进侧根的形成[29]。综合上述,推测红豆杉TmNAC21、39、40、44(NAP/ANAC3 亚家族)和TmNAC22(NAM 亚家族)可能在红豆杉根系生长发育中起到重要调控作用。
本研究从红豆杉转录组中鉴定出44 个NAC成员,发现红豆杉NAC基因编码的44 个蛋白在N 端均具有保守的NAC 结构域,TmNAC 家族有很大可能与其他植物的NAC 蛋白功能相似。蛋白功能结构域分析结果预示着红豆杉NAC 家族成员可能在亚家族间以及亚家族内部具有功能的特异性。表达量比较分析显示,TmNAC基因在红豆杉不同组织中的表达量各不相同,TmNAC21、22、39、40和44可能与红豆杉根的生长发育有关,为进一步探索红豆杉NAC 转录因子调控红豆杉根系生长提供理论基础。