油橄榄WRKY转录因子的全基因组鉴定与分析

2021-11-18 03:53王丽娟李贤忠冯发玉
关键词:进化树油橄榄外显子

王丽娟, 王 毅, 胡 青, 陆 斌, 李贤忠, 赵 川, 赵 敏, 冯发玉

(1.西南林业大学林学院,云南 昆明650224; 2.云南省林业和草原科学院云南省森林植物培育与开发利用重点实验室/国家林业局云南珍稀濒特森林植物保护和繁育重点实验室,云南 昆明650201)

在自然条件下生长的植物经常遭受干旱、水淹、高低温、冷冻害、重金属污染等非生物胁迫,严重影响其正常生长发育.为了适应和抵消非生物胁迫对植物的影响,植物体自身建立了一系列信号转导和调控的分子机制,通过相关转录因子的表达来调控下游基因表达,从而提高植物抗逆性.转录因子具有DNA结合域、转录调控区、核定位信号区、寡聚化位点等结构.根据DNA结合域结构的不同,又可分为乙烯响应因子(AP2/ERF)、成髓细胞增生基因(MYB/MYC)、NAC(NAM、ATAF1/2、CUC2)、WRKYGQK七肽结构蛋白(WRKYGQK heptapeptide structural protein, WRKY)、锌指结构蛋白(ZFP)和碱性螺旋—环—螺旋(bHLH)等家族[1].

WRKY是植物中最大的转录因子家族之一,参与植物的各个生理过程,涉及生长、发育和自我应激信号传导或与不同的基因和转录因子交叉调节[2],其具有特殊结构,编码的蛋白都含WRKYGQK七肽结构,称WRKY结构域,每个家族成员包含1个或2个WRKY保守域,由60个氨基酸组成.C端通常为锌指结构C2H2(C-X4-5-C-X22-23-H-X-H)或C2HC(C-X7-C-X23-H-X-C)[3].根据WRKY结构域的数目和锌指结构的类型,WRKY转录因子可分为3类:第Ⅰ类包含2个WRKY域和1个C2H2锌指结构;第Ⅱ类含有1个WRKY结构域和1个C2H2锌指结构,根据进化关系可细分成Ⅱa、Ⅱb、Ⅱc、Ⅱd、Ⅱe等5类;第Ⅲ类包含1个WRKY结构域和1个C2HC锌指结构[4].1994年在甘薯[Dioscoreaesculenta(Lour.) Burkill]中发现第1个WRKY转录因子cDNA结合蛋白(SPF1)后[5],研究者相继在水稻(OryzasativaL.)[6]、罗汉果[Siraitiagrosvenorii(Swingle) C. Jeffrey ex A. M. Lu et Z.Y. Zhang][7]等植物上鉴定得到WRKY转录因子.根据近年来越来越多植物基因组数据的公布,发现高粱[Sorghumbicolor(L.) Moench]有97个WRKY基因家族成员[8],甜菜(BetavulgarisL.)有40个[9],油棕(ElaeisguineensisJacq.)有95个[10].大量研究证明了WRKY转录因子在植物应答生物和非生物胁迫中起重要的调控作用[11].如:拟南芥[Arabidopsisthaliana(L.) Heynh.]过表达WRKY14,以提高耐旱性[12];玉米(ZeamaysL.)有58个WRKY基因受干旱胁迫诱导表达[13];烟草(NicotianatabacumL.)过表达WRKY10,提高转基因植株的耐旱和耐盐性,表明该基因受多重胁迫的诱导表达[14].可见,WRKY转录因子在许多植物中均已得到鉴定和分析,但目前对油橄榄(OleaeuropaeaL.)WRKY转录因子基因和蛋白的鉴定与生物信息学分析的研究尚未见报道.

油橄榄为木犀科木樨榄属的重要油料作物,原产于地中海沿岸半干旱气候地区,该地区夏季长、热、干燥,冬季温和多雨[15].云南夏季湿润多雨、冬季干旱的气候与原产地气候正好相反,且油橄榄栽培还面临很多问题,因此选育抗旱、抗涝的砧木品种是解决云南油橄榄栽培问题瓶颈的关键.本研究旨在对油橄榄WRKY基因进行全基因组鉴定,分析其蛋白理化性质、系统发育、分类、结构、保守元件及基因表达谱.此外,本研究还进一步探究了油橄榄WRKY基因在干旱和水淹胁迫下的表达模式,探索油橄榄砧木品种‘TYZ-1号’抗旱、耐涝特性的作用机理,该研究结果可为油橄榄WRKY的功能和非生物胁迫反应提供参考.通过了解WRKY转录因子在干旱和水淹胁迫下的分子机理,有利于选育和使用油橄榄抗旱、耐涝的砧木品种.

1 材料与方法

1.1 试验材料的获取

样品采集于云南省林业和草原科学院树木园,材料是‘佛奥’(原产意大利,是我国通过国家审定的油橄榄良种,中国油橄榄适生区大都有种植,且表现良好)和‘TYZ-1号’(是在绿化用油橄榄品种混合子培育出的实生苗中选取的优良无性系)扦插苗在干旱、水淹胁迫及正常浇水下的根和叶.

1.2 转录组测序

采集的根和叶当即处理后用液氮速冻后干冰保存送样进行转录组测序,测序委托上海派森诺生物科技有限公司基于Illumina测序平台进行测序.

1.3 油橄榄WRKY蛋白序列的获取

油橄榄的全基因组数据从NCBI上下载,搜索获得油橄榄WRKY转录因子的cDNA序列和蛋白序列;利用NCBI进行BLAST同源序列比对及蛋白结构域分析,除去无WRKY结构域的蛋白序列及基因对的复制;利用KaKs_Calculator 2.0生物信息学分析软件计算Ka、Ks和Ka/Ks,进而揭示基因家族受选择情况.

1.4 油橄榄WRKY蛋白理化性质的预测

利用ExPASy Protparam Tool在线软件分析WRKY蛋白理化性质,用NetPhos3.1 Service和DictyOGlyc 1.1 Service在线软件预测氨基酸序列磷酸化和O-糖基化修饰情况,通过SignaIP-5.0和Euk-mPLoc 2.0 Server在线软件预测蛋白的信号肽和亚细胞定位,利用Prabi在线软件预测蛋白的二级结构[10].

1.5 油橄榄蛋白进化树、保守元件、基因结构分析

从拟南芥基因数据库(https://www.arabidopsis.org/)引入拟南芥WRKY转录因子,通过MEGA7和Figtree进化树编辑软件对油橄榄和拟南芥WRKY转录因子蛋白进行系统进化树构建及修饰,执行参数为None.将油橄榄WRKY蛋白序列导入到DNAMAN分子生物学综合应用软件中,进行多重序列比对.利用MEME(http://meme.nbcr.net/meme/tools/meme)在线软件对106个油橄榄WRKY蛋白保守结构域进行预测,具体参数设置如下:重复次数选择不限制,保守性基序的数目限制选择10,其他参数均采用默认值.

1.6 油橄榄WRKY外显子和内含子结构分布

利用NCBI在线软件查询外显子位点和基因长度,计算外显子长度和外显子数,绘制基因外显子和内含子的结构分布图.

1.7 油橄榄WRKY水分胁迫基因表达谱的获得

1.7.1 油橄榄水分胁迫试验 试验于2019年9月3日开始,采用1年生‘佛奥’和‘TYZ-1号’扦插苗为试验材料,每个品种分为2组,每组10株,观察其叶片变化.抗旱逆测定:在同一避雨环境条件下,分别对2个品种的扦插苗进行浇水处理,通过称重的方式控制其田间持水量,此后不进行浇水,直至叶片枯死,观察并记录叶片变化.抗旱逆恢复测定:与抗旱逆测定进行相同的处理.当叶片出现卷曲时,对植株恢复正常浇水(5 d一次),浇水后保证其正常田间持水量,观察叶片变化.改变干旱处理为水淹处理,用同样的方法进行抗涝逆测定和抗涝逆恢复测定.在每组重复试验中随机采集2个品种非生物胁迫及正常浇水下的3对根系和叶片,液氮速冻后干冰保存送样进行转录组测序,获得油橄榄WRKY转录因子基因表达谱.

1.7.2 油橄榄WRKY参与水分胁迫基因的表达 将WRKY转录因子基因表达谱数据录入派森诺基因云在线软件作基因表达交互热图.水分胁迫基因表达谱数据的处理及筛选采用每千个碱基的转录每百万映射读取的Fagments(FPKM)对表达量进行标准化,保留所有FPKM数据,对其进行排序,删除FPKM无变化或者变化范围不超过2倍的数据,筛选出基因表达量变化最大的15个基因.

2 结果与分析

2.1 油橄榄WRKY转录因子家族成员的基本信息

通过对油橄榄基因组中WRKY基因的搜索,共鉴定出107个成员,有2个成员具有相同的蛋白序列,原始基因组数据中的2个成员具有不同的蛋白登录号和基因编号,但蛋白序列是一样的,属于相同的2个拷贝,故只保留了相同蛋白序列的1个基因,最后剩下106个油橄榄WRKY家族成员.利用KaKs_Calculator 2.0生物信息学分析软件计算Ka、Ks和Ka/Ks,发现Ka>Ks,且Ka/Ks>1,P<0.05,表明油橄榄基因组在进化过程中受正向选择.该106个蛋白所含氨基酸的大小为132~1 368 bp,平均氨基酸个数为357个.其中,油橄榄WRKY蛋白的氨基酸数目小于300个的基因序列有40个,数目为300~700个的基因序列有64个,数目大于700个的基因序列有2个.

2.2 油橄榄WRKY蛋白的理化性质

利用ExPASy Protparam Tool在线软件分析油橄榄WRKY蛋白的基本性质,发现在106个WRKY蛋白中有61个蛋白的理论等电点(PI)小于7,45个蛋白的PI大于7,PI最小值为4.81(WRKY103),最大值为10.16(WRKY90),平均值为7.13.油橄榄WRKY转录因子家族中有6个蛋白的不稳定系数小于40,为稳定蛋白,其余96个蛋白的不稳定系数大于40,为不稳定蛋白,表明油橄榄WRKY转录因子家族大多为不稳定蛋白.分析蛋白的亲、疏水性,从油橄榄WRKY蛋白的脂肪族系数来看,该106个WRKY蛋白的脂肪族系数均小于100,表明其均为亲水性蛋白,但从亲水性平均系数来看,油橄榄WRKY蛋白的亲水性不强.预测油橄榄WRKY氨基酸序列磷酸化和O-糖基化修饰情况,发现平均磷酸化位点有78.1个,O-糖基化位点平均有1.7个.在蛋白信号肽预测中发现106个WRKY蛋白都不存在信号肽.亚细胞定位显示,106个WRKY蛋白均定位于细胞核中.通过Prabi在线软件预测蛋白的二级结构,发现所有油橄榄WRKY蛋白的二级结构均有4种,即α-螺旋、β-转角、无规卷曲、延伸链,其中,以无规则卷曲为主要结构,α-螺旋为次要结构,β-转角和延伸链所占比例较少.

2.3 油橄榄WRKY蛋白的系统进化树

利用MEGA7进化树编辑软件对油橄榄106个WRKY转录因子及模式植物拟南芥的72个已知的WRKY蛋白进行系统进化树分析.结果(图1)显示,油橄榄WRKY蛋白与拟南芥WRKY蛋白分类一致,分为Ⅰ、Ⅱ、Ⅲ类.第Ⅰ类成员最少,包含2个WRKY结构域;第Ⅱ类成员最多,含有1个C2-H2锌指结构和1个WRKY保守结构域,根据锌指结构位点的不同,又将其分为Ⅱa、Ⅱb、Ⅱc、Ⅱd、Ⅱe等5个亚类;第Ⅲ类含有1个WRKY保守结构域和1个C2-HC锌指结构.蛋白系统进化树中的3个大类和5个亚类同时包含油橄榄和拟南芥的WRKY基因,表明拟南芥和油橄榄的WRKY家族在进化水平上具有较高的相似性.从进化树分支关系可以看出,油橄榄3个大类的分支关系都较近,表明油橄榄WRKY基因家族在进化过程中的相似度越来越高.油橄榄WRKY七肽核心基序除了WRKYGQK外还含有WRKYGKK、WRKYNQK、WKKYRQK、WKKYGQK这4种变异类型.利用DNAMAN生物信息学分析软件对油橄榄WRKY蛋白进行比对,结果(图2)显示:第Ⅰ类有2个WRKYGQK保守结构域,第1个位点在984至991之间,第2个位点在1 214至1 221之间,锌指结构在WRKY保守结构域后面;第Ⅱ类的1个WRKY结构域位点在414至421之间;第Ⅲ类的1个WRKY保守结构域位点在142至148之间;此外还有14个(WRKY8、WRKY22、WRKY28、WRKY41、WRKY47、WRKY58、WRKY65、WRKY82、WRKY85、WRKY86、WRKY87、WRKY90、WRKY93、WRKY100)异常结构基因单独归为一类,它们都具有WRKY结构域,但锌指结构不一样,这些异常的WRKY蛋白被归为Ⅳ类.然而,这些蛋白可能代表假基因或测序和装配错误[16].

系统进化树包含Ⅰ、Ⅱ、Ⅲ 3个大类和Ⅱa、Ⅱb、Ⅱc、Ⅱd、Ⅱe 5个亚类;At:拟南芥,Oe:油橄榄.图1 油橄榄和拟南芥WRKY蛋白的系统进化树Fig.1 Phylogenetic tree of WRKY proteins from olive and Arabidopsis

Ⅰ、Ⅱ、Ⅲ、Ⅳ分别表示4类油橄榄WRKY蛋白;一致的基序在黄色框中突出,高度保守的氨基酸被显示在黑色框中,保守较少的被显示在蓝色和粉色框中,而不相似的氨基酸被显示在黑色文字中;在Ⅰ组蛋白中,红线表示没有显示出来的保守度较低的间歇序列;Oe:油橄榄.图2 油橄榄WRKY蛋白多重序列比对Fig.2 Multiple sequence alignment of olive WRKY proteins

2.4 油橄榄WRKY的保守元件、基因结构

通常情况下,含有相同元件的基因具有相似的转录调控功能.利用MEME在线软件对油橄榄WRKY家族基因进行保守元件分析,得到相关性最高的10个元件.其中,基序1和基序3为油橄榄WRKY七肽保守结构域,油橄榄WRKY基因除了WRKY2、WRKY5、WRKY59、WRKY69外都包含1~2个WRKYGQK七肽段区域,而WRKY2、WRKY5、WRKY59、WRKY69经验证后表明都属于WRKY转录因子,但在进化过程中,其结构域发生了变异,基序2和基序4均表示油橄榄WRKY家族的锌指结构,所有油橄榄WRKY基因都含有锌指结构,表明保守基序分析结果与系统进化树比对结果一致.基序5、基序7和基序9为未知保守结构域,基序5只分布于Ⅱa、Ⅱc、Ⅱd、Ⅱe类家族,基序7分布于Ⅰ、Ⅱb类家族,基序9分布于Ⅱd、Ⅲ类家族,这一情况体现了家族成员进化的保守性.

2.5 油橄榄WRKY的外显子和内含子

通过油橄榄基因组数据和NCBI在线软件分析得到油橄榄WRKY基因外显子的位点及分布.根据外显子位点计算外显子数和长度,得到油橄榄WRKY基因内含子和外显子的结构.WRKY61含有外显子数最多(17个),WRKY69含有外显子数最少(1个),平均每个油橄榄WRKY含外显子数为3.94个,转录因子基因长度变化范围为423 bp(WRKY69)至11 939 bp(WRKY55),平均大小为1 912 bp.油橄榄WRKY基因家族的内含子和外显子结构变化较大,这表明油橄榄基因组在长期进化过程中经历了较大的变异选择.

2.6 油橄榄WRKY转录因子水分胁迫基因的表达谱

本课题组前期进行油橄榄水分胁迫(干旱、水淹)试验,发现在相同的胁迫条件下,‘TYZ-1号’的抗旱能力和耐涝能力强于‘佛奥’.‘佛奥’的叶片在干旱胁迫第18天时开始出现枯死,第27天完全枯死;‘TYZ-1号’的叶片在第18天开始出现枯死,第36天完全枯死.根据该试验结果,统计在正常浇水情况下及水分胁迫下2个品种叶片和根系的FPKM数据,得到油橄榄WRKY转录因子水分胁迫基因表达交互热图(图3).从图3可以看出:与正常浇水相比,‘TYZ-1号’在应对干旱胁迫时,其叶片有40个WRKY基因表达为上调,占37.7%,66个基因表达为下调,占62.2%;根系有59个WRKY基因表达为上调,占55.6%,47个基因表达为下调,占44.3%.而‘佛奥’在应对干旱胁迫时,其叶片有59个WRKY基因表达为上调,占55.6%,47个基因表达为下调,占44.3%;根系有60个WRKY基因表达为上调,占56.6%,46个基因表达下调,占43.3%.在水淹胁迫下,‘佛奥’根系有50个WRKY基因表达为上调,占47.1%,56个基因表达为下调,占52.8%;叶片有75个WRKY基因表达为上调,占70.7%,31个基因表达为下调,占29.7%.而‘TYZ-1号’在应对水淹胁迫时,其根系有55个WRKY基因表达为上调,占51.8%,51个基因表达为下调,占48.1%;叶片有44个WRKY基因表达为上调,占41.5%,62个基因表达为下调,占58.4%.图3中,色块的深浅表示基因表达量变化的大小,显示在未受水分胁迫时,‘TYZ-1号’本底水平基因的表达量高于‘佛奥’,‘TYZ-1号’叶片有85个基因的表达量高于‘佛奥’,根系有60个基因的表达量高于‘佛奥’;在受到水分胁迫后,‘TYZ-1号’基因表达量的变化不显著,色块普遍较浅,而‘佛奥’中的深色块多于‘TYZ-1号’,表明‘佛奥’基因上调或下调表达量较显著.从水分(干旱、水淹)胁迫基因表达谱数据中筛选出15个抗旱相关基因(WRKY18、WRKY14、WRKY51、WRKY39、WRKY47、WRKY20、WRKY77、WRKY41、WRKY91、WRKY30、WRKY50、WRKY40、WRKY1、WRKY66、WRKY92)和15个水淹胁迫相关基因(WRKY14、WRKY51、WRKY37、WRKY1、WRKY77、WRKY66、WRKY4、WRKY91、WRKY21、WRKY103、WRKY94、WRKY96、WRKY74、WRKY92、WRKY65).其中,WRKY14、WRKY51、WRKY77、WRKY91、WRKY1、WRKY66、WRKY92在干旱和水淹胁迫下都起重要作用,基因表达量变化较大.

F表示‘佛奥’,O表示‘TYZ-1号’;D表示干旱,S表示水淹,N表示正常浇水;R表示根,L表示叶片;Oe表示油橄榄.图3 油橄榄WRKY转录因子水分胁迫基因表达交互热图Fig.3 Interactive heat map of expressions of genes encoding WRKY transcription factors in olive under water stress

3 讨论与结论

油橄榄基因组包含106个WRKY家族基因,大体分为Ⅰ、Ⅱ、Ⅲ类.随着下一代测序技术的成熟,WRKY作为调节植物各种生理过程的转录因子之一,已在多种植物中被挖掘及鉴定,如向日葵(HelianthusannuusL.)基因家族包含117个WRKY转录因子[17],茶树[Camelliasinensis(L.) O. Ktze]含有56个[18],枇杷[Eriobotryajaponica(Thunb.) Lindl.]含有33个[19],石榴(PunicagranatumL.)含有69个[20],海岛棉(GossypiumbarbadenseLinn.)含有180个[21].本研究通过分析油橄榄基因组数据,发现了106个WRKY转录因子.WRKY家族中的转录因子数量不但与物种基因组有关,还与植物长期进化过程中受外界环境的影响有关.与其他物种相比,油橄榄WRKY转录因子的数量属于中等类型,从这一结果可以推测,在油橄榄的自然进化过程中,WRKY基因家族受到一定的外部环境压力.

本研究前期田间试验的结果表明,‘TYZ-1号’表现出的抗旱性及耐涝性明显强于‘佛奥’,这个性状出现的原因有二:其一,‘佛奥’对水分胁迫的应激表达过于剧烈,后期不能得到缓解,导致‘佛奥’不适应水分胁迫;其二,未受水分胁迫时,‘TYZ-1号’基因本底表达量高于‘佛奥’,这表明‘TYZ-1号’可能一直处于防御状态,在胁迫中能很好地做出应答.本研究筛选出15个干旱胁迫相关基因和15个水淹胁迫相关基因,发现有7个相同的基因(WRKY14、WRKY51、WRKY77、WRKY91、WRKY1、WRKY66、WRKY92)共同调控干旱和水淹胁迫,这7个基因可能是水分胁迫调控的主要基因.查阅大量相关文献发现,关于调控水淹胁迫的WRKY转录因子鲜见报道,此类转录因子在水淹胁迫下的作用机制尚不清楚,有待进一步研究.但关于调节抗旱机制的WRKY转录因子报道有很多,如:拟南芥WRKY48、WRKY57参与了干旱调控[22];小麦(TriticumaestivumL.)WRKY16、WRKY24参与了干旱调控[23];小麦WRKY2、WRKY19转基因到拟南芥中,提高了拟南芥的抗旱能力[24];拟南芥中过表达的水稻WRKY45提高了拟南芥的耐旱性[25];水稻中过表达的WRKY11增强了耐旱性[26];大豆WRKY35基因增强了烟草的耐旱能力[27];拟南芥中过表达的大豆WRKY13、WRKY21、WRKY54增强了拟南芥的非生物胁迫能力[28];大麦(HordeumvulgareL.)WRKY38提高了抗旱能力[29];小麦WRKY44过表达到烟草中可提高烟草的耐旱性[30];遏蓝菜WRKY53提高转基因烟草(NicotianatabacumL.)的抗旱能力[31].将这些转录因子与油橄榄WRKY转录因子构建系统进化树,结果(附件图Ⅰ,扫OSID码可见)显示,15个抗旱相关因子在系统进化树中并没有全部聚在同一分支上,但小麦WRKY2、小麦WRKY19、大麦WRKY38、大豆WRKY21这4个基因与上述筛选出的7个油橄榄抗性相关的转录因子中的4个(WRKY14、WRKY51、WRKY91、WRKY92)属于同一分支,油橄榄这4个转录因子与小麦WRKY2、小麦WRKY19、大麦WRKY38、大豆WRKY21的相似度更高,推测油橄榄WRKY14、WRKY51、WRKY91、WRKY92与植物干旱胁迫的关系更为密切.作为核蛋白,小麦WRKY2、WRKY19的表达受干旱胁迫和脱落酸(ABA)诱导表达[24],油橄榄WRKY92与其相似度较高,并且在干旱胁迫中发挥重要的调节作用,推测油橄榄WRKY92通过调节内源激素脱落酸的表达水平使其进入生长停滞或半停滞状态以抵御干旱胁迫,这与油茶干旱胁迫响应机制[32]一致.已有研究表明在不同程度的水分胁迫下,油橄榄叶肉细胞中脯氨酸、丙二醛、可溶性糖和可溶性蛋白的含量随胁迫程度的加剧而变化[33],不同品种油橄榄在水分胁迫下的脯氨酸、丙二醛、可溶性糖和可溶性蛋白含量变化不同,而脯氨酸含量与超氧化物歧化酶(SOD)、过氧化物酶(POD)活性有一定的相关性.本课题组前期试验结果表明,‘TYZ-1号’抗旱性强于‘佛奥’,这个结果可推测‘TYZ-1号’抗性相关基因WRKY14、WRKY51、WRKY91、WRKY92可能通过调节细胞中脯氨酸、丙二醛、可溶性糖和可溶性蛋白的含量来抵御胁迫的危害,但具体的代谢通路需要进一步分析验证.

水分胁迫下的基因表达谱数据显示,油橄榄WRKY转录因子在不同胁迫(干旱、水淹)及不同部位(根、叶)的基因表达量均存在差异,这表明油橄榄WRKY基因参与了对水分胁迫的响应.基因表达谱数据显示,在油橄榄叶片和根系响应干旱胁迫时,根系基因表达量总是高于叶片,这个结果表明根系作为植物吸收水分和各种养分的重要器官,受到干旱胁迫时,首先会对逆境做出应答.

猜你喜欢
进化树油橄榄外显子
基于改进EfficientDet的油橄榄果实成熟度检测
肌营养不良蛋白基因检测的评价
云南省玉龙纳西族自治县金沙江干热河谷区油橄榄种植技术
大学生对进化树的常见误解
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
人类组成型和可变外显子的密码子偏性及聚类分析