油棕WRKY转录因子的全基因组鉴定与分析

2020-08-26 15:00周丽霞曹红星
广西植物 2020年7期
关键词:表达分析生物信息学基因组

周丽霞 曹红星

摘 要:該研究从NCBI网站下载油棕全基因组序列信息,从The Arabidopsis Information Resource(TAIR)数据库中下载得到拟南芥WRKY转录因子序列,并在油棕基因组数据库中进行BLAST同源序列比对分析,通过NCBI在线工具CDD和PFAM数据库进行蛋白结构与分析,剔除无WRKY结构域的系列,利用生物信息学方法对油棕WRKY转录因子进行分析及功能预测。结果表明:(1)从油棕基因组数据库中发掘WRKY转录因子95个,该WRKY转录因子蛋白质所编码氨基酸大小为116~1 303 bp,95个均为亲水性蛋白,总体为不稳定蛋白(EgWRKY25和EgWRKY56除外),60个蛋白以α-螺旋为主要二级结构元件,35个以无规卷曲为主要二级结构元件。(2)保守结构域系统进化树结果表明,油棕WRKY转录因子家族蛋白主要分为三大类,即I、Ⅱ和Ⅲ类,其中I类分为I C、I N亚类,Ⅱ类分为Ⅱ a、Ⅱ b、Ⅱ c和Ⅱ d亚类。(3)内含子和外显子结构显示,EgWRKY基因结构进化高度保守。以上结果为油棕WRKY转录因子的挖掘、功能分析及分子生物学研究奠定了基础,同时为分子育种和遗传改良提供了参考。

关键词:油棕,基因组,WRKY转录因子,生物信息学,表达分析

中图分类号:Q943

文献标识码:A

文章编号:1000-3142(2020)07-0977-11

Abstract:Genome-wide sequence information of oil palm from NCBI website,and the WRKY transcription factor sequence from The Arabidopsis Information Resource (TAIR) Database were downloaded,BLAST homology sequence alignment analysis was carried out in oil palm genome database. Protein structure and analysis were carried out through CDD and PFAM database of NCBI online tool,and the series without WRKY domain were eliminated. Bioinformatics analysis and functional prediction of WRKY transcription factor in oil palm. The results were as follows:(1) A total of 95 EgWRKY transcription factors were excavated,and they encoded 116-1 303 bp amino acids,predicting hydrophilic and unstable (except for EgWRKY25 and EgWRKY56). The main structure of 60 EgWRKY proteins was α-helix,and the remaining 35 proteins were irregular curl. (2) The phylogenetic analysis on conserved domain showed that EgWRKY transcription factor family proteins were divided into three categories (I,Ⅱ and Ⅲ). Category I could be separated into I C and I N,and Category Ⅱ was classified into Ⅱ a,Ⅱ b,Ⅱ c and Ⅱ d.  (3) The intron-exon structure analysis revealed that structures of EgWRKY gene were highly conserved. This research will lay a foundation for the study of WRKY transcription factor exacavation,function analysis,and molecular biology of oil palm and provide references for its genetic modification and molecular breeding.

Key words:oil palm,genome,WRKY transcription factors,bioinformatics,expression and analysis

植物经过长期的进化,自身形成了一套对抗不良环境的适应机制,植物受到胁迫后,通过相应的信号传递途径,诱导相关基因的表达以抵御胁迫,而基因的表达受到转录因子的调控(谢政文等,2016)。转录因子又称反式作用因子,其作为一类重要的调控基因,主要通过与基因启动子区域中的顺式作用元件结合来发挥调控作用,近年来已成为基因挖掘与功能分析领域的研究热点(贾翠玲和侯和胜,2010)。转录因子的特点为含有DNA结合域、转录调控区、核定位信号区及寡聚化位点等结构。根据DNA结合域结构的不同,转录因子又可分为MYB、WRKY、NAC、Zinx finger(锌指蛋白)等诸多家族(伍林涛等,2013)。

WRKY作为植物中最大的转录因子家族之一,通过结合植物次生代谢产物合成途径关键酶基因的启动子元件来调控植物的代谢过程(丁蒙蒙等,2018)。WRKY的N-末端具有7个高度保守氨基酸残基WRKYGQK,C端有1个非典型的锌指结构,其结构域由近60个氨基酸组成。根据WRKY结构域的数目及锌指结构的类型,WRKY蛋白可分为三个类型:第一类为含有2个WRKY结构域,锌指结构的类型为C2H2;第二类为含有1个WRKY结构域,锌指结构的类型为C2H2;第三类为含有1个WRKY结构域,锌指结构的类型为C2HC(伍林涛等,2013)。WRKY cDNA最初是从甘薯中克隆出来的(Ishiguro & Nakamura,1994),随后在其他植物如欧芹(Rushton et al.,1995)、野燕麦(Rushton et al.,1996)、拟南芥(Pater et al.,1996)、水稻(孙利军等,2014)、枣树(Xue et al.,2019)等不同物种中分离鉴定出来。谷彦冰等(2016)利用WRKY保守域全蛋白序列鉴定出61个桃WRKY基因,通过生物信息学分析发现桃WRKY蛋白分为I、Ⅱ和Ⅲ类型,应用半定量和荧光定量PCR技术发现有16个WRKY基因均在桃的根、茎、叶、花和果重表达。刘潮等(2017)基于桑树全基因组蛋白数据库,鉴定出55个桑树WRKY基因,通过系统进化分析将WRKY蛋白分为I、Ⅱ和Ⅲ類型,应用保守结构域分析发现WRKY蛋白序列高度保守,在植物抵御非生物胁迫过程中发挥作用。包昌艳等(2018)应用“红阳”猕猴桃全基因组数据,鉴定出89个WRKY基因,通过进化分析发现WRKY蛋白可分为I、Ⅱ和Ⅲ类型,有33个WRKY基因在猕猴桃根、叶、花和果四个器官中均有显著表达。Fei et al.(2019)从陇南大红袍花椒中分离鉴定出38个WRKY家族成员,其中ZbWRKY33是对干旱胁迫反应最敏感的成员之一,通过直接与乙烯合成前体基因asc结合调节花椒抵御干旱的能力。由此可见,诸多植物中WRKY转录因子均得到鉴定与分析,但目前针对油棕WRKY转录因子基因及蛋白质的鉴定与生物信息学分析的研究鲜见报道,本研究基于油棕基因组数据,利用生物信息学方法全面分析油棕WRKY转录因子家族结构及特征,为深入研究WRKY转录因子家族的生物学功能奠定基础。

1 材料与方法

1.1 EgWRKY序列获取与鉴定

油棕全基因组序列从NCBI下载获得,拟南芥WRKY基因序列从The Arabidopsis Information Resource(TAIR)数据库中下载获得(http://www.arabidopsis.org),以拟南芥WRKY序列为探针,阈值设定为e-10,在油棕基因组数据库中进行同源序列比对分析得到油棕WRKY基因序列,将得到的油棕WRKY基因序列在美国麻省理工学院在线基因扫描服务器(The GENSCAN Web Server at MIT)搜索以获得WRKY蛋白序列,通过NCBI在线工具CDD(http://www.ncbi.nlm.nih.gov/cdd)和PFAM数据库(http://pfam.xfam.org/)进行蛋白结构域分析,剔除无WRKY保守结构域的蛋白序列。

1.2 方法

1.2.1 EgWRKY蛋白理化性质分析 利用ProtParam分析EgWRKY蛋白的理化性质,利用NetPhos 3.1 Server和DictyOGlyc 1.1 Server预测氨基酸序列磷酸化及O-糖基化修饰情况,利用ProtScale分析蛋白质的亲/疏水性,利用SignalP和ProtComp预测蛋白的信号肽和亚细胞定位预测,应用SOPMA预测蛋白的二级结构。

1.2.2 EgWRKY的进化树、外显子及内含子分析

应用MEGA 6.06软件构建EgWRKY进化树,执行参数为Neighbor-Joining,Bootstrap重复1 000次。

2 结果与分析

2.1 EgWRKY转录因子家族成员基本信息

基于油棕全基因组数据及拟南芥WRKY基因序列,通过BLAST搜索同源序列和WRKY蛋白保守结构域鉴定,共挖掘95个油棕WRKY转录因子成员。由表1可知,该95个蛋白质所含氨基酸大小为116~1 303 bp,其中蛋白氨基酸数目小于300 aa的基因序列占35.8%,介于300~700 aa的基因序列占57.9%,大于700 aa的基因序列占6.3%。

2.2 EgWRKY蛋白理化性质分析

利用ProtParam在线软件(http://expasy.org/tools/protparam.html)分析EgWRKY蛋白的基本性质,预测结果如表2所示。95个WRKY蛋白中,56个蛋白的理论等电点(pI)小于7,39个蛋白的pI大于7,pI最小值为4.74(EgWRKY73),最大值为10.18(EgWRKY84),平均pI为7.15;EgWRKY25和EgWRKY56蛋白质的不稳定系数小于40,为稳定蛋白,其余93个EgWRKY蛋白的不稳定系数大于40,为不稳定蛋白,该结果表明EgWRKY转录因子家族大多为不稳定蛋白。利用NetPhos 3.1 Server在线软件(http://www.cbs.dtu.dk/services/NetPhos/)预测氨基酸序列磷酸化;利用DictyOGlyc 1.1 Server在线软件(http://www.cbs.dtu.dk/services/DictyOGlyc/)预测氨基酸序列的O-糖基化修饰情况,发现平均磷酸化位点有37.8个,O-糖基化位点有1.6个;利用ProtScale在线软件(https://web.expasy.org/protscale/)分析蛋白质的亲/疏水性,从EgWRKY蛋白的脂肪系数来看,该95个EgWRKY蛋白的脂肪系数均小于100,该结果表明其均为亲水性蛋白;利用SignalP 5.0在线软件(http://www.cbs.dtu.dk/services/SignalP/)预测蛋白的信号肽,发现5个EgWRKY蛋白存在信号肽(EgWRKY29、EgWRKY38、EgWRKY45、EgWRKY63及EgWRKY87),为分泌蛋白;利用ProtComp 9.0(http://linux1.softberry.com/berry.phtml?topic=protcomppl&group=programs&subgroup=proloc)在线软件预测蛋白亚细胞定位,结果表明95个EgWRKY蛋白中有84个定位在细胞核中,占总蛋白的88.3%,11个在细胞质中,推测可能参与细胞质基因的转录调控;应用SOPMA在线软件(https://npsa-prabi.ibcp.fr/cgi-bin/np sa_automat.pl?page=npsa_sopma.html)预测蛋白的二级结构,发现所有EgWRKY蛋白的二级结构均有4种,即α-螺旋、β-转角、无规卷曲及延伸链,其中60个EgWRKY蛋白以α-螺旋为主要结构,无规卷曲为次要结构,35个以无规卷曲为主要结构,α-螺旋为次要结构,β-转角及延伸链所占比例较少。

2.3 EgWRKY的进化树分析

利用MEGA 6.06对油棕95个WRKY转录因子蛋白的保守结构域进行系统进化树分析,结果如图1所示。油棕WRKY蛋白主要分为三大类,即Ⅰ、Ⅱ、Ⅲ类。其中,根据WRKY保守结构域所处的位置,将第I类分为I N和I C两个亚类;第Ⅱ类含有1个锌指结构和1个WRKY保守结构域,根据锌指结构的不同,又将其分为Ⅱ a、Ⅱ b、Ⅱ c及Ⅱ d四个亚类;第Ⅲ类是含有2个WRKY保守结构域。

2.4 油棕WRKY外显子及内含子

通过油棕基因组数据分析得到WRKY转录因子基因外显子和内含子的结构分布示意图(图2)。EgWRKY转录因子家族成员所含内含子数的范围为0~12个,平均每個EgWRKY含内含子数为2.99个。其中,EgWRKY42含有内含子数最多(12个),转录因子基因长度变化范围为477 bp(EgWRKY08)至89 167 bp(EgWRKY71),平均大小为5 992 bp,图2中阴影部分的数字代表该外显子翻译成部分WRKY保守结构域的长度。EgWRKY基因家族的结构变化较大,说明在长期进化过程中油棕基因组经历了较大的变异选择。

3 讨论与结论

随着高通量测序技术的成熟,WRKY作为调控植物多种生理过程的转录因子家族之一,已在多个物种中被挖掘及鉴定,如拟南芥基因组中含有72个WRKY转录因子(Ulker & Somssich,2004),黄瓜基因组中有132个WRKY转录因子(谷彦冰等,2015),棉花基因组中有116个WRKY转录因子(Dou et al.,2014),橡胶树基因组中含有81个WRKY转录因子(Li et al.,2014),桑树基因组中含有54个WRKY转录因子(Baranwal et al.,2016)及鹰嘴豆基因组中含有70个WRKY转录因子(Waqas et al.,2019)。本研究通过分析油棕基因组数据,挖掘出95个WRKY转录因子,WRKY家族中转录因子的数目不仅与物种的基因组相关,而且与植物在长期进化过程中所受的外界环境影响有关。油棕WRKY转录因子数目与其他物种相比,属于中等数目的类型,该结果可推测油棕在自然进化过程中,WRKY基因家族受到了一定的外界环境压力。

本研究通过预测油棕WRKY蛋白的二级结构,发现其以α-螺旋及无规卷曲为主,这与丁蒙蒙等(2018)报道结果相一致。本研究对油棕WRKY保守结构域进行系统进化分析,将油棕WRKY家族蛋白分为三大类,即I、Ⅱ、Ⅲ类,其中Ⅱ类又分为四个亚类。本研究中油棕95个WRKY家族成员均含有WRKYGQK保守基序,Ⅱ类均含有1个锌指结构及1个WRKY保守结构域,根据锌指结构和位置的不同又分为四个亚类,类似分类在拟南芥及桑树等物种中发现,该结果可推测植物WRKY基因家族在结构上具有高度保守性。油棕作为热带地区重要的油料作物之一,低温气候严重限制着油棕的大面积种植,若能挖掘与低温胁迫相关的调节基因,并对其功能进行预测,运用分子技术对油棕品种进行改良,提高其抗寒性,从而实现油棕大面积的种植。

参考文献:

BAO CY,DENG L,ZHOU J,et al.,2018. Genome-wide identification and analysis of the WRKY transcription factor gene family in kiwi fruit[J]. Mol Plant Breed,2(12):301-310.[包昌艳,邓浪,周军,等,2018. 猕猴桃WRKY转录因子家族全基因组鉴定与分析[J]. 分子植物育种,2(12):301-310.]

BARANWAL VK,NEGI N,KHURANA P,2016. Genome-wide identification and structural,functional and evolutionary analysis of WRKY components of mulberry[J]. Sci Reports,6:30794-30807.

DING MM,SHI XD,GU YX,et al.,2018. Transcriptome-based excavation and analysis of MYB family transcription factors in Phoebe zhennan[J]. Guihaia,38(1):90-100.[丁蒙蒙,時小东,顾雨熹,等,2018. 基于转录组的楠木MYB转录因子的挖掘及分析[J]. 广西植物,38(1):90-100.]

DOU LL,ZHANG XH,PANG CY,et al.,2014. Genome-wide analysis of the WRKY gene family in cotton[J]. Mol Genet Genom,289(6):1103-1121.

FEI XT,HOU LX,SHI JW,et al,2019. Patterns of drought response of 38 WRKY transcription factors of Zanthoxylum bungeanum Maxim[J]. Int J Mol Sci,20(1):68-85.

GU YB,JI ZR,CHI FM,et al.,2016. Genome-wide identification and expression analysis of the WRKY gene family in peach[J]. Hereditas,38(3):254-270.[谷彦冰,冀志蕊,迟福梅,等,2016. 桃WRKY基因家族全基因组鉴定和表达分析[J]. 遗传,38(3):254-270.]

GU YB,JI ZR,CHI FM,et al.,2015. Bioinformatics and expression analysis of the WRKY gene family in apple[J]. Sci Agric Sin,48(16):3221-3238.[谷彦冰,冀志蕊,迟福梅,等,2015. 苹果WRKY基因家族生物信息学及表达分析[J]. 中国农业科学,48(16):3221-3238.]

ISHIGURO S,NAKAMURA K,1994. Characterization of a cDNA encoding a novel DNA-binding protein,SPF1,that recognizes SP8 sequences in the 5 upstream regions of genes coding for sporamin and β-amylase from sweet potato[J]. Mol Genet Genet,244(6):563-571.

JIA CL,HOU HS,2010. Structure of plant WRKY transcription factors and their roles in plant defense response[J]. Tianjin Agric Sci,16(2):21-26.[賈翠玲,侯和胜,2010. 植物WRKY转录因子的结构特点及其在植物防卫反应中的作用[J]. 植物生理与生物技术,16(2):21-26.]

LI HL,GUO D,YANG ZP,et al.,2014. Genome-wide identification and characterization of WRKY gene family in Hevea brasiliensis[J]. Genomics,104(1):14-23.

LIU C,HAN LH,SONG PB,et al.,2017. Genome-wide identification and bioinformatics analysis for mulberry WRKY transcription factors[J]. J S Agric,48(9):1691-1699.[刘潮,韩利红,宋培兵,等,2017. 桑树WRKY转录因子的全基因组鉴定及生物信息学分析[J]. 南方农业学报,48(9):1691-1699.]

PATER S,GRECO V,PHAM K,et al.,1996. Characterization of a zinc dependent transcriptional activator from Arabidopsis[J]. Nucl Acids Res,24(23):4624-4631.

RUSHTON PJ,MACDONALD H,HUTTLY AK,et al.,1995. Members of a new family of DNA-binding proteins bind to a conserved cis-element in the promoters of α-Amy2 genes[J]. Plant Mol Biol,29(4):691-702.

RUSHTON PJ,TORRES JT,PARNISKE M,et al.,1996. Interaction of elicitor-induced DNA-binding proteins with elicitor response elements in the promoters of parsley PR1 genes[J]. EMBO J,15 (20):5690-5700.

SUN LJ,HUANG L,LI DY,et al.,2014. Comprehensive expression analysis suggests overlapping of rice OsWRKY transcription factor genes during abiotic stress responses[J]. Plant Physiol J,50(11):1651-1658.[孙利军,黄磊,李大勇,等,2014. 水稻OsWRKY转录因子对非生物胁迫响应的重叠表达特性分析[J]. 植物生理学报,50(11):1651-1658.]

ULKER B,SOMSSICH IE,2004. WRKY transcription factors:From DNA binding towards biological function[J]. Curr Opin Plant Biol,7(5):491-498.

WAQAS M,AZHAR MT,RANA IA,et al.,2019. Genome-wide identification and expression analyses of WRKY transcription factor family members from chickpea (Cicer arietinum L.) reveal their role in abiotic stress-responses[J]. Genes Genom,41(4):467-481.

WU LT,DU CF,ZHANG MQ,et al.,2013. The structure and function of WRKY transcription factors in abiotic and biotic stress[J]. Mol Plant Breed,11(4):634-638.[伍林濤,杜才富,张敏琴,等,2013. WRKY转录因子的结构及其在植物抗逆境胁迫中的功能[J]. 分子植物育种,11(4):634-638.]

XIE ZW,WANG LJ,CHEN JY,et al.,2016. Studies on WRKY transcription factors and their biological functions in plants[J]. J Agric Sci Technol,18(3):46-54.[谢政文,王连军,陈锦洋,等,2016. 植物WRKY转录因子及其生物学功能研究进展[J]. 中国农业科技导报,18(3):46-54.]

XUE CL,LI HT,LIU ZG,et al.,2019. Genome-wide analysis of the WRKY gene family and their positive responses to phytoplasma invasion in Chinese jujube[J]. BMC Genom,20(1): 464-478.

(责任编辑 周翠鸣)

猜你喜欢
表达分析生物信息学基因组
宏基因组测序辅助诊断原发性肺隐球菌
科学家开发出人工基因组高效简化策略
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
红花生育酚环化酶基因的克隆及表达分析
玉米纹枯病病菌y—谷氨酰转肽酶基因克隆与表达分析
信号分子与叶锈菌诱导下小麦病程相关蛋白1基因的表达分析
水稻OsCATA基因相互作用蛋白的筛选和表达分析