水稻WRKY转录因子家族的生物信息学分析

2019-07-19 06:43王鹏洋曲姗姗梁源
安徽农业科学 2019年12期
关键词:生物信息学水稻

王鹏洋 曲姗姗 梁源

摘要 [目的]对水稻WRKY转录因子家族成员进行生物信息学分析,为进一步研究水稻WRKY转录因子的功能提供依据。[方法]从NCBI网站下载水稻全基因组序列,利用CDD、Blast、MEME、MEGA、ProtParam等在线工具或本地软件筛选WRKY家族成员,对所得WRKY家族成员的理化性质、系统进化亲缘关系、保守元件等项目进行生物信息学分析。[结果]共从水稻基因组中鉴定筛选出65个WRKY家族成员,每一个成员中都具有WRKYGQK的保守元件,除此之外还有一个保守锌指结构的元件存在。利用MEGA对所得WRKY家族成员进行聚类发现,65个WRKY家族成员可以分为A、B、C、D、E 5类,其中A、B、C、D 4类的亲缘关系较近,可以聚为一类;而A类相对亲缘关系较远,认为A类成员可能是长期进化过程中被保留下来的较为原始的一类。[结论]该研究较系统地鉴定了水稻WRKY家族,为进一步研究水稻WRKY转录因子功能和互作关系提供参考。

关键词 水稻;WRKY转录因子;生物信息学;系统进化树

中图分类号 Q 943.2  文献标识码 A

文章编号 0517-6611(2019)12-0123-04

doi:10.3969/j.issn.0517-6611.2019.12.033

开放科学(资源服务)标识码(OSID):

Abstract [Objective]Bioinformatics analysis of WRKY transcription factor family members in rice was carried out to provide basis for further study on the function of WRKY transcription factor family in rice.[Method]The whole genome sequence of rice was downloaded from NCBI website.The WRKY family members were screened by CDD,Blast,MEME,MEGA,ProtParam and other online tools or local software.The physical and chemical properties,phylogenetic relationships and conservative elements of the WRKY family members were analyzed by bioinformatics.[Results]A total of 65 WRKY family members were identified from the rice genome,each of which had a conserved element of WRKYGQK,in addition to a conserved zinc finger structure.Using MEGA to cluster the obtained WRKY family members,65 WRKY family members can be divided into A,B,C,D,E 5 categories,among which A,B,C,D 4 are closely related and can be clustered into one group;while class A is relatively distantly related,and it is considered that class A members may be a relatively primitive class that has been preserved during longterm evolution.[Conclusion]This study systematically identified the WRKY family of rice,and provided a reference for further study on the function and interaction of WRKY transcription factors in rice.

Key words Rice;WRKY transcription factor;Bioinformatics;Phylogenetic tree

水稻(Oryza sativa)被譽为五谷之首,是我国的主要粮食作物之一,其生产史悠久,种植分布广泛,我国水稻主产区主要是东北地区、长江流域、珠江流域[1]。稻米中有丰富的营养,如碳水化合物、蛋白质和一些矿物元素。据统计,世界上近一半人口都以稻米为食[2-3]。

WRKY是存在于植物中的最大且最重要的转录因子家族之一,因其存在WRKYGQK(色氨酸-精氨酸-赖氨酸-酪氨酸-甘氨酸-谷氨酰胺-赖氨酸)结构域而得名,该结构域十分保守[4]。WRKY转录因子是通过与靶基因启动子中的W-box相互作用来启动应答的,一种应答反应常常需要多个WRKY因子的协同作用,而同一个WRKY转录因子有可能在多组应答作用中发挥功能[5]。在多种植物中都存在WRKY转录因子,如拟南芥(Arabidopsis thaliana)中有74个、番茄(Lycopersicon esculentum Mill.)中有81个、苹果(Malus pumila Mill.)中有116个[6]。

WRKY转录因子在应对逆境胁迫时可以发挥重要功能[7]。有研究表明,许多WRKY基因有参与抗病过程的功能,其参与途径一般为调控抗病相关基因的转录[8]。WRKY还在干旱、低温、高盐的情况下表达以降低植物受到的伤害,例如WRKY13选择性的结合到SNAC1启动子区不同的顺式作用元件上通过调节气孔闭合来提高对干旱的抗性[9];WRKY1、WRKY7、WRKY22等基因在低温情况下有应激反应[10];WRKY75是对盐胁迫响应的重要调控因子[11]。因此解析WRKY基因的生物学功能对建立植物对逆境胁迫的调控信号网络意义重大,也可对植物分子改良提供理论基础。该研究拟对水稻WRKY进行生物信息学分析,以期全面了解水稻WRKY蛋白的基本性质、结构特点及系统进化等信息,为WRKY基因的进一步研究提供依据。

1 材料与方法

1.1 数据来源 从NCBI(https://www.ncbi.nlm.nih.gov/assembly/GCA_000004655.2)上下载水稻的全基因组序列,以染色体为单位下载,共12条染色体。用NCBI中的在线工具CDD[12](https://www.ncbi.nlm.nih.gov/cdd)得到WRKY转录因子家族的保守简并结构域(LDDGYRWRKYGQKVVKGNPYPRSYYKCTTPGCGVRKHVERAATDPKAVVTTYEGKHNH),并以该结构域作为后续Blast的探针。

1.2 试验方法

1.2.1 数据筛选。运用本地Blast软件,采用tBlastn[13]算法,以水稻12条染色体的全基因组为数据库,以WRKY保守结构域为探针进行比对,E-value值设为1e- 5,手动除去短的干扰序列,输出分值比较高的比对结果。上述tBlastn算法比对输出的结果为蛋白序列,将其逐条于水稻数据库(http://rice.plantbiology.msu.edu/)的在线Blastp算法比对以获得WRKY蛋白的全序列。

1.2.2 数据的筛选与鉴定。将从水稻数据库获得的WRKY蛋白输入CDD,有WRKY保守结构域的蛋白质才被确定为WRKY家族成员。应用在线工具MEME(http://meme-suite.org/tools/meme)对WRKY家族成员做鉴定,寻找该家族是否有其他共有的保守序列,设定保守序列长度为2~600个氨基酸残基,最多检测10个保守序列,其余参数为默认,并得到保守序列处于蛋白位置的示意图。

1.2.3 WRKY家族成员系统进化分析。将筛选鉴定得到的WRKY蛋白质序列以fasta格式保存,利用软件MEGA(Molecular Evolutionary Genetics Analysis)中的ClustalW进行序列比对,再利用MEGA中PHYLOGENY功能的邻接法(neighbor-joining)[14-15],设置NO.of Bootstrap Replications值为1 000,Number of Threads值为3,其余参数为默认,作出WRKY家族的系统进化树。

1.2.4 WRKY家族成员蛋白的理化性质分析。利用在线工具ProtParam(https://web.expasy.org/cgi-bin/protparam/protparam)对WRKY家族成员蛋白作理化性质预测与分析,分别预测了分子质量(Molecular weight)、等电点(PI)、不稳定系数(Instability index)和总平均亲水性(Grand average of hydropathicity)。

2 结果与分析

2.1 水稻WRKY转录因子家族的鉴定及理化性质分析 通过筛选鉴定得到水稻WRKY转录因子家族成员65个,鉴定依据为蛋白序列中存在WRKYGQK保守基序,WRKY家族成员的命名采用水稻数据库中的名字,登录号为水稻数据库中该蛋白对应基因的登录号,并统计了蛋白氨基酸数目、对应基因的ORF长度、蛋白相对分子质量、等电点、不稳定系数和总平均亲水性。据统计,水稻WRKY家族中蛋白氨基酸数目最多为1 002个,最少为181个,极差较大,平均值为400个氨基酸。等电点范围为4.52~10.20,其中小于7的有39个,大于7的有26个,说明该家族蛋白质更偏向于弱酸性。相对分子质量在18 481.3~109 042.29之间。该家族中不稳定系数只有3个成员小于40,为稳定蛋白,其余均为不稳定蛋白。总平均亲水性均为负值,说明WRKY家族成员均为亲水蛋白。

2.2 WRKY家族成员系统进化分析结果 为得到WRKY家族中各成员间的同源进化关系,笔者采用系统进化分析的方法,将鉴定得到的65个家族成员输入MEGA绘制系统进化树(图1)。根据进化树的聚类结果将这65个成员分为A、B、C、D、E 5类,其分别包括WRKY基因9、16、12、11和17个,A类中的WRKY成員最少,E类中的WRKY成员最多。从进化树分支关系中还可以得到B、C、D、E 4类的亲缘关系相对较近聚为一大类,而A类相对关系较远,认为可能A类成员是在长期进化过程中保留下来的较原始的一类。根据进化树分组结果将家族成员分组进行比对发现,每组的保守氨基酸都各不相同,但相同的是所有组都有WRKY保守序列(图2)。其中C组中同组完全保守氨基酸较多,E组中完全保守氨基酸较少。B、C、D、E 4组比较相似,它们与A组成员相差较远,其差异主要表现在后半部分,从第1个保守的半胱氨酸(C字母)开始出现差异,第2个半胱氨酸相对于其他4组更晚出现,且碳端保守组氨酸(H字母)也出现的更晚,这些是由于长期进化而出现的序列差异。

2.3 保守元件分析 利用在线工具MEME寻找WRKY家族的保守元件,发现除WRKYGQK的保守元件,该家族中还具有1个锌指结构[16],A组中该锌指结构为C-X7-C-X22-28-H-X-H,B组和C组中该锌指结构为C-X5-C-X23-H-X-H,而D组和E组中该锌指结构为C-X4-C-X23-H-X-H,其中X可以是任意氨基酸,但X中也有相对保守的氨基酸存在。

3 结论与讨论

WRKY转录因子家族是在植物中广泛存在的一类重要蛋白,其可以在很多逆境胁迫中发挥作用以减少逆境对植物带来的伤害,因此对WRKY家族的研究至关重要。常常有多个WRKY协同发挥一个功能,但WRKY转录因子与基因之间或两个WRKY之间是如何协同进行信号转导的,该机制尚不清楚,仍需进一步阐明和完善。该研究对水稻WRKY转录因子家族成员的理化性质、系统进化亲缘关系、保守元件等项目的生物信息学分析。结果表明,水稻WRKY转录因子家族成员共有65个,每一个成员中都具有WRKYGQK的保守元件,除此之外还有一个保守锌指结构的元件存在。利用MEGA对所得WRKY家族成员进行聚类发现,65个WRKY家族成员可以分为A、B、C、D、E 5类,其中A、B、C、D 4类的亲缘关系较近,可以聚为一类;而A类相对亲缘关系较远,认为A类成员可能是长期进化过程中被保留下来的较原始的一类。该研究认为,水稻基因组中共有65个WRKY转录因子,这与Ross等[17]在日本晴水稻上得出的结论不同,可能是由于所选用的水稻基因组数据、筛选方式以及结构域探针不同等因素导致的。该研究较系统地鉴定了水稻WRKY家族,为学者研究WRKY转录因子功能和互作关系提供生物信息学信息,有利于对WRKY的进一步深入研究。未来对WRKY转录因子的研究重点依然在明确WRKY在植物受逆境胁迫时的信号转导途径,以及利用WRKY对作物和林木进行分子改良以开发其巨大的应用价值。

参考文献

[1]ZHU D W,QIAN Z H,WEI H Y,et al.The effects of field preharvest sprouting on the morphological structure and physicochemical properties of rice (Oryza sativa L.) starch[J].Food chemistry,2019,278:10-16.

[2] YADAV S,GILL S S,PASSRICHA N,et al.Genomewide analysis and transcriptional expression patternassessment of superoxide dismutase (SOD) in rice and Arabidopsis under abiotic stresses[J].Plant gene,2019,17:1-9.

[3] 朱景福,李芳,鹿保鑫.基于聚类改进的Fisher与KNN判别分类算法对比研究[J].安徽农业科学,2019,47(1):250-252,257.

[4] 谷彦冰,冀志蕊,迟福梅,等.苹果WRKY基因家族生物信息学及表达分析[J].中国农业科学,2015,48(16):3221-3238.

[5] 赵楠楠,刘立峰.植物WRKY转录因子及其生物学功能[J/OL].分子植物育种.[2018-12-25].http://kns.cnki.net/kcms/detail/46.1068.S.20181218.1113.004.html.

[6] ISHIGURO S,NAKAMURA K.Characterization of a cDNA encoding a novel DNAbinding protein,SPF1,that recognizes SP8 sequences in the 5' upstream regions of genes coding for sporamin and betaamylase from sweet potato[J].Molecular and general genetics,1994,244(6):563-571.

[7] ZHANG Y J,WANG L J.The WRKY transcription factor superfamily:Its origin in eukaryotes and expansion in plants[J].BMC Evolution Biology,2005,5(1):1-12.

[8] 刘梦佳,李海峰.水稻WRKY转录因子家族研究进展[J].河南农业科学,2016,45(3):1-8.

[9] 肖俊.水稻WRKY13通过选择性结合不同顺式作用元件调控非生物和生物胁迫信号路径间的互作[D].武汉:华中农业大學,2013.

[10] 周丽霞,曹红星.低温胁迫下油棕WRKY转录因子基因的表达特性分析[J].南方农业学报,2018,49(8):1490-1497.

[11] 万永青,毛铭铢,万东莉,等.中间锦鸡儿WRKY75基因对拟南芥耐受盐和ABA能力的影响[J].西北植物学报,2018,38(1):17-25.

[12] 梁滨,董冬.植物WRKY转录因子的研究进展[J].生物学通报,2018,53(6):5-8.

[13] 刘洋,郑洋洋,宫超,等.番茄AS2基因家族的系统进化分析[J].基因组学与应用生物学,2018,37(9):3958-3965.

[14] SAITOU N,NEI M.The neighborjoining method:A new method for reconstructing phylogenetic trees[J].Molecular biology and evolution,1987,4(4):406-425.

[15] KUMAR S,STECHER G,LI M,et al.MEGA X:Molecular Evolutionary Genetics Analysis across computing platforms[J].Molecular biology and evolution,2018,35(6):1547-1549.

[16] 向贵生,王开锦,晏慧君,等.蔷薇科植物MLO蛋白家族的生物信息学分析[J].基因组学与应用生物学,2018,37(5):2043-2059.

[17] ROSS C A,LIU Y,SHEN Q J.The WRKY gene family in rice (Oryza sativa)[J].J Integr Plant Biol,2007,49(6):827-842.

猜你喜欢
生物信息学水稻
有了这种合成酶 水稻可以耐盐了
水稻种植60天就能收获啦
油菜可以像水稻一样实现机插
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用