拟南芥SBP基因家族生物信息学分析

2020-09-06 14:05姚远马勇
安徽农业科学 2020年15期
关键词:生物信息学拟南芥

姚远 马勇

摘要SBP基因家族是植物体中特异性存在的一类重要转录因子,主要功能是调控生物生长以及细胞分化。此次研究采用生物信息学的方法,对拟南芥SBP蛋白序列进行系统进化分析,并为其构建了系统发育树。由试验结果可以得出,拟南芥SBP基因家族共包括30个成员,分布在4条染色体上,其分布比较集中,分成三大亚族。拟南芥SBP蛋白具有的生物功能是控制生物生长以及细胞分化,调节基因表达以及谷胱甘肽的分解代谢过程,在Cu2+跨膜转运中也有一定作用。另外,有许多的蛋白序列还具有分子功能——调控转录因子活性。该研究所得结果均为拟南芥SBP转录因子的进一步功能分析提出了重要研究依据。

关键词拟南芥;生物信息学;SBP基因家族;进化分析

中图分类号Q943.2文献标识码A文章编号0517-6611(2020)15-0112-04

doi:10.3969/j.issn.0517-6611.2020.15.031

开放科学(资源服务)标识码(OSID):

Bioinformatics Analysis of SBP Gene Family in Arabidopsis thaliana

YAO Yuan1,2, MA Yong3

(1.Department of Neurology, Inner Mongolia Peoples Hospital, Hohhot, Inner Mongolia 010017;2.School of Life Sciences, Inner Mongolia University, Hohhot, Inner Mongolia 010060;3.Department of Biological Science and Technology, Baotou Teachers College, Baotou, Inner Mongolia 014030)

AbstractThe SBP gene family which existed in the specificity of the plant corpus is a kind of important transcriptional factor and its main function is to regulate and control biological growth and cell differentiation. In this study, bioinformatics methods were used to systematically analyze the sequence of A. thaliana SBP protein and build the phylogenetic tree for the sequence of A. thaliana SBP protein. The result of the experiment shows that the family includes 30 members, which is distributed on four chromosomes intensively and are divided into three subtribe. The biological function of A. thaliana SBP protein is a process of not only controlling biological growth and differentiation of cells, but also regulating gene expression and glutathione catabolism and it also plays an important role in the copper ions transport membrane.In addition,a great number of protein sequences have molecular functionregulating and controlling the activity of transcription factors.The results of this study provide important research basis for further functional analysis of A. thaliana SBP transcription factors.

Key wordsArabidopsis thaliana;Bioinformatics;SBP gene family;Evolutionary analysis

基金項目内蒙古自然科学基金项目(2017BS0315);内蒙古人民医院自然科学基金项目(2019YN09,2019BS01)。

作者简介姚远(1984—),男,内蒙古呼和浩特人,助理研究员,博士,从事生物化学与分子生物学研究。

*通信作者,副教授,从事植物分子生物学及基因工程研究。

收稿日期2020-01-05;修回日期2020-03-04

转录因子(transcription factor)又被称作反式作用因子。转录因子在植物体内的作用部位位于细胞核内,它是一种可以与某一指定基因上游相结合的,特异核苷酸序列上的蛋白质[1]。通常,转录因子在植物中与它相对应的顺式元件一起控制基因表达。也就是说转录因子进行着将基因翻译为蛋白质这一工作。研究发现,改变转录因子的表达对多个逆境有关功能基因的表达也起到一定的效果,从而对植物体的生长和发育、次生代谢以及抗逆性起到一定的调控作用。人们通过对转录因子的调控可以起到改良植物抗逆性的目的,对农作物农艺性状的改良以及新品种的培育都能获得较为理想的综合效果[2]。

在植物体中包含着数量巨大的转录因子,而在拟南芥(Arabidopsis thaliana)中就有将近27 000个基因,而这27 000个基因中有5.9%的基因都是编码转录因子的。人们按照这些转录因子与DNA结合区域的特点,将它们分成若干个家族[3]。

很早以前,人们在低等的苔藓植物中就已经发现一些转录因子家族。随着自然的发展,由低等水生植物进化到高等陆生植物,转录因子同时也随着植物的生长发育过程进行转变,它们自身变化的同时,也增进了植物从低等进化到高等的演变历程。对植物进化发育史以及基因的转变发展情况进行总结可以发现,植物体内富含有大量的转录因子,其中拟南芥、大豆和水稻中就分别有2 016、3 546和2 856个转录因子,在这些转录因子中作用最为显著,研究最多的有MADS、bZIP、WRKY和SBP等,这些转录因子之间也相互交错着,织成了一个复杂的植物调控网络,而这个SBP基因家族普遍存在于绿色植物中,别的生物上未见到有关的报道[4],因此SBP就被公认为是植物所独有的一种转录因子,现在在拟南芥中发现该家族共30个成员,这其中大部分已有文献报道。这类转录因子主要是参与植物的生长、发育,还有许多生理生化反应的信号传导过程。

SBP基因家族是被发现比较晚的转录因子家族之一。1996年,德国科隆马普研究所的Klein等[5]从金鱼草中克隆得到了2个基因SBP1和SBP2,经过研究发现它们可以与金鱼草花分生组织特征基因Squamosa启动子相结合,并可以调节它的表达,于是就将它命名为Squamosa启动子结合蛋白(squamosa promoter binding protein,SBP)。在这之后,Cardon等[6-7]又从拟南芥和玉米中陆续分离出了编码类似SBP蛋白的基因,因其中众多基因还没进行功能鉴定,所以将它们命名为类SBP基因(SBL),又因为它们中都含有编码DNA结合结构域的保守核苷酸序列,于是又将它们称为SBP盒基因(SBP-BOX)。

该研究是在拟南芥全基因组水平上,通过使用生物信息学的方法,鉴别了SBP基因家族的成员,而且进一步结合拟南芥家族基因,研究植物中SBP蛋白序列的进化联系,以期为更深入地研究拟南芥SBP基因家族的生物功能奠定基础。

1材料与方法

1.1数据来源

研究所使用的拟南芥全基因组数据都是从植物转录因子数据库Planttfdb(http:∥planttfdb.cbi.pku.edu.cn/)下载,并从该网站下载所需要的蛋白质数据包,保存至本地文件夹,建立拟南芥全基因组数据库[8]。

1.2拟南芥SBP基因家族蛋白生物信息学分析

1.2.1拟南芥SBP基因家族蛋白的搜索与鉴定。

以拟南芥SBP转录因子家族蛋白序列作为探针序列,使用NCBI(https:∥www.ncbi.nlm.nih.gov/)数据库中所包含的本地Blast功能对拟南芥蛋白质数据库进行查找,之后再使用SMART(simple modular architecture research tool)(http:∥smart.embl-heidelberg.de/)在线分析工具对候选蛋白的保守结构域进行分析,排除SBP基因家族蛋白序列中不具有保守结构域的蛋白序列,留下所需要的蛋白序列进行下一步分析与研究。

1.2.2拟南芥SBP基因家族系统发生学分析。

根据拟南芥SBP的保守结构域蛋白序列进行进化树分析,通过利用下载安装的MEGA 5.2.0软件里面的邻位相接法(NJ),构建拟南芥SBP转录因子候选蛋白系统发生树,鉴定拟南芥SBP家族蛋白成员之间的进化关系[9],默认的自举值(Bootstrap analysis)设置为1 000个重复,其他参数均设置為默认值。自举值与其可信度呈显著相关[10]。

1.2.3拟南芥SBP蛋白的保守域序列分析。

利用序列分析软件DNAMAN8.0对拟南芥SBP家族蛋白序列进行比对,参考Cardon等[6-7]的分类标准对所有的家族蛋白成员进行分析。

1.2.4拟南芥STRING蛋白网络调控数据库分析。

利用蛋白网络调控系统(STRING)对拟南芥SBP蛋白序列进行生物功能以及分子功能的分析。

2结果与分析

2.1拟南芥SBP基因家族成员的鉴定

使用NCBI数据库中所包含的本地Blast功能对拟南芥蛋白质数据库进行查找后得到30条含有典型SBP结构域的非冗余的蛋白序列,再经过SMART在线工具[11]进行分析后,没有发现不具有完整SBP结构域蛋白序列,由此认为30条序列均具有典型的SBP结构域(表1)。

30个SBP基因在染色体上分布情况如下:1号染色体15个(AT1G02065.1、AT1G02065.2、AT1G20980.1、AT1G27360.1、AT1G27360.2、AT1G27360.3、AT1G27360.4、AT1G27370.1、AT1G27370.2、AT1G27370.3、AT1G27370.4、AT1G53160.1、AT1G53160.2、AT1G69170.1、AT1G76580.1),2号染色体3个(AT2G33810.1、AT2G42200.1、AT2G47070.1),3号染色体3个(AT3G15270.1、AT3G57920.1、AT3G60030.1),5号染色体9个(AT5G18830.1、AT5G18830.2、AT5G18830.3、AT5G43270.1、AT5G43270.2、AT5G43270.3、AT5G50570.1、AT5G50570.2、AT5G50670.1)。

2.2拟南芥SBP基因家族的分类及系统发育分析

进化树分析(图1)表明,拟南芥SBP基因家族中AT5G50570.1、AT5G50570.2和AT5G50670.1;AT5G43270.1、AT5G43270.2和AT5G43270.3;AT1G53160.1和AT1G53160.2;AT1G02065.1和AT1G02065.2;AT1G27370.1、AT1G27370.2、AT1G27370.3和AT1G27370.4;AT1G27360.1、AT1G27360.2、AT1G27360.3和AT1G27360.4同源性较高,分别位于进化树的同一个分支,分化程度较少,推测这几组基因可能存在功能冗余现象。冗余现象是生命体在漫长的进化过程和适应环境过程中,为了降低外界恶劣环境对自身生长发育的不利影响而保存下来的生存对策。在生命系统中,生物为了维持它正常的生存以及繁衍,抵抗外界不利环境如病虫害、雨雪、干旱、霜冻、动物的采摘和食用对它们产生的影响,有必要在加强系统稳定性、可靠性的同时,准备好大量的备用元件,这是适应环境改变的一种生存策略。通常条件下,这些后备元件被称为冗余元件。在生命系统中,从每一个细胞、组织、器官到个体、群落,生态系统的各个层次中都存在一定的冗余现象,甚至在分子水平上也存在许多的冗余现象[12]。拟南芥SBP基因家族中存在的冗余现象也许是为了更加适应环境。

进化分析树表明,AT5G18830.1、AT5G18830.2与AT5G18830.3是SBP基因家族中亲缘进化关系最为接近的一组。由进化树可以直观地看出,SBP基因家族可以分成3个亚族,即Ⅰ、Ⅱ、Ⅲ,第Ⅰ亚族包括AT1G27370.1、AT1G27370.2、AT1G27370.3、AT1G27370.4、AT1G27360.1、AT1G27360.2、AT1G27360.3和AT1G27360.4;第Ⅱ亚族包括AT5G50570.1、AT5G50570.2、AT5G50670.1、AT5G43270.1、AT5G43270.2和AT5G43270.3,其余的归为第Ⅲ亚族。

2.3拟南芥SBP转录因子序列比对分析

通过DNAMAN8.0序列分析软件对拟南芥SBP结构域蛋白序列进行鉴定和分析。结果显示,拟南芥SBP中所有序列在第228位都具有绝对保守的氨基酸序列R*CQQC**F,在第189、194以及211位具有绝对保守的氨基酸序列C,在第204位具有绝对保守的氨基酸序列Y,在第208位具有绝对保守的氨基酸序列H(图2)。

2.4拟南芥STRING蛋白网络调控数据库分析利用STRING蛋白网络调控数据库(http:∥www.string-db.org/)逐一对拟南芥SBP蛋白序列生物功能和分子功能进行分析。拟南芥SBP转录因子中的30个蛋白序列的生物功能与分子功能如表2、3所示。

采用STRING蛋白网络调控系统对拟南芥SBP蛋白序列进行逐一分析试验,发现拟南芥SBP基因家族的有些蛋白序列对其生长发育没有作用,探究不到其参与的生物过程。通过数据分析,得到的初步结果为拟南芥SBP蛋白可能具有的生物功能是控制生物生长以及细胞分化,调节基因表达以及谷胱甘肽的分解代谢过程,在铜离子跨膜转运中也有一定作用。另外,有许多的蛋白序列还具有分子功能——调控转录因子活性。

3讨论

随着植物分子生物学的进一步发展,未来植物的改良技术将达到基因水平。植物转录因子的研究是目前生命科学研究的热点领域,使用生物信息学方法对其基因家族成员进行分析、鉴定、保守结构域分析、成员分类、系统进化树构建以及STRING蛋白网络系统的试验,发现并且证明有相当一部分转录因子的基因家族与植物对自然环境的防御能力以及生长发育等有关。有许多调控低温、高盐、干旱以及与植物体发育有关的转录因子已相继从高等植物中提取出来。SBP转录因子家族是一个发现比较晚的家族,对它进行生物学功能研究是一个十分重要的内容。现在,植物转录因子研究在拟南芥中进行得比较深入,而且已经构建了拟南芥转录因子数据库DATF[13](http:∥datf.cbi.pku.edu.cn/),这也为此次数据分析提供了丰富的经验和广泛的信息资源。

与普通的利用实验室进行的生物学研究相比较,生物信息学能够用较低的成本和较高的效率获得研究资源。通过对拟南芥中SBP基因家族序列的分析及其编码的蛋白质功能的分析,为研究SBP特性及其条件提供理论参考,并对拟南芥SBP功能研究具有重要的指导意义。

参考文献

[1] 刘强,张贵友,陈受宜.植物转录因子的结构与调控作用[J].科学通报,2000,45(14):1465-1474.

[2] 李洁.植物转录因子与基因调控[J].生物学通报,2004,39(3):9-11.

[3] 孙丽芳,邢少辰,张君,等.转录因子在植物进化和抗逆中的作用[J].基因组学与应用生物学,2009,28(3):569-577.

[4] 吴乃虎,刁丰秋.植物转录因子与发育调控[J].科学通报,1998,43(20):2133-2139.

[5] KLEIN J,SAEDLER H,HUIJSER P.A new family of DNA binding proteins includes putative transcriptional regulators of the Antirrhinum majus floral meristem identity gene SQUAMOSA[J]. Molecular and general genetics,1996,250(1):7-16.

[6] CARDON G H,HHMANN S,NETTESHEIM K,et al.Functional analysis of the Arabidopsis thaliana SBPbox gene SPL3:A novel gene involved in the floral transition[J].The plant journal,1997,12(2):367-377.

[7] CARDON G,HHMANN S,KLEIN J,et al.Molecular characterisation of the Arabidopsis SBPbox genes[J].Gene,1999,237(1):91-104.

[8] TIAN F,YANG D C,MENG Y Q,et al.PlantRegMap:Charting functional regulatory maps in plants[J].Nucleic acids research,2019,48:1-10.

[9] KUMAR S,TAMURA K,NEI M.MEGA:Molecular Evolutionary Genetics Analysis software for microcomputers[J].Bioinformatics,1994,10(2):189-191.

[10] 巴德仁貴,赵乾,任凤蕊,等.甜瓜持绿蛋白基因家族的全基因组鉴定及进化分析[J].广东农业科学,2014,41(13):136-139.

[11] RDEI G P.SMART(Simple modular architecture research tool)[M]//RDEI G P.Encyclopedia of genetics, genomics, proteomics and informatics.Netherlands:Springer,2008.

[12] 陈霞,罗世巧,段翠芳,等.高等植物转录因子研究进展[J].安徽农学通报,2008,14(9):48-52.

[13] GUO A Y,HE K,LIU D,et al. DATF:A database of Arabidopsis transcription factors[J]. Bioinformatics,2005,21(10):2568-2569.

猜你喜欢
生物信息学拟南芥
富天冬酰胺蛋白增强拟南芥辐射抗性的研究
尿黑酸对拟南芥酪氨酸降解缺陷突变体sscd1的影响
两种LED光源作为拟南芥生长光源的应用探究
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
过量表达URO基因抑制拟南芥次生细胞壁开关基因表达