甘蔗抗坏血酸过氧化物酶的电子克隆及生物信息学分析

2013-05-16 07:27张云鹤李雪梅
关键词:信息学甘蔗克隆

黄 菲,张云鹤,李雪梅

(沈阳师范大学 化学与生命科学学院,沈阳 110034)

0 引 言

近年来,随着基因组和EST计划的发展,电子克隆(In silico cloning)也随之发展起来。它是以生物信息数据库中的EST(expressed sequence tag)、核酸序列和蛋白质等数据库为基础,利用生物软件对EST序列进行拼接延伸,从而获得目的基因的部分乃至全长的cDNA序列的新方法[1-2]。

逆境胁迫可以造成植物活性氧代谢紊乱,致使活性氧积累过度,造成植物机体损伤,影响植物体正常的生理代谢。因此,植物体内便会产生一系列氧清除剂去除体内的氧毒害来减弱或消除氧胁迫对植物所造成的的损伤。超氧化物歧化酶(SOD)、过氧化物酶(POD)、过氧化氢酶(CAT)和抗坏血酸过氧化物酶(APX)都是植物体内常见的氧清除剂。对于植物而言,APX与SOD,CAT相比在减弱或消除植物体内H2O2的毒害方面发挥着更关键的作用[3]。因此,APX的深入研究对植物体的生长发育和应对逆境胁迫具有较深远的意义。

本研究运用电子克隆的方法,以水稻种子序列为探针,通过甘蔗EST序列数据库进行比对分析,经过多次比对拼接得到甘蔗APX的cDNA序列,并对其进行生物信息学分析,分析和预测其结构与功能,并与其他植物进行同源性比较,为甘蔗抗氧胁迫进一步研究奠定基础。

1 材料与方法

1.1 电子克隆获得PX2基因序列

以水稻(Oryza sativa)抗坏血酸过氧化物酶OsAPX2基因(GeneBank登录号AB053297)为探针,运用NCBI中的Blast工具对甘蔗的EST数据库进行搜索,得到与探针序列同源性较高的一系列甘蔗EST序列,利用DNAMAN软件进行拼接、延伸,以拼接好的contig重叠群为新探针,再次搜索EST数据库,直到没有新的EST可供拼接。最后,将得到的序列在NCBI非冗余数据库进行比对,进行新基因确认。

1.2 生物信息学分析

利用ORF Finder在线检索S-APX2contig,预测并推导其编码区以及编码氨基酸序列。利用在线工具ProtParam分析甘蔗S-APX2基因及其他植物该基因的氨基酸组成以及理化性质,并进行对比。使用软件ProtScale和GOR4对该基因氨基酸序列的亲水性/疏水性以及二级结构进行预测,并利用NCBI保守结构数据库(CDD),分析该编码蛋白的保守结构域。利用在线工具NetPhos2.0Server、SignalP 4.0Serverh、Wolf psort和TMHMM分别对该蛋白质序列进行潜在磷酸化位点、信号肽预测、亚细胞定位、跨膜螺旋区的预测。通过GeneBank中的Blastp程序对甘蔗S-APX2基因编码氨基酸的同源性进行分析,运用DNAMAN对该基因的氨基酸序列和其它物种进行多重比对并构建系统进化树。

2 结果与分析

2.1 甘蔗PX2基因的获得

以水稻(Oryza sativa)OsAPX2基因(GeneBank登录号AB053297)作为查询探针,在NCBI的甘蔗EST库中检索,筛选出7条与该序列同源性较高的EST序列。利用DNAMAN对其进行反复拼接,并在NCBE的Blast系统中重复检索拼接,得到一个长为1 110bp的cogtig重叠群,拼接示意图如图1。通过 NCBI ORF Finder(http:∥www.ncbi.nlm.nih.gov/gorf/gorf.html)软件预测,该序列完整的开放阅读框长为975bp,编码氨基酸为324个,符合kozak原则(即起始密码子ATG附近的核苷酸序列以ANNATGG和GNNATGG利用率高,而没有起始功能的ATG附近的序列则无此保守性),说明拼接获得的为一条完整的cDNA序列,命名为S-APX2。具体序列信息如图2所示。

图1 甘蔗APX基因PX2cDNA拼接图

图2 甘蔗PX2基因的cDNA序列(Iength=1110bp)及氨基酸序列(Iength=324aa)

2.2 甘蔗S-APX2基因编码氨基酸一级结构及疏水性/亲水性预测及分析

利用ProtParam在线工具对甘蔗S-APX2基因的理化性质,并同其他植物进行比对(如表1),该基因的氨基酸个数为324,分子量27627.6Da,等电点为5.52,负电荷残基与正电荷残基个数分别为38、29,蛋白质不稳定系数为34.77,该蛋白的理化性质与禾本科植物水稻、玉米等的APX相似性较高,由此可见该基因拼接的正确率较高。该类蛋白的不稳定系数小于40,可见,该类蛋白质较稳定[3]。对甘蔗S-APX2基因编码的氨基酸序列的亲水性/疏水性(如图3)预测的结果显示,S-APX2基因多肽链的第357位表现为最高值2.022,疏水性最强;第972位表现为最低值-2.244,亲水性最强。该蛋白的GRAVY值为0.791,可见该蛋白质具有疏水性,推断为疏水性蛋白。

表1 不同植物APX基因的理化性质分析

2.3 甘蔗S -APX2蛋白磷酸化位点及信号肽预测

运用NetPhos2.0Server对该蛋白质序列进行潜在磷酸化位点预测分析。结果显示,该蛋白具有5个丝氨酸磷酸化位点、9个苏氨酸磷酸化位点以及1个酪氨酸磷酸化位点(如图4)。同时运用SignalP 4.0Server预测其蛋白信号肽,结果如图5所示,第23位丙氨酸残基具有最高的原始剪切位点分值0.139,第7位组氨基酸残基具有最高的信号肽分值0.850,谷氨酞胺残基具有最高的综合剪切位点分值0.306。由此可以推测,该基因所编码的蛋白存在信号肽,并且为分泌蛋白。

图3 甘蔗PX2蛋白疏水性/亲水性的预测结果

图4 甘蔗S APX2蛋白的磷酸化位点预测

2.4 甘蔗S-PAX2蛋白亚细胞定位及跨膜结构域的预测分析

利用Wolf psort在线工具对S-APX2进行亚细胞定位预测,结果显示,该蛋白可能定位于线粒体上,为线粒体蛋白质。通过TMHMM工具预测S-APX2蛋白的跨膜结构域,结果显示:该蛋白无跨膜螺旋区,为非膜蛋白。

图5 甘蔗PX2蛋白信号肽的预测分析

2.5 甘蔗S-APX2蛋白保守结构域及二级结构的预测分析

通过CDD对该基因编码蛋白的保守结构域分析显示,经蛋白保守域分析发现,含有heme binding site、Substrate binding site、K+binding site、ascorbate_peroxidase结合位点和保守域,属于plant_peroxidase-like Superfamily家族(图6),与种子序列编码蛋白保守域相一致。

图6PX2蛋白保守结构域的预测分析

GOR4对甘蔗S-APX2蛋白二级结构的预测显示结果如图7和表2,α螺旋的比例为30.74%,延伸链为13.92%,无规则卷曲55.34%,其主要结构元件为无规则卷曲,并且分散于整个蛋白质中。

图7 甘蔗PX2蛋白的二级结构预测

表2 PX2蛋白的二级结构预测分析

表2 PX2蛋白的二级结构预测分析

二级结构类型 氨基酸残基数/个 百分比/%α螺旋Alpha helix 95 30.74%延伸链Extended strand 43 13.92无规则卷曲Random coil 171 55.34

2.6 甘蔗S-APX2氨基酸同源性分析及进化树的构建

利用GeneBank数据库中的Blastp程序(http:∥www.nchi.nlm.nih.gov/BLAST),对甘蔗SAPX2蛋白的氨基酸进行同源性分析,结果显示电子克隆获得的目的基因S-APX2所编码的氨基酸序列与禾本科植物的同源性较高,这与甘蔗和这些物种同属于禾木科植物的传统分类是一致的,进一步证明了该基因电子克隆的准确性。

利用DNAMAN软件对甘蔗S-APX2的氨基酸序列和其它物种APX的氨基酸序列进行多重比对的结果(图8),以及通过几个物种APX基因的核酸序列所构建的系统进化树(图9)的结果进一步证明了该基因cDNA序列电子克隆的正确性,说明了本研究所拼接的目的基因属于APX基因家族成员。

图8 不同植物中APX蛋白与甘蔗PX2蛋白氨基酸序列同源性对比

3 讨 论

图9 甘蔗PX2蛋白与其他植物该蛋白的系统进化树

基因的电子克隆是随着基因组计划和EST计划的发展而兴起的,它主要利用不同物种的同类基因之间存在序列保守性原理[4-5]。电子克隆与传统的基因克隆方法相比,具有高效快速、成本低廉、针对性强、技术要求低等明显优势[6-7]。由于受到序列资料丰富度的限制,在植物领域基因克隆仍以常规的试验方法为主,但是随着EST数据库的不断完善,利用生物信息学方法来进行某些植物基因的电子克隆己经成为可能[8]。迄今,在水稻、小麦、大豆等作物的功能基因克隆中己有报道,并且在甘蔗中也己有成功的先例[9-10]。本文对该基因研究的目的就在于为其今后的实验室克隆及相关研究奠定了基础。

4 结 论

本文应用生物信息学方法,拼接出甘蔗中的一条APX基因(S-APX2)的cDNA全长序列,并应用分子生物学相关软件,预测出此基因编码蛋白的二级结构中的主要结构元件为α螺旋和无规则卷曲,其分散于整个蛋白质中,具有15个磷酸化位点,无跨膜螺旋区,存在信号肽,可能为疏水性的分泌蛋白,亚细胞定位分析显示该蛋白可能定位于线粒体内。此外,所克隆的S-APX2基因具有多个保守功能域,在序列组成、蛋白质结构等方面,与玉米、小麦、水稻等禾本科植物进行氨基酸同源比对,其APX基因具有高度同源,推测其具有类似的功能。以上结果为该基因的实验室克隆及其后续的功能鉴定提供了理论依据。

[1]GILL R W,SANSEAU P.Rapid in silico cloning of genes using expressed sequence tags(ESTs)[J].Biotechnology Annual Review,2000,5:25-44.

[2]孙淼,赵茂林.利用表达序列标签电子克隆cDNA全序列的策略[J].生物技术通报,2010(1):49-52.

[3]FOURCROY P,VANSUYT G,KUSHNIR S,et al.Iron-regulated expression of a cytosolic ascorbate peroxidase encoded by the APX1gene in Arabidopsis seedlings[J].Plant physiology,2004,134(2):605-613.

[4]高静,程汉,蔡海滨,等.巴西橡胶树HbRD22基因的电子克隆与生物信息学分析[J].热带作物学报,2010,31(9):1439-1445.

[5]冯浩咏,苗向阳,罗绪刚,等.生物信息学在发现新基因方面的应用[J].生物技术通报,2007(5):1-5.

[6]王冬冬,朱延明,李勇,等.电子克隆技术及其在植物基因工程中的应用[J].东北农业大学学报,2006,37(3):403-408.

[7]胡皝,萧浪涛.生物信息学在新基因全长cDNA电子克隆中的应用[J].生物技术通报,2007(4):93-96.

[8]唐向荣,吴昊,贾明,等.水稻双链RNA结合蛋白同源基因OsRBP的克隆及其表达的分析[J].植物生理与分子生物学学报,2002,28(1):41-45.

[9]李国印,阙友雄,许莉萍,等.甘蔗 MYB2转录因子的电子克隆和生物信息学分析[J].生物信息学,2011,9(1):24-27.

[10]苏亚春,李国印,阙友雄,等.甘蔗几丁质酶基因的电子克隆与生物信息学分析[J].生物信息学,2011,9(4):322-326,330.

猜你喜欢
信息学甘蔗克隆
克隆狼
清明甘蔗“毒过蛇”
鸡NRF1基因启动子区生物信息学分析
浙江:诞生首批体细胞克隆猪
甘蔗的问题
初论博物馆信息学的形成
爱咬甘蔗的百岁爷爷
23个甘蔗品种对甘蔗黑穗病的抗性测定
抗BP5-KLH多克隆抗体的制备及鉴定
Galectin-7多克隆抗体的制备与鉴定