陆地棉GhNIP5.1基因的电子克隆及生物信息学分析

2013-04-18 05:10巩元勇郭书巧束红梅何林池倪万潮
江苏农业学报 2013年3期
关键词:登录号拟南芥克隆

巩元勇, 郭书巧, 束红梅, 何林池, 倪万潮

(1.江苏省农业科学院经济作物研究所,农业部长江下游棉花和油菜重点实验室,江苏 南京 210014;2.江苏沿江地区农业科学研究所,江苏 如皋 226541)

水通道蛋白(Aquaporin,AQP)是古老的通道蛋白MIP(Membrane intrinsic protein)家族成员之一,是广泛存在于动植物和微生物中,负责转运水分子和某些小分子物质的一类膜嵌入式蛋白。1992年,第一个植物水通道蛋白从拟南芥中分离获得,由于其定位在液泡膜,因此被命名为液泡膜内在蛋白(TIP)[1]。近年来,在玉米、棉花、水稻、油菜、向日葵等多种植物中都发现有AQPs的存在,且在植物不同发育时期的不同组织和器官中广泛分布[2]。与其他类型的生物相比,植物AQPs类型更为丰富,多样性也更大[3]。根据植物体AQPs的结构和细胞定位的不同分为4种类型,液泡膜内在蛋白、质膜内在蛋白(PIP)、大豆根廇菌周膜上水通道蛋白类NOD26膜内在蛋白(NIP)以及定位于内质网和质膜上的小分子碱性膜内在蛋白(SIP)[4-6]。植物AQPs不仅具有水分子运输功能,还具有某些营养元素(硅、硼等)[5-7]和某些中性小分子(甘油、尿素、甲酰胺等)[8]的运输功能,在植物细胞水分平衡的维持和生长发育等生理过程中具有举足轻重的作用。

利用生物信息学同源性搜索和分子克隆,在陆地棉(Gossypium hirsutum)中发现存在71 个 AQPs[9]。但是绝大多数的棉花AQPs还没有克隆获得全长序列,对它们的生理及分子功能的理解更是远远不够。本试验通过电子克隆的方法,获得棉花GhNIP5.1基因全长的开放阅读框序列,并在棉花基因组测序结果中,搜索获得了GhNIP5.1基因的编码区序列,对所获得的序列进行了一系列的生物信息学的预测和分析,以期为进一步深入研究该基因的功能提供必要的基础。

1 材料与方法

1.1 棉花GhNIP5.1基因的电子克隆

根据同源基因中存在保守序列的特性,用拟南芥AtNIP5.1基因(NCBI登录号:NM_117106)序列为信息探针,对NCBI中EST数据库棉花(Gossypium hirsutum)进行Tblastx同源性检索,将检索到的来自于棉花的EST序列利用DNAS-tar软件拼接获得连接体。然后用此连接体再次同源检索、拼接,重复以上过程直至无棉花的重叠EST检出,最终获得陆地棉GhNIP5.1基因的cDNA序列片段。再以此片段在NCBI中进行Blastx同源性检索,与其他物种的水通道蛋白进行序列比较,进而判断拼接得到的陆地棉GhNIP5.1基因的cDNA的正确性及其ORF序列的完整性。然后用DNAS-tar软件分析该序列,并将ORF翻译成氨基酸序列。

1.2 蛋白质生物信息学预测与分析

用ProtParam对蛋白质进行基本特性分析;利用SOPMA软件对蛋白质二级结构的组成形式进行分析;用TMHMM-2.0预测蛋白质的跨膜结构域;用NCBI的 Blast P对氨基酸序列进行蛋白质保守区分析;用NetPhos 2.0 Server预测蛋白质翻译后的磷酸化修饰位点;用PSORT进行信号肽及亚细胞定位分析。

1.3 氨基酸序列同源和进化分析

用DNAMAN V6软件对棉花GhNIP5.1蛋白的氨基酸序列和拟南芥AtNIP家族蛋白质的氨基酸序列进行同源性分析,并构建同源树;用MEGA4软件,采用Neighbor-Joining法对NCBI数据库中获得的其他植物NIP5.1蛋白和棉花Gh-NIP5.1蛋白构建进化树。

1.4 基因结构分析

棉花D亚组雷蒙德式棉(Gossypium raimondii)基因组DNA已经测序并部分公布(http://www.phytozome.net/cotton.php),根据获得的 GhNIP5.1基因的 ORF序列,在已公布的棉花基因组序列中搜寻 GhNIP5.1基因序列,通过DNAStar软件分析GhNIP5.1基因的外显子和内含子的大小及分布情况。

2 结果

2.1 棉花GhNIP5.1基因的电子克隆结果

利用拟南芥AtNIP5.1(GenBank登录号:NM_117106)基因序列为种子序列,在棉花EST数据库中进行Tblastx同源性检索,得到56条长度不一的棉花EST序列,将这些EST序列拼接获得连接体,将这个连接体再次在棉花EST数据库中进行Tblastx同源性检索,将获得的EST序列再次拼接;重复以上过程,直到序列不能再延伸为止,最终获得1条长度为1 303 bp的cDNA序列。DNAStar软件分析发现,该序列包含1个897 bp的ORF,翻译后的氨基酸序列有298个氨基酸残基构成,与拟南芥AtNIP5.1蛋白氨基酸序列一致性达到83.2%,将该序列命名为GhNIP5.1。

2.2 棉花GhNIP5.1蛋白基本特性分析

由GhNIP5.1基因的cDNA序列推测GhNIP5.1蛋白由298个氨基酸残基构成,利用ProtParam分析该蛋白的基本理化性质,结果表明,GhNIP6.1成熟蛋白质的分子量是30 970,理论等电点为8.57;该蛋白质含 Ala(A)最多,占13.8%,不含有Pyl(O)和Sec(U),负电荷的氨基酸残基数(Asp+Glu)是16,正电荷的氨基酸残基数(Arg+Lys)是19;脂肪系数为91.97,表明其为脂溶性蛋白;总平均亲水性为0.410,该蛋白属于疏水性蛋白;不稳定系数是31.36,表明该蛋白是稳定蛋白。

2.3 棉花GhNIP5.1蛋白二级结构分析

利用SOPMA在线分析GhNIP5.1蛋白的二级结构,结果表明,该成熟蛋白质主要由α-螺旋、延伸直链、β-转角和无规则卷曲4种结构形式构成。这4种结构的氨基酸组成及占全部氨基酸的比例分别为:α-螺旋包含105个氨基酸,约占35.23%;延伸直链包含49个氨基酸,约占16.44%;β-转角包含9个氨基酸,约占3.02%;无规则卷曲包含135个氨基酸,约占45.30%。可见,无规则卷曲区间是该蛋白质二级结构的主要组成部分。

2.4 棉花GhNIP5.1氨基酸序列跨膜结构及保守区预测

用TMHMM-2.0对GhNIP5.1蛋白氨基酸序列跨膜结构域预测,结果显示,该成熟蛋白质具有5个跨膜螺旋(TM1~TM5),由4个环相连,其中蛋白质的N末端和环B、D都在细胞膜外,C末端和环A、C位于细胞膜内,N末端有73个氨基酸,C末端有18个氨基酸。用Blast P在NCBI的蛋白质保守区数据库对GhNIP5.1氨基酸序列进行分析,结果显示,该氨基酸序列的65~227位区段与MIP超家族相匹配,具有MIP家族典型的NPA(Asp-Pro-Ala基序)保守肽段和两亲性通道,由此推测该基因是水通道蛋白基因家族的一员。

2.5 棉花GhNIP5.1蛋白翻译后修饰预测

用NetPhos 2.0 Server预测GhNIP5.1蛋白翻译后修饰的磷酸化位点,结果表明,32、34、39、99、160、185 和295 位的7 个Ser(丝氨酸),6、8、19、147、246 位的5 个 Thr(苏氨酸)和35 位的Tyr(色氨酸)可能发生翻译后的磷酸化修饰。由PSORT软件预测信号肽及亚细胞定位,结果表明,GhNIP5.1的氨基酸序列没有信号肽残基,该蛋白质最有可能定位在质膜上。

2.6 棉花GhNIP5.1蛋白的进化树和同源树分析

棉花GhNIP5.1蛋白的氨基酸序列与NCBI数据库已公布的NIP5.1蛋白的拟南芥(Arabidopsis thaliana,登录号:NP_192776)、大豆(Glycin max,登录号:XP_003535560)、莲花(Lotus japonicus,登录号:ABY19373)、葡萄(Vitis vinifera,登录号:XP_002276319)和玉米(Zea mays,登录号:NP_001150784)的氨基酸序列的一致性分别为83.2%、74.8%、71.1%、89.3%和42.7%。进化树分析结果表明,棉花与葡萄聚到一个分支,进化关系最近,与玉米的进化关系最远。

2.7 棉花GhNIP5.1基因结构分析

在棉花基因组中搜寻GhNIP5.1基因,结果表明,该基因编码区全长2 067 bp,包含4个外显子和3个内含子,所有内含子的左右边界均为gt/ag结构。通过对比发现,棉花Gh-NIP5.1基因与拟南芥AtNIP5.1基因内含子和外显子数量均相同,这两个基因只有第一个外显子长度存在18 bp的微小差异,其他3个外显子长度均相当,造成基因结构差异的主要原因是内含子长度不同,尤其是第一个内含子有1 159 bp的长度差。

3 讨论

用拟南芥AtNIP5.1(GenBank登录号:NP_192776)的蛋白质序列在 HMMER(http://hmmer.janelia.org/)中进行同源检索,结果显示棉花中与之同源的序列有52条,其中与之同源性最高的是已公布的棉花NIP6.1(GenBank登录号:DAA33875)的部分片段序列,但是在这些序列中并没有GhNIP5.1的信息,由此表明,GhNIP5.1基因还没有被克隆。

表达序列标签(Expressed sequence tags,EST)是在来源于不同组织的cDNA文库中随机克隆,对所挑选的克隆进行单向测序后获得的cDNA序列,长度一般在300~500 bp[10]。基因的电子克隆就是以EST数据库为基础,运用计算机分析技术进行新基因克隆的一种方法。通过生物信息学的方式向EST序列延伸,最终获得新基因的部分或全长cDNA序列[11]。起初,随着人类与小鼠、牛、线虫和斑马鱼等多种模式生物的全基因组测序的完成,电子克隆作为克隆基因的新方法在模式生物上的应用相对比较广泛[12]。随着各种测序工作的开展,尤其是EST数据库的不断扩大和充实,电子克隆在小麦[13]、棉花[14]、大豆[15]和油菜[16]等植物新基因的获取中都有应用。

AQPs是通道蛋白MIP家族成员之一,具有MIP家族结构的典型特征,最主要的是在其α-螺旋结构中包含有3个氨基酸残基(Asp-Pro-Ala基序)构成的NPA模体,参与形成AQP水孔[5]。在GhNIP5.1氨基酸序列中就存在这个 NPA保守肽段,初步推断它是属于MIP家族成员的AQPs。磷酸化是植物AQPs水通道活性非常重要的调控方式,通过磷酸化,可以快速、直接、可逆地实现植物 AQP的门控调节[6]。预测GhNIP5.1蛋白存在有13个可能发生翻译后修饰的磷酸化位点,这些位点的存在可能参与该水通道蛋白对水分或其他物质运输的活性调节。这些结果提示该基因可能在棉花水分调控网络中有着重要意义,为进一步深入探索该基因的功能奠定了基础。

与棉花GhNIP5.1氨基酸序列一致性最高的是葡萄和拟南芥,分别达到89.3%和83.2%。拟南芥NIP家族与棉花GhNIP5.1 同源性最高的是 AtNIP5.1,由此推断 GhNIP5.1 和AtNIP5.1可能具有类似的生理学功能。AtNIP5.1是拟南芥根部主要的硼酸通道蛋白,对拟南芥在缺硼条件下根系对硼的有效吸收以及植株正常的生长发育至关重要[7]。那么,棉花GhNIP5.1是否也与AtNIP5.1一样是硼酸通道蛋白呢?还需要深入研究。

[1]HÖFTE H,HUBBARD L,REIZER J,et a1.Vegetative and seed-specific forms of tonoplast intrinsic protein in the vacuolar membrane of Arabidopsis thaliana[J].Plant Physiology,1992,99(2):561-570.

[2]BAIGE I,Schaffner A R,Affenzeller M J,et al.Plant aquaporins[J].Physiologia Plantarum,2002,115(2):175-182.

[3]KALDENHOF R,FISCHER M.Aquaporins in plants[J].Acta Physiologica,2006,187:169-176.

[4]CHAUMONT F,BARRIEU F,WOJCIK E,et al.Aquaporins constitute a large and highly divergent protein family in maize[J].Plant Physiology,2001,125(3):1206-1215.

[5]QUIGLEY F,ROSENBERG J M,SHACHAR -HILL Y,et al.From genome to function:the Arabidopsis aquaporins[J].Genome Biology,2001,3(1):1-17.

[6]CHANMONT F,MOSHELION M,DANIELS M J.Regulation of plant aquaporin activity[J].Biology Cell,2005,97(10):749-764.

[7]TAKANO J,WADA M,LUDEWIG U,et al.The Arabidopsis major intrinsic protein NIP5.1 is essential for efficient boron uptake and plant development under boron limitation[J].Plant Cell,2006,18(6):1498-1509.

[8]MAUREL C,VERDOUCQ L,LUU D T,et al.Plant aquaporins:memberane channels with multiple integrated functions[J].Annual Review of Plant Biology,2008,59:595-624.

[9]PARK W,Scheffler B E,Bauer P J,et al.Identification of the family of aquaporin genes and their expression in upland cotton(Gossypium hirsutum L.)[J].BMC Plant Biology,2010,10:142-158.

[10]万海伟,杜立新.表达序列标签(EST)在基因组学研究中的应用[J].生物技术通报,2004,20(1):35-39.

[11]王冬冬,朱延明,李 勇,等.电子克隆技术及其在植物基因工程中的应用[J].东北农业大学学报,2006,37(3):403-408.

[12]胡 皝,萧浪涛.生物信息学在新基因全长cDNA电子克隆中的应用[J].生物技术通报,2007(4):93-96.

[13]张龙雨,袁 蕾,杨书玲,等.小麦雄性不育系中TaPDC-E1及其调节酶基因的表达特征[J].作物学报,2011,37(4):620-628.

[14]童旭宏,吴玉香,祝水金.陆地棉EPSPS基因的克隆及其组织特异性表达分析[J].棉花学报,2009,21(4):259-264.

[15]姜 威,朱宝华,高静瑶,等.大豆天冬氨酸途径关键酶基因GmASADH的克隆与分析[J].中国油料作物学报,2011,33(3):221-225.

[16]薛 蕾,闫贵欣,高桂珍,等.白菜型油菜八氢番茄红素合酶基因BrPSY的克隆与序列分析[J].中国油料作物学报,2011,33(3):210-215.

猜你喜欢
登录号拟南芥克隆
拟南芥:活得粗糙,才让我有了上太空的资格
克隆狼
基于DNA条形码进行金花茶组种间鉴别
浙江:诞生首批体细胞克隆猪
含氟新农药的研究进展
小反刍兽疫病毒F基因的序列分析
尿黑酸对拟南芥酪氨酸降解缺陷突变体sscd1的影响
两种LED光源作为拟南芥生长光源的应用探究
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
电子版馆藏数据回溯中的交叉、重叠、阻滞问题处理