王玮蔚, 王冬梅, 沈 佳, 孙 雪
(1. 宁波大学 海洋学院, 浙江 宁波315211; 2. 浙江省海洋生物工程重点实验室, 浙江 宁波315211)
真核藻类中对CA研究最广泛的是莱茵衣藻(Chlamydomonasreinhardtii),已经发现莱茵衣藻中存在12种编码CA的基因,包括3条α-CA,多分布于周质空间,6条β-CA,分布于线粒体、细胞质、叶绿体中,3条γ-CA,全为线粒体CA[7];在绿藻Ostreococcuslucimarinus中也发现1条β-CA及1条类似硅藻中δ-CA的CA基因[8-9];从三角褐指藻(Phaeodactylumtricornutum)中鉴定出12条CA基因,包括5条α-CA、3条β-CA和4条γ-CA[10-11];在假微型海链藻(Thalassiosirapseudonana)中分离到13条CA基因,包括3条α-CA、5条γ-CA、4条δ-CA及1条ζ-CA[12]。
蛋白核小球藻(Chlorellapyrenoidosa)是绿藻门的一种重要经济微藻,具有较高的光合效率。小球藻中碳酸酐酶的研究大多集中在CA活性与环境因素的关系、CA酶的鉴定等方面[13-14],而关于CA基因的研究比较少,只有同属小球藻C.sorokiniana中一条 α-CA全基因序列的报道[15]。随着小球藻C.variabilisNC64A全基因组序列的阐明[16],揭示了该小球藻中3种(α-、β-、γ-CA)共10条CA。由于CA序列保守性很差,很难通过同源性比对设计简并引物的方法获得未知CA基因序列,因此只能通过基因组或转录组测序来获得某一物种的全部CA基因序列。
本文在前期工作中对海水蛋白核小球藻(Chlorellapyrenoidosa)820进行了转录组测序,获得了一批CA基因。本文选取其中部分序列通过生物信息学软件分析了其中3种类型CA编码蛋白的理化性质、亚细胞定位和高级结构等,希望为小球藻CA的分类、定位、作用机制及后续的实验研究提供信息。
蛋白核小球藻(C.pyrenoidosa)820,来自宁波大学海洋生物工程重点实验室藻种室。培养温度为25 ℃,光照强度为40 μmol/m2·s,光暗周期为12L∶12D。
将处于对数生长中期的蛋白核小球藻820使用Trizol试剂进行总RNA提取,然后送深圳华大基因科技有限公司(BGI)进行转录组测序。所有的测序序列存储在Short Read Archive (SRA) database中(http://www.ncbi.nlm.nih.gov/sra,登录序列号为SRX399080)。分别利用NR、NT、SwissProt、KEGG、COG 和GO数据库进行基因的功能注释,查找全部CA基因。从CA基因中分别选取代表α-、β-、γ-亚型的各一种CA进行分析,它们的基因编号分别为Unigene13488、Unigene11800和Unigene8070。
1.2.1 CA编码蛋白质理化性质分析
在NCBI上通过ORF Finder (http://www.ncbi.nlm.nih.gov/gorf/gorf.html),查找其可能的开放阅读框。分别对蛋白核小球藻3种类型的CA基因进行分析,利用ProtParam tool(http://www.expasy.org/tools/pi-tool.html)对推测的CA编码蛋白进行基本理化性质分析,包括等电点(pI)、相对分子质量(Mw)、脂肪族系数、平均疏水性及稳定性等。
1.2.2 CA基因编码蛋白亚细胞定位预测
通过PSORT Prediction(http://psort.ims.u-tokyo.ac.jp/form.html)对CA基因编码的蛋白质进行亚细胞定位预测。
1.2.3 CA基因编码蛋白跨膜区域分析
利用Tmpred (http://www.ch.embenet.org/cgi-bin/TMPRED-form.html) 对3条基因所编码的蛋白质跨膜结构域进行分析。
1.2.4 CA基因编码蛋白信号肽分析
用Signal4.0 Server在线软件对3条CA基因所编码的蛋白质进行信号肽分析。
1.2.5 CA基因编码蛋白二级结构及三级结构预测
通过NNPredic(http://www.cmpharm.ucsf.edu/~nomi/nnpredict.html)和SWISS-MODEL在线软件,预测3条CA基因编码蛋白质的二级结构及三级结构。
表1 蛋白核小球藻CA的理化性质分析
蛋白核小球藻3条CA理化性质分析结果如表1所示, 3条CA序列编码蛋白的等电点分别为4.6、6.31和6.44,均为酸性蛋白,其中α-CA、γ-CA为稳定性蛋白,β-CA为不稳定性蛋白,三者的分子量分别为28.9 kDa、34.9 kDa和24.8 kDa;平均疏水值(GRAVY)的范围在2与-2之间,α-CA、β-CA和γ-CA的GRAVY值分别为-0.000、-0.369和-0.061,显示为微亲水蛋白,其亲水性的强弱依次为β-CA>γ-CA>α-CA。脂肪族系数指蛋白质脂肪侧链占蛋白质的相对含量,由蛋白质中Ala、Val、Ile和Leu的含量所决定。可以看出,α-CA、β-CA、γ-CA所编码的蛋白脂肪侧链的含量高达80%~90%,推测其均为脂溶性蛋白。
对α-CA、β-CA及γ-CA基因编码的蛋白进行亚细胞定位分析后得到如下结果,α-CA蛋白定位于周质空间、高尔基体、内质网膜、过氧化物酶的可信度分别为0.79、0.3、0.2和0.141;β-CA蛋白定位于细胞质、叶绿体基质、线粒体基质空间的可信度分别为0.45、0.4和0.1;γ-CA编码蛋白定位于细胞质、微体(过氧化物酶体)、线粒体基质空间、叶绿体类囊体膜的可信度分别为0.45、0.388、0.36和0.1。上述分析表明,α-CA可能为胞外CA,β-CA为胞内CA且很可能位于细胞质或叶绿体基质中,γ-CA为胞内CA,分布于细胞质、微体及线粒体中的可能性较大。
跨膜结构域一般由20个左右的疏水氨基酸组成,包括α-螺旋和β-折叠,其疏水键通过范德华力与磷脂双分子层相互作用,是膜内蛋白与膜脂结合的重要部位[17]。跨膜结构域的分析结果结合亚细胞定位的预测,有利于推测其在细胞内具体位置及功能作用。
3条CA跨膜结构域预测结果见图1,α-CA基因编码的蛋白由外向内,即N末端裸露在外的只有一个可能的强跨膜区域,位于23~42氨基酸之间,预测分值为1594;β-CA跨膜结构域预测分值小于500,无可信的跨膜结构;γ-CA最可能有的跨膜区域为162~180氨基酸处,但预测分值较低,为549,可信度很低。上述结果印证了α-CA、β-CA和γ-CA基因编码的蛋白分别为胞外CA、胞内CA和胞内CA的推测。
图1蛋白核小球藻3种CA的跨膜结构域预测
Fig 1 Transmembrane domain prediction of amino acid sequence deduced from α-CA, β-CA and γ-CA genes inChlorellapyrenoidosa
图2 蛋白核小球藻3种CA编码蛋白的信号肽预测
用Signal4.0 Server在线软件分析表明,α-CA编码的蛋白序列存在信号肽,且信号肽区域为14~46氨基酸区间,β-CA、γ-CA编码的蛋白序列不存在信号肽,结合其定位分析,可以推测α-CA蛋白属于胞外周质空间酶或胞内单层细胞器内酶,β-CA、γ-CA属于胞内细胞质酶。
大量的无规则卷曲可以使蛋白结构拥有足够的空间,受侧链相互作用的影响很大,是构成蛋白质特异功能部位和酶活性部位的主要二级结构形式,如许多钙结合蛋白中结合钙离子的E-F手形结构中央环。从表2可以看出,α-CA中无规则卷曲所占比例最高(64.66%),而β-CA和γ-CA中无规则卷曲与α-螺旋所占比例相近,分别为44.13%和44.76%、40.34%和39.48%,这可能与其在细胞内的功能、定位有关。
表2 蛋白核小球藻3种CA二级结构预测
蛋白质的三级结构指球状蛋白质的多肽链在二级结构的基础上相互配置而形成特定的构象。α螺旋、β折叠、β转角和无规则卷曲等二级结构通过侧链基团的相互作用进一步卷曲、折叠,借助次级键的维系形成三级结构,三级结构的形成使肽链中所有的原子都达到空间上的重新排布,它是建立在二级结构、超二级结构和结构域基础上的球状蛋白质的高级空间结构。通过SWISS-MODEL在线软件对α-CA、β-CA和γ-CA蛋白质三维结构进行预测结果如图3所示。图中所示β-CA、γ-CA蛋白的三级结构明显不同于α-CA,α-CA折叠程度较轻且结构松散,β-CA、γ-CA折叠程度较复杂紧密,并且γ-CA三级结构出现重复折叠的结构。这种三级结构与其二级结构组成有很大关系,同时这些高级结构也有利于其功能的发挥。
图3 蛋白核小球藻3种CA的三维结构预测
随着基因组和功能基因组研究的广泛开展,生物信息学理论和方法得到了迅猛发展和广泛的应用。由于CA基因序列获得多是通过大规模测序得到,仅依靠相近物种基因序列的保守性来设计简并引物很困难,因此获得CA基因完整序列并进行生物信息学分析的物种并不多。如海带配子体中一条α-CA基因的生物信息学分析结果表明其分子量为32.53 kDa,等电点为5.12,是酸性、疏水、稳定型蛋白,位于叶绿体中[18]。该α-CA与本文中所分析的α-CA在分子量、等电点、稳定性和细胞定位方面均不同。
高等植物与藻类细胞CA主要包括细胞质CA、叶绿体CA和线粒体CA 3种类型[19-21]。CA位于细胞的不同部位可能与其所承担的功能相关。对莱茵衣藻中α-CA、β-CA和γ-CA细胞定位研究分析显示,2条α-CA为周质CA,1条α-CA位于类囊体腔;6条β-CA分别位于线粒体、叶绿体基质、细胞质及周质中;而3条γ-CA均位于线粒体[7]。对本文的α-CA分析发现其具有一个信号肽区域和一个强的跨膜结构,且二级结构及三级结构较β-CA、γ-CA松散,结合其亚细胞定位,我们推测它为胞外CA且位于细胞质膜与细胞壁之间。β-CA无可信的跨膜结构,无信号肽区域,亚细胞定位结果显示其可能位于细胞质和叶绿体基质中。γ-CA有一可信度很低的跨膜结构(162~180个氨基酸),无信号肽区域,亚细胞定位结果显示其位于细胞质、叶绿体和线粒体基质的可能性相似,再结合γ-CA几乎都位于线粒体中以及莱茵衣藻中所有γ-CA也都位于线粒体中的结果[7,22],我们将本文的γ-CA定位于线粒体基质中。
基因编码蛋白质二级结构及三级结构的预测并结合其亚细胞定位、信号肽、跨膜结构域的分析有利于研究、推测其生物学功能,二级结构在一定程度上能决定三级结构,三级结构决定蛋白质的功能和其在细胞中的定位。α-CA、β-CA及γ-CA的二级及三级结构有很大程度的不同,这可能与其各自在细胞中所发挥的功能有关,但确切的亚细胞定位和功能还需要通过免疫荧光、胶体金细胞定位等方法及CA酶活性测定和表达水平等研究后进一步确定。
参考文献:
[1]Dieter S. Carbonic anhydrase in eukaryotic algae: characterization, regulation, and possible function during photosynthesis [J]. Canadian Journal of Botany, 1998, 76(6): 962-972.
[2]Badger M R, Price G D. The role of carbonic anhydrase in photosynthesis [J]. Annual Review of Plant Physiology and Plant Molecular Biology, 1994, 45: 369-392.
[3]Smith K S, Ferry J G. Prokaryotic carbonic anhydrases [J]. FEMS Microbiology Reviews, 2000, 24(4): 335-366.
[4]So A K, Espie G S, Williams E B, et al. A novel evolutionary lineage of carbonic anhydrase (ε class) is a component of the carboxysome shell [J]. Journal of Bacteriology, 2004, 186(3): 623-630.
[5]Lane T W, Saito M A, George G N, et al. Biochemistry:a cadmium enzyme from a marine diatom [J]. Nature, 2005, 435(7038): 42.
[6]黄 瑾,夏建荣, 邹定辉. 微藻碳酸酐酶的特性及其环境调控[J] . 植物生理学通讯, 2010, 46(7): 631-636.
[7]Moroney J V, Ma Y, Frey W D, et al. The carbonic anhydrase isoforms ofChlamydomonasreinhardtii: intracellular location, expression, and physiological roles [J]. Photosynthesis Research, 2011, 109(1-3): 133-149.
[8]Palenik B, Grimwood J, Aerts A, et al. The tiny eukaryoteOstreococcusprovides genomic insights into the paradox of plankton speciation [J]. Proceedings of the National Academy of USA, 2007, 104(8): 7705-7710.
[9]Peers G, Niyogi K K. Pond scum genomics: the genomes ofChlamydomonasandOstreococcus[J]. Plant Cell, 2008, 20(3): 502-507.
[10]Bowler C, Allen A E, Badger J H, et al. ThePhaeodactylumgenome reveals the evolutionary history of diatom genomes [J]. Nature, 2008, 456(7219): 239-244.
[11]Kroth P G, Chiovitti A, Gruber A, et al. A model carbohydrate metabolism in the diatomPhaeodactylumtricornutumdeduced from comparative whole genome analysis [J]. PLoS ONE, 2008, 3(1): e1426.
[12]Tachibana M, Allen A E, Kikutani S, et al. Localization of putative carbonic anhydrases in two marine diatoms,PhaeodactylumtricornutumandThalassiosirapseudonana[J]. Photosynthesis Research, 2011, 109(1-3): 205-221.
[13]Li L, Fu M L, Zhao Y H, et al. Characterization of carbonic anhydrase II fromChlorellavulgarisin bio-CO2capture[J]. Environmental Science and Pollution Research, 2012, 19(9): 4227-4232.
[14]吴运东, 吴沿友, 李 潜, 等. pH与氟对莱茵衣藻和蛋白核小球藻胞外碳酸酐酶活性及光合效率的影响[J]. 农业环境科学学报, 2011, 30(10): 1972-1977.
[15]Satoh A, Iwasaki T, Odani S, et al. Purification, characterization and cDNA cloning of soluble carbonic anhydrase fromChlorellasorokinianagrown under ordinary air [J]. Planta, 1998, 206(4): 657-665.
[16]Blanc G, Duncan G, Agarkova I, et al. TheChlorellavariabilisNC64A genome reveals adaptation to photosymbiosis, coevolution with viruses, and cryptic sex [J]. Plant Cell, 2010, 22(9): 2943-2955.
[17]薛永常, 聂会忠, 刘长武. 木质素合成酶C3H基因的生物信息学分析[J]. 生物信息学, 2009, 7(1): 1-5.
[18]余 贞,毕燕会,周志刚. 海带配子体碳酸酐酶(CA)基因的克隆及其分析[J]. 水产学报, 2011, 35(9): 1343-1353.
[19]Moroney J V, Bartlett S G, Samuelsson G. Carbonic anhydrases in plants and algae [J]. Plant Cell and Environment, 2001, 24(2): 141-153.
[20]Moulin P, Crpineau F, Kloareg B, et al. Isolation and characterization of six cDNAs involved in carbon metabolism inLaminariadigitata(Phaeophyceae) [J]. Journal of Phycology, 1999, 35(6): 1237-1245.
[21]Hewett-Emmett D, Tashian R E. Functional diversity, conservation, and convergence in the evolution of the α-, β-, and γ-carbonic anhydrase gene families [J]. Molecular Phylogenetics and Evolution, 1996, 5(1): 50-77.
[22]Fabre N, Reiter I M, Becuwe-Linka N, et al. Characterization and experession analysis of genes encoding α and β carbonic anhydrase inArabidopsis[J]. Plant Cell Environ, 2007, 30(5): 617-629.