李雪雯,郑穗平
(华南理工大学生物科学与工程学院,广东广州 510006)
酪氨酸酚裂解酶在高温下保持良好活性对L-酪氨酸的生产有着重要意义。L-酪氨酸是人和动物生长发育及新陈代谢中起着重要作用的芳香族氨基酸,在食品、化工和医药行业中有着重要的应用[1],可以作为食品添加剂、人工饲料使用,L-酪氨酸是L-多巴、黑色素和沙弗拉霉素A 的前体物质,其中L-多巴用于治疗帕金森病,黑色素有着抗氧化的作用,可以用于化妆和医药领域,而沙弗拉霉素A 具有抗肿瘤和抗菌活性的天然产物[2]。在生产上可以用丙酮酸作为原料,通过酪氨酸酚裂解酶催化生产L-酪氨酸。酪氨酸酚裂解酶(TPL,EC4.1.99.2)也称为β-酪氨酸酶,是依赖于磷酸吡哆醛(PLP)的多功能酶,可以将苯酚、丙酮酸和氨转化成L-酪氨酸[3]。TPL 是一个由两个大小相同的催化二聚体构成的四聚体,每个二聚体由两个相同的小亚基组成,小亚基中包括了磷酸吡哆醛结合域(PLP)、N 末端臂和小结构域[2]。TPL 来源广泛,其中微生物来源的有嗜热共生菌(Symbiobacterium toebii)[4]、嗜热共生杆菌(Symbibacterium thermophilum)、弗氏柠檬梭菌(Citrobacter freundii)、具核酸杆菌(Fusobacterium nucleatum)、破伤风梭菌(Clostridium tetani)、草生欧文氏菌(Erwinia Herbicola)[5]等。
TPL 的最适反应pH 在7~9 之间,属于中性酶,其反应pH 范围在6~11 之间,反应pH 宽度较大;最适反应温度在60~80 ℃之间,属于耐高温的酶,反应温度区间大,在20~90 ℃内均能反应[6-10]。在非细胞合成体系生产上,可以利用葡萄糖四步合成丙酮酸[11],再由丙酮酸通过TPL 催化生成L-酪氨酸。由于合成丙酮酸的酶均在高温下反应,能在高温条件下保持良好稳定性的TPL,对高效合成L-酪氨酸有重要意义。选取来源于Symbiobacterium toebii的耐热酪氨酸酚裂解酶StTPL、来源于Fusobacterium nucleatum的耐热酪氨酸酚裂解酶FnTPL 和来源于Citrobacter freundii的中温酪氨酸酚裂解酶CfTPL 开展相关生物信息学分析工作,对TPL 热稳定性和序列之间的关系进行初步探究,为通过蛋白质工程提高酪氨酸酚裂解酶热稳定性提供关键位点的参考。
从Brenda 下载已有记录的酶的数据,使用ClustalW 进行多序列比对,再使用Mega 软件对比对结果建立进化树分析。
利用 Ex PASy 蛋白质一级结构分析工具ProtParam,分析TPL 的氨基酸组成、分子量、等电点等信息[12],并用BlastP 把需要比对的序列进行多序列比对。
利用ExPASy 疏水性和极性分析工具Protscale,计算分析蛋白质的疏水性和极性。采用了Protacale 网站中的Hphob./Kyte &Doolittle 工具计算TPL 的疏水性分布。通过Protacale 网站中的Polarity/Grantham 计算TPL 的极性分布。采用TMHMM 网站分析TPL 的跨膜结构域。
二级结构预测采用蛋白质二级结构预测网站prabi 来预测。
同源模建是常用的预测蛋白质三维结构方法。根据序列同源性可以分成不同的蛋白质家族。如果一个蛋白质序列和另一个蛋白质序列具有大于30%的同源性,那么这两个蛋白质可能由同一祖先进化而来,称为同源蛋白质。同源蛋白质具有相似的结构和功能。利用结构已知的同源蛋白质作为模板,建立目标蛋白质的结构模型,然后用理论计算方法进行优化,达到预测目标蛋白质结构的目的。首先在SWISS-MODEL上搜索结构已知的与TPL 的相似的序列,接着通过SWISS-MODEL 的自动蛋白质同源建模服务器构建TPL 的模型,再使用拉氏图进行模型评估。
使用MUSCLE 工具对StTPL、FnTPL 和CfTPL进行多序列比对、使用PDBeFold 对建立好的三个模型进行结构比对。使用Pymol 标记StTPL、FnTPL 和CfTPL 三个模型中的脯氨酸在二级结构的位置。
StTPL 最适反应温度为80 ℃[4],FnTPL 最适反应温度为60 ℃[13],CfTPL 最适反应温度为45 ℃[14]。从图1 中看出StTPL(Q0889)和另一株耐热菌的酶(O0850)亲缘关系最近,而CfTPL 则和StTPL 亲缘关系较远,与FnTPL 亲缘关系较近。
表1 StTPL、FnTPL 和CfTPL 氨基酸组成Table 1 Amino acid composition of StTPL,FnTPL and CfTPL
利用ExPASy 数据库的蛋白质一级结构分析工具ProtParam 分析得到StTPL 的分子量为52198.83 u、由458 个氨基酸组成、等电点(pI)为6.26,其中带负电荷的氨基酸(Asp+Glu)数量为61 个,带正电荷的氨基酸(Arg+Lys)为54 个;FnTPL 的分子量为52156.02 u、由460 个氨基酸组成、等电点(pI)为6.53,其中带负电荷的氨基酸(Asp+Glu)数量为65 个,带正电荷的氨基酸(Arg+Lys)为52 个;CfTPL 的分子量为51441.83 u、由456 个氨基酸组成、等电点(pI)为6.00,其中带负电荷的氨基酸(Asp+Glu)数量为61 个,带正电荷的氨基酸(Arg+Lys)为53 个。StTPL、FnTPL和CfTPL 氨基酸组成成分如表格1 所示。
StTPL、FnTPL 和CfTPL 的疏水性和极性分布结果如图2 所示,结果显示StTPL、FnTPL 和CfTPL 中并没有显著的疏水性或极性区域。TMHMM 预测的StTPL、FnTPL 和CfTPL 跨膜区域如图3 所示,结果显示StTPL、FnTPL 和CfTPL 没有跨膜区域。
StTPL、FnTPL 和CfTPL 的二级结构预测结果如图4。StTPL 的各种二级结构Helix(H)、β-Sheet(E)、Turn(T)和Coil(C)的比例为:40.39%、16.81%、8.30%和34.50%;FnTPL 的各种二级结构Helix(H)、β-Sheet(E)、Turn(T)和Coil(C)的比例为:41.30%、16.74%、8.26%和33.70%;CfTPL 的各种二级结构Helix(H)、β-Sheet(E)、Turn(T)和Coil(C)的比例为:42.98%、16.23%,7.68%和33.11%。与CfTPL相比,StTPL 和FnTPL 的螺旋百分比减少,β-折叠和转角的百分比增加,增加的β-折叠和转角二级结构在蛋白质的构象稳定性中起重要作用[15]。
使用SWISS-MODE 搜索模板对StTPL、FnTPL和CfTPL 同源建模,结果显示PDB ID 为6mls 的蛋白适合作为模板,6mls 与StTPL 的相似性为62.94%,与FnTPL 相似性为81.84%,与CfTPL 的相似性为62.72%,均大于30%,适合用当模板进行同源建模。图5 为StTPL、FnTPL 和CfTPL 建模后的结构和模型的拉氏图评价。
GMQE 接近1,QMEAN 接近0,说明模型质量较好。理想情况下拉氏图评估中 Ramachandran Facoured 区域>98%,Ramachandran Qutliers 区域<0.20%,Rotamer Outliers 区域<1.00%。由此看出两个模型效果良好,若要进行突变或结构分析,需进行进一步的优化。
表2 StTPL、FnTPL 和CfTPL 模型评估Table 2 Model evaluation of StTPL,FnTPL and CfTPL
把中温酶CfTPL 和耐热酶FnTPL、StTPL 进行多序列比对,结果如图6 所示;序列比对结果和结构比对RMSD 结果如图7 所示。
根据Vieillec 等[16]的研究,嗜热酶和嗜温酶具有许多共同点:(1)序列有40%~85%相似性;(2)立体结构的可迭合性(superposable);(3)相同的催化机制,并且嗜热酶都能在嗜温菌中表达而性质不变,说明热稳定性是其内在本质。三个来源不同的TPL 序列相似度在60%~85%,符合序列相似度的共同点;RMSD 是测量某部分特定原子相对于一参考结构的坐标偏差,最完美的重合时则RMSD 为0.0,结果显示两两比对的结果接近0,模型大部分能重合。
同源性较高的蛋白质却有着天壤之别的性质,是由于某些关键氨基酸残基的差异造成的。脯氨酸残基在蛋白质结构以及热稳定性中具有特殊作用,它十分偏爱β转折或无规卷曲结构,而很少出现在α螺旋和β折叠中,脯氨酸比其它氨基酸更适合位于β转折的第二位点或无规卷曲的拐角处,它能使肽链顾家更容易与其他专辑氨基酸的极性侧链形成氢键,降低肽链骨架的柔性从而使结构更稳定,且脯氨酸疏水侧链与邻近洞穴相互作用,使得疏水基团包裹的β转折和无规卷曲各种键合更牢固,增强稳定性,因此在β转折中的脯氨酸能改善热稳定性[17]。使用Pymol 绘制蛋白结构并标记CtTPL、FnTPL 和StTPL 中所有脯氨酸的位置发现,大部分的脯氨酸位于无规卷曲的拐角处,而CtTPL 有一个脯氨酸Pro95 位于β转折中,FnTPL中有两个脯氨酸位于β转折中,分别是Ppro96 和Pro121,在StTPL 中位于β转折中的脯氨酸多达4 个,分别是Pro16、Pro96、Pro119 和Pro456。通过Suzuki等比较了5 种1.6-寡葡糖苷酶的序列发现当酶的热稳定性呈线性升高时,它们序列中脯氨酸含量呈线性增长,结果结构中的α-螺旋含量下降,β-折叠和回折结构的含量几乎不变,但参与疏水作用的氨基酸数量增加,加强了酶的疏水核心作用。从一级结构比对看出,CfTPL 的脯氨酸摩尔百分比为2.85%,FnTPL 的脯氨酸摩尔百分比为3.70%,StTPL 的脯氨酸摩尔百分比5.02%,随着最适反应的升高,脯氨酸含量升高,StTPL的脯氨酸摩尔百分比较高,与已报道的文献符合。从二级结构比对看,与CfTPL 相比,FnTPL 和StTPL的螺旋百分比减少,β-折叠和转角的百分比增多,而增加的β-折叠和转角二级结构在蛋白质的构象稳定性中起重要作用。以上数据能印证耐热酶StTPL、FnTPL和中温酶CfTPL 在序列中的差异导致热稳定性有所不同。
把StTPL、FnTPL、CfTPL 的模型叠加比对,根据Han 等[11]的研究,对CfTPL 的Glu313 位点进行突变,把Glu313 突变成Trp313 和Met313 后热稳定性提高,CfTPL,E313W 和E313M 的熔融温度分别为59.2、63.0、65.9 ℃。如图8 所示,红色区域表示残基相同且匹配,绿色区域表示残基不相同但匹配,灰色区域表示不匹配,三个TPL 中的309-313 残基区域并不能很好重叠,而在309-313 前后的区域,两者均能很好重叠,这个现象可能也进一步说明310-313 区域和TPL 的热稳定性有关系,也与已报道的文献结果相符。
根据Rha 等[18]的研究,StTPL 中Ala13、Glu83和Thr407 突变为Val13、Lys83、Ala407 后热稳定性提高。如图9 所示比对该残基附近的区域发现,与StTPL 的Ala13 相对应的残基是CfTPL 中的Ser12 和FnTPL 中的Ser15,在结构上并不能很好重合;而StTPL 中的Glu83 附近的区域残基83~89,与CfTPL的残基82~88、FnTPL 的残基85~91 相对应,而这部分区域差异较大。如图10 所示,与StTPL 的残基407对应的CfTPL 残基406 和FnTPL 残基409 能很好重合,且附近区域能重合的残基较多,StTPL 的Thr407突变为Ala407 后热稳定性提高,如果对CfTPL 和FnTPL 做定点突变提高热稳定性,可以选择这个区域的位点进行突变尝试。
酪氨酸酚裂解酶选取了耐温酶StTPL、FnTPL 和中温酶CfTPL 进行比对,结果显示CfTPL 则和StTPL亲缘关系较远,与FnTPL 亲缘关系较近,三者均无明显极性区、疏水区和跨膜区。从一级结构比对看出,随着最适反应的升高,脯氨酸含量升高,最适反应温度为45 ℃的CfTPL 脯氨酸含量为2.85%,最适反应温度为60 ℃的FnTPL 脯氨酸含量为3.70%,最适反应温度为80 ℃的StTPL 脯氨酸含量为5.02%,而脯氨酸在蛋白质结构以及热稳定性中具有特殊作用,与已报道的文献符合。从二级结构比对看,与CfTPL 相比,FnTPL 和StTPL 的螺旋结构百分比减少,β-折叠和转角的百分比增多,分别为23.91%、25.00%和25.51%,而增加的β-折叠和转角二级结构在蛋白质的构象稳定性中起重要作用。以上数据能印证耐热酶StTPL、FnTPL 和中温酶CfTPL 在序列中的差异导致热稳定性有所不同。三个TPL 的模型叠加比对结果显示,310-313 残基区域、残基13、82-88 残基区域叠加效果差,313 残基突变有利于CfTPL 提高热稳定性,StTPL中的Ala13、Glu83 突变有利于StTPL 突变,推测以上残基区域和热稳定性相关,也符合已有文献报道的情况。此外StTPL 中的Thr407 对热稳定性也有贡献,若突变CfTPL 或FnTPL 以提升热稳定性,可以考虑选择407 残基或附近区域进行突变尝试。