张家昌,史玲玉,郭兆铖,赵元,徐鹏程,张俊丽
(山东第一医科大学(山东省医学科学院) 生命科学学院,山东泰安 271016)
萜类化合物(Terpenoids)是植物次生代谢产物中结构和数量最多的一类天然化合物,目前已知的种类超过50 000种[1]。由于其特殊且复杂多样的生物活性,萜类化合物在医药、食品、化妆品等领域广泛应用[2]。生物体中,萜类化合物是以异戊二烯为单位,经过环化、结构重排及碳骨架氧化等一系列反应衍生而来[3]。其中,法尼基焦磷酸作为重要的前体物质,是由法尼基焦磷酸合酶(Farnesyl Pyrophosphate Synthase,FPPS)催化异戊烯基焦磷酸及其异构体二甲基丙烯基焦磷酸生成[4]。
近年来,随着合成生物学的发展,通过构建微生物细胞工厂合成萜类化合物成为研究的热点[5-6]。在微生物合成次生代谢产物的研究中,关键酶编码基因的分析、克隆、鉴定及功能分析一直是研究重点和难点[7-10],FPPS作为合成途径中的关键酶,其表达量与酶活力对下游萜类化合物合成有重要影响,在代谢工程和合成生物学等领域受到广泛关注[11]。ANDERSON等[12]阐述了FPPS的特性、结构与功能关系、进化、定位及其作为药物开发靶点的研究进展。刘美佳等[13]在克隆、分析珠子参FPPS基因cDNA序列的基础上,通过调控皂苷生物合成关键酶的表达,成功实现了皂苷的生物合成。李永波等[14]在植物法尼基焦磷酸合酶基因克隆、表达、酶动力学研究等方面阐述了重要观点。
本研究利用生物信息学方法,选择不同生物(包括植物、动物、微生物)来源的FPPS,通过分析其理化性质、结构、功能及系统演化关系,比较和分析在进化过程中真核生物、原核生物以及不同物种间FPPS的进化差异,以期为采用分子生物学和合成生物学手段,构建生产萜类化合物的微生物细胞工厂奠定基础。
选取已在NCBI-Genbank数据库中公布的20种生物的FPPS的核苷酸序列及氨基酸序列,序列号如表1所示。
表1 不同物种来源的法尼基焦磷酸合酶的核酸及蛋白质序列号
1.2.1 FPPS氨基酸序列分析
通过 ProtParam(https://web.expasy.org/protparam/)获得20个物种的FPPS氨基酸序列的理化性质。
1.2.2 FPPS系统进化分析
运用BioEdit将20个物种的核苷酸及氨基酸序列分别整合成一个Fasta格式的文件,然后利用Clustal Omega在线工具进行多序列比对,结果保存为“.clustal_num”格式的文件,可运用多序列比对结果编辑器如Jalview对其加工美化;系统进化树的构建和检验通过本地软件MEGA实施时,先将多序列比对结果保存成.meg格式,然后采用邻接法构建进化树,使用自展值(Bootstrap)重复检验1 000次。
通过在线工具ProtParam对FPPS的氨基酸序列进行研究,分析其氨基酸组成及理化性质,包括氨基酸数量、分子量、等电点、带正负电残基数、不稳定指数、脂肪族指数和蛋白质亲疏水性(GRAVY)等信息,相关结果如表2所示。
表2 不同物种来源的法尼基焦磷酸合酶氨基酸序列的理化性质
从表2可以看出,氨基酸数量为288~419个不等,等电点在4~7波动,脂肪族指数为100左右;不稳定指数>40的为不稳定类蛋白质,其中拟南芥、大肠杆菌、黑腹果蝇、牛、蜜蜂、黑猩猩、褐家鼠的FPPS属于不稳定类蛋白质,其余属于稳定类蛋白质;GRAVY为负值时,说明氨基酸为亲水性的,为正值时说明氨基酸是疏水性的,其绝对值越大则其表示亲/疏水性越强,即荚膜红细菌来源的FPPS为疏水性蛋白质,其余来源的FPPS为亲水性蛋白质。
2.2.1 FPPS氨基酸序列比对分析
基因组不同功能区段在演化过程中面对不同的选择压力,重要的区段不易发生变化,不重要的区段易发生变化。多序列比对在系统发育分析、基因和蛋白质功能分析、突变分析、序列拼接方面都有重要的应用。
通过多序列比对发现,结构域I中除蜜蜂第二位氨基酸残基为G外,G(1位)、K(2位)和R(5位)在另外19种生物中均为保守氨基酸,其赖氨酸残基能够促进FPPS与异戊烯焦磷酸(IPP)的结合。WANG等[15]发现与其他生物一样,植物FPPS也具有5个保守结构域,即:结构域Ⅰ(GKXXR)、结构域Ⅱ(EXXXXXXLXXDDXXDXXXXRRG)、结构域Ⅲ(GQXXD)、结构域Ⅳ(KT)和结构域Ⅴ(GXXFQXXDDXXDXXXXXXXXGK XXXDXXXXK)。SZKOPINSKA等[16]发现,FPPS具有2个天冬氨酸富集区,即结构域Ⅱ和Ⅴ中的DDXXD(X代表任意氨基酸)。
2.2.2 FPPS氨基酸序列分子系统进化分析
系统发育分析用于描述同源序列之间的亲缘关系的远近,为了探索不同物种之间FPPS的亲缘关系远近,利用上述多序列比对结果构建进化树,结果如图1所示。
由图1可知,FPPS蛋白的系统进化树聚类分为植物、真菌、动物和细菌4个类群,具有较显著的种族特异性。由上述多序列比对结果可知,蜜蜂FPPS氨基酸序列与其余真核生物FPPS相比,在保守区域某些位点容易发生变化,因此,蜜蜂与其余物种亲缘关系较远。而细菌等原核生物在保守位点发生一些位点的插入或缺失,因此,细菌单独聚成一支。
本研究以不同物种来源的FPPS核苷酸序列及氨基酸序列为研究对象,分析不同物种FPPS在进化中的差异,寻找它们易发生突变的位点以及保守序列。这为采用分子生物学技术,定点修饰编码该酶保守区中某些重要氨基酸残基密码子提高酶催化速率,进而提高次生代谢产物的合成提供一定依据。