海洋链霉菌差向异构结构域基因的克隆与分析

2022-12-14 07:46吴欣园朱晨阳薛永常
现代食品科技 2022年11期
关键词:跨膜结构域质粒

吴欣园,朱晨阳,薛永常

(大连工业大学生物工程学院,辽宁大连 116034)

放线菌是诸多天然生物活性物质的重要来源,目前已从放线菌中发现了10 000 多种生物活性化合物[1],具有广泛实际用途和巨大经济价值。海洋放线菌尤其是链霉菌具有陆地微生物所不具备的适应性[2,3],能在高盐、高压、低温和寡营养等条件下产生具有特殊化学结构的次级代谢产物[4,5],其大都是通过非核糖体肽合成酶(Non-Ribosomal Peptide Synthetase,NRPS)和聚酮合酶途径产生[6]。NRRS 是一种多功能大型合成酶,由执行不同功能的结构域组成的模块按特定顺序排列而成[7-10](图 1),NRPS 体系除了腺苷化(Adenylation,A)结构域、肽基载体蛋白(Peptidyl Carrier Protein Domain,PCP)、缩合(Condensation,C)结构域等三个必需的核心结构域外,还有差向异构(Epimerization,E)结构域、硫酯酶(Thioesterase,TE)等修饰性结构域[11],共同完成非核糖多肽(Non-Ribosomal Peptide,NRP)的生物合成及组装。在细菌、蓝藻和真菌中NRPs 具有抗真菌、抗病毒、抗肿瘤和免疫抑制剂等非常重要的药理活性[12-14],广泛应用于医药领域。

图1 NRPS 模块组成及合成机制[10]Fig.1 Module composition and synthetic mechanism of NRPS

E 结构域作为NRPS 组成模块中常见的修饰性结构域,能将连接在PCP 结构域上的L-氨基酸(L-Amino Acid,L-AA)立体异构化为D-氨基酸(D-Amino Acid,D-AA),掺入到正在延伸的NRP 上,从而增加了NRP组成的多样性[15]。由E 结构域催化引入的D-AAs 不仅影响产物肽的最终构象以及下游加工单元模块(如硫酯酶结构域)的接受性[16],还在确保延伸模块的正常工作方面发挥重要作用[17]。在增加NRP 功能和结构多样性的同时还降低其蛋白水解敏感性,提高了NRP 的抗癌抑菌活性[18]。目前,在E 结构域异构化机制及其晶体结构已有所研究,Stachelhaus 等[19]研究短杆菌素S合成酶GrsA E 结构域的突变时发现753His 和892Glu 影响异构化活性。而Samel 等[16]解析了酪氨酸合成酶的E结构域晶体结构,发现822Glu 可能作为酸碱催化剂起作用,743His 则是用来稳定异构化过程中产生的瞬时烯醇中间体。在GrsA 的PCP-E 双结构域中,753His 的咪唑侧链与磷酸泛酰巯基乙胺基(4′-Phosphopantetheinyl,Ppant)的硫原子相连[20]。Kim 等[21]则在研究GrsA 的E结构域催化机制发现,只有753His 能与氯乙烯基甘氨酸形成稳定的酶探针加合物,进一步证实了His 在异构化过程中的重要地位。随着对NRPS 高级结构研究的深入,各结构域间的相互作用机制受到广泛关注。Chen等[20]研究GrsA 的PCP-E 双结构域时首次提出了PCP与E 结构域之间是通过613Arg/788Asp、614Arg/785Glu 两个盐桥提供的静电相互作用发生结合的。由于E 结构域与上下游结构域的供体位置相互作用以及其底物识别和催化机理尚不透彻,E 结构域与PCP 结构域的具体作用还需进一步剖析。而对E 结构域的分子机理和生物学作用的研究,对揭示NRPS 模块间的通信机制、NRPS 的结构域操纵和重排以及新药的研发都有重要意义。本研究通过从实验室保存的具有完整NRPS 基因簇的海洋链霉菌基因组DNA 中扩增E结构域基因,并进行生物信息学分析,以期对随后深入研究其结构与功能提供参考。

1 材料和方法

1.1 试验材料

1.1.1 菌株与质粒

本文链霉菌Streptomycessp.X66 是由实验室保藏菌株[22],大肠埃希菌(Escherichia coli)DH5α、BL21(DE3),表达载体pET-32a(+)均为实验室保存。pMDTM19-T 载体购自宝生物工程(大连)有限公司。

1.1.2 培养基

LB 液体培养基、LB 固体培养基、高氏一号固体培养基配置参考文献[23]。

1.1.3 试剂与仪器

细菌基因组DNA 提取试剂盒、柱式DNA 胶回收试剂盒,生工生物工程(上海)有限公司;FastPure 质粒提取试剂盒、DNA Marker DL2000,南京诺唯赞生物科技有限公司;QuickCutTMEcoRⅠ(15 U/μL)、QuickCutTMHind Ⅲ(15 U/μL)、PrimeSTAR®Max DNA Polymerase,宝生物工程(大连)有限公司;DNA MarkerⅣ,天根生化科技(北京)有限公司;PCR Thermal Cycler Dice TP610,日本TaKaRa。

1.2 试验方法

1.2.1 引物设计

参考GenBank 数据库中Streptomyces albidoflavusstrain W68(登录号:CP064783.1)NRPS 中E 结构域基因序列,使用Primer Premier 5.0 软件设计特异性引物。同时在引物的5′端添加EcoR Ⅰ、Hind Ⅲ酶切位点,所设计引物为:

E-F:5′-CGGAATTCATGCTGCGCGCCGTCTAC-3′

E-R:5′-CCAAGCTTACTGAGCGCGGGAGTAGGAC-3′

由北京六合华大基因科技有限公司合成。

1.2.2 E 结构域基因克隆及鉴定

以Streptomycessp.X66 基因组DNA 为模板,E-F和E-R为特异引物进行PCR扩增。PCR扩增体系为20 μL:ddH2O 8.5 μL、E-F(10 μmol/L)及E-R(10 μmol/L)各0.5 μL,PrimeSTAR®Max Premix 10 μL,基因组DNA 0.5 μL。1wt%琼脂糖凝胶电泳检测扩增产物,回收目的片段与pMDTM19-T载体连接,并转化大肠杆菌DH5α感受态细胞。阳性重组质粒经特异引物PCR、双酶切及测序鉴定。

1.2.3 E 结构域基因生物信息学分析

利用NCBI(http://www.ncbi.nlm.nih.gov/)数据库Nucleotide Blast 对测序结果进行比对;ORF Finder对该扩增序列进行翻译,获得其拟编码的氨基酸序列;使用ExPASy ProtParam[24]和Protscale[25]对拟编码的氨基酸序列的理化性质及亲/疏水性分析;采用TMHMM 2.0 Server[26]、SignalP 6.0 Server[27]在线工具对蛋白的跨膜结构域、信号肽进行预测;采用SOPMA[28]和SWISS-MODEL[29]预测其二级结构以及三级结构模型;NCBI 数据库中的CDD 工具预测该蛋白的保守区域;Protein Blast 搜索E 结构域的同源蛋白,选取相似性>85%的蛋白利用DNAMAN 软件进行氨基酸多重序列比对分析;利用MEGA X[30]软件基于邻接法分析E结构域蛋白和其他物种E结构域蛋白的系统发生关系。

1.2.4 E 结构域蛋白的异源表达

利用QuickCutTMEcoR Ⅰ和QuickCutTMHind Ⅲ对pET-32a(+)及构建的重组质粒pMDTM19-T-E进行双酶切,回收目的片段,连接并转入大肠杆菌BL21(DE3)感受态细胞。分别培养只含pET-32a(+)单克隆菌及含有重组子pET-32a(+)-E单克隆菌落,待OD600为0.6 时,加入IPTG 使反应终浓度达到0.5 mmol/L,16 ℃诱导12 h 后,进行SDS-PAGE 分析目的基因的表达。

2 结果与分析

2.1 E 结构域基因的克隆

以Streptomycessp.X66 基因组DNA 为模板,E-F和E-R 为特异引物扩增目的基因片段。经1%琼脂糖凝胶电泳检测(图2),在1 100 bp 左右有单一清晰扩增条带,与预期的E 结构域基因片段大小基本一致。

图2 E 结构域基因扩增产物凝胶电泳图Fig.2 Agarose gel electrophoresis of E domain gene fragment

回收目的片段与pMDTM19-T 载体连接,转化大肠杆菌DH5α感受态细胞,选取阳性菌落提取质粒。电泳发现能够在3 500 bp 左右出现了一条清晰明亮条带(图3),这与预期的质粒大小一致。

图3 质粒DNA 电泳图Fig.3 Agarose gel electrophoresis of recombinant plasmid

以重组质粒DNA 为模板进行特异性扩增(图4),扩增的条带大小在1 100 bp 左右,与目的条带的大小相符,说明该重组质粒含有目的片段。将该重组质粒命名为pMDTM19-T-E。

图4 质粒DNA 中扩增E 结构域基因电泳图Fig.4 Agarose gel electrophoresis of E domain gene amplified from recombinant plasmid DNA

用限制性核酸内切酶EcoR Ⅰ、Hind Ⅲ双酶切重组质粒(图5),在3 000 bp 左右与1 100 bp 左右各得到一条清晰条带,符合预期的结果,证明目的基因成功插入T-载体中。将重组质粒送至生工生物工程(上海)股份有限公司测序。

图5 重组质粒双酶切电泳图Fig.5 Recombinant plasmid cut by Hind III and EcoR I

测序结果得知,该插入片段为1 099 bp。Blast 序列比对表明其与Yao 等[31]公布的Streptomyces albidoflavusstrain W68 的E 结构域基因序列相似度达99%以上(图6),证明扩增的基因片段为E 结构域基因序列。

2.2 E 结构域基因生物信息学分析

通过ProtParam 工具对该扩增序列编码的氨基酸进行分析,该E 结构域基因共拟编码366 个氨基酸,分子式为C1752H2738N510O523S3,理论等电点为5.69,不稳定指数为32.68,平均亲水系数为-0.15。该E 结构域蛋白的等电点小于7,不稳定指数小于40 且平均亲水系数为负值,推测该蛋白可能是一个酸性亲水稳定蛋白。

蛋白质的亲疏水性决定了它在水中的可溶解性,高度可溶的蛋白质一般都是亲水性的部分裸露在最外面,而疏水性氨基酸在内部。利用Protscale 软件,选用默认Kyte & Doolittle 计算方法分析该蛋白的亲疏水性(图7),发现在E 结构域蛋白序列中,在第143位氨基酸处存在最小值-2.25,此处亲水性最强,疏水区在第204 位氨基酸处有最大值2.33,亲水区域比疏水区域稍多一些,整体呈现亲水性,预测该蛋白为可溶性蛋白,这也与ProtParam 中的分析结果相吻合。

图7 E 结构域蛋白亲水性/疏水性预测Fig.7 Prediction of hydrophobicity/hydrophilicity of E domain protein

跨膜结构域多为强疏水性氨基酸组成,根据氨基酸亲疏水性结果推测,拟翻译的蛋白不具备跨膜结构。为进一步验证该猜想,利用TMHMM 软件预测E结构域蛋白跨膜结构域(图8),跨膜信号没有波动,编码产物中不存在跨膜螺旋结构,故该蛋白为非跨膜类蛋白质。

图8 E 结构域蛋白跨膜结构域预测Fig.8 Transmembrane domain prediction of E domain protein

信号肽通常用于指导蛋白质的跨膜转移或定位,运用SignalP 预测该蛋白信号肽(图9),结果显示该蛋白不具备信号肽。据此猜测可能是因为其不是分泌蛋白或者异构化反应中不涉及蛋白质的转移,所以也不会存在跨膜结构。这一结果与E结构域基因拟表达蛋白的跨膜结构预测结果相符合。

图9 E 结构域蛋白的信号肽预测Fig.9 Signal peptide prediction of E domain protein

应用SOPM 软件对该蛋白的二级结构进行预测(图10)。该蛋白的二级结构由41.69%的α-螺旋、17.44%的延伸链、3.81%的β转角和37.06%无规则卷曲组成。其中以稳定的α-螺旋结构为主,说明E 结构域基因拟表达蛋白的二级结构较为稳定,这也与ProtParam 中的理化性质结果相吻合。以酪氨酸合成酶B 第三个模块的差向异构化结构域TycB3(E)的晶体结构为模板构建E 结构域蛋白的三维结构,运用SWISS-MODEL 进一步分析其三级结构(图11),发现序列相似性为0.37,这与Samel 等[16]和Chen 等[20]的结果基本一致,左右两个与氯霉素乙酰转移酶结构类似的亚域构成E 结构域的主体部分,活性位点位于两个亚域的交界处,整体均呈“V”字型结构。该蛋白结构整体以α-螺旋为主,还包含少量的无规卷曲和延伸链,符合二级结构的预测结果。

图10 E 结构域蛋白二级结构预测Fig.10 Prediction of the secondary structure of E domain protein

图11 E 结构域蛋白三级结构预测Fig.11 The tertiary structure prediction of E domain protein

通过CDD 工具预测了E 结构域的保守区域(图12),可以看出该序列中含有E 结构域催化的特有结构域,属于C 结构域超家族成员,该超家族还包括环化结构域,双重E/C 结构域,因此可以判定克隆的目的基因片段属于E 结构域基因。

图12 E 结构域蛋白保守结构域分析Fig.12 Domain analysis of E domain protein

用NCBI Blast 检索工具比对E 结构域基因拟编码的氨基酸序列,选取数据库中相似性较高的9 个蛋白质序列,使用DNAMAN 进行多重序列比对分析(图13),发现该E 结构域的氨基酸序列与同属其他物种的相似度较高,氨基酸序列较为保守,且含有一段E 结构域保守基序HHxxxD。

图13 氨基酸多序列比对Fig.13 Alignment of the predicted amino acid sequences

MEGA X 构建的E 结构域蛋白的系统发育进化树(图14)显示该E 结构域蛋白质序列与Streptomyces albidoflavus的NRPS 处于同一分支,同源性达到95%,亲缘关系较近;与Streptomyces scopuliridisRB72的E结构域蛋白序列同源性较低,亲缘关系相对较远。

图14 E 结构域蛋白进化树分析Fig.14 Phylogenetic tree of E domain protein

2.3 E 结构域基因的异源表达

选取含 pET-32a(+)的单菌落及构建成功的pET-32a(+)-E阳性表达质粒的单菌落进行低温诱导培养,样品处理后用SDS-PAGE 进行检测,结果如图15。

图15 E 结构域基因拟表达蛋白SDS-PAGE 分析Fig.15 SDS-PAGE analysis of E domain gene expression

作为对照的pET-32a(+)质粒对诱导物IPTG添加与否对其表达没有影响。而含有pET-32a(+)-E的菌株在未加入IPTG 时,没有目的蛋白的表达;在加入IPTG低温诱导12 h 后,在55 ku 左右出现明显的条带,这与预测的融合蛋白大小相近,说明E结构域基因在大肠杆菌BL21(DE3)中能够表达。

3 结论

本研究从海洋链霉菌Streptomycessp.X66 的基因组中扩增获得1 099 bp 的E结构域基因序列,其编码366 个氨基酸,生物信息学分析发现它具有差向异构结构域特有的保守基序HHxxxD,理论等电点为5.69,不稳定指数为32.68,故该基因拟翻译的蛋白为酸性稳定的非分泌型蛋白质。平均亲水系数为-0.15,结合其亲疏水性预测结果来看,该蛋白为亲水性蛋白,不存在信号肽和跨膜结构域;其二级结构和三级结构显示主要以α-螺旋和无规则卷曲结构为主,与已报道的酪氨酸合成酶B(PDB ID:6TA8)的E 结构域晶体结构具有高度相似性。同源比对和系统发育进化树发现,在链霉菌属中E 结构域基因编码的氨基酸序列相似性较高,能看出E 结构域基因在不同种属内具有极高的保守性,这也对应了E 结构域蛋白保守的立体异构功能。在0.5 mmol/L 的IPTG 诱导下,目的基因能表达得到大小为55 ku 左右的融合蛋白,这为深入开展E 结构域蛋白的功能研究提供参考。

猜你喜欢
跨膜结构域质粒
本期英文缩略语名词解释
细菌四类胞外感觉结构域的概述
mcr-1阳性类噬菌体质粒与F33∶A-∶B-质粒共整合形成的融合质粒的生物学特性分析
西湖大学:首次实现跨膜孔蛋白的精确从头设计
革兰氏阳性菌蛋白结构域特征分析
囊性纤维化跨膜转运调节体对血压及血管功能的影响
跨膜运输,孰是孰非?
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
重组质粒rAd-EGF构建并转染hDPSCs对其增殖的影响
Survivin-siRNA重组质粒对人神经母细胞瘤细胞SH-SY5Y的作用