月季新型PKSⅢ基因的生物信息学分析及原核表达

2022-12-07 11:30吉乃喆崔娇鹏赵世伟赵惠恩
关键词:合酶基序残基

汪 王,吉乃喆,崔娇鹏,赵世伟,赵惠恩

(1北京林业大学 园林学院,北京100089;2北京市园林科学研究院,北京100020;3 北京市植物园,北京100089)

月季品种‘月月粉’(Rosachinensis‘Old Blush’)花香的主要成分为1,3,5-三甲氧基苯(TMB)[1]。前人对TMB的生物合成过程已进行了广泛的研究,该过程以间苯三酚(PLG)为合成前体,在间苯三酚O-甲基转移酶(POMT)的催化作用下生成3,5-二羟基苯甲醚(DHA),随后苔黑酚O-甲基转移酶(OOMTs)催化最后2步甲基化反应,即OOMT1催化DHA形成3,5-二甲氧基苯酚(DMP),OOMT2催化DMP合成TMB[2]。目前关于PLG合成通路的研究仅在细菌中有过报道。PLG及其衍生物是在聚酮合酶(PKS)催化作用下形成的聚酮化合物[3]。PKS根据蛋白结构可以分为Ⅰ型、Ⅱ型和Ⅲ型,其中PKSⅠ和PKSⅡ仅存在于微生物中,PKSⅢ主要分布于植物中,也存在于少数细菌和真菌中[4]。PKSⅢ能够催化多种含有黄酮类骨架结构化合物的生物合成,如花青素、二苯乙烯、查尔酮、间苯三酚等,被认为是植物化学成分合成过程中的重要酶类[5]。

对荧光假单胞菌属的研究发现,间苯三酚合成酶A(phlA)、phlB、phlC、phlD、phlE和phlF等6个基因参与PLG的合成,其中phlA、phlB和phlC在真细菌和古细菌中保守,而phlD与植物的查尔酮合酶基因(CHS)和二苯乙烯合酶基因(STS)家族成员具有较高的同源性,系统进化分析表明,phlD基因属于Ⅲ型聚酮合酶(PKSⅢ)[6]。phlD也是PLG合成过程中最重要的基因,可以催化3个丙二酰-CoA单元的重复缩合反应,合成聚酮化合物3,5-二酮庚二酸酯,然后将聚酮化合物环化形成PLG[7]。在大肠杆菌中表达异源PhlD基因能显著提高大肠杆菌PLG的产量[8]。在植物中,关于PKSⅢ的研究也有一些报道。在褐藻中发现的PLG合成酶以及在杜鹃中鉴定出的苔黑素合成酶,其编码基因均属于PKSⅢ家族[9-11]。对‘月月粉’基因组测序发现,编码PLG合成酶的候选基因在花中具有较高的表达量,它们属于PKSⅢ型并且与POMT表达模式一致,因此可以作为候选基因来研究TMB合成的初始步骤[12]。

目前,已有20多种功能不同的植物PKSⅢ被鉴定,它们有30%~95%的序列具有同一性,其中最突出的成员是CHS和LAP5/6蛋白[13-15]。PKSs蛋白的不同功能是由其底物特异性、缩合轮数和环化反应的差异产生的,这些差异最终均受编码基因序列的控制[16-17]。PKSⅢ目前在月季中少见报道,其是否参与PLG的生物合成仍然未知。月季品种‘月月粉’基因组已被测序[18],基于此本研究对其PKSⅢ进行了全基因组分析,鉴定出6个PKSⅢ基因, 对其系统发育关系、催化位点残基组成、蛋白质结构及在花朵不同发育时期的表达水平进行分析,并诱导表达纯化了PKSs蛋白,以期为‘月月粉’RcPKSs基因的分类提供有价值的信息,并为探索其功能奠定基础。

1 材料与方法

1.1 试验材料

从北京林业大学林业科技温室(北纬116.35°,东经40.02°)采集月季品种‘月月粉’花蕾期、半开期和盛开期花朵的花瓣(图1),每个时期各采3朵,立即投入液氮中,于-80 ℃保存用于后续研究。

从左到右依次为花蕾期、半开期和盛开期花朵

1.2 月季PKSs蛋白的鉴定与生物信息学分析

从NCBI(https://www.ncbi.nlm.nih.gov/)下载其他月季品种的PKSs基因序列,将其在‘月月粉’基因组(https://iris.angers.inra.fr/obh/)中进行比对,获得RcPKSs基因信息。利用Pfam(http://pfam.xfam.org/)对RcPKSs蛋白质进行保守结构域(PF00195.14:Chal_sti_synt_N 和PF02797.10:Chal_sti_synt_C)分析,并在Smart数据库(http://smart.embl-heidelberg.de/)中验证,以确定筛选出的蛋白为PKSs。利用Open Reading Frame Finder(https://www.ncbi.nlm.nih.gov/orffinder/)分析RcPKSs的开放阅读框(ORF)及编码氨基酸,用ProtPara(http://web.expasy.org/protparam)分析蛋白质分子量和等电点(pI),用blastp(https://blast.ncbi.nlm.nih.gov/Blast.cgi)对RcPKSs蛋白质进行比对获得注释信息。用Mapchart绘制基因在染色体上的位置;用GSDS2.0在线软件(http://gsds.cbi.pku.edu.cn/)绘制基因结构图;用MEME(http://meme-suite.org/)在线软件识别蛋白质保守基序(motif),设置基序数量为10;用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对ORF上游2 000 bp序列进行启动子顺式作用元件分析,并使用HemI软件绘制热图。

1.3 月季PKSs蛋白序列及其系统发育分析

从NCBI下载已知物种的PKSs蛋白序列,采用MEGA7构建系统进化树,设置bootstrap tests值为1 000。采用DNAMAN对RcPKSs蛋白与紫花苜蓿(Medicagosativa)CHS2进行多序列比对,并进一步对活性位点(起始口袋、延伸口袋、催化三联体)结构进行比较,以揭示RcPKSs的催化特征。

1.4 RcPKSs蛋白的同源建模和结构特征分析

为了评估活性位点残基变化对蛋白质结构的影响,以紫花苜蓿CHS2的晶体结构为模板,利用SWISS-MODEL(https://swissmodel.expasy.org/interactive)对RcPKS4、RcPKS5和RcPKS6这3种蛋白进行同源建模分析,并利用CASTp(网址:sts.bioe.uic.edu/castp/calculation.html)对活性口袋进行分析。

1.5 TMB合成相关基因的实时荧光定量PCR(RT-qPCR)分析

以RcGAPDH作为内参,采用RT-qPCR分析TMB合成相关基因RcPKS4、RcPKS5、RcPKS6、POMT、OOMT1和OOMT2的相对表达量。使用RNA纯化试剂盒(TIANGEN公司产品)从‘月月粉’不同发育时期花瓣中提取总RNA,用qPCR反转录试剂盒(TOYOBO公司产品)合成第一链cDNA。利用NCBI网站Primer-BLAST工具(https://www.ncbi.nlm.nih.gov/tools/primer-blast/)设计引物(表1),交由北京擎科生物公司合成。采用三步法进行qPCR扩增反应,反应体系为:2×T5 Fast qPCR Mix 10 μL,10 μmol/L Primer F 0.8 μL,10 μmol/L Primer R 0.8 μL,Template DNA 1 μL,ddH2O 7.4 μL,总体系20 μL。反应程序为:95 ℃预变性1 min;95 ℃变性10 s,55 ℃退火5 s,72 ℃延伸15 s,循环40次。利用SYBR Green(Tsingke)对qPCR进程进行实时检测,采用2-ΔΔCt法[19]计算RcPKS4、RcPKS5、RcPKS6、POMT、OOMT1(ID:RC2G0349000)、OOMT1(ID:RC2G0348900)和OOMT2(ID:RC2G0374900)、OOMT2(ID:RC2G0349700)基因的相对表达量。每个发育时期设置3个生物学重复。

表1 实时荧光定量PCR引物

1.6 重组pET-32a-RcPKSs的原核表达与蛋白纯化

使用Prime 5.0设计RcPKSs基因特异性引物(表2),交由北京擎科生物公司合成。采用高保真酶KODMix(东洋纺)扩增RcPKSs全长,反应体系为:KODMix 12.5 μL,10 μmol/L Primer F 0.75 μL,10 μmol/L Primer R 0.75 μL,Template DNA 1 μL,ddH2O 10 μL。反应程序为:98 ℃变性10 s,55 ℃退火5 s,68 ℃延伸15 s,循环35次。扩增产物经1%琼脂糖凝胶电泳后,切胶回收目的条带,并连接T载体转化大肠杆菌DH5α,送往北京擎科生物公司测序。以测序正确的T-RcPKSs质粒为模板,采用高保真酶KODMix再次进行扩增,扩增体系和程序同上;扩增引物序列同表1,只是在上游引物的5′端加上了BamH Ⅰ酶切位点(GGATCC),在下游引物的5′端加上了NotⅠ酶切位点(GCGGCCGC)),扩增产物经1%琼脂糖凝胶电泳后,切胶回收目的条带,连接T载体转化大肠杆菌DH5α,送往北京擎科生物公司测序。将添加酶切位点的T-RcPKSs质粒经BamHⅠ和NotⅠ双酶切后与预先经同样双酶切后的pET-32a载体连接,连接产物转化大肠杆菌DH5α并送往北京擎科生物公司测序,将测序正确的重组质粒命名为pET-32a-RcPKSs。将重组质粒pET-32a-RcPKSs转化入大肠杆菌BL21中,培养后挑取单菌落在37 ℃、180 r/min条件下培养过夜,随后将菌液与LB液体培养基按1∶100的体积比同等条件下扩大培养,当菌液OD600为0.6~0.8时,加入终浓度为0.25 mmol/L的IPTG在20 ℃、140 r/min条件下诱导24 h,12 000 r/min离心10 min,弃上清,菌体沉淀保存于-20或-70 ℃冰箱中。

表2 RcPKSs全长扩增特异性引物

重组pET-32a-RcPKSs载体携带有6个组氨酸残基组成的融合标签,与固态的镍有强烈的吸附力,因此可用固定化金属螯合层析方法对重组蛋白进行分离纯化。在层析柱中加入1 mL次氨基三乙酸(NTA)(qiagen)介质,并分别用8 mL去离子水和8 mL上样缓冲液A(100 mmol/L NaH2PO4,10 mmol/L Tris,8 mol/L尿素,10 mmol/L 2-ME,pH=8.0)洗涤。在冻融后的菌体沉淀中加入5 mL上样缓冲液,放置于冰上进行超声波破碎。随后用振荡器轻柔地混匀样品60 min,4 ℃、12 000 r/min离心30 min,取上清样品进行镍离子(Ni2+)-NTA柱洗脱纯化,使用洗脱缓冲液B(100 mmol/L NaH2PO4,10 mmol/L Tris,8 mol/L尿素,pH=6.3)洗脱杂蛋白,直至洗脱液OD280为0.01,最终用洗脱缓冲液C(100 mmol/L NaH2PO4,10 mmol/L Tris,8 mol/L尿素,500 mmol/L咪唑,pH为8.0)洗脱目标蛋白。取10 μL纯化蛋白进行SDS-PAGE分析,目标蛋白分子量为34.33~35.90 ku,标签蛋白分子量为19 ku左右,观察融合蛋白条带的大小。

2 结果与分析

2.1 RcPKSs家族成员的鉴定与生物信息学特征

2.1.1RcPKSs基因家族成员信息 从‘月月粉’基因组中共筛选到6个RcPKSs基因,分别命名为RcPKS1(ID:RC1G0024800)、RcPKS2(ID:RC1G0024900)、RcPKS3(ID:RC1G0025000)、RcPKS4(ID:RC4G0108400)、RcPKS5(ID:RC6G0039300)和RcPKS6(ID:RC1G0261900),基因信息如表3所示。

表3 ‘月月粉’RcPKSs基因的基本信息

2.1.2RcPKSs生物信息学分析 由基因在染色体上的定位结果(图2)可知,6个基因位于3条染色体上,其中RcPKS1、RcPKS2、RcPKS3和RcPKS6位于染色体Chr01上,RcPKS4位于染色体Chr04上,RcPKS5位于染色体Chr06上。

图2 RcPKSs在染色体上的定位

由图3可知,所有RcPKSs基因都有2个外显子和1个内含子。蛋白质保守基序分析结果(图3)表明,RcPKS1、RcPKS2、RcPKS3和RcPKS4均有8个保守基序,且基序组成相同;RcPKS5和RcPKS6其他有7个保守基序,其组成也完全一致。进一步分析发现,RcPKS5和RcPKS6有2个基序在组成上与前4个RcPKSs的基序存在差异性。

图3 RcPKSs基因结构和蛋白质的保守基序分析

启动子顺式作用元件分析结果(图4)表明, CAAT-box和TATA-box顺式作用元件显著富集。一些顺式作用元件与激素相关,如脱落酸响应元件ABRE、茉莉酸、甲酯响应元件CGTCA-motif和TGACG-motif、乙烯响应元件ERE、赤霉素响应元件P-box;一些顺式作用元件与光响应相关,如G-Box、Box 4和AE-box;与低温响应相关的顺式作用元件LTR也被鉴定。此外,一些顺式作用元件与防御和应激反应相关,如MBS、MYB、MYC、STRE、W box和ARE。

图4 RcPKSs前15个富集启动子的顺式作用元件分析

2.2 RcPKSs的系统发育分析

对RcPKSs与其他植物的PKS氨基酸序列进行系统进化分析,结果(图5)发现,RcPKS1、RcPKS2和RcPKS3与玫瑰CHS蛋白聚为一支,进一步确认这3个RcPKSs为CHS。RcPKS4、RcPKS5和RcPKS6在系统进化树中与非CHS聚为一支,因此推断这3种酶可能是一种源自CHS的新型酶。

CHS.查尔酮合酶;STS.二苯乙烯合酶;ACS.吖啶酮合酶;STCS.二苯乙烯羧酸合酶;CTAS.对香豆酰三乙酸合酶;CURS.姜黄素合酶;DCS.β -酮酰辅酶A合酶;BAS.苯亚甲基丙酮合酶;VPS.苯戊酮合酶;OLS.二羟基戊苯合酶;ALS.芦荟松合酶;2PS.2-吡喃酮合酶;PYKS.吡咯烷酮合酶;PCS.聚五酮色原酮合酶;OKS.聚八酮合酶;BPS.二苯甲酮合酶;BIS.联苯合酶;ADS.烷基乙酮CoA合酶;QNS.喹诺酮合酶;AQS.烷基喹诺酮合酶;BBS.联苄合酶;ORS.5-甲基间苯二酚合酶;CHSL1.二苯乙烯羧酸合酶1;ARS.烷基间苯二酚合酶;CUS.类姜黄素合酶;PhlD.间苯三酚合成酶D

2.3 RcPKSs与紫花苜蓿CHS2蛋白多序列比对及蛋白三维结构比较

2.3.1 序列比对 序列比对发现,RcPKS1、RcPKS2和RcPKS3与紫花苜蓿CHS2蛋白的相似度较高,均为72.16%;其次为RcPKS4,相似度为67.52%;而RcPKS5和RcPKS6与紫花苜蓿CHS2相似度较低,分别为33.85%和32.73%。

2.3.2 活性位点上氨基酸残基的比较 活性位点结构比较有助于揭示RcPKSs的催化特征。由表4可知,RcPKS1、RcPKS2和RcPKS3的氨基酸残基在紫花苜蓿CHS的活性位点上均保守,推测这3种聚酮合酶为CHS。在RcPKS4起始口袋中,氨基酸残基Ile 254和Gly 256(根据紫花苜蓿CHS2编号,下同)分别被Met 192和Leu 194替换;在延伸口袋中,氨基酸残基Val 196、Thr 197和Ser 338分别被Ile 133、Ile 134和Thr 276取代。RcPKS5和RcPKS6活性位点替换只发生在延伸口袋中,且替换位置相同,即Thr 132、Val 196和Thr 197分别被Ser 61、Ile 125(Leu 125)和Gly 126所取代。这些活性位点参与调节CHS相关酶的底物特异性和催化特性[20],因此推测RcPKS4、RcPKS5和RcPKS6为新型的聚酮合酶,且RcPKS5和RcPKS6可能具有相似的催化功能。

表4 紫花苜蓿CHS2与RcPKSs活性位点上氨基酸残基的比较

2.3.3 蛋白三维结构比较 序列比对结果表明,尽管RcPKS5和RcPKS6与紫花苜蓿CHS2(MsCHS2)的同源性相对较低,但蛋白质结构采用了几乎相同的αβαβα三维整体折叠形式(图6),每个单体都含有一个功能独立的活性物质,位于下域和上域之间的裂缝中[21]。通过CASTp网站在线分析发现,RcPKS4、RcPKS5和RcPKS6氨基酸残基的替换都发生在紫花苜蓿CHS2表面积和体积最大的活性口袋上。

不同颜色的卷曲和条带表示不同的蛋白质肽链,蛋白质三维结构按照图例颜色从N-末端向C-末端折叠

2.4 TMB合成相关基因的表达模式

由图7可知,RcPKS4和RcPKS6在花发育过程中表达量持续增加,于盛开期达到最大值,其中RcPKS4在盛开期表达量增幅最大;RcPKS5在花发育不同时期的表达量呈先降低后增高的趋势,也在盛开期达到最大值。POMT(ID:RC6G0495-200)、OOMT1(ID:RC2G0349000和RC2G03489-00)和OOMT2(ID:RC2G0374900和RC2G03497-00)是催化PLG形成TMB生物过程中重要酶的编码基因[22],由图7可以看出,随着花的发育,POMT的表达量持续下降,而OOMT1和OOMT2的表达量均呈先增高后降低的趋势,并且以盛开期表达量最低。

图7 ‘月月粉’不同开花时期相关基因的表达模式分析

2.5 RcPKSs重组蛋白的诱导与纯化

SDS-PAGE结果(图8)表明,在43~55 ku处有目标蛋白出现,且条带较为单一,表明目标蛋白诱导表达纯化成功。

M.蛋白质Marker;1.RcPKS1蛋白;2.RcPKS2蛋白;3.RcPKS3蛋白;4.RcPKS4蛋白;5.RcPKS5蛋白;6.RcPKS6蛋白

3 讨 论

本研究从‘月月粉’基因组中共鉴定出6个PKSⅢ基因,系统进化分析发现,RcPKS1、RcPKS2和RcPKS3与植物CHS蛋白聚为一支,而RcPKS4、RcPKS5和RcPKS6与非CHS聚为一支,因此推断前3个RcPKSs为CHS蛋白,后3个为一种新型的非CHS蛋白,并且它们在花朵盛开时期的表达量均达到最大值,表明其在花发育后期可能具有重要调控作用。POMT、OOMT1和OOMT2是TMB合成过程中的3个重要甲基化酶编码基因[23],在月季花发育过程中,POMT表达量持续下降,而2个OOMT1和2个OOMT2基因均呈现先上升后下降的表达模式。由于‘月月粉’仅释放微量TMB,因此PLG可能被POMT在花蕾时期甲基化,然后在开放过程中被OOMT1和OOMT2甲基化合成TMB。前人测定了月季不同开花阶段花瓣中TMB及其合成前体PLG、DHA、DMP在细胞中的含量,发现PLG、DHA、DMP的含量较低,而TMB的含量相对较高,表明这3个合成前体与TMB的含量无明显的相关性[22]。本研究对3种合成前体的重要酶编码基因POMT、OOMT1和OOMT2的表达量进行了分析,发现它们在花发育后期表达量较低。一般而言,物质含量与其基因的表达水平在一定程度上具有关联性,据此推测在花发育后期TMB合成3种前体物质的含量可能较低。

由于植物PKSⅢ超家族酶是高度同源的序列,因此仅从氨基酸序列推测酶的催化功能是很困难的。事实上,仅对活性位点进行很小的修改,甚至是单个氨基酸的替换,都会极大地改变酶的催化功能及其产物特性[15]。因此,对PKSⅢ蛋白质结构的解析是理解酶的结构-功能关系以及催化机制的先决条件[24-25]。对酶活性位点的结构进行比较,有助于揭示酶的催化特征。PKS 197,256,338,215,265氨基酸残基(根据紫花苜蓿CHS2编号)发生变化可能影响PKS的聚酮链长度、底物的选择性和建环反应[15]。本研究结果显示,RcPKS1、RcPKS2和RcPKS3在这些氨基酸残基上与MsCHS2高度保守,表明它们与CHS具有相同的催化功能;RcPKS4在197,256和338氨基酸残基处发生了改变,RcPKS5和RcPKS6在197氨基酸残基处发生了改变,表明它们可能具有新的催化功能。据报道,活性位点腔的形状和体积极大影响PKSⅢ酶的底物特异性,并且控制聚酮化合物的最终长度[26]。本研究从结构上阐明了‘月月粉’RcPKSs蛋白的催化特点,构建了pET-32a-RcPKSs原核表达载体,并诱导表达、纯化了RcPKSs重组蛋白质。

猜你喜欢
合酶基序残基
人分泌型磷脂酶A2-IIA的功能性动力学特征研究*
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
四种中药单体选择性抑制环氧合酶-2活性的评价
基于支持向量机的蛋白质相互作用界面热点残基预测
一氧化氮合酶抑制剂治疗实验性自身免疫性心肌炎的研究