连凯琪,纪 爽,2,周玲玲,时志琪,王 飞,2,张元臣,2
(1.安阳工学院 生物与食品工程学院,河南 安阳 455000;2.河南省太行山林业有害生物野外科学观测研究站,河南 林州 456550)
黏虫(Mythimnaseparate)是远距离迁飞的典型害虫,给我国及世界农业生产造成严重的经济损失。目前蛋白酶主要分为丝氨酸蛋白酶、巯基蛋白酶、天冬氨酸蛋白酶、金属蛋白酶和谷氨酸蛋白酶等,其中丝氨酸蛋白酶是黏虫等鳞翅目昆虫中肠蛋白酶的主要活性成员。丝氨酸蛋白酶家族是一类跨膜嵌合蛋白酶超家族,主要参与到降解蛋白质、防御细菌侵害、凝血过程、补体系统等生化反应中[1]。结构上,丝氨酸蛋白酶属于β蛋白,其催化中心主要由3个氨基酸组成,其中Ser有重要的作用,被定位于C端结构域上,其他2个(Asp和His)在N端结构域上。另外,包括底物结合位点和底物特异性口袋等行使重要功能的位点均位于C端结构域,因此,丝氨酸蛋白酶的C端结构域是主要功能区,而保证催化中心三联体的结构稳定性主要是N端结构域在发挥作用[2]。近些年,世界上众多的学者已经从许多昆虫体内克隆得到多种丝氨酸蛋白酶基因,并对其进行了生物学分析以及先天免疫、消化等生理功能的研究。其中,在盲蝽(Creontiadesdilutes)、甘蓝夜蛾(Mamestrabrassica)、蓖麻夜蛾(Achaeajanata)、飞扬阿夜蛾(Achaeajanata)等昆虫中都有丝氨酸蛋白酶研究的报道[3-4],在美洲棉铃虫(Helicoverpazea)、球菜夜蛾(Agrotisipsilon)、家蚕(Bombyxmori)、野桑蚕(Bombyxmandarina)和烟芽夜蛾(Heliothisvirescens)等昆虫体内扩增到多条丝氨酸蛋白酶基因[5-6]。Lange等[7]利用Sf21昆虫表达系统,获取了有活性的大型溞(Daphniamagna)丝氨酸蛋白酶;周晓群等[8]利用原核表达系统表达了苜蓿夜蛾(Heliothisdipsacea)中肠中克隆的丝氨酸蛋白酶基因。目前,研究者主要对黑腹果蝇(Drosophilamelanogaster)、家蚕、烟草天蛾(Manducasexta)等生物体内的丝氨酸蛋白酶的基因序列和生理功能开展了研究,而对于黏虫丝氨酸蛋白酶的相关研究较少。Zhou等[9]曾克隆了2种黏虫中肠丝氨酸蛋白酶基因,并研究了其在食物消化中的作用。
本研究克隆了一种新的黏虫丝氨酸蛋白酶基因(MsPG),首先采用RACE技术克隆黏虫中肠丝氨酸蛋白酶的全长基因,然后通过大肠杆菌原核表达系统表达黏虫丝氨酸蛋白酶,为进一步研究丝氨酸蛋白酶基因的功能奠定基础,也为黏虫新型杀虫剂的研发提供新的靶点。
所用昆虫由黑光灯诱捕方法捕获,用约8%蜂蜜水饲养于安阳工学院生物实验室内,待其产卵,将卵置于25 ℃、湿度约75%、光照周期14L∶10D的培养箱中利用小麦叶片进行饲养,得到四龄幼虫备用。
RNA反转录试剂盒、RNA酶抑制剂、DL2000 DNA Marker、2×PCR master mix、TaqDNA 聚合酶、质粒提取试剂盒、EcoR Ⅰ和Hind Ⅲ 限制性内切酶、Premixed Protein Marker(low)、T4-DNA连接酶、通用引物M13F/R和T7F/R购自宝生物工程(大连)有限公司;RACE试剂盒购自Clontech公司;DNA胶回收试剂盒购自OMEGA公司;pEASY-T3 Cloning Vector购自北京全式金生物技术有限公司;TRIzol购自Invitrogen公司;pET30a(+)Vector、E.coliDH5α和BL21感受态细胞由安阳工学院生物与食品工程学院实验中心保存。
在生理盐水中解剖四龄黏虫幼虫获取中肠,充分快速研磨后按照TRIzol提取RNA的方法提取总RNA。按照RNA反转录试剂盒的说明书,将RNA反转录成cDNA。根据NCBI GenBank上发表的鳞翅目昆虫粉蚊夜蛾(Trichoplusiani,登录号:XM_026875618.1)、斜纹夜蛾(Spodopteralitura,登录号:XM_022965589.1)等昆虫的丝氨酸蛋白酶序列信息,利用Primer 5.0软件设计1对特异性引物Ser-PRF和Ser-PRR(表1)。以反转录的cDNA为模板,PCR扩增MsPG的部分基因。PCR扩增体系:cDNA模板 1 μL,Ser-PRF和Ser-PRR(20 μmol/L)各0.5 μL,2×PCR master mix 25 μL,加ddH2O补充至50 μL。反应条件:95 ℃ 4 min;94 ℃ 40 s,56 ℃ 35 s,72 ℃ 1 min,40个循环;72 ℃ 10 min。将PCR反应产物进行1% 琼脂糖凝胶电泳,切胶回收目的片段,并构建到pEASY-T3克隆载体上,选择阳性质粒送苏州金唯智生物科技有限公司测序。
表1 试验所用引物序列Tab.1 Primer sequences used in the study
根据1.2中克隆测序获得的MsPG基因部分序列,设计扩增5′端和3′端的引物5GSP和5NGSP以及3GSP和3NGSP(表1)。以1.2中提取的总RNA为模板,按照参考文献[10]中的方法,分别扩增MsPG基因的5′端和3′端,并构建到pEASY-T3载体上进行测序。将获得的5′端和3′端基因序列以及1.2中获得的MsPG部分基因序列进行拼接,得到MsPG的全长序列。
将MsPG的全长序列在NCBI-Blast上进行比对,进而利用NCBI中的ORF Finder对开放阅读框(ORF)进行在线预测。根据基因序列推导其氨基酸序列,通过SignalP 4.1 Server对其信号肽进行预测,通过Protparam软件在线预测其分子质量和等电点。然后,采用DNAMAN 7.0软件对不同物种间丝氨酸蛋白酶氨基酸序列进行多重联配分析,利用MEGA 5.0软件中最大似然法构建系统进化树。
根据1.4中对ORF和信号肽的预测,将ORF基因去掉信号肽序列后进行引物设计(pr1F和pr1R),同时引入限制性内切酶EcoRⅠ和Hind Ⅲ的酶切位点(表1)。以1.2中合成的cDNA为模板,按照1.2中的PCR扩增体系和方法进行基因扩增,将PCR产物进行1%琼脂糖凝胶电泳,切下目的条带进行胶回收。使用EcoRⅠ和Hind Ⅲ分别对胶回收的目的片段和pET30a(+)载体进行双酶切,将酶切产物进行胶回收,按照一定比例将酶切后的目的片段和pET30a(+)载体混匀,在T4-DNA连接酶的作用下16 ℃连接过夜。将连接产物转化至E.coliDH5α感受态细胞中,涂布含卡那霉素的LB固体平板上,37 ℃恒温箱培养15 h,挑取单克隆菌落摇菌12 h,提取质粒进行鉴定,将鉴定阳性的质粒送苏州金唯智生物科技有限公司测序。
将重组质粒和空载体质粒分别转化E.coliBL21感受态细胞,涂布于含卡那霉素的LB固体平板上,37 ℃恒温箱培养12 h。挑取单克隆菌落置于10 mL含卡那霉素的LB培养基中,摇菌14 h。取200 μL菌液接种于10 mL含卡那霉素的LB培养基中,制取5管。同时设置1管空载体表达菌液作为阴性对照。将6管菌液置于37 ℃摇床中,200 r/min摇菌约3 h(OD600≈0.6)。向5管重组质粒菌液中加入IPTG(终浓度0.1 mmol/L),分别置于20,25,30,35,40 ℃摇床内,180 r/min诱导8 h。同时向pET30a(+)空质粒菌液加入相同浓度IPTG,置于20 ℃、180 r/min条件下诱导8 h,作为对照组。分别从6管菌液中取1.5 mL菌液到6个离心管中,13 000 r/min、25 ℃离心5 min,弃上清,收集菌体。用PBS重悬菌体,并加入蛋白质电泳上样缓冲液,沸水煮10 min,然后12 000 r/min离心1 min,吸取10 μL上清液进行SDS-PAGE分析。
通过反转录PCR获得MsPG基因部分核苷酸序列,共977 bp,之后利用Clontech公司的RACE试剂盒和自行设计的特异性RACE引物,扩增得到863 bp的5′端序列和约490 bp的3′端序列(图1)。将获得的核苷酸序列进行拼接得到目的基因全序列共2 010 bp,并命名为MsPG。随后通过ORF全长的扩增和测序进一步验证了MsPG基因。
M.DL2000 DNA 标记;1.MsPG片段的PCR产物;2.5′ RACE产物;4.3′ RACE产物;3,5.5′ RACE 和 3′ RACE的阴性对照。M.DL2000 DNA Marker;1.PCR product of partial MsPG gene;2.PCR product of MsPG by 5′ RACE;4.PCR product of MsPG by 3′ RACE;3,5.The negative control of 5′ RACE and 3′ RACE.
利用DNAMAN 7.0对所得到的全长序列进行分析,结果如图2所示,MsPG基因序列为2 010 bp,末端带有典型的Poly(A)尾。NCBI ORF Finder预测的ORF为1 593 bp,编码530个氨基酸,分子质量为67.6 ku,等电点7.63。SignaIP 4.1预测结果显示,其N端有一段长21个氨基酸残基的信号肽。参考已报道文献[9],发现MsPG活性中心为GDSGGP(图2)。根据于洁等[11]的报道,发现MsPG具有含6个半胱氨酸的clip结构域(图2),推测其属于clip型丝氨酸蛋白酶。
信号肽序列用浅蓝色阴影表示;活性中心(GDSGGP)用红色阴影表示;下划线部分为clip结构域;6个半胱氨酸由方框标记。
将MsPG编码的氨基酸序列在NCBI-Blast上进行搜索,显示其与鳞翅目昆虫的丝氨酸蛋白酶序列相似性为70.00%~91.92%,其中与烟芽夜蛾(登录号:PGG78401.1)的一致性最高,为91.92%。使用DNAMAN对黏虫和代表性昆虫的丝氨酸蛋白酶氨基酸序列进行多重比对,发现它们都具有丝氨酸蛋白酶的活性中心GDSGGP(图3)。
下划线表示氨基酸序列为活性中心GDSGGP。深色背景表示一致性为100%,红色背景表示一致性大于等于75%,浅蓝色背景表示一致性大于等于50%。HvB5.烟芽夜蛾(登录号:PCG78401.1);HaPE.棉铃虫(登录号:XP_021187378.1);S1TS.斜纹夜蛾(登录号:XP_022821357.1);AtX1.脐橙螟(登录号:XP_013191307.1);BaPS.丛林斜眼蝶(登录号:XP_023945684.1);PxPZ.柑橘凤蝶(登录号:XP_013176912.1);PpPE.玉带凤蝶(登录号:XP_013135138.1);DpPE.黑脉金斑蝶(登录号:XP_032527749.1);GmPE.大蜡螟(登录号:XP_026758758.1);AtX2.脐橙螟(登录号:XP_013191309.1);ApUN.灯蛾属(登录号:CAB3239924.1);MsPE.烟草天蛾(登录号:XP_030031627.1)。
利用MEGA 5.0软件中的最大似然法构建了丝氨酸蛋白酶的系统进化树,结果显示,黏虫MsPG与斜纹夜蛾、烟芽夜蛾和棉铃虫(Helicoverpaarmigera)的丝氨酸蛋白酶遗传距离较近(图4)。
图4 黏虫和其他物种丝氨酸蛋白酶氨基酸序列的系统进化树Fig.4 Phylogenetic tree of serine protease among Mythimna separate and other species based on amino acid sequences
通过PCR扩增MsPG基因去除信号肽序列的编码区序列,同时引入酶切位点EcoRⅠ和Hind Ⅲ,核酸电泳结果表明,扩增到1 547 bp的序列(图5)。
M.DL2000 DNA 标记;1,2.去除信号肽的MsPG ORF基因的PCR产物;3.重组质粒pET30a(+)-MsPG双酶切产物。
利用T4-DNA连接酶将EcoRⅠ和Hind Ⅲ酶切过的MsPG基因片段和pET30a(+)进行连接,对构建的重组质粒pET30a(+)-MsPG进行双酶切鉴定,核酸电泳结果表明,酶切产物出现2条带,其中一条约为1 547 bp(图5),与预期大小相符,测序结果进一步证实重组质粒pET30a(+)-MsPG构建成功。
将构建成功的重组质粒pET30a(+)-MsPG和空载体pET30a(+)转化到E.coliBL21菌株中,在不同温度下经IPTG诱导后,处理样品进行SDS-PAGE,结果表明,pET30a(+)-MsPG诱导组在66.4 ku附近出现一条特异性条带,与预期的67.6 ku相符,而对照组没有出现相同的条带,说明融合蛋白MsPG在大肠杆菌中成功表达,且在不同温度下的表达量有差别,25 ℃为最优表达温度(图6)。
M.蛋白质分子质量标准;1—5.分别为pET30a(+)-MsPG在40,35,30,25,20 ℃下的诱导表达;6.pET30a(+)的诱导表达。M.Protein Marker;1—5.Induced expression of pET30a(+)-MsPG at40,35,30,25,20 ℃,respectively;6.Induced expression of pET30a(+).
在昆虫的体液免疫中,丝氨酸蛋白酶参与到其抗菌过程,通过促进抗菌肽的合成,帮助昆虫抵御外敌。有研究表明,家蚕BmSP142能够有效地抑制病毒的增殖,帮助机体抵抗病毒的入侵[12]。在对烟草天蛾及黄粉虫(Tenebriomolitor)的丝氨酸蛋白酶基因的进化分析中发现,这些基因均有多个分支,且在机体的信号级联反应中起到类似的作用[13]。一些对鳞翅目昆虫的研究表明,玉米螟(Ostrinianubilalis)敏感菌株可溶性部分的丝氨酸蛋白酶含量与耐药菌株相比有显著差别[14]。丝氨酸蛋白酶参与苏云金芽孢杆菌(Bt)的原生酶激活和原生酶/毒素降解[15]。因此,对丝氨酸蛋白酶的研究有利于辅助Bt对害虫进行防治,为研发新一代杀虫剂奠定基础。中肠是黏虫消化吸收营养物质的主要场所,具有大量的微生物和蛋白质,丝氨酸蛋白酶是埃及伊蚊[16]、棉铃虫[17]和蓖麻夜蛾[18]中肠最重要的消化酶。Zhou等[9]对黏虫胰蛋白酶型丝氨酸蛋白酶和胰凝乳蛋白酶型丝氨酸蛋白酶基因的研究发现,前者与黏虫的消化和蜕皮密切相关,后者与有毒物质的消化降解密切相关。然而,目前对黏虫clip型丝氨酸蛋白酶基因的研究还未见报道。
本研究利用RT-PCR和RACE技术成功克隆黏虫的丝氨酸蛋白酶全基因序列,共2 010 bp,命名为MsPG,生物信息学分析发现,其开放阅读框为1 593 bp,编码530个氨基酸残基,这些特征与亲缘关系较近的其他丝氨酸蛋白酶相似。将MsPG氨基酸序列在NCBI-Blast上比对,发现其与其他昆虫氨基酸序列相似性达到70.00%~91.92%,其中与烟芽夜蛾(登录号:PGG78401.1)的一致性最高(91.92%)。对氨基酸序列分析发现,在N端有信号肽序列,具有多个半胱氨酸残基可以组成多个二硫键,还有保守的GDSGGP序列,可以参与降解底物的过程。氨基酸序列同源性分析发现,黏虫MsPG与其他鳞翅目昆虫丝氨酸蛋白酶的氨基酸序列一致性较高,推测它们行使的功能相似。丝氨酸蛋白酶具有保守性,它们都有类似的一级结构,主要包括clip结构、sushi结构、wonton结构、frizzle结构等[19],其中clip结构常具有35~60个氨基酸残基,并有6个半胱氨酸组成的3个二硫键[1],BmSP95就是clip型丝氨酸蛋白酶,其C端有1个类似于胰蛋白酶的丝氨酸蛋白酶结构域(tryp_spc),另外,还有1个富含脯氨酸的保守序列位于C端和N端之间[20]。本试验中黏虫MsPG的N端也含有clip结构域,推测其可能属于clip型丝氨酸蛋白酶。
本研究进一步构建了原核表达载体pET30a(+)-MsPG,并将其导入E.coliBL21感受态细胞中,利用IPTG在5个不同温度下对目的蛋白进行诱导,发现其最优表达温度为25 ℃。黏虫MsPG全长基因尚属首次克隆并公布,对于MsPG的功能仍不清楚,后续将进行融合蛋白纯化,深入研究MsPG的功能。
综上,本研究首次克隆并公布一种黏虫丝氨酸蛋白酶基因,其具有丝氨酸蛋白酶家族保守的功能位点,且在大肠杆菌原核表达系统中0.1 mmol/L IPTG诱导下的最佳表达温度是25 ℃。