张荣宗,江丁文,陈锦香
(惠安县乡镇畜牧兽医站,福建 惠安 362100)
枯草芽孢杆菌是一种有益菌,广泛分布在土壤、空气、水和腐败的有机物中。它是一种革兰氏阳性杆菌,大小为1.5μm×3.0μm,菌落粗糙、褶皱,能够运动,具有可休眠的芽孢结构。其中芽孢由芽孢衣和皮层等组成,可以抵抗不良环境的影响[1-2]。枯草芽孢杆菌能够消毒抑菌防腐,可以分泌多种酶和抑菌物质,阻止病原菌生长,使植物在表皮层形成保护膜[3]。除此之外,它还能够促进动物肠道有益菌生长、水生态环境修复、粪污除臭、杀灭寄生虫和卵、减少蚊虫苍蝇等的滋扰[4-5],对铀、锰、砷等重金属富集[6],起到促进生殖生长激素分泌、修复创伤感染、保护神经元、抗肿瘤活性、促血管扩张、营养保健、减少蛋白过敏源和增强动物免疫力[7]等作用。枯草芽孢杆菌可应用在生态发酵、微生物医学、动植物生产和保护、消毒杀虫、基因宿主细胞表达、生物制剂和生物防治、粪污环境污染控制等方面[8]。
在生物核酸基因转录翻译中,氨基酸的密码子在选择上存在偏好性,通过密码子优化增加宿主细胞中的最优密码子及次优密码子,可以使表达量提高几倍甚至几十倍[9-10]。为获得特定基因的表达蛋白,可先扩增不含信号肽和前导肽的编码基因,扩增片段连接质粒载体构建质粒重组体,然后将连接产物CaCl2法转化原核菌株或者电转化真核菌株,表达成熟的蛋白,最后运用SDS-PAGE和免疫印迹法检测蛋白[11-13]。其中,核酸基因的表达系统有以己糖类等为底物的大肠杆菌,以甲醇为碳源的毕赤酵母,保留野生菌株活性的枯草芽孢杆菌蛋白酶,以及病毒感染的昆虫细胞和哺乳动物细胞等。
枯草杆菌蛋白酶是碱性丝氨酸水解酶,包括解淀粉芽孢杆菌的枯草杆菌蛋白酶BPN’、地衣芽孢杆菌的枯草杆菌蛋白酶Carlsberg和枯草芽孢杆菌的枯草杆菌蛋白酶E,以及其他芽孢杆菌的枯草杆菌蛋白酶,可以水解合成过氧乙酸,用在洗涤剂、漂白剂、添加剂、制革、丝绸等方面,其催化中心活性由结合O到结合S、Se逐渐减弱[14-18]。枯草芽孢杆菌的枯草杆菌蛋白酶,能减少有毒有害物质成分的残留,对真菌产生抑制作用,快速发酵分解粪污,是良好的生物安全控制剂。为了合理运用枯草芽孢杆菌,可使用基因重组杂交、连接转化、突变等方法,对基因密码子进行优化表达,提高枯草芽孢杆菌活性物质的产量[19-20]。
本文引用的序列数据主要用来了解基因分子生物信息学、进化和结构等,以期对信息进行比较利用,不负责侵权责任,其中优化的密码子序列为成熟蛋白酶基因序列。通过分析枯草芽孢杆菌蛋白酶的作用,实现在宿主细胞中表达,将有助于畜牧业、特种养殖、实验动物的生态发展,稳产保供和粪便集中统一无害化处理,有助于对流浪宠物、鸟类、野生动物等公共动物资源的生态管理和节育保护或利用,有助于动物生理的健康繁殖发育和巡查检验。
根据genebank(登录号:MK673996.1)公开的芽孢杆菌蛋白酶编码基因序列,通过SignalP-5.0分析,去除31个氨基酸信号肽,取不含前导肽的序列分析密码子;根据DNAman分析,枯草芽孢杆菌成熟蛋白酶基因的酶切位点Eco56 I位于39位,Pvu II位于817位。枯草杆菌蛋白酶编码基因碱基含量见表1、表2,密码子第1位GC含量为53.99%,密码子第2位含量为52.54%,密码子第3位含量为40.22%,密码子GC含量依次递减,GC总含量为48.91%,密码子第3位含量以A、T为主。
表1 枯草杆菌蛋白酶编码基因碱基含量Tab.1 Base content of subtilisin coding gene
表2 枯草杆菌蛋白酶编码基因碱基含量(2)Tab.2 Basecontent of subtilisin encoding gene
密码子有效数(Effective number of codons,Nc)表示基因转录氨基酸所使用的密码子类型数量,一般数值在20~61。Nc值越小,说明该基因密码子偏性越强;反之,说明该基因密码子偏性越弱,使用的稀有密码子较多,表达效率低。密码子适应指数(codon adaption index,CAI)表示基因完全使用高表达基因的密码子程度,其数值范围在0~1,数值越大,越接近高表达基因使用的密码子。枯草杆菌蛋白酶编码基因Nc值为42.677,CAI值为0.647,均处于中等偏性,可对其密码子进一步优化。
相对同义密码子使用度(Relative Synonymous Codon Usage,RSCU)指编码同一种氨基酸的密码子间的相对概率,当RSCU大于1时,表示密码子使用偏性较高,其为优势密码子。同义密码子的改变会使mRNA结构稳定改变而影响翻译效率,尽可能使表达的基因同义密码子与宿主的密码子用法一致,或者调整α螺旋中间非结构部分翻译速度,将有助于提高基因表达水平。选择合适的表达载体和启动子(pET20b-T7、Pcold-cspA、pET28a(+)-T7、pPIC3.5K-AOX1等)、匹配度高的信号肽(PelB、OmpA等)等,可使表达更加稳定。在发酵培养基中添加甘氨酸、SDS、吐温-20、CTAB、蔗糖、Na+、Mg2+、Ca2+等添加物,可以提高细胞膜通透性以提高蛋白的分泌,但可能存在阻碍细胞生长的问题。密码子偏好性的另外一个原因是不同宿主细胞的tRNA丰度不同,可通过过量表达tRNA来识别稀有密码子以减少密码子偏性[9]。
密码子使用频率(Codon Usage,CUSP)是指基因密码子在编码中的使用频率。利用一定的宿主细胞(E.coli BL21、P.pastoris SMD1168、B.megaterium MS941等)进行表达时,要考虑表达基因和宿主细胞载体的CUSP、优势密码子尽可能一致。提高基因表达水平的方法,一是通过DNA编码结构链或信号肽密码子优化,减少稀有密码子,调整GC含量;二是防止中间出现终止密码子或者待切酶切位点;三是对mRNA二级结构优化,利用特异性引物等合成改造新的编码序列(固相亚磷酰胺三酯法、二步重叠PCR法、热力学平衡由内向外TBIO法等)[21]。在优化过程中要尽量避免第2位、第3位碱基出现GC、TA,防止真核生物甲基化丧失基因活性。同时,要避免出现富含TA序列,以免影响mRNA的稳定性[13]。
由表3可知,枯草芽孢杆菌蛋白酶编码链核酸基因存在一定的密码子偏性,CCT(P)、AAA(K)、ACA(T)、GGC(G)、ATT(I)、CTT(L)、AAC(N)、CAA(Q)、AGC(S)、GTA(V)等密码子优势明显可进一步优化表达。
表3 枯草杆菌蛋白酶编码基因的优势密码子Tab.3 Dominant codon of subtilisin coding gene
密码子使用偏好性研究可应用在多个方面,如进行基因定位,提高异源基因表达,预测进化过程等[22]。通过分析发现,枯草芽孢杆菌蛋白酶基因密码子第3位GC含量40.22%,比例偏低,说明密码子第3位以A、T为主;Nc值为42.677,CAI值为0.647,处于中等偏性,说明密码子偏性不强,有较多的密码,需要进一步优化表达;相对同义密码子使用度分析发现,CCT(P)、AAA(K)、ACA(T)、GGC(G)、ATT(I)、CTT(L)、AAC(N)、CAA(Q)、AGC(S)、GTA(V)等为优势密码子,表明该基因表达水平有明显的提升空间。