张晓元,郝荣华,刘 飞,2,3*,袁丹丹,陈 勉,凌沛学,2,3
(1. 山东省药学科学院 山东省生物药物重点实验室 山东省多糖类药物工程实验室 多糖类药物发酵与精制国家地方联合工程实验室 博士后科研工作站,山东 济南 250101;2. 山东大学 药学院,山东 济南 250012;3. 山东福瑞达医药集团有限公司,山东 济南 250101)
海藻糖合成酶(trehalose synthase)通过分子内转苷作用,可催化麦芽糖中两个葡萄糖分子α,α-1,4 糖苷键转变成葡萄糖α,α-1, 1 糖苷键,从而生成海藻糖。已报道利用生物酶法合成海藻糖存在TPS/TPP、TS、TreY/TreZ、TreP、TreT等5种途径[1-2]。其中海藻糖合成酶途径(TS途径,又称Tres途径)仅需一种酶一步酶反应,在海藻糖的工业化生产中,相比传统酵母细胞提取法及其他生物合成途径具有底物廉价、工艺简单、易于调控等显著优点,是生物酶法工业化合成海藻糖的研究热点[3-4]。
来源于灰色链霉菌Streptomyces griseus subsp.Griseus的海藻糖合成酶转化效率高、反应速度快,葡萄糖副产物少[5]。但该酶在天然的灰色链霉菌中属胞内酶,表达量极低,需浓缩上千倍才能检测到海藻糖合成酶活性[5]。大肠杆菌(Escherichia coli)繁殖迅速、培养简单、遗传背景清楚、表达系统成熟,利用基因工程法构建大肠杆菌工程菌株来表达灰色链霉菌海藻糖合成酶,有望解决这一问题。外源蛋白在大肠杆菌中的表达差异,除受表达条件的直观影响外,外源基因自身特性的影响也至关重要。其中密码子的选择是左右表达量的参数之一, 基因表达水平高低与嗜好密码子的使用程度之间存在较强的相关性。灰色链霉菌密码子偏好性与大肠杆菌存在着很大差别,本研究旨在不改变灰色链霉菌海藻糖合成酶氨基酸组成的前提下,将编码灰色链霉菌TreS蛋白的密码子优化为大肠杆菌的偏爱密码子,以减少翻译过程中产生的瓶颈效应,实现外源蛋白在大肠杆菌体内表达量的提高。
Multitron通用型振荡培养箱(伊孚森生物技术公司);HPS-250生化培养箱(哈尔滨东联);GelDocXR+全自动凝胶成像系统(Bio-rad);Power Pac BasicTM型蛋白电泳仪(Bio-rad);生物样品均质器(Bertin);1200型高效液相色谱仪(Agilent)。
质粒pET-26b(+)作为表达载体,大肠杆菌E.coliBL21(DE3)作为表达宿主,均为本实验室保藏。
LB种子培养基(g/L):蛋白胨 10,酵母粉5,氯化钠10,pH 7.0,固体培养基含1.5 %琼脂粉。
液体发酵培养基(g/L):蛋白胨12,酵母粉24,甘油4,KH2PO42.31,K2HPO412.54,pH 7.5。
限制性内切酶,T4 DNA连接酶等(NEB);低分子量标准蛋白(Fermentas);质粒小提试剂盒,DNA纯化回收试剂盒,琼脂糖凝胶回收试剂盒等(Tiangen);其他化学试剂均为国产分析纯。
根据http://www.kazusa.or.jp/codon、CodonW 1.4.2与GenScript Rare Codon Analysis Tool对编码灰色链霉菌海藻糖合成酶基因序列(Genbank:HQ915641.1)密码子组成、GC含量组成、密码子使用频率等进行分析,发现灰色链霉菌海藻糖合成酶基因存在多处大肠杆菌稀有密码子。利用密码子优化软件Jcat等进行序列优化,优化前提:不改变氨基酸序列,密码子偏好性参考大肠杆菌K12 MG1655。
优化前、优化后海藻糖合成酶基因序列tres、tres1由济南博尚生物科技有限公司合成,序列首尾分别设计引入NcoI、XhoI酶切位点。NcoI/XhoI双酶切tres、tres1全基因序列与同样处理过的pET-26b(+)质粒在T4 DNA 连接酶作用下进行连接,得重组质粒载体pET-26b(+)-tres、pET-26b(+)-tres1。构建好的重组质粒采用CaCl2法转化大肠杆菌E. coliBL21(DE3)感受态细胞,37 ℃,LB平板培养18~24 h,直至长出转化子。挑取单菌落接种于含50 μg/ml卡那霉素的LB液体培养基中,37 ℃,220 r/min培养过夜,提取质粒双酶酶切及序列测定验证读码框正确性。
将经电泳及测序鉴定正确的阳性转化子,过夜培养活化后,按1 %的接种量转接于含50 μg/ml卡那霉素的LB 液体培养基中培养,37 ℃、220 r/min振荡培养至OD600=1.0时,加入异丙基硫代半乳糖苷(IPTG)至终浓度1 mmol/L,25 ℃、每2 h取1.5 ml培养液至18 h,所取样品采用生物样品均质器Precellys 24均质破碎,均质速度5500 r/min,3个循环,每个循环运行时间为15 s,循环间隔10 s。均质液12 000 r/min离心后上清即为粗酶液。
将不同时间取样制备的粗酶液进行酶活性测定,取200 μl酶液,加入200 μl 10 %麦芽糖溶液(0.1 mol/L pH 6.5磷酸盐缓冲液配制),24 ℃水浴反应1 h后,沸水浴10 min终止反应。酶反应产物进行高效液相色谱(HPLC)分析。HPLC条件:分离柱ZORBAX NH2,4.6 mm×250 mm,5 µm,流动相为乙腈:水=75:25,柱温:50 ℃,流速 1.0 ml/min。海藻糖合酶酶活力1 U定义:24 ℃、pH 6.5反应条件下,以10 % 麦芽糖溶液为底物,每1 min产生1 μmoL海藻糖所需酶量。
以牛血清蛋白为标准蛋白,采用Bradford法[6]测定粗酶液的蛋白质含量。
取发酵粗酶液,加入适量5×SDS上样缓冲液,沸水浴处理10 min,4 ℃,12 000 r/min离心5 min,取10 μl进行SDS-PAGE电泳检测。
灰色链霉菌的海藻糖合成酶tres基因开放阅读框(ORF)共计1707 bp,因灰色链霉菌与大肠杆菌存在物种间差异,对照图1E. coliK-12 MG1655密码子使用情况,纵坐标Wij代表编码第i个氨基酸的第j个同义密码子的“相对适应性”,即该同义密码子的观察值除以编码该氨基酸的同义密码子的最大值,其值在0~1之间,越高则表明该基因的密码子使用偏好性越强。tres基因所用三联密码子存在大肠杆菌稀有密码子或低频使用密码子,如CCC(14个)、CGG(12个)、GGG(8个)、GGA(2个)、AGG(1个)、CGA(1个)等(见表1),这些密码子的存在会影响tres基因在大肠杆菌异源表达水平。经Jcat密码子优化软件优化得基因序列tres1,tres1与tres基因密码子优化前后的核甘酸序列对比分析结果见图2。由图2可见,优化后的tres1基因序列共有268 bp碱基进行大肠杆菌适应性变化,但所编码的氨基酸的序列无任何改变。
表1 海藻糖合成酶tres基因优化前后编码密码子数量统计表
图1 E. coli K-12 MG1655密码子使用情况
图2 海藻糖合成酶基因tres和tres1的核苷酸序列
GC含量是鸟嘌呤和胞嘧啶所占DNA 4种碱基的比率。GC含量随DNA来源物种不同而异。GC含量高低影响DNA的密度,GC含量高,相应DNA密度也高,加热及加碱均不易使之变性,GC含量理想的比例范围是30 %~70 %[7]。链霉菌基因组GC含量整体较高[8],经计算,来源于灰色链霉菌tres基因的GC含量约为65.8 %,高于大肠杆菌平均50 %左右的GC含量。序列优化后,如图3所示:优化后的tres1基因序列平均GC含量降低至54.4 %,更接近大肠杆菌表达基因的GC百分比,有利于基因高效表达。
图3 优化前后基因序列GC含量分布曲线图
密码子适应指数(codon adaption index,CAI)反映基因编码区所有同义密码子中某一指定密码子的使用频率与最优密码子频率相符合的程度。取值范围在0~1之间,表达量较高的基因常具有较高的CAI值,表达量较低的基因则具有较低的CAI值。CAI已广泛应用于基因表达水平的预测[9-11]。经优化软件测算,基因tres1经合理优化后,密码子适应指数CAI值由0.37提升至0.97,符合GenScript's OptimumGeneTM密码子优化软件所建议的高表达优化CAI 0.8~1.0取值范围。密码子使用频率分布(condon frequency distribution,CFD)见图4。由图4可见,优化前基因序列出现使用频率小于30 %的密码子,存在阻碍基因高效表达的可能性,优化后基因多数密码子的使用频率在90 %以上,未发现有使用频率小于50 %的密码子,有利于基因高效表达。
图4 密码子优化前后密码子使用频率分布情况
采用CaCl2法进行了tres、tres1基因的大肠杆菌转化,测序鉴定筛选出正确的阳性转化子进行摇瓶诱导发酵。pET-26b(+)载体设计含有pelB信号肽,蛋白表达时可将目的基因定位于细胞周质。因此,含质粒pET-26b(+)-tres、pET-26b(+)-tres1基因工程菌株在加入IPTG诱导后每2 h所取发酵液,均质破碎,取上清做表达产物分析。SDS-PAGE分析结果见图5。由表5可见,tres、tres1氨基酸序列编码相同的568个氨基酸,相对分子质量(Mr)理论值约66×103。有图5可见,含密码子优化的tres1大肠杆菌基因工程菌株Mr66×103的条带明显浓于tres基因工程菌株,目的蛋白表达量高。
图5 Tres1、Tres蛋白表达SDS-PAGE电泳图
灰色链霉菌海藻糖合成酶在转化麦芽糖生成海藻糖过程中会产生少量葡萄糖副产物,产生的海藻糖与未反应的麦芽糖分子量大小一致,HPLC不易区分。本实验优选色谱柱 ZORBAX NH2(4.6 mm×250 mm,5 µm),流动相采用乙腈:水=75:25,柱温 50 ℃,流速 1.0 ml/min。该条件下海藻糖与麦芽糖具备了较好的区分度,且出峰时间短(<10 min),易于海藻糖的快速检测(见图6)。
图6 葡萄糖、麦芽糖、海藻糖 HPLC图谱
含质粒pET-26b(+)-tres、pET-26b(+)-tres1基因工程菌株在同样条件下采用IPTG诱导后2,4,6,8,10,12,14 ,16 和18 h 分别取样进行酶活力的测定,比较结果见图7,由图7可见在诱导反应开始的2 h内,两者的酶活力几乎都不存在。2 h后海藻糖合成酶均开始表达,优化后菌株海藻糖合成酶活性在诱导4 h后呈明显增加趋势,12 h时即可达到未优化菌株18 h发酵水平。优化菌株18 h取样测定酶活性为48.9 U/ml,比未优化对照菌株酶活性30.5U/ml提高了60.3 %。经蛋白含量测定,计算海藻糖合成酶蛋白比活性不存在显著性差异,这与优化前后氨基酸序列无改变直接相关,单位时间内产酶量的增加,推测与优化后的tres1翻译效率提高关系密切。
图7 基因优化前后产酶酶活性曲线图
天然蛋白质的氨基酸可由1~6个核苷酸三联密码子编码,称为同义密码子。不同物种其基因在同义密码子的使用上存在偏爱性。密码子偏爱性的不匹配是外源基因在宿主系统表达不好的主要原因之一,利用生物信息学方法统计物种间不同密码子使用频率,把不匹配的非偏爱性密码子加以定点突变,可改变外源基因的密码子偏爱性使之和宿主系统更加匹配,从而得到较高产量的表达产物。
已全基因组测序的链霉菌编码基因普遍具有较高GC含量[8]。本研究来源自灰色链霉菌的海藻糖合成酶基因GC含量就高达65.8 %,三联密码子第三位简并密码子更倾向于GC,CodonW软件分析GC3s(密码子第三位G或C)出现频率0.955很好验证这一特点。序列合理优化后,tres基因GC含量下降至54.5 %,GC3s出现频率降低至0.592,密码子适应指数CAI值由0.37提升至0.97,更接近于大肠杆菌基因编码特点,基因工程菌株表达海藻糖合成酶酶活性也因此提高了60.3 %。该密码子优化方法为不同物种来源的外源蛋白在大肠杆菌高效表达提供理论指导。然而,外源基因表达水平不仅仅与密码子偏爱性直接相关,还取决于基因表达启动子终止子强度、识别密码子的tRNA丰度、序列二级结构复杂程度等。因此,开发一种基于DNA序列组成方面的多尺度、系统性、综合性的生物信息学分析方法对实现外源基因在不同物种间高效表达至关重要。