徐友强,马翠卿,陶飞,许平
1 山东大学 微生物技术国家重点实验室,济南 250100
2 上海交通大学 微生物代谢教育部重点实验室,上海 200240
细菌启动子识别及应用研究进展
徐友强1,马翠卿1,陶飞2,许平2
1 山东大学 微生物技术国家重点实验室,济南 250100
2 上海交通大学 微生物代谢教育部重点实验室,上海 200240
细菌启动子是细菌中基因表达的必需调控元件,决定了细菌基因表达的强度和时机。通过启动子的插入或缺失,可以改变细菌基因的表达,实现对菌体生长发育以及代谢调控的研究。启动子也是构建各种表达系统、实现异源基因表达的基础。启动子的识别和应用研究,对于实现异源基因的可控表达、有效获得目的产物、促进生物催化和代谢工程研究具有重要的意义。以下对细菌启动子进行了简单的介绍,总结了细菌启动子的识别方法,并对细菌启动子的研究进展和具体应用进行了概述。
启动子识别,诱导型启动子,启动子应用
随着DNA测序技术的进步,越来越多的细菌基因组被测序,为启动子识别和应用提供了材料,大量启动子的发现及应用,推动了生物催化技术的发展。本文对细菌启动子进行了简单的介绍,对其识别方法进行了总结,并对细菌启动子的研究和具体应用进展进行了概述。
细菌启动子是指可与 RNA聚合酶结合以起始基因转录的DNA序列区域。细菌启动子的结构一般包括−35区、−10区、−35区和−10区之间的区域以及转录起始位点 (Transcription start site,TSS),其中,−35区位于起始转录区上游35 bp附近,一般为6个碱基,其序列一般为TTGACA,详细形式为:T82T84G78A65C54A45(下标表示最大频率出现碱基对应的百分数)[2],可以与RNA聚合酶结合从而起始转录[3-4]。−10区位于起始转录区上游10 bp附近,一般为6个碱基,序列一般为TATAAT,详细形式为:T80A95T45A60A50T96(下标表示最大频率出现碱基对应的百分数)[2],其序列也与RNA聚合酶结合从而起始转录有关,又叫Pribnow盒子 (Pribnow box)[3-4]。除此之外,一些细菌启动子还有特殊结构,如 UP元件、转录起始位点下游A/T富集区和延伸−10区。前者是指一段富含A/T碱基的序列,位于−35区上游,一般为转录起始位点上游40~60 bp范围的富含A/T的区域,与RNA聚合酶的α亚基的C端终止域结合[5-6],其序列分为 2个部分:转录起始位点上游41~44 bp位置的AAAA和转录起始位点上游47~57 bp位置的AAA(A/T)(A/T)T(A/T)TTTT。转录起始位点的下游存在周期分布的A/T富集区域,主要集中在 6±3、23±3、40±2、56±2等位置[7]。延伸−10区是指位于−10区上游的几个碱基,一般位于转录起始位点上游 13~17 bp处,序列一般为TGTGN[8],可以与RNA聚合酶结合,有利于RNA聚合酶起始转录。可以看出,细菌启动子的保守序列在核心区域中按一定规律分布,彼此存在一定间隔。这使得各个区域均保持在双螺旋的同一侧,从而有利于与RNA聚合酶相结合。但RNA聚合酶并不能直接与启动子DNA序列相结合起始转录[9],而是需要σ因子的辅助,形成RNA聚合酶全酶,才能与启动子DNA序列相结合[10]。
细菌的σ因子分为2个大类,σ70家族和σ54家族[11]。其中,σ70家族存在于几乎所有细菌中,σ70家族大部分成员一般含有 4个结构域:σ1、σ2、σ3和σ4,其中,σ2有利于RNA聚合酶β’亚基与启动子−10区结合,σ4有利于RNA聚合酶β亚基与启动子−35区结合[12]。σ54家族成员与 σ70相比,在氨基酸序列和转录机制上均有不同[13],其存在也不如σ70家族广泛,已知研究发现在于变形菌中,它与氮源代谢的调控相关[13];在枯草芽胞杆菌中,它与精氨酸和鸟氨酸利用的调控[14]以及果糖转运有关[15]。另外,基因组测序显示,σ54因子还存在于其他菌,如极度嗜热菌、专性细胞内病原体、螺旋菌和绿色硫细菌中[16]。σ54家族具有一些特殊的调控特性,如起始转录需要同源激活蛋白,使该起始转录具有严谨调控性且本底表达很低[17]。σ54-RNA聚合酶复合体行使功能需要较长的基因间隔序列等[18]。
除此之外,还有一些特殊的σ因子,分别行使特定的不同功能,如与细菌环境压力反应和细菌生长稳定期相关的σs因子;与细胞质热反应相关的σ32因子 (又名σH因子);与细菌饥饿反应和鞭毛合成相关的 σ28因子 (又名σF因子);与细菌胞膜压力反应相关的σE因子等[19],在此不再赘述。
由于细菌启动子在生物催化中的重要作用,目前对细菌启动子研究的工作非常多。本文首先对细菌启动子的识别方法作一概括。
细菌启动子识别在启动子研究中起着重要作用。识别和发现新的启动子,对细菌启动子的研究具有重要的意义,可以提供具有不同启动强度、不同宿主适用范围等特点的启动子,满足生物催化技术的各种要求,促进生物催化技术的发展。细菌启动子识别的目的是对已测序的细菌基因组的部分或全部进行分析,从而识别出启动子的核心区域。在识别的基础上,结合其他的实验方法,可以对细菌启动子进行进一步的验证。随着启动子识别研究的深入,出现了许多启动子识别的方法,概要介绍如下。
细菌启动子具有多种共同的特征,如低稳定性(Stability)、高弯曲率 (Curvature)、低的可弯曲性(Bendability)等[20-23],这为细菌启动子的预测提供了线索。
Kanhere等[24]研究发现,启动子所在区域与细菌基因组的其他区域相比更加不稳定,易发生熔解,从而有利于RNA的转录。在此基础上对大肠杆菌、枯草芽胞杆菌和谷氨酸棒杆菌的启动子进行了识别,分别发现了227、89和28个启动子,他们认为该方法有很好的应用性,并且如果将该方法与启动子的其他特征相结合会大大改善启动子序列的识别。
Wang等[25]研究发现细菌基因组有一些区域在超螺旋压力下非常不稳定,经统计发现,这些区域与含有启动子序列的基因间区域有关。他们将这一发现结合启动子已知的结构和序列特征,进行了启动子的识别。结果发现,压力诱导型DNA复式不稳定 (Stress-induced DNA duplex destabilization,SIDD) 与特定的启动子区域有关。在E. coli K12的基因组序列中,与启动子DNA的其他特性如−10区的弯曲、形变、热稳定性或是序列结构域相比,SIDD在启动子识别上具有非常高的准确率 (高于80%)。除此之外,该方法也可用于枯草芽胞杆菌,识别准确率也高于80%。
Towsey等[26]将DNA的结构特征与基于计算机的识别方法相结合,建立了一个新的启动子识别方法。他们将压力诱导型复式不稳定 (SIDD)、DNA螺旋和折叠能量等参数结合在一起,以期能够建立一个完善的启动子识别方法。然而他们发现,启动子启动基因表达的相关特性并不是一成不变的,所以不可能建立启动子的完美的识别模型。
以上启动子识别方法的特异性并不是很高,但启动子的这些特征可以方便地与启动子其他的识别方法结合,使其具有潜在的应用性。
细菌启动子在基因组中的分布并不是杂乱的,而是有一定的规律可循。在细菌中,σ因子和其他转录调控蛋白识别启动子DNA序列,然后与RNA聚合酶结合启动基因转录。进化导致了转录因子识别的 DNA序列在细菌基因组的编码区之间比较密集,而在编码区则不常见。据此,可以进行启动子的识别。
Jacques等[27]研究发现细菌基因组中转录因子结合区域的分布倾向于编码区之间的区域,而且这一倾向存在于大部分的细菌中。在该发现的基础上,他们建立了一个比直接的序列比对更有效的启动子识别方法。这一方法可以很容易地与其他的识别方法结合使用,而且可以同时用于对多个细菌基因组的分析。
由于细菌启动子的转录起始区域基因序列有固定的规律,Gordon等[28]以转录起始位点 (Transcription start site,TSS) 为基础,利用计算机建立了一个算法。利用该算法,绘制了一幅大肠杆菌基因组的启动子图谱。尽管该方法并不是很严谨,但却是一个自动的基因组水平上的启动子识别方法,简化了启动子识别的途径。
尽管此类方法比较简单,而且可以快速高效地识别启动子,但是该类方法是建立在细菌基因组经过系统注释的基础上的,故应用范围受到限制。
细菌启动子序列与基因组 DNA相比存在较明显的特征,因此最直接的方法就是把启动子序列看成一种整体信号,直接用各种模式发现的方法进行识别。常用的方法有人工神经网络 (Artificial neural network,ANN)[29]、隐马尔可夫模型 (Hidden markov model,HMM)[30]等,还有研究将以上模型与启动子已知的特征相结合进行启动子的识别,具体介绍如下。
Tavares等[31]利用几种机器学习算法建立了对大肠杆菌基因组中启动子的识别方法。他们系统地比较了 Bayes (CNB;Naïve Bayes;Naïve Bayes Simple;NaiveBayesUpdateable;AODE)、Neural Net (Multiplayer Perceptron;SMO;RBF Network;Logistic;Voted Perceptron)、Meta (Logit Boost;MultiBoost AB;MultiClass Classifier;Threshold Selector;ADA Boost)、Trees (NBTree;LMT;ADTree;J48;ID3)、Lazy (LBR;IB1;Kstar;IBk;LWL) 和Rules (PART;Decision table;Ridor;JRip;NNge) 模型。经过比较,他们发现以概率和神经网络系统为基础的算法具有更高的准确性。在细菌启动子识别中可以有选择地使用这些模型,也可以互相搭配使用这些模型。
Du等[32]基于特征选择的二次方程判别式分析方法 (Quadratic discriminant analysis,QDA) 进行细菌启动子的识别,并且将启动子DNA的序列特征、信号特征、结构特征等与二次方程判别式分析方法相结合,建立了一个启动子识别模型,并将该模型用于大肠杆菌启动子的识别。结果发现,非编码区的识别成功率为 85.7%,编码区的识别成功率也接近80%。这一结果表明该算法是很有价值的一个启动子识别方法。他们还将该算法应用于枯草芽胞杆菌,发现启动子的识别成功率也在80%左右,这说明该方法具有较为广泛的适用性。
Reis等[33]以隐马尔可夫模式、阈值决定评估和辨别分析为基础,建立了一个细菌启动子识别方法,并将该方法应用于细菌基因组的启动子识别,结果与以前的工作相比,对大肠杆菌的启动子识别错误率下降了44.96%,对枯草芽胞杆菌的启动子识别准确率和成功率分别为95%和78%,但对幽门螺旋杆菌的启动子识别成功率并不高。这说明该算法具有较高的启动子识别准确率和成功率,但适用范围并不广泛。
Dekhtyar等[34]建立了一个三维的强启动子识别模型,该模型可用于已注释的细菌基因组启动子预测,它与特定的大肠杆菌的I型RNA聚合酶σ70因子相匹配。它是通过将序列依次匹配3个条件来进行预测的,这 3个条件依次是:含有 UP-元件;需要与α亚基作用;具有明显可以区分的−35区和−10区,以与RNA聚合酶的σ70亚基相互作用。利用该模型对 43个细菌基因组进行了强启动子的识别。结果发现,该三维强启动子识别模型适于细菌基因组 A+T含量在 62%以下的细菌基因组的强启动子识别。
总而言之,计算机建模方法首先根据已有的信息选择结构模型,然后用已知的序列数据作为训练集,通过相应的训练算法,进行训练得到模型参数。此类方法对训练算法、模型参数的初值以及阈值都很敏感。虽然一些模型如神经网络模型和马尔可夫模型可以分别通过增加神经网络的层数和马尔可夫链的阶次来提高模型复杂度,但由于利用的信息太宽泛,导致假阳性较多,识别准确率较低。
利用计算机来进行细菌启动子的识别并没有有效的利用启动子的转录特性,这意味着通常的启动子识别方法可能并不完善。细菌启动子启动mRNA的转录通常必须是在 RNA聚合酶及其辅因子的共同调控下进行,利用这一特征可以有效准确地进行启动子识别。
Nakano等[35]利用Spx和RNA聚合酶α亚基C-端复合体进行启动子识别。Spx是砷酸盐还原酶家族的成员,是微生物压力反应的通用转录调控因子,在革兰氏阳性菌中高度保守。他们研究发现,Spx和 αCTD形成一个复合体,该复合体可以识别 Spx调控基因的启动子DNA。当Spx氧化成二硫化构型时,Spx的α螺旋 (α4) 结构发生改变,而α4含有具有转录起始功能以及和 αCTD/Spx-启动子结合的残基。根据这一结合特性,可以准确地识别启动子序列。
这一方法准确度高,但由于实验的复杂性及该现象的局限性,使其应用具有很大的限制,但却是对上述识别方法的一个很好的补充。
细菌表达系统研究中涉及到的启动子有很多种,大致可以分为诱导型启动子和组成型启动子两大类。其中,细菌表达系统中常用的诱导型启动子有lac启动子 (乳糖启动子)、trc和tac启动子 (乳糖和色氨酸的杂合启动子)、T7噬菌体启动子、L-阿拉伯糖诱导的 PBAD启动子、L-鼠李糖诱导的rhaPBAD启动子等,现分别介绍如下。
3.1.1 lac启动子
它来自大肠杆菌的乳糖操纵子。乳糖操纵子是DNA分子上一段有方向的核苷酸序列,由阻遏蛋白基因、启动基因、操纵基因和编码 3个与乳糖利用有关的酶的基因所组成[36]。lac启动子受分解代谢系统的正调控和阻遏物的负调控。正调控通过CAP (Catabolite gene activation protein) 因子和cAMP来激活启动子,促进转录。负调控则是由调节基因产生LacZ阻遏蛋白,该阻遏蛋白能与操纵基因结合阻止转录。
lac启动子应用非常广泛,分子生物学研究中常用的载体很多都含有 lac启动子,可以加入诱导物IPTG以启动目的基因的表达,但是该启动子与 tac和trc启动子相比,启动效率较低,不利于目的蛋白的高效表达[37]。
3.1.2 tac和trc启动子
tac启动子是由lac启动子和trp启动子人工构建的杂合启动子[38],受LacI阻遏蛋白的负调节,它的启动能力比lac和trp都强[39]。其中tacI启动子的−20到起始位点的区域来自trp启动子,其余部分来自于lac UV5启动子;tacII启动子的−11到起始位点 (包括Pribnow盒子) 来自trp启动子,其余部分由一个合成的46 bp DNA片段加上lac操纵子中的操纵基因和SD序列融合而成[38]。
trc启动子也是由 trp启动子和 lac启动子人工构建的杂合启动子,由lac UV5启动子的−10区和trp启动子的−35区构成[37],同样具有比lac更高的转录效率[39]和受阻遏蛋白 LacI调控的强启动子特性。trc启动子的平均效率只有tac启动子的90%[39]。这两个启动子均受IPTG诱导调节。
3.1.3 T7噬菌体启动子
T7噬菌体启动子具有高度的特异性,只有 T7 RNA聚合酶才能使其启动,许多外源终止子都不能有效地终止T7 RNA聚合酶,因此它可以转录某些不能被大肠杆菌RNA聚合酶有效转录的序列,可以高效表达其他系统不能有效表达的基因,这使该启动子成为目前应用最为广泛的启动子之一[40]。T7 RNA聚合酶与大肠杆菌RNA聚合酶相比,在转录时对DNA链的延伸效率要高数倍,使其可以很好地应用于E. coli BL21 (DE3) 表达宿主,因为E. coli BL21 (DE3) 宿主基因组上含有 T7 RNA聚合酶基因,该基因通过lac启动子系列的L8-UV5 lac启动子调控[41]。L8-UV5 lac启动子因为含有突变位点而与野生型lac启动子相区别。在它的−10区有2个位点的突变,这增强了它的启动效率,并且降低了它对AMP循环的依赖,另外它还有一个位点的突变,这导致了该启动子对葡萄糖的敏感性降低[41],即在葡萄糖存在的情况下,T7 RNA聚合酶也可以被IPTG有效地诱导表达。但由于其启动效率很高,如果表达的外源蛋白对宿主有毒害,则不利于外源基因的表达[42]。这也使得该启动子在应用中存在一定的局限。
3.1.4 L-阿拉伯糖诱导的PBAD启动子
L-阿拉伯糖诱导的PBAD启动子来自于阿拉伯糖操纵子。阿拉伯糖操纵子是指令合成糖分解代谢所需酶系的操纵子,具有正、负调节的功能。它有 2个启动子Pc和PBAD,可以双向转录。
阿拉伯糖诱导的PBAD启动子已经被广泛地用于大肠杆菌和其他宿主中表达异源基因[43-45]。当阿拉伯糖加入培养基后,它会与蛋白AraC结合,从而使结合于PBAD和PC之间araI1和araI2基因位置上的蛋白 AraC脱落下来[46]。当不存在阿拉伯糖时,蛋白AraC结合在PBAD和PC之间并不脱落下来,这一特性使araC-PBAD表达系统具有如下性质:当阿拉伯糖不存在时只有很少量的本底表达,并且可以通过控制 L-阿拉伯糖的加入调控基因的表达水平。araC-PBAD表达系统调控基因表达时表现出的是一种全或无的调控特性[47],即在没有L-阿拉伯糖加入时不表达基因,而在低浓度L-阿拉伯糖加入时,只有部分细胞诱导表达,另一部分细胞不诱导表达,随着L-阿拉伯糖浓度的增加,诱导表达的细胞比例增加,而且已被诱导表达的细胞表达强度并不随L-阿拉伯糖的浓度变化而变化。
3.1.5 L-鼠李糖诱导的rhaPBAD启动子
L-鼠李糖诱导的 rhaPBAD启动子来源于鼠李糖调节子,该调节子包括启动子PBAD及其控制的结构基因rhaA、rhaB和rhaD,启动子Pt及其控制的结构基因rhaT,启动子Psr及其控制的调节基因rhaS和 rhaR。L-鼠李糖诱导的 rhaPBAD启动子是一个非常好的在大肠杆菌中严谨调控外源基因表达的工具。L-鼠李糖作为诱导物可以与蛋白RhaR一起诱导RhaS的合成,RhaS具有正调控鼠李糖调节子的功能[48]。
当环境中无 L-鼠李糖时,rhaSR虽存在一定数量的本底表达,但启动子效率极低;当存在L-鼠李糖时,RhaR被活化结合到rhaSR操纵子的特定区域,并与CRP和RNA聚合酶的α-CTD (RNA聚合酶α亚基 C-端复合体) 相互作用起始自身的表达,同时表达RhaS。当RhaS积累到一定程度,就会结合到rhaBAD和 rhaT启动子区的特定 DNA位点上与CRP、RNA聚合酶一起启动基因的表达[49-50]。
表1 细菌常用诱导型启动子特性总结Table 1 Summary of the characteristics of common bacterial promoters
除了这些常用的启动子外,四环素诱导的 tetA启动子也很常用。tetA启动子常用于大肠杆菌高效且严谨调控外源基因的表达[51-52]。与其他表达系统相比,该表达系统在大肠杆菌中的本底表达量非常低,这也使其应用具有一定的优势。除了上述这些启动子外,来自于TOL质粒的调控甲苯代谢的启动子[53],来自于 NAH质粒的调控萘代谢的启动子[54]以及最近用于丙酸盐代谢研究的启动子[55-56]也得到了广泛的应用。细菌诱导型启动子的具体应用主要有以下4个方面:
3.2.1 细菌启动子在蛋白质生产中的应用
这是细菌启动子应用最为广泛的方面。通过改造现有载体,插入不同的启动子可获得各种不同需要的载体,满足不同蛋白质生产的要求。
Skerra等[51]构建了一个以大肠杆菌为宿主的含有 PtetA启动子的严谨调控型的表达载体。通过低浓度无水四环素的加入即可方便地诱导外源基因的表达。并以重组小鼠免疫球蛋白Fab片段的生产作为实例,检测了该系统的性能,发现该系统功能的行使具有独立性,不依赖于宿主,而且在没有诱导物时无本底表达,是一个很好的IPTG诱导的启动子系统的替代系统,在异源基因表达方面具有很大的应用前景。
Lee等[56]构建了可应用于大肠杆菌的pPro系列的表达载体,pPro载体含有prpBCDE启动子,通过在启动子后插入绿色荧光蛋白基因gfp,检测了该系统的效率和调控特性。这一系列的表达系统在没有丙酸盐存在的条件下本底表达很低,在丙酸盐存在的条件下是可控表达的,而且在高浓度丙酸盐存在的条件下具有很高的表达强度,这些特征使该系列的载体在蛋白质及代谢产物生产领域中具有很大的应用前景。
黄素 c-硫化脱氢酶 (Flavcytochrome c-sulfide dehydrogenase,FCSD) FCSD酶在以还原型硫化物为电子供体固定二氧化碳的细菌中广泛存在。FCSD酶是一个异源二聚体酶,包括1个黄素 (FAD) 亚基和1~2个c-型亚铁血红素亚基。但是利用不同载体在大肠杆菌中表达可溶性的光合细菌酒色着色菌Allochromatium vinosum FCSD酶和空泡外硫红螺菌Ectothiorhodospira vacuolata膜结合蛋白并未成功,尽管这些载体可以表达FCSDs酶并分泌到细胞周质中,但FCSDs酶并不与亚铁血红素亚基结合,从而没有活性。为了解决这一问题,Smet等[57]建立了一个可以应用于光合宿主的新的表达系统。他们在大肠杆菌中,利用一个宽宿主范围表达质粒pGV910,插入A. vinosum RuBisCo基因的启动子rbcA,通过结合方式将构建的质粒转化到光合细菌荚膜红细菌Rba. Capsulatus、球状红细菌 Rba. sphaeroides和Ect. vacuolata中,2个Rhodobacter宿主均可以成功地表达有活性的FCSD酶。这表明该表达系统在表达同源重组 c-型的细胞色素中具有很大的应用前景。
3.2.2 细菌启动子在化合物降解中的应用
启动子在化合物降解中的应用主要在于调控载体基因簇上的基因表达。
TOL质粒pWW53含有甲苯代谢的相关基因簇。它含有1个upper代谢基因簇 (包括调控基因xylR),可以将甲苯氧化为苯甲酸钠。除此之外,该质粒还含有2个功能同源的meta代谢基因簇 (包括调控基因 xylS1和 xylS3),可以代谢芳香羧酸。Gallegos等[53]研究发现,当培养基中没有相关代谢底物时,upper和meta代谢通路的相关基因簇均不表达,但xylR基因在 σ70依赖性的启动子作用下得到表达。xylS1和xylS3基因也在σ70依赖性的启动子Ps2和Ps3作用下得到表达。当培养基中存在O-二甲苯时,XylR蛋白具有活性并且激发启动子Pu,起始upper基因簇的表达。当环境中含有苯甲酸钠时,upper代谢通路不起作用,但 2个 meta代谢基因簇均得到表达。当环境中存在3-甲苯时,2个meta代谢基因簇也会同时表达。以上特性使得该质粒在甲苯、苯甲酸以及芳香羧酸化合物降解中具有广泛的应用性。
质粒NAH7含有化合物萘降解的基因簇,该质粒是假单胞菌中发现的第一个具有代谢作用的质粒,可使其相应宿主具有代谢萘和水杨酸盐的能力。NAH7质粒上的基因簇分为2个区域,第一个区域为基因簇nahABCDEF,可将化合物萘转化为水杨酸盐;第二个区域包括基因簇nahGHIJK,包括水杨酸盐氧化代谢途径相关酶的基因。Yen等[54]将转座子Tn5插入到质粒NAH7中,系统研究了Tn5对化合物萘氧化代谢相关步骤的影响,结果发现Tn5可以诱导nahR基因,nahR基因对该质粒基因簇的2个区域的基因簇均具有正调控的功能。对质粒 NAH7的研究有利于更好了解萘代谢的机理,从而促进质粒NAH7对萘及其相关化合物降解的研究。
3.2.3 细菌启动子在物质检测中的应用
由于诱导型启动子诱导物的专一性较强,使细菌启动子在物质检测中的应用具有特异性,即一个构建好的检测系统可以专一性地检测某一化合物或某一类化合物。
Korpela等[52]将生物发光法用于对四环素类抗生素的检测。即将一个信号感应的质粒导入到大肠杆菌中,该质粒必须是严谨调控型的质粒并带有一个敏感性高的报告基因。Korpela等构建了质粒pTetLuX1,含有严谨调控型的启动子 PtetA,在该启动子的下游插入了 5个荧光素酶基因。利用这一质粒构造的重组菌可用于四环素及四环素类化合物的检测,而且检测的精度会随着pH及Mg2+浓度的变化而变化,实际检测中可以通过调节pH及Mg2+的浓度来调节检测的精度,满足不同检测标准的要求。
Anderson等[58]在大肠杆菌中建立了一个人工合成的AND门,基本过程是通过2个启动子作为“输入”项,当 2个启动子均被诱导时,会导致另外一个启动子被诱导,即产生“输出”。两组启动子之间的联系通过mRNA和tRNA的相互作用来实现。第一个启动子启动T7 RNA聚合酶基因的表达 (在聚合酶基因后存在2个内在的amber终止密码子),第二个启动子启动amber抑制的tRNA supD基因。当2个基因均表达时,T7 RNA聚合酶才具有活性并启动 T7启动子。该方法的输入与输出项均是可调控的,即输入项的 2个启动子可以与不同的信号相关联,然后可以输出不同的细胞信号反应,反应灵敏,而且高效。
3.2.4 细菌启动子在代谢通路研究中的应用
这是启动子应用中非常重要的一个方面,启动子在这方面的应用具有很大优势,因为现有启动子很多,可提供各种不同诱导强度和不同适用范围的启动子;检测的准确度及效率也很高,一定程度上满足了代谢通路研究的需要。
生物代谢通路研究中一个很重要的问题是确定代谢通路中的基因是如何行使功能的。Guet等[59]利用组合合成的方法,在大肠杆菌中建立了一个代谢通路连接位点可变的代谢网络库。该网络库是以启动子Plac、PtetA、Pλ及其相应的调控元件LacI,TetR,λCI为基础建立的。他们模拟二进制的逻辑线路来研究表型的变化,即通过2个化合物的“输入”,检测一个荧光蛋白的“输出”。通过荧光蛋白的检测表征细胞表型的变化。通过改变模型中代谢网络的连接点,可以检测到细胞各种不同的功能变化。组合合成技术为生物代谢网络的研究提供了一个很好的方法,该方法不但快捷高效,而且实现了生物有机体活体的实时表型检测。
尽管很多生物中一个特定基因的敲除或过表达对代谢的影响研究很多,但很少有研究涉及生物中新的代谢通路的添加对生物本身代谢的影响。Isalan等[60]研究了生物中新的代谢通路的添加对生物代谢的影响。他们构建了 598个重组的启动子 (包括调控区域),以其为基础构建了598个高拷贝的质粒,将其转化到野生型大肠杆菌中,结果发现宿主对大约95%的新加入的代谢系统具有免疫性,即新的代谢系统可存在于宿主中,但很少有新加入的代谢系统会影响宿主的生长特性。而且他们还发现,一些加入新的代谢通路的菌株较野生型的菌株在不同的选择压力下具有更好的适应性,这表明菌株中新代谢通路的形成对菌株的进化在一定程度上具有促进作用,利于菌株适应环境的变化。这对于研究细菌的进化也有重要的意义。
以上是诱导型启动子的研究进展和具体应用。但诱导型启动子也存在一些缺陷,如有些诱导物价格昂贵;有些光照或温度诱导的启动子在实际应用中增加了工业生产的成本;有些诱导物具有毒性,增加了从产物中去除诱导物的难度,这时组成型启动子就成了很好的替代工具。
组成型启动子由于自主启动表达的特性,不需要外加诱导物或进行额外操作,而且基因的表达大体恒定在同一水平上,不同细胞表达水平没有明显差异。这些特性使该类启动子在具有经济价值化合物或药物生产中起着重要的作用。通过改变启动子−10区或−35区的碱基序列或者2个区域之间的碱基数,可以获得一系列不同启动效率的组成型启动子[61-62]。但由于一个序列确定的组成型启动子的启动效率是一定的,这限制了它的应用,比如其启动效率无法人为调控,在一些异源的对宿主有毒害的蛋白表达中就受到限制,因为这类启动子在宿主生长初期就启动异源基因的表达,很可能导致菌株死亡;另外,如果启动子的启动效率较高,会导致宿主的生长压力过大,极大影响菌体的生长,这限制了组成型启动子在生物催化领域的应用。
细菌启动子在基因转录水平的调控上起着重要作用,直接决定蛋白的表达水平,用启动子构建各种表达载体,可以在宿主中方便地表达外源基因;通过启动子的插入、缺失,或者构建的载体转化宿主细胞,可以有效改变或调节细菌的代谢,方便地获得目的产物,或者降解不同的化合物,这使得细菌启动子在全细胞催化和酶催化领域具有巨大的应用价值。随着基因组测序技术和生物信息学的飞速发展,越来越多的细菌基因组被测序,在启动子已有的研究基础上,根据启动子固有的特征,通过启动子识别技术,可以很方便地进行细菌启动子的识别,使更多不同启动效率和不同宿主范围的启动子被发现并得到应用,这为全细胞催化和酶催化提供了更多的材料,推动了生物催化技术的发展。特别是启动子改造 (建立在启动子核心区域关键位点对启动子启动效率研究基础之上[63]) 和启动子合成技术[64]的建立,为获得研究所需要的启动子提供了方便,这必将推动启动子的研究和应用,而启动子的研究和应用必将为生物催化带来巨大变革。
REFERENCES
[1] Keasling JD. Synthetic biology for synthetic chemistry. Acs Chem Biol, 2008, 3(1): 64–76.
[2] Lin CJ, Peng CC, Lee CY. Prediction of RNA polymerase binding sites using purine-pyrimidine encoding and hybrid learning methods. Int J Appl Sci Eng, 2004, 2: 177–188.
[3] O'Neill MC. Escherichia coli promoters. I. Consensus as it relates to spacing class, specificity, repeat substructure, and three-dimensional organization. J Biol Chem, 1989, 264(10): 5522–5530.
[4] Harley CB, Reynolds RP. Analysis of E. coli promoter sequences. Nucleic Acids Res, 1987, 15(5): 2343–2361.
[5] Estrem ST, Ross W, Gaal T, et al. Bacterial promoter architecture: subsite structure of UP elements and interactions with the carboxy-terminal domain of the RNA polymerase alpha subunit. Genes Dev, 1999, 13(16): 2134–2147.
[6] Ross W, Gosink KK, Salomon J, et al. A third recognition element in bacterial promoters: DNA binding by the alpha subunit of RNA polymerase. Science, 1993, 262(5138): 1407–1413.
[7] Ozoline ON, Deev AA, Arkhipova MV, et al. Proximal transcribed regions of bacterial promoters have a non-random distribution of A/T tracts. Nucleic Acids Res, 1999, 27(24): 4768–4774.
[8] Mitchel J, Zheng D, Busby S, et al. Identification and analysis of extended -10 promoters in Escherichia coli. Nucleic Acids Res, 2003, 31(16): 4689–4695.
[9] Browning DF, Busby SJ. The regulation of bacterial transcription initiation. Nat Rev Microbiol, 2004, 2: 57–65.
[10] Travers AA, Burgess RR. Cyclic re-use of the RNA polymerase sigma factor. Nature, 1969, 222: 537–540.
[11] Gruber TM, Gross CA. Multiple sigma subunits and the partitioning of bacterial transcription space. Annu Rev Microbiol, 2003, 57: 441–466.
[12] Murakami K, Masuda S, Campbell EA, et al. Structural basis of transcription initiation: an RNA polymerase holoenzyme/DNA complex. Science, 2002, 296: 1285–1290.
[13] Merrick MJ. In a class of its own—the RNA polymerase sigma factor σ54(σN). Mol Microbiol, 1993, 10: 903–909.
[14] Gardan R, Rapoport G, Debarbouille M. Role of the transcriptional activator RocR in the arginine-degradation pathway of Bacillus subtilis. Mol Microbiol, 1997, 24: 825–837.
[15] Debarbouille M, Verstraete IM, Kunst F, et al. The Bacillus subtilis sigL gene encodes an equivalent of σ54from gram-negative bacteria. Proc Natl Acad Sci USA, 1991, 88: 9092–9096.
[16] Buck M, Gallegos MT, Studholme DJ, et al. The bacterial enhancer-dependent σ54(σN) transcription factor. J Bacteriol, 2000, 182(15): 4129–4136.
[17] Wang L, Gralla JD. Multiple in vivo roles for the 212-region elements of sigma 54 promoters. J Bacteriol, 1998, 180: 5626–5631.
[18] Buck M, Miller S, Drummond M, et al. Upstream activator sequences are present in the promoters of nitrogen-fixation genes. Nature, 1986, 320: 374–378.
[19] Feklistov A, Darst SA. Promoter recognition by bacterial alternative σ factors: the price of high selectivity? Genes Dev, 2009, 23(20): 2371–2375.
[20] Kanhere A, Bansal M. Structural properties of promoters: similarities and differences between prokaryotes and eukaryotes. Nucleic Acids Res, 2005, 33(10): 3165–3175.
[21] McAllister CF, Achberger EC. Effect of polyadeninecontaining curved DNA on promoter utilization in Bacillus subtilis. J Biol Chem, 1988, 263(24): 11743–11749.
[22] Jose PM, Rojo F, Lorenzo DV. Promoters responsive to DNA bending: a common theme in prokaryotic gene expression. Microbiol Rev, 1994, 58(2): 268–290.
[23] Plaskon RR, Wartell RM. Sequence distributions associated with DNA curvature are found upstream of strong E. coli promoters. Nucleic Acids Res, 1987, 15(2): 785–796.
[24] Kanhere A, Bansal M. Bansal M. A novel method for prokaryotic promoter prediction based on DNA stability. BMC Bioinformatics, 2005, 6: 1. doi:10.1186/1471-2105-6-1.
[25] Wang H, Benham CJ. Promoter prediction and annotation of microbial genomes based on DNA sequence and structural responses to superhelical stress. BMC Bioinformatics, 2006, 7: 248. doi:10.1186/1471-2105-7-248.
[26] Towsey M, Hogan JM. The in silico prediction of promoters in bacterial genomes. Genome Inform, 2007, 19: 178–189.
[27] Jacques PE, Rodrigue S, Gaudreau L, et al. Detection of prokaryotic promoters from the genomic distribution of hexanucleotide pairs. BMC Bioinformatics, 2006, 7: 423. doi:10.1186/1471-2105-7-423
[28] Gordon L, Chervonenkis AY, Gammerman AJ, et al. Genome-wide prokaryotic promoter recognition based on sequence alignment kernel//Berthold MR, Lenz HJ, Bradley E, et al eds. Advances in Intelligent Data Analysis V, Berlin: Springer Press, 2003: 386–396.
[29] Horton PB, Kanehisa M. An assessment of neural network and statistical approaches for prediction of E. coli promoter sites. Nucleic Acids Res, 1992, 20(16): 4331–4338.
[30] Pedersen AG, Baldi P, Brunak S, et al. Characterization of prokaryotic and eukaryotic promoters using hidden Markov models. Proc Int Conf Intell Syst Mol Biol, 1996, 4: 182–191.
[31] Tavares LG, Lopes HS, Lima CRE. A comparative study of machine learning methods for detecting promoters in bacterial DNA sequences//Huang DS, Wunsch DC, Levine DS, et al eds. Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence, Springer Berlin / Heidelberg Press, 2008: 959–966.
[32] Du YH, Wu TH. A novel method of prokaryotic promoter regions prediction with feature selection: quadratic discriminant analysis approach. Apcmbe 2008: 7th Asian-Pacific Conference on Medical and Biological Engineering, 2008, 19: 608–614.
[33] Reis AN, Lemke N. An improved hidden Markov model methodology to discover prokaryotic promoters//Bazzan ALC, Craven M, Martins NF, eds. Advances in Bioinformatics and Computational Biology. Springer Berlin/Heidelberg Press, 2005: 85–94.
[34] Dekhtyar M, Morin A, Sakanyan V. Triad pattern algorithm for predicting strong promoter candidates in bacterial genomes. BMC Bioinformatics, 2008, 9: 233 doi:10.1186/1471-2105-9-233.
[35] Nakano MM, Lin A, Zuber CS, et al. Promoter recognition by a complex of Spx and the C-terminal domain of the RNA polymerase alpha subunit. Plos One, 2010, 5(1): e8664. doi:10.1371/journal.pone.0008664.
[36] Dickson RC, Abelson J, Barnes WM, et al. Genetic regulation: the Lac control region. Science, 1975, 187(4171): 27–35.
[37] Amann E, Brosius J, Ptashne M. Vectors bearing a hybrid trp-lac promoter useful for regulated expression of cloned genes in Escherichia coli. Gene, 1983, 25(2-3): 167–178.
[38] Boer HA, Comstock LJ, Vasser M. The tac promoter: a functional hybrid derived from the trp and lac promoters. Proc Natl Acad Sci USA, 1983, 80(1): 21–25.
[39] Brosius J, Erfle M, Storella J. Spacing of the -10 and -35 regions in the tac promoter. Effect on its in vivo activity. J Biol Chem, 1985, 260(6): 3539–3541.
[40] Studier FW, Moffatt BA. Use of bacteriophage T7 RNA polymerase to direct selective high-level expression of cloned genes. J Mol Biol, 1986, 189(1): 113–130.
[41] Grossman TH, Kawasaki ES, Punreddy SR, et al. Spontaneous cAMP-dependent derepression of gene expression in stationary phase plays a role in recombinant expression instability. Gene, 1998, 209(1/2): 95–103.
[42] Dubendorff JW, Studier FW. Controlling basal expression in an inducible T7 expression system by blocking the target T7 promoter with lac repressor. J Mol Biol, 1991, 219(1): 45–59.
[43] Karine BS, Leblon G, Reyes O. Positively regulated expression of the Escherichia coli araBAD promoter in Corynebacterium glutamicum. FEMS Microbiol Lett, 1999, 174(1): 125–130.
[44] Newman JR, Fuqua C. Broad-host-range expression vectors that carry the L-arabinose-inducible Escherichia coli araBAD promoter and the araC regulator. Gene, 1999, 227(2): 197–203.
[45] Smolke CD, Martin VJJ, Keasling JD. Controlling the metabolic flux through the carotenoid pathway using directed mRNA processing and stabilization. Metab Eng, 2001, 3(4): 313–321.
[46] Soisson SM, Beth MS, Schleif R, et al. Structural basis for ligand-regulated oligomerization of AraC. Science, 1997, 276(5311): 421–425.
[47] Siegele DA, Hu JC. Gene expression from plasmids containing the araBAD promoter at subsaturating inducer concentrations represents mixed populations. Proc Natl Acad Sci USA, 1997, 94(15): 8168–8172.
[48] Haldimann A, Daniels LL, Wanner BL. Use of new methods for construction of tightly regulated arabinose and rhamnose promoter fusions in studies of the Escherichia coli phosphate regulon. J Bacteriol, 1998, 180(5): 1277–1286.
[49] Bhende PM, Egan SM. Genetic evidence that transcription activation by RhaS involves specific amino acid contacts with sigma 70. J Bacteriol, 2000, 182(17): 4959–4969.
[50] Holcroft CC, Egan SM. Roles of cyclic AMP receptor protein and the carboxyl-terminal domain of the alpha subunit in transcription activation of the Escherichia coli rhaBAD operon. J Bacteriol, 2000, 182(12): 3529–3535.
[51] Skerra A. Use of the tetracycline promoter for the tightly regulated production of a murine antibody fragment in Escherichia coli. Gene, 1994, 151(1/2): 131–135.
[52] Korpela MT, Kurittu JS, Karvinen JT, et al. A recombinant Escherichia coli sensor strain for the detection of tetracyclines. Anal Chem, 1998, 70(21): 4457–4462.
[53] Gallegos MT, Williams PA, Ramos JL. Transcriptional control of the multiple catabolic pathways encoded on the TOL plasmid pWW53 of Pseudomonas putida MT53. J Bacteriol, 1997, 179(16): 5024–5029.
[54] Yen KM, Gunsalus IC. Regulation of naphthalene catabolic genes of plasmid NAH7. J Bacteriol, 1985, 162(3): 1008–1013.
[55] Lee SK, Newman JD, Keasling JD. Catabolite repression of the propionate catabolic genes in Escherichia coli and Salmonella enterica: evidence for involvement of the cyclic AMP receptor protein. J Bacteriol, 2005, 187(8): 2793–2800.
[56] Lee SK, Keasling JD. A propionate-inducible expression system for enteric bacteria. Appl Environ Microbiol, 2005, 71(11): 6856–6862.
[57] De Smet L, Kostanjevecki V, Guisez Y, et al. A novel system for heterologous expression of flavocytochrome c in phototrophic bacteria using the Allochromatium vinosum rbcA promoter. Arch Microbiol, 2001, 176(1/2): 19–28.
[58] Anderson JC, Voigt CA, Arkin AP. Environmental signal integration by a modular AND gate. Mol Syst Biol, 2007, 3: doi: 10.1038/msb4100173.
[59] Guet CC, Elowitz MB, Hsing W, et al. Combinatorial synthesis of genetic networks. Science, 2002, 296(5572): 1466–1470.
[60] Isalan M, Lemerle C, Michalodimitrakis K, et al. Evolvability and hierarchy in rewired bacterial gene networks. Nature, 2008, 452(7189): 840–845.
[61] Jensen PR, Hammer K. The sequence of spacers between the consensus sequences modulates the strength of prokaryotic promoters. Appl Environ Microbiol, 1998, 64(1): 82–87.
[62] Jensen PR, Hammer K. Artificial promoters for metabolic optimization. Biotechnol Bioeng, 1998, 58(2/3): 191–195.
[63] Patwardhan RP, Lee C, Litvin O, et al. High-resolution analysis of DNA regulatory elements by synthetic saturation mutagenesis. Nat Biotechnol, 2009, 27(12): 1173–1175.
[64] Ruth C, Glieder A. Perspectives on synthetic promoters for biocatalysis and biotransformation. Chembiochem, 2010, 11(6): 761–765.
Bacterial promoter recognition and application
Youqiang Xu1, Cuiqing Ma1, Fei Tao2, and Ping Xu2
1 State Key Laboratory of Microbial Technology, Shandong University, Jinan 250100, China
2 MOE Key Laboratory of Microbial Metabolism, Shanghai Jiao Tong University, Shanghai 200240, China
Bacterial promoter is a kind of regulators which are needed in bacterial gene expression and decide the strength and opportunity of gene expression. By insertion or deletion of promoters, we can change bacterial gene expression in order to study the growth and metabolic regulation. Promoters are also used to construct many kinds of vectors, so as to express heterologous genes. The study of promoter recognition and application is of great importance to realize the regulation of genes, gain products effectively and promote biological catalysis and metabolic engineering. This paper reviews bacterial promoters, and the methods for recognition of bacterial promoters as well as the study and application of bacterial promoters.
promoter recognition, inducible promoter, promoter application
细菌的基因表达调控主要发生在转录水平上,而启动子在转录水平调控中居于关键的地位[1]。随着生物催化技术的发展,细菌启动子获得了越来越多的应用。利用启动子可以改造细菌的代谢通路,或者方便地表达目的蛋白,使其在全细胞催化和酶催化中应用广泛,在生物催化中占有重要地位。而且该方法与物理法或化学法相比,还具有生产流程简单、底物的利用效率高、副产物少等特点,降低了产物后处理的成本,在可持续发展中具有重要的意义。
May 24, 2010; Accepted: August 11, 2010
Supported by:National Natural Science Foundation of China (No. 30770064), National High Technology Research and Development Program of China (863 Program) (No. 2007AA10Z401), National Basic Research Program of China (973 Program) (No. 2007CB707803).
Cuiqing Ma. Tel: +86-531-88364003; Fax: +86-531-88369463; E-mail: macq@sdu.edu.cn
国家自然科学基金 (No. 30770064),国家高技术研究发展计划 (863计划) (No. 2007AA10Z401),国家重点基础研究发展计划 (973计划) (No. 2007CB707803) 资助。