乳酸乳球菌表达系统及其启动子的研究进展

2022-07-02 03:49黄琳琳方以诚熊智强艾连中
食品科学 2022年11期
关键词:球菌乳酸诱导

王 慧,劳 晓,黄琳琳,方以诚,熊智强,艾连中,宋 馨*

(上海理工大学健康科学与工程学院,上海 200093)

乳酸菌是一类革兰氏阳性、无孢子、G+C含量低的细菌,已被欧洲食品安全局认证为“可用于食品生产的安全微生物”。乳酸乳球菌()是研究乳酸菌的模式菌株,成为继大肠杆菌、枯草芽孢杆菌、酵母菌之后最受关注的外源基因表达宿主。

相较大肠杆菌,乳酸乳球菌具有单一的外膜,能够将目的蛋白直接分泌到细胞外环境中,且乳酸乳球菌具有独特的胞外管家蛋白酶HtrA,仅分泌一种主要的胞外蛋白Usp45,最大限度减少了胞外蛋白水解系统对蛋白质的降解,更利于蛋白质的下游加工,因此作为细胞工厂被广泛应用,生产具有商业价值的异源蛋白,如酶、化合物、抗原、过敏原和细胞因子等。

稳定的载体骨架和高效可控的启动子是保证乳酸乳球菌表达外源蛋白的关键因素,本文主要介绍了乳酸乳球菌表达系统,着重关注表达系统中的转录调控元件üü启动子,详细阐述启动子的结构以及启动子的预测与分析,总结新启动子的克隆方法,最后对乳酸乳球菌启动子的研究进行展望。以期为深入研究启动子的结构和功能并进一步在工业上生产外源蛋白提供参考。

1 乳酸乳球菌表达系统

外源基因在乳酸乳球菌中表达的方法有两种,一种是将其整合到染色体上,进而转录表达;另一种是将携带有外源基因的质粒载体转入乳酸乳球菌中,通过质粒复制表达。根据上述两种表达方式,可将乳酸乳球菌表达系统分为整合型及游离型。

整合型表达系统包括基于质粒的同源重组系统,基于外源重组酶的单链DNA(single-stranded DNA,ssDNA)重组系统、双链DNA(double-stranded DNA,dsDNA)重组系统等。该类表达系统不需要筛选压力,外源基因能够随基因组稳定传代并表达,但外源基因在基因组上往往是单拷贝,因此表达强度较低。相较于整合型表达系统,游离型表达系统能利用独立自主复制的质粒载体更简捷地表达外源蛋白。当质粒载体进入乳酸乳球菌中后,通过θ复制或滚环复制方式进行自主复制,目的基因的表达强度由表达载体的拷贝数决定,表达量会随拷贝数的增加而提高,但游离型表达系统需要筛选压力保持稳定,且拷贝数很大时会增加载体的不稳定性,进而影响基因的表达。

无论是整合型还是游离型表达系统,目的基因的稳定表达都离不开启动子元件。根据启动子作用方式及功能,可将乳酸乳球菌表达系统分为诱导型启动子表达系统及组成型启动子表达系统。

1.1 诱导型启动子表达系统

诱导型启动子通常驱动细胞适应环境相关基因的表达,已知许多胁迫乳酸乳球菌启动子的条件因素,如噬菌体感染、温度或pH值变化、特定的糖等。由诱导型启动子驱动的基因表达系统即为诱导型启动子表达系统。

乳酸乳球菌中应用最广泛的诱导型启动子表达系统是由荷兰国家乳品研究所开发的乳酸链球菌素诱导基因表达系统(the nisin controlled gene expression system,NICE)。在NICE系统中,位于膜上的组氨酸激酶NisK感知Nisin的诱导信号并进行自身磷酸化,随后将磷酸基团转移到细胞内反应调节蛋白NisR上,激活启动子表达下游基因。Ciaćma等使用NICE系统,在Nisin诱导的P调控下,在乳酸菌分泌型表达载体pNZ8124中合成并克隆了人可溶性肿瘤坏死因子相关凋亡受体(tumor necrosis factor-related apoptosis-inducing ligand,TRAIL)cDNA(TRAIL-cDNA)。Feizollahzadeh等以携带NICE系统的质粒pNZ8149和乳酸乳球菌NZ3900分别作为载体和表达宿主,分泌表达白细胞介素-18。

NICE系统具有以下优点:1)操作简便、易于使用;2)可严格控制、诱导高产表达外源蛋白;3)能减少毒性蛋白的积累、避免细胞死亡。NICE系统的诱导剂、宿主菌和载体都是食品级的,安全可靠,应用前景相当广阔。但Nisin的添加成本较高,且在蛋白的生产过程中(尤其是药用蛋白)需进行下游提纯。

P170表达系统是乳酸乳球菌中的另一类诱导型表达系统,由强诱导型启动子P170控制。P170是通过转座子诱变筛选而获得的诱导型启动子,该启动子调控未知功能基因转录,细菌生长至稳定期时,低pH值诱导P170表达上调,进而调控蛋白表达。与NICE系统相比,P170表达系统通过生长过程中乳酸的积累实现自我诱导,利于下游蛋白的纯化,该表达系统已广泛用于乳酸乳球菌的工业生产中。虽然该系统的启动子是一个强诱导型启动子,但其适宜运作的pH值范围较狭窄,仅当pH 5.5时才能够强烈转录。此外,该系统受培养温度影响较大,温度低时活性更强。

当培养基中锌含量丰富时,乳酸乳球菌操纵子中的阻遏物与启动子P结合,抑制基因转录,而缺锌会导致失活,使得RNA聚合酶与P结合并进一步转录,研究者依此建立了P诱导表达系统。它基于乳酸乳球菌操纵子,该操纵子编码紧急Zn吸收ABC转运蛋白及其调控因子,而Zn可以抑制该转运蛋白的表达。当外源添加乙二胺四乙酸(ethylene diamine tetraacetic acid,EDTA)时,EDTA减少了培养基中的可用锌,诱导P启动,从而激活紧急摄取系统的转录。虽然通过EDTA可以耗尽Zn从而实现诱导,但这会阻碍需要阳离子的酶的过表达。

此外,锌离子浓度调节表达系统(zinc-regulated expression system,Zirex)由肺炎链球菌P及其编码调控蛋白SczA组成,将Nisin诱导的启动子与锌诱导的启动子P结合,使不同基因在同一乳酸菌细胞中分别以Nisin和ZnSO为诱导剂,同时独立表达。该系统有利于活性依赖Zn的羊毛硫肽环化酶及其他金属酶的过表达。

除以上所述,乳酸乳球菌诱导表达系统还包括热休克诱导系统、压力诱导型表达系统(stress-inducible controlled expression,SICE)、木糖诱导表达系统(xylose-inducible expression system,XIES)、噬菌体ɸ31爆发式诱导的表达系统、胍丁胺控制表达系统(agmatine-controlled expression,ACE)等。但这些系统大多实用价值不高,因为它们只能在有限范围内可控,效率较低。具体表现在:1)相应的诱导剂是必需的营养物或代谢物,其在培养物中的浓度无法完全控制;2)对分解代谢物的抑制非常敏感(如某些糖诱导系统);3)诱导表达的启动子活性会降低;4)操作过程复杂繁琐。目前最广泛使用和最有效的基因表达系统依然是NICE系统。

1.2 组成型启动子表达系统

许多已鉴定的启动子不受任何调节剂或生长条件的控制,结构基因的表达水平通常恒定在一定水平上,具有无时空特异性的特点,被称为组成型启动子。在乳酸乳球菌中,已鉴定出一些组成型启动子,如P、P、P、P以及P、P、P、P,目前已被广泛应用于乳酸乳球菌中表达外源基因(表1)。

表1 组成型启动子调控表达异源蛋白Table 1 Constitutive promoters regulating the expression of heterologous proteins

尽管组成型启动子成本较低、易于使用且不受培养基的限制,但与诱导型启动子相比,其表达强度不高。因此,筛选强组成型启动子成为近年的研究热点。

2 启动子的结构

启动子作为表达系统的一个重要元件,对基因的高水平表达起着关键的调控作用。

原核生物启动子长度约20~200 bp,转录起始位点(transcription start site,TSS)上游200 bp到下游100 bp为启动子的保守区域。对于典型的原核启动子,其保守区域包括TSS、-35区(Sextama框)、-10区(Pribnow框)以及间隔区(指在-10区和-35区之间的序列)(图1)。

几乎所有的启动子TSS上游10 bp处都有一个6 bp的保守序列(TATAAT),即-10区。另外一个6 bp的保守区域位于-35区,序列为TTGACA,其碱基的保守性较-10区低。研究发现,替换-10区内序列比替换-35区内序列对启动子活性影响更大。然而,相较于间隔区域的距离差异,序列构成并不重要,间隔太小或太大均会不同程度地影响启动子活性。-35区和-10区间的最佳间隔序列为17 bp,也可能小于15 bp或者大于20 bp。另外,-10区延伸序列、-35区上游的UP元件、-10区与TSS的间隔序列等非典型元件都对启动子的活性有影响(图1)。

图1 原核启动子核心保守序列Fig.1 Conserved core sequences of prokaryotic promoters

在基因转录过程中RNA聚合酶具有重要作用,它能特异性识别启动子并与之结合,随后转录才能开始。启动子与RNA聚合酶的亲和力越高,启动子活性越高,基因的表达水平越高。RNA聚合酶由5个亚基构成,分别为亚基、亚基、’亚基、亚基和Sigma(σ)因子。σ因子能使RNA聚合酶核心酶识别和结合到启动子的TSS上,决定了RNA聚合酶对启动子序列的特异性,在基因转录过程中起着关键作用。

核糖体结合位点(ribosome binding site,RBS)是位于起始密码子AUG上游的一段富含嘌呤的DNA序列(AGGAGG),也称作Shine-Dalgarno(SD)序列。该序列能识别核糖体16S rRNA并与之进行互补配对,促使mRNA与核糖体结合,从而促进翻译的起始。目前,并没有研究揭示乳酸乳球菌的RBS序列,但有研究者假定乳酸乳球菌载体pTRKH的RBS序列为“AAGGAGGT”,通过改变pTRKH质粒repDE操纵子的RBS序列来修饰pAMβ1复制子的拷贝数,从而影响核糖体与mRNA结合的强度,并最终影响复制起始蛋白RepE的产生。

乳酸乳球菌作为典型的原核生物,其启动子序列遵循原核启动子的特点。在乳酸乳球菌的启动子中,大多包含-35区及-10区保守序列,与大肠杆菌和枯草芽孢杆菌的启动子相似。此外,大约一半的乳酸乳球菌启动子包含一个-10区延伸序列,该延伸序列经常出现在革兰氏阳性菌的启动子中。目前,对乳球乳酸菌σ因子的研究较少,仅鉴定出一个σ因子(σ),由基因编码。σ与来自枯草芽孢杆菌的σ和来自大肠杆菌的σ具有高度的相似性,表明σ能够识别并结合到-35区序列“TTGACA”和-10区序列“TATAAT”上。然而,目前尚不清楚缺乏-35区的启动子是否被σ识别,或者其他可能存在的σ因子是否参与乳酸乳球菌中启动子的转录。

3 启动子的预测及分析

由于启动子在基因转录中的重要作用,准确预测启动子位点成为基因表达、模型解释以及建立和理解遗传调控网络的必要步骤。为获得可能的启动子序列,研究者们通过对启动子序列碱基偏好、局部保守模块信息以及启动子空间构象特征、能量分布特征等的研究,进行生物信息学分析,开发有效的启动子预测工具。

早期,启动子序列的预测仅基于各生物特有的核苷酸序列,缺乏足够大的已知基因样本库,进而会产生不准确的预测结果。此外,一些基因预测方法是基于两个或多个基因组之间的同源性,对于没有同源性的菌株,这些方法并不适用。随后,研究人员发现在所有类型的启动子中,最突出的特征是上游和下游区域的DNA双链稳定性不同,并提出了一种基于启动子和非启动子区域之间DNA序列稳定性差异的原核启动子预测方法。利用DNA的物理特性预测启动子的方法逐渐受到了广泛的关注,SEPro是一种通过研究和利用DNA序列的内置结构和能量信息而开发的启动子预测工具,适用于包括古细菌在内的所有原核生物。表2列出了部分原核生物启动子预测工具。

表2 原核生物启动子在线预测软件Table 2 Online prediction software for prokaryotic promoters

现有的预测软件大多依据典型模式生物数据库建立,例如革兰氏阴性菌启动子预测软件依据大肠杆菌数据库建立,革兰氏阳性菌启动子预测软件依据枯草芽孢杆菌数据库建立。BacPP能够在线预测革兰氏阴性菌的启动子,其通过识别革兰氏阴性菌给定序列的σ因子以预测可能的启动子序列。

除对启动子序列进行准确预测外,对转录因子、转录因子结合位点(transcription factor binding site,TFBS)等的预测分析同样具有重要意义。用户能利用在线搜索工具Virtual Footprint通过全基因组搜索以交互方式识别可能的TFBS,并立即获得有关启动子、相应基因、操纵子和编码蛋白的详细信息。用于预测原核生物启动子元件和调节子的网络服务器PePPER,可在任何测序的细菌基因组中挖掘调控子和TFBS,研究者也借此建立了乳酸乳球菌TFBS数据库。

4 乳酸乳球菌启动子的克隆

从乳酸乳球菌和其他乳酸菌中分离克隆启动子的策略有很多,主要分为启动子探针质粒载体筛选法和克隆法。

4.1 启动子探针质粒载体筛选法

启动子探针载体是指无启动子,携带报告基因、抗性标记和转录终止子的克隆载体。启动子探针质粒载体法是一种简单有效而且精准的筛选启动子的方法。筛选分离启动子时,用合适的限制性内切酶来消化相应的基因组DNA,启动子探针载体也同时用相同的酶进行酶切处理,然后,将酶切处理好的基因组片段和相同方式处理的启动子探针连接重组,使克隆的片段恰好插在报告基因的上游位置,根据报告基因的表达与否、表达的强弱来确定启动子的筛选情况。

在构建探针质粒载体中,报告基因的选取至关重要,一般要求报告基因序列已知,目的蛋白特征清晰,检测方便快捷,且在宿主中表达时不存在背景干扰。启动子研究中最常用的报告基因大多是编码抗生素抗性蛋白的基因,除此之外,还有编码氯霉素乙酰基转移酶、-半乳糖苷酶或-葡萄糖醛酸酶的基因以及荧光蛋白基因等。

利用启动子探针载体法无需具体的基因核苷酸序列,不用设计引物即可随机筛选分离得到大量的启动子,简单轻松,但这种方法需要先构建一个启动子探针载体,且后续筛选工作量较大,既费时又费力,因此主要在早期的启动子筛选克隆工作中应用较多。

4.2 克隆法

对于已知序列的启动子,可以设计序列特异性引物,通过聚合酶链式反应(polymerase chain reaction,PCR)技术克隆获得基因的启动子序列。该方法结合了生物信息学技术和PCR技术,先用计算机相关软件对基因序列进行预测分析,然后利用PCR技术获取已知序列中的启动子,该方法已逐渐成为获取启动子的主要手段。

利用PCR技术获得启动子的速度快、特异性强,避免了DNA本身连接和环化的问题,但其对启动子的预测和分析要求比较精准。

5 结 语

近年来,研究者通过建立有效的乳酸乳球菌表达系统高效生产异源蛋白,并将其应用于食品工业、医药卫生等行业。相比于传统的大肠杆菌系统,对乳酸乳球菌表达系统的研究远远落后。

在进一步发展和完善乳酸乳球菌表达系统时,完善和扩大乳酸乳球菌载体系统和宿主系统是研究的重点,而在载体系统的改造过程中,启动子调控元件是重中之重。未来的研究方向主要有:1)对乳酸乳球菌启动子结构进行更深入全面的研究,包括其σ因子、核糖体起始位点序列、转录因子、转录结合位点等;2)现有的概念框架尚不足以完全理解启动子信号的性质,应开发针对乳酸乳球菌的模型或理论来解释与启动子相关的蛋白质、转录因子及配体等在转录过程中的结构及能量变化;3)提供准确的启动子预测对于理解启动子及RNA聚合酶如何进行转录过程十分重要,应将实验与计算预测相结合,以获得精准有效的预测工具。

启动子的研究主要集中在两个方面:1)新型高效可控强启动子的发现是满足工业生产高要求的最佳措施;2)对现有启动子的改造。启动子是控制目的基因表达的开关,对启动子进行精确的定位,阐明其各部分元件的工作原理及意义,有针对性地加以改造,可使启动子利用效率最大化。

从启动子出发,筛选新的强启动子元件,构建成熟高效的乳酸乳球菌表达系统,无论是在理论研究还是实际生产中都有十分重要的意义。

猜你喜欢
球菌乳酸诱导
递增负荷运动中大学生乳酸阈及乳酸阈心率的实验研究
宏基因组测序辅助诊断原发性肺隐球菌
浅析诱导公式的导向功能
人在运动后为什么会觉得肌肉酸痛
临床检验科普之你不知道的肠球菌
糖尿病性乳酸性酸中毒
玉米单倍体诱导系XKY—1和XKY—2的选育研究
本院引起泌尿系统感染的148株肠球菌耐药性分析
服二甲双胍别喝酸奶
包头智能停车诱导系统将建成