张大伟, 康 倩
(1.中国科学院天津工业生物技术研究所 中国科学院系统微生物工程重点实验室,天津 300308;2.中国科学院大学,北京 100049)
枯草芽胞杆菌是常见的杆状、产芽胞的革兰阳性细菌,广泛存在于土壤等自然环境中。一直以来,枯草芽胞杆菌作为典型的革兰阳性细菌的模式生物,成为微生物中最为重要的菌种之一。枯草芽胞杆菌,因其模式菌株基因组已完成全部序列测序及部分基因解析[1],生理生化特征清晰,菌株安全性高及其非致病性,细胞膜结构简单及其分泌性良好,不仅被当作基础生理生化、遗传研究的模式生物,而且因其有巨大的工业生产应用潜力,逐渐成为基因表达系统的研究热点菌株之一[2-4]。
作为较有潜力应用于工业生产的微生物菌株之一,相比较于其他菌株,枯草芽胞杆菌具有较为明显的应用价值及意义。首先,枯草芽胞杆菌是目前解析最为清楚的生物体之一,也是革兰阳性细菌研究的典型模式生物,对其研究较为广泛及清晰。1997年,欧洲和日本学者联合研究解析了枯草芽胞杆菌模式菌株168的基因组序列,并将其发表在Nature[5]。在全基因组测序完成的基础上,后续针对枯草芽胞杆菌基因解析及生理特性的研究逐渐开展。2003年,枯草芽胞杆菌的必需基因被解析及报道[1]。随后,枯草芽胞杆菌转录调控数据库建立及逐渐完善,数据库网站DBTBS(http://dbtbs.hgc.jp/)可以较为快捷地查询枯草芽胞杆菌的转录因子,调控操纵子等一系列信息。枯草芽胞杆菌的蛋白组学研究,尤其是针对其分泌蛋白的组学研究[6-7]逐渐被报道,以上一系列枯草芽胞杆菌生理性质的研究成果成为了对其应用研究的理论基础。其次,枯草芽胞杆菌具有菌株安全的特性。对于常见的革兰阴性细菌,如大肠埃希菌,其细胞外膜上的主要成分脂多糖(LPS),通常被认为是可以引发人类和哺乳动物发热的一种内毒素,导致其在食品添加剂产物和药物产物生产的应用中有所局限。而枯草芽胞杆菌只有一层膜结构,并不含有内毒素隐患,具有一定的安全性,被美国食品药品监督局(FDA, US Food and Drug Administration)认定为是公认安全菌株(GRAS, Generally Recognized As Safe)。另外,枯草芽胞杆菌具有良好的蛋白分泌特性,可以通过改造,使目标蛋白产物进行大量的分泌。以大肠埃希菌为代表的革兰阴性细菌具有双层膜结构,即内膜和外膜,所以其胞内合成蛋白产物在进行胞外分泌时需要通过两层屏障,困难较大,因此其蛋白分泌程度较难达到理想水平。而枯草芽胞杆菌只有一层膜结构,分泌途径得到较为详细的解析,所以其有能力进行大多数蛋白产物的大量生产和分泌。
枯草芽胞杆菌中的蛋白表达过程受到多种元素的调控,其中主要集中于转录过程和翻译过程[8]。在转录阶段的调控过程主要集中于对启动子的筛选和优化,选择最优的启动子及调控其表达的强度,可以最大程度地进行蛋白的活性表达和避免蛋白包涵体的产生。另外在翻译阶段的调控主要集中于对蛋白序列中RBS的调控,以及针对后续分泌中信号肽的选择,都是枯草芽胞杆菌中蛋白表达系统构建的重要步骤。
对于枯草芽胞杆菌蛋白表达的调控首先可以从转录水平进行,在转录过程中,RNA聚合酶特异性地结合不同的启动子,进行相应基因的转录。RNA聚合酶结构包括了核心酶区域(α亚基、β亚基、β′亚基、ω亚基)和一个Sigma (σ)因子。其中核心酶结构为保守结构,σ因子的作用是介导核心酶识别和结合至转录起始位点上,因为表达基因不同,作用的σ因子的数量和种类不同,保证了其识别的特异性。枯草芽胞杆菌中σ因子的发现不断更新,目前在枯草芽胞杆菌中已发现多种不同的σ因子,其中σA、σB、σC、σD、σH、σL、σX、σW为枯草芽胞杆菌营养生长因子,σE、σF、σG、σK为芽胞形成因子,其在不同的基因转录过程中起着调控作用[9-10]。启动子作为表达系统的一个重要元件,其有几个序列区域高度保守,可以用来预测和分析启动子。典型的原核启动子保守区域包括:-35区域,序列为TTGACA;-10区域,序列为TATAAT;-35区域和-10区域间17~18个碱基的间隔区域;转录起始位点(TTS)。TGn motif(也称为-15区域)存在于-17至-14位置,其序列包括TRTG(R代表A或G)。转录起始位点通常是由嘌呤开始,即A或G。大多数启动子的-10至+1区间通常会有一个富含AT的区域,本区域由4~7个碱基构成。-35区域的上游还有一个UP元件同样富含AT碱基,并被证明其可以通过和RNA聚合酶的α亚基相互作用,以增强转录作用。通过修改及优化UP元件可以较为明显地增强启动子的活性,并进而增强目标蛋白的表达[11-12]。除了根据上述启动子的特性进行启动子优化,以提高目标蛋白的表达外,直接进行启动子的筛选也是一个方便且快捷的蛋白表达的优化方案。枯草芽胞杆菌中可应用的启动子,依据其应用方式被分类为组成型启动子和诱导型启动子,目前已经有许多不同强度的启动子被报道,本文将对其进行总结,并描述其特点及应用方式(表1)。
表1 枯草芽胞杆菌蛋白表达系统中常用启动子
核糖体结合位点(Ribosome-Binding Site, RBS)在枯草芽胞杆菌的蛋白翻译效率中起着重要作用。据报道,在移除了RBS的5′端的茎环结构[36],或失活了RBS序列和起始密码子之后[37],明显地减弱了mRNA的半衰期;优化RBS序列,可增强mRNA的稳定性[38],表示RBS和mRNA序列稳定性有关。所以,对mRNA序列上的RBS序列进行改造,以增强其mRNA的稳定性,可以较好地增强蛋白的表达水平,如Phan等[39]通过将lacO转录操纵子的茎环结构和gsiB基因的RBS序列结合,融合groE基因的启动子,明显提升了mRNA的半衰期,从而增加了目标蛋白的表达。
除了对天然的RBS序列进行改造,通过软件设计人工的RBS序列及对其优化也可提高目标蛋白的表达。在统计热力学平衡模型中,根据mRNA和30S核糖体之间分子互作的作用力,推算出转录起始速率。当RBS附近的核酸酶识别位点被初始核糖体覆盖时,5′核酸内切酶的作用被有效抑制,所以mRNA的稳定性和转录起始频率相关[40]。
在蛋白表达系统中,细胞根据有无信号肽,对新合成的蛋白质进行分选,决定其留在胞内作用或转运至细胞膜及细胞外。虽然枯草芽胞杆菌中各种分泌途径之间略有不同,但其大多数分泌蛋白的N端信号肽有三个性质相似的区域:一个和转运装置相互作用,带正电荷的N端区域;一个富含疏水残基的疏水的核心区域(H区域)和一个带有信号肽酶切割位点的C端区域[7,41],当蛋白被运送到准确的作用位置之后,信号肽被信号肽酶切除并被降解。N端结构域和转运元件或细胞膜上带负电的磷脂相互作用,其结构中带有至少一个精氨酸或者赖氨酸的残基。H结构域由疏水氨基酸残基延伸构成,可以在细胞膜中形成α螺旋,在此疏水核心中通常存在发夹结构,以便于将完整的信号肽插入细胞膜中从而进行介导作用。C结构域中存在信号肽酶切割位点,当蛋白完成转运后,信号肽被信号肽酶切割,从细胞膜上释放,蛋白正确折叠且成熟。根据信号肽的结构特点,一些软件可以对未知蛋白进行信号肽的预测,其中主要有SignalP和LipoP被广泛应用。
依据信号肽参与的分泌途径不同,将其分类为多种,其中主要有Sec依赖的信号肽、Tat依赖的信号肽、ABC依赖的信号肽和Com依赖的信号肽等。Tat信号肽和Sec信号肽都被信号肽酶I所切割,依赖Sec分泌途径进行分泌的脂蛋白前体的信号肽被II型信号肽酶切割,假纤毛蛋白(Com依赖型分泌)的信号肽被ComC信号肽酶切割。依赖ABC途径分泌的核糖体合成外激素和羊毛硫抗生素的信号肽被ABC转运子切割。在枯草芽胞杆菌蛋白表达系统中,通过筛选和优化异源蛋白的前导信号肽,可以实现目标蛋白的胞外分泌[42-43],其不仅可以使目标蛋白导出至细胞外环境,方便进一步分离纯化,也可以减少细胞内蛋白的积累压力,解除部分蛋白表达中的瓶颈抑制,以增加目标蛋白的表达量。
在蛋白质被合成后,蛋白质通过不同的机制被转运到其作用的位置继续发挥生理生化功能。在枯草芽胞杆菌中有多种蛋白分泌途径来进行新合成蛋白的转运和分泌,其中主要包括经典蛋白分泌途径(Sec分泌途径)、双精氨酸分泌途径(Tat)和ATP结合盒转运蛋白(ABC途径)等。除了上述经典的分泌途径外,随着研究的进展,在枯草芽胞杆菌中越来越多的其他分泌途径逐渐被揭示及解析,但也有很多未知分泌途径的分泌蛋白被发现,且分泌途径未被阐明,上述蛋白被统称为非经典分泌蛋白(图1)。
3.2.1 Sec依赖的蛋白分泌途径 经典分泌途径,又成为Sec依赖的蛋白分泌途径,或Sec分泌途径,广泛存在于生命体中,主要负责未折叠蛋白的转运。枯草芽胞杆菌中Sec转运元件由至少4个蛋白构成,分别是转运动力蛋白SecA和构成跨膜蛋白复合体的SecY、SecE和SecG蛋白。在Sec分泌途径中,主要可以分为三个部分:蛋白质的分选和靶定,转运,蛋白质的成熟和释放[8,44]。①蛋白质的分选与靶定:在枯草芽胞杆菌Sec分泌途径中,根据翻译和转运的关系及时间可分为翻译共转运和翻译后转运两种形式,在翻译共转运分泌的蛋白靶定过程中,分泌蛋白中高度疏水的信号肽或细胞膜蛋白的N端跨膜结构在核糖体的出口处被SRP(信号识别因子)所识别。作为高度保守的核糖核蛋白复合物,SRP由scRNA,两个组蛋白类似蛋白(HBsu)和一个与scRNA相互作用的Ffh蛋白所构成。SRP可以传送RNC(核糖体-新生肽链复合物)至位于细胞膜上的跨膜SecYEG蛋白通道复合物上。SRP的膜相关受体FtsY直接和膜上脂质和SecYEG复合物相互作用,带领新生肽链进入SecY通道[45]。在翻译后转运分泌的蛋白靶定过程中, SecA蛋白和新合成的多肽链相互作用。secA是一个保守的ATP酶,其广泛存在于各种细菌中,主要负责介导以ATP和质子动力势PMF为能量来源的分泌蛋白,将其引导向细胞内膜的SecYEG分泌通道蛋白[46]。实验结果证明,删除SecA的C端区域可以增加枯草芽胞杆菌中异源蛋白的胞外分泌[47]。②蛋白质的转运:在Sec分泌途径中,细胞膜上跨膜的SecYEG蛋白复合体,副转运蛋白SecDF-YajC和跨膜蛋白YidC蛋白共同构成了完整的细胞膜上Sec分泌途径的蛋白转运子结构[46]。在蛋白质转运过程中,SecYEG形成转运通道,SecA催化ATP水解,为蛋白跨膜提供能量。在蛋白转运过程中,对蛋白通道SecYEG进行人工过表达可以增加转运子的数量,从而增加活性蛋白的分泌量[48]。SecDF蛋白是Sec蛋白分泌途径中的辅助蛋白,针对蛋白的序列分析和拓扑学分析表示这两个蛋白是有大的胞外loop环的完整蛋白,SecDF蛋白在蛋白质跨膜转运的后期有辅助作用。③蛋白质的成熟与释放:当蛋白质完成转运时,信号肽酶对蛋白质N端信号肽进行切割,从而形成成熟的蛋白质。在枯草芽胞杆菌中,信号肽酶分为两种,I型信号肽酶(Lep)针对大多数分泌蛋白进行信号肽的切割,II型信号肽酶对脂蛋白的信号肽进行切割。针对I型信号肽酶(SipS、 SipT、 SipU、 SipV、 SipW)进行分析,发现SipS和SipT两个信号肽酶的存在就足以处理前体蛋白的成熟和维持细胞的活性,其余信号肽酶发挥补充作用以满足不同分泌蛋白的成熟过程,如SipW信号肽酶被证明是双功能信号肽酶,其需要对孢子生成相关蛋白TasA进行加工处理,也会控制表面附着生物膜的形成。枯草芽胞杆菌中存在II型信号肽酶LspA,负责脂蛋白信号肽的切割,但是实验证明,在缺少II型信号肽酶的时候,枯草芽胞杆菌在实验室环境下的生长并没有明显被影响[8]。转运完成之后,信号肽酶针对分泌蛋白信号肽上的C端区域中的信号肽酶切割位点进行切割,蛋白被释放,且由于信号肽结构对蛋白折叠的延迟作用被解除,蛋白进行进一步折叠与成熟。
图1 枯草芽胞杆菌中蛋白表达和主要分泌途径Fig.1 Protein expression and main secretion pathway in Bacillus subtili1:依赖SRP的共翻译转运途径;2:Sec依赖的翻译后转运途径;3:Tat依赖的蛋白转运途径;4:ABC转运子依赖的转运途径;5:非经典蛋白分泌途径1:Co-translation protein secretion with the assistance of SRP; 2:Post-translation protein secretion in Sec-depended pathway; 3:Tat-depended protein secretion pathway; 4:ATP-binding cassette (ABC) transporters secretion pathway; 5:Non-classical protein secretion pathway
3.2.2 Tat依赖的分泌途径 区别于Sec蛋白转运途径,Tat蛋白分泌途径主要负责折叠蛋白的转运,其负责转运的底物蛋白包含一个保守的双精氨酸信号肽序列。在Tat蛋白分泌途径中,参与氧化呼吸链的辅助因子和复杂氧化还原酶在蛋白转运过程中起着重要作用。Tat分泌途径通过TatC和TatA蛋白(或TatA类似蛋白)形成对接复合物,对接复合物中的TatC元件将底物蛋白插入膜内,底物-对接复合物招募孔洞形成蛋白TatA,细胞膜内外的质子动力势PMF提供蛋白转运的所需能源[49]。枯草芽胞杆菌的Tat分泌元件由两个蛋白组成,分别是一个小膜蛋白TatA和一个大的膜蛋白TatC。其中TatA蛋白有三个亚蛋白组成,为TatAc、TatAd和TatAy;TatC蛋白有两个亚蛋白组成,为TatCy和TatCd。两个TatA蛋白亚基和TatC蛋白亚基组合构成两个平行的途径,分别是TatAy-TatCy和TatAd-TatCd途径,此两个途径分别介导不同底物蛋白的分泌且受操纵子的控制表达[50-51]。目前,枯草芽胞杆菌中已发现的依赖Tat分泌途径的分泌蛋白有PhoD、YwbN(EfeB)、QcrA、YkuE等[50]。Tat分泌途径可以将折叠好的蛋白分泌至胞外,降低了生产中蛋白纯化的成本,所以针对Tat分泌途径应用的研究越来越多。Yang等[52]在枯草芽胞杆菌中,将大肠埃希菌来源的N-氧化还原酶TorA的 Tat信号肽融合表达目标蛋白甲基对硫磷水解酶(MPH),成功实现了该酶在枯草芽胞杆菌中的表达和分泌,其胞外产量可达6.1 mg/L,有较大的工业应用潜力。Xia等[53]将嗜热脂肪土芽胞杆菌来源的耐热β-半乳糖苷酶在枯草芽胞杆菌中表达,通过融合表达枯草芽胞杆菌内源的磷酸二酯酶的Tat信号肽,实现了异源半乳糖苷酶的表达和胞外分泌,其胞外酶活达到总酶活的44%。
3.2.3 ABC转运原件依赖的分泌途径 ATP结合盒(ABC)转运元件存在于从细菌到人类的所有的生物体细胞中,是由多种复杂蛋白组成的家族。ABC转运元件负责很多形态功能各不相同的底物的吸收和外排。ABC转运元件有较为保守的特点:都有两个跨膜区域(TMD),底物识别位点和两个作为动力区域的核苷酸结合区域(NBDs),NBD区域负责识别几个较为保守的系列区域[54]。ABC转运元件在不同的方面发挥功能。在枯草芽胞杆菌中,Opu家族就是ABC转运元件的转运系统之一,负责渗透压诱导的渗透保护器吸收系统。其中,OpuA是主要的甜菜碱吸收系统,表达受细胞内外渗透压的调节;OpuB负责胆碱的特异性转运,与OpuA和OpuB不同,OpuC呈现出多底物兼容的结合性质[55]。NatAB操纵子编码双基因ABC转运子,参与枯草芽胞杆菌中钠离子外排[56],FtsEX ABC转运子在初始产孢阶段调节细胞的分化[57]。
3.2.4 非经典分泌系统 除了严格的信号肽介导的分泌途径以外,在枯草芽胞杆菌中,越来越多的分泌蛋白被证明不依赖已知的信号肽,且没有可被预测的信号肽区域,但却可以大量地被分泌至细胞外,这类蛋白被统称为非经典分泌蛋白。非经典的蛋白分泌现象是一种普遍且广泛存在的行为,对于枯草芽胞杆菌,越来越多的非经典分泌蛋白被发现,且其分泌途径暂时未被系统地解析。
针对非经典分泌蛋白的研究,目前已取得部分进展:根据细胞生长过程中吸光值的测定和细胞生长状态的检测证明,在蛋白的非经典分泌过程中,并不存在大量的细胞裂解现象[58],且一些细胞自裂解基因如LytC、LytD的敲除实验[58],细胞胞内、胞外的蛋白组学分析证明[59],非经典分泌蛋白并不是依赖细胞自裂解进行外排的,且其分泌和胞内表达水平无明显线性相关,推测其存在一定的特异性的分泌途径;针对非经典分泌蛋白自身序列及结构进行研究,发现非经典分泌蛋白序列的完整性对蛋白的分泌至关重要[60-61],且非经典分泌蛋白倾向于以多聚体的形式存在于细胞内外并保持聚体形式进行分泌,并倾向于从细胞的两极和隔膜区域进行分泌[61-62];针对非经典分泌蛋白的功能和应用进行研究,发现部分非经典分泌蛋白和细胞的致病性和侵染过程相关[63],一些非经典分泌蛋白还参与细胞对逆境环境的抵抗过程[64],且一些非经典分泌蛋白已被证实可以被应用于介导所需蛋白的可溶表达和活性分泌[59,65],未来有一定的应用前景有待发掘。
枯草芽胞杆菌作为革兰阳性的模式研究菌株,被美国食品药品监督管理局定为一般认为的安全菌株,有很强的学术研究价值及工业应用价值。以枯草芽胞杆菌作为底盘细胞,除了可以实现多种生物制品如抗生素、嘌呤核苷酸、维生素的制备,更为重要的是可以作为异源蛋白表达和分泌的良好载体,进行所需蛋白产物的生产。枯草芽胞杆菌作为工业生产菌株,有生长速度快,所需碳源、氮源廉价且易获得,遗传背景清晰,遗传操作成熟,分泌途径解析较为清楚,蛋白产物易分泌和纯化等优点,有较强的生产优势。但是在枯草芽胞杆菌中的异源蛋白表达及分泌过程中,仍然存在一些目前难以解决的问题,如蛋白二硫键的形成和蛋白的非正确折叠的问题,所以针对枯草芽胞杆菌中蛋白表达和分泌的改造方法在不断地探索和进步。
目前针对在枯草芽胞杆菌中的蛋白表达策略和优化,主要集中在四个方面,即蛋白的转录、翻译、转运和折叠。可通过筛选天然启动子序列和RBS序列[39],基于序列预测的理性人工改造启动子序列以增强目的基因的转录和翻译效率[11-12,66],开发新型蛋白表达系统[22],以优化目标蛋白的表达;通过筛选天然信号肽序列[67-68],人工半理性的信号肽序列优化[69],发掘新的蛋白转运途径以应用[59,65],来增加目标蛋白的转运效率,使其更易获得;通过过表达或改造分泌元件[47,70],以增强目标蛋白的转运效率;通过共表达分子伴侣蛋白[40],增加目标蛋白的有效折叠;通过对细胞表面构成进行改造,增强目的蛋白的分泌[71-72](图2)。除了上述针对蛋白表达和分泌过程的改造策略之外,对枯草芽胞杆菌的菌株改造策略也切实可行,如对枯草芽胞杆菌胞外蛋白酶的敲除,可以保证细胞外蛋白的稳定性,增加目的蛋白的胞外产量[73];对细胞全局碳、氮代谢网络的调控,可增强目标蛋白的产量[74];对细胞进行基因组的精减和改造,构建简化细胞,也被证实可以提高枯草芽胞杆菌中的蛋白生产[75]等。
图2 枯草芽胞杆菌中蛋白表达分泌优化策略及发展Fig.2 The optimizing strategy and development of protein expression and secretion in Bacillus subtilis
综上所述,目前针对枯草芽胞杆菌中的蛋白表达和分泌的优化策略已逐渐清晰化和系统化,在实际研究和应用中,可根据目标蛋白的特异性,选择不同的优化策略将其进行组合,模块化优化,逐步提升目标蛋白的表达和分泌水平,实现定制化的枯草芽胞杆菌蛋白表达系统,实现目标蛋白的大量表达及分泌。
枯草芽胞杆菌,作为科学研究中的重要模式菌株,也是酶与蛋白质合成的重要工业生产菌株,有菌株安全、生长速度快、发酵原料廉价、遗传背景清晰、遗传操作手段完善、蛋白可大量分泌易于纯化等诸多优点。未来,枯草芽胞杆菌蛋白表达系统将在以下研究内容中迎来更大的机遇与挑战。①基因组人工合成技术:将在基因组层面从头设计蛋白表达分泌途径及相关因子,新设计的基因组将在细胞生理与代谢方面赋予枯草芽胞杆菌更多新功能,促进基因的遗传稳定及高效的蛋白表达与分泌。②基因编辑技术:分子遗传学的快速发展,尤其是CRISPR为代表的基因编辑技术,将会更新枯草芽胞杆菌遗传改造手段,实现多位点同时编辑,多途径同时精确调控等,大大提高菌株改造效率。③宿主与蛋白表达的匹配与协同:蛋白表达,尤其是异源蛋白表达会给宿主造成细胞生理与代谢的负担与响应压力,是优化蛋白表达系统的重点与难点之一。针对异源蛋白的表达与分泌,从宿主细胞生理与代谢层面,深刻理解并进行理性改造,将会有效提高蛋白表达效率。④开发新型调控系统和新型分泌途径:另辟新径,拓展枯草芽胞杆菌蛋白质表达系统的功能途径。包括开发新型强启动子,特定信号诱导调控的启动子等;开发新型分泌途径,例如非经典分泌途径,自诱导分泌系统,可编程分泌系统等。⑤构建人工微小室或拟亚细胞器:含有二硫键的蛋白在枯草芽胞杆菌中表达具有很大挑战,通过对细胞内进行简单分区或分成小型微室(micro-compartment),形成不同氧化还原环境,同时引入促进二硫键形成折叠酶,将有望解决含有二硫键蛋白的折叠与表达问题(图2)。最后,随着合成生物技术的发展和理念的深入人心,枯草芽胞杆菌的基础研究和应用技术将会得到更深入的研究和推进,会使其在工业酶、食品酶及医药蛋白生产领域有更大的应用潜力,逐步成为蛋白质合成的优势宿主菌株。