王叶 贾振华 宋水山
(1. 河北工业大学化工学院,天津 300131;2. 河北省科学院生物研究所,石家庄 050000)
以往,工业生产中主要利用化学催化剂进行工业产品的生产,对条件要求苛刻,且污染环境严重。生物催化剂是具有催化作用的游离或固定化细胞和游离或固定化酶的统称。由于其反应条件温和,绿色、安全,因此被广泛应用于工业、农业、医药和能源等领域。目前,生物催化剂的市场价值约40亿美元,并且酶类的使用范围仍在不断的扩大[1],其中腈水解酶、蛋白酶、脂肪酶[2]、转氨酶和糖基水解酶的研究受到了广泛的关注。随着科技的进步,工业生产中对酶的催化性能及耐受性提出了更高的要求。这就需要我们开发新的生物技术去寻求新型催化剂。
传统的挖掘新型生物催化剂的方法主要基于可培养微生物的功能筛选,然后对阳性菌株进行序列分析,功能验证。人们利用传统的挖掘方法发现了淀粉酶[3]和酯酶[4]等。其中微生物作为催化剂的来源[5]在该方法中起着核心作用。据统计,地球上微生物细胞的总数达1030[6]。但是,大多数微生物存在于其天然微生物群落环境中,与其他微生物相互依赖而生存,很难在实验室条件下进行纯培养[7]。这极大地限制了传统方法挖掘新型酶的效率。宏基因组学通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能[8],避免了微生物的分离和实验室培养,成为探索生物学和不同自然环境中分子生物多样性的有力工具。而宏基因组学基因挖掘策略中也存在一些限制,可通过合成生物学来弥补。通过这两种方法的结合使用,可以提高挖掘新型生物催化剂的效率,而宏基因组学基因挖掘策略中也存在一些限制,可通过合成生物学来弥补。通过这两种方法的结合使用,可以提高挖掘新型生物催化剂的效率.本文综述了宏基因组学方法挖掘新型生物催化剂的最新研究进展,并对利用合成生物学方法改进宏基因组筛选新型生物催化剂的效率进行了讨论。从而探索提高挖掘新型生物催化剂的方法。
宏基因组学挖掘新型生物催化剂的基本流程(图1):(1)采集样品:微生物的生存环境与其所表达的酶的耐受性及底物特异性具有一致性,可通过所要筛选的生物催化剂的特性寻求合适环境中的微生物群体进行采样。目前微生物样品的来源大致可归结为5大类:陆地环境、水生环境、寄生环境、人工环境及其他特殊环境。(2)提取特定环境中的基因组DNA:一般可分为直接提取法和间接提取法。可根据样品来源微生物的特性及目的催化剂的特性进行优化及选择来提取环境总DNA。(3)构建宏基因组文库:所提取的基因组DNA需要连接到合适的载体中并转化宿主菌。(4)筛选阳性克隆子:根据目的基因的活性或其序列特点进行宏基因组文库的筛选。(5)目的基因的亚克隆和表达:将筛选到的目的基因连入合适的表达载体和宿主菌中表达。(6)目的催化剂的生化特性分析[9]:诱导目的基因表达,纯化目的蛋白,并作生化特性分析。[10]。近年来,人们已经成功利用宏基因组学发现在工业应用中具有潜在利用价值的酶[5,11]。宏基因组学挖掘新型生物催化剂包括基于活性的筛选和基于序列的筛选。
图1 宏基因组学挖掘新型生物催化剂流程图
基于活性的筛选(Activity-based screening),也称功能驱动筛选(Function-driven screening),是指通过活性检测手段从基因组文库中获得具有特殊活性的克隆方法[9]。基于活性的筛选是在没有任何核苷酸、核糖核苷酸或蛋白质序列分析的情况下,直接对基因潜在功能的筛选。因此,为了有效地从潜在基因(含有潜在功能基因片段的克隆或具有相应表型的菌株)中发现新型催化剂,需要建立合适的功能筛选方法。这些方法最好简单易行,如通过肉眼直接观察或用分光光度计检测来鉴别阳性克隆[12]。通常在固体培养基中添加特殊底物,经过微生物代谢,引起比色变化,透明圈、抑菌圈或生长表型的变化,从而来筛选阳性克隆。本实验室在筛选能将异丁酸合成β-羟基异丁酸菌株时,将菌株培养于以异丁酸为唯一碳源的培养基中,能进行生长的为阳性克隆。在添加特殊底物的液体培养基中,可将细胞或细胞裂解液置于96孔板中,通过分光光度计测量其吸光度的变化来鉴别阳性克隆。最后,利用分子生物学工具和生物体内蛋白调控的知识来挖掘新型酶。近年来有很多利用这种方法成功挖掘具有新型功能的生物催化剂[13-15]的例子。
脂肪酶和酯酶作为生物催化剂,被广泛应用于纺织、食品、洗衣、造纸和纸浆工业、生物柴油生产和精细化学品的合成等领域。Chu等[16]从中国南海取样,构建宏基因组文库。以1%三丁酸甘油酯和1%阿拉伯树胶为底物,筛选出周围带透明圈的阳性菌落。进一步用BamHⅠ内切酶随机消化阳性菌落质粒DNA,构建带有随机片段的克隆子,分离出两种新型酯酶estA和estB。同样,李云娣等[17]在含有1%三丁酸甘油酯的培养平板上,37℃培养3-5 d 后观察产生透明圈的阳性克隆子,发现了酯酶ESTYN1[17]。Wierzbicka-Woś等[18]筛选出新型冷活性糖苷水解酶(BglMKg)。在这项研究中,在固体培养基中添加X-gal,阳性克隆将会变为深蓝色,从而筛选出具有新型冷活性糖苷水解酶的菌落。另外作者还用不同的发色底物检验了酶的特殊活性。
如前所述,基于活性筛选的方法已经建立并成功运用,但有些种类的催化剂还没找到合适的功能筛选方法。因此,利用工业相关底物去寻求理想新型(底物特异性、手性、酶活稳定性)催化剂的智能筛选方法仍是我们现在面临的巨大挑战。但这并不是说通用底物在功能筛选中没有作用。解决这一问题的关键是全面重新审视并诠释新型酶的特征,并选择合适的生化检测实验来验证阳性克隆。
基于序列的筛选是以序列相似性为基础,根据已知相关功能基因的保守序列设计探针或PCR 引物[19],然后通过杂交或PCR 扩增来筛选目标克隆[9],这两种方法都不需要异源宿主细胞中的蛋白表达[20]。当然,其随后的功能表达仍需面临蛋白表达的问题,但是在筛选阶段可以避免这些限制,降低了由异源表达效率低而造成的假阴性。近年来利用此种方法已成功挖掘许多新型催化剂。
梁跃斌等[21]对CAZy数据库中193条细菌源α-L-鼠李糖苷酶进行氨基酸序列分析[22],根据保守氨基酸序列设计简并引物,对健康人体粪便宏基因组DNA[23]进行筛选,将获得的基因片段进行测序,进而通过原核表达获得新型α-L-鼠李糖苷酶基因。Jiang等[24]从北冰洋海水中取样,构建了一个质粒宏基因组文库,并筛选出新型延胡索酸酶基因fumF。另外,Wang等[25]在摩斯拉热液喷口处采样并对构建的宏基因组文库进行随机焦磷酸测序,筛选出糖苷水解酶(GH-57)。Fang等[26]通过保守区域-铜结合位点对中国南海微生物宏基因组文库进行分析,筛选出一长1.32 kb的细菌漆酶基因。
从2009年到2015年宏基因组测序项目从199个增长到607个,同时在GOLD 网站上有22 455条非宏基因组研究条目。巨大的测序数据库为探索特定酶活性的基因奠定了基础。尽管如此,这种方法还是具有其局限性,尤其是新颖性。该方法依赖于数据库中已知的序列,仅限于同源酶的分析[27]。迄今为止,新发现的酶的氨基酸序列与数据库中已存在的序列同源性高于50%,一般在70%-90%之间,脂肪类酶除外[28]。因此,同源性低于这个范围的新型酶需要利用其他方法进行筛选,如可采用功能筛选或提高预测软件识别区域结构的能力。
随着注解多样性的增加,利用同源性搜索,我们可以挖掘更具新颖性的基因序列。不管它是否转录为具有新功能的酶还是只具备之前被定义的活性,这种预筛选都是有意义的。虽然目前的筛选方法可以分离新序列,尤其是脂肪酶类序列,但并没有表现出筛选新颖功能酶的用途。基因检测的发展和更复杂的注解程序可以实现这一功能。或者,从宏基因组样品中勘测到的具有新颖性的序列可以作为接下来分子操作的一个基础。
如Handelsman等[29]所述,宏基因组可定义为“自然界中存在的所有微生物的基因组”,指的是从自然环境中可以直接得到的基因序列。虽然宏基因组学是不依赖于生物培养的获取有价值基因资源的有效方法[16]。但其仍然存在局限性,其具体主要归纳为以下3个方面。首先,挖掘的新型基因需要在异源宿主细胞中进行表达,而各个菌属的菌株在转录、翻译等过程中都具有偏好性(RNA聚合酶对启动子的识别,密码子、核糖体识别等),这就需要提高基因在异源宿主菌中表达目的酶的能力。其次,载体与宿主菌常存在不兼容问题,需要开发新的遗传工具以改善宏基因组文库的构建,使其适合不同宿主的筛选。最后,需要继续完善筛选方法,从而提高挖掘新型催化剂的效率。以自然环境为资源,将迎来更强大有效的探索庞大基因组潜能工具的热潮。
合成生物学在现代生物学基础上融入了工程学思想。它将化学或生物化学合成的DNA生物元件构建为标准化的元件库,并利用这些元件组装成具有全新特征或增强了性能的生物模块、网络、体系乃至生物体(细胞),以满足人类的需求[30]。其中元件指具有特定功能的DNA片段(如基因),模块指多个元件的组合[31]。它主要包括两种技术线路:(1)利用标准化元件设计和建造模块、体系。(2)在天然的代谢网路基础上,利用标准化原件对其进行改造。合成生物学使得基因网路能像电路一样,通过控制各个元件,来调控功能的表达。利用此特点可以很好的解决上面提出的宏基因组筛选策略中遇到的3类问题。
通过宏基因组学筛选出的阳性克隆子,需要进行目的基因的亚克隆、表达、纯化,才能对目的催化剂的生化特性进行分析。由于目的基因的来源菌株与异源表达宿主菌株系统发育的不同,可能导致异源基因表达失败或低表达,造成宏基因组文库中所需酶回收率低[11,32]。合成生物学可以解决这一难题。转录初始阶段,由于原核生物中RNA聚合酶对启动子的识别具有很大的偏好性[33],使得宿主体内的RNA聚合酶与宏基因组中的启动子亲和力低成为蛋白异源表达的主要限制。蛋白质异源表达理想的的宿主菌应该具有识别广谱启动子的能力。可以通过插入特定启动子及其σ因子等元件在宿主菌中共表达来实现[34-35]。另外可以利用T7 RNAP表达模块系统实现异源蛋白的高效表达[36],而且这种方法可以使受复杂信号转导机制的基因仅仅通过添加单一诱导物如异丙基-β-D-硫代吡喃半乳糖苷而被诱导表达。同理,在mRNA翻译过程中,核糖体结合位点的差异性也会导致蛋白表达水平的降低[37]。因此同时也需共表达mRNA识别步骤中的蛋白,从而增强宿主菌表达外源基因的能力[38]。然而这些都只是为了提高目的蛋白的表达水平,表达出来蛋白是否有活性是开发新型催化剂的另一个关键因素。表达出来的蛋白需要进行复杂折叠或通过额外的处理步骤(如切割、分泌或肽修饰)形成正确的构象[39]。例如,Ferrer等[40]在大肠杆菌中将目的蛋白与分子伴侣[41]共表达,使得异源蛋白正确的折叠。
在提高异源宿主能力的方法中基因编辑尤其受到了关注[42]。因为在标准的试验条件下目的基因并不是宿主菌(如大肠杆菌)生长所必需的[43],兼容这些基因并大量表达其编码的蛋白意味着巨大的能量消耗和代谢负担[44]。删除非必需基因,减小基因组大小,提高细菌代谢活力,可以提高异源蛋白的表达水平[45]。拥有最小化基因组的细菌,由于其超强的表达能力,成为筛选宏基因组文库最理想的宿主。
除了基因工程中最常用的宿主菌大肠杆菌外,在宏基因组筛选中人们还尝试过其他菌株作为宿主菌来提高挖掘新酶的效率[46-47]。而在宿主细胞中的表达,需将目的基因整合入载体并导入宿主菌中,进行稳定遗传及表达,这就需要建立一个通用的、标准化、适合多种宿主菌的广谱工具(载体),以促进各种宿主菌中宏基因组文库的筛选。可以利用合成生物学,重新组装元件,构建新的基因网路[48-49],开发出适合多种宿主细胞的载体。在这些适合于多种宿主的工具中,pSEVA载体因可以广泛应用于100多种不同的细菌种类而受到广泛关注[50]。可以此系统为出发点,设计基因网路,开发新的遗传工具,从而更高效的筛选不同种类细菌的DNA。2.3 合成生物学改善宏基因组筛选方法
目前常用来筛选宏基因组文库中新型催化活性的方法常可以用肉眼观测到。在固体培养基中添加特殊底物,阳性菌落周围底物颜色发生变化[51-52]或底物被降解形成透明光圈[53]。劳动密集型筛选方法如菌落PCR也用于新型催化剂的挖掘[54]。利用合成生物学及生物学知识,通过合理整合调节网路的各个部分[55],设计生物传感器,可以为酶活性的筛选提供更好的方案[56]。生物传感器是将工程基因网路与已报道基因(lacZ、绿色荧光蛋白或萤光素酶等)的整合,通过简单的表观现象筛选阳性克隆,便于生物体内鉴别酶活性的一种工具[57]。这种方法减少了筛选过程中大量的重复劳动,极大的提高了宏基因组文库的筛选效率。合成生物学也可以通过生物合成途径调节酶分子水平。Zelcbuch 等[37]通过与核糖体结合位点结合配对基因来调节酶表达的水平,引起蛋白种类几个数量级的变化,这表明工程代谢途径受酶水平的精确调控。这些例子表明可以通过合成生物学方法,关联各调控因子(如启动子和调节子),设计出具有更好性能的酶的基因网路。以基因工程网路中各调控元件为基础重新设计调节系统,并将其应用于挖掘新型催化剂策略中,将会极大提高挖掘新型催化剂的速率。
新型催化剂在工业中已受到广泛应用,宏基因组筛选策略挖掘新型催化剂将会推动下一代工业流程如生物药物的合成并开创新的机遇。这就要求生物技术的全面综合发展。从基因序列角度来看,随着宏基因组多样性的增加及基因分离、测序技术的发展,宏基因组筛选策略已经开始着手挖掘序列同源性较低的基因,并将推动基于序列的新型催化剂的挖掘。可以将所有原核微生物的宏基因组进行测序[58],为宏基因组学法挖掘新型生物催化剂奠定基础,并为生物技术的发展提供数据参考。
构建工程基因网路可以将合成生物学与编程相结合,它包括设计、建模、实施及调试等环节。例如开发一些电子设备分析生物系统,在这里细胞可以被重新编程,从而以更高的效率执行新的任务[59-60]。设计方面着重规划和构建新的基因网路以便于工业应用[61]。建模包括所提出的基因网路的计算机模拟,评估网路性能与能力并为其选择合适的分子组分做指导[62]。实施部分包括根据组装标准,对适当的组分例如启动子、调节元件、终止子、酶和转运蛋白等进行机械组装[48]。最后,调试步骤需要测试和验证生物体内代谢通络,并且改善生物系统在应激情况中表现出来的对生产不利的特性[63-65]。目前已经有设计并实施成功的生物通路的例子[64,66-67],并且近年来该领域的发展速度惊人[65,68]。
将宏基因组筛选策略[69]中各种方法结合起来,并与生物信息学测序能力,信息分析能力[70-73],智能筛选技术和合成技术[73]协同作用将会迎来生物学技术的巨大飞跃。为了实现这个目标并使其效能最大化,需要各领域的科学家们的协调配合。信息学、分子生物学、化学、药物设计、物理学、工程学及系统生物学等学科学术与工业应用的融合发展,将会更好的应对未来的挑战,为生物催化剂及生物产物的发现提供广阔的平台。