安迎锋, 王虹玲
(沈阳农业大学 生物科学技术学院,辽宁 沈阳 110161)
随着石油燃料的逐渐枯竭和环境污染的日益严重,生物燃料作为绿色的可再生资源,其开发和利用受到了全世界的广泛重视。其中,以生物乙醇和生物柴油为代表的第二代生物燃料发展规模最大,最受关注。第二代生物燃料以非粮食作物,如稻壳、秸秆、木屑、枯草等农林废弃物以及动物脂肪、藻类等为原料,通过酶解作用将上述木质纤维素等生物质分解成可发酵的单糖,进行用于生物燃料的生产。然而,目前常见的生物催化剂对这些生物质的分解能力差,在特定环境下的活性不稳定,极大地限制了它们在工业生产中的应用。因此开发具有高催化活性、良好稳定性和底物特异性的新酶一直是科研工作者们研究的热点。自然界中微生物是生物催化剂非常重要的来源。传统的从环境样品中分离新酶的方法主要建立在微生物纯培养的基础上,但生物环境中高达99%以上的微生物是不可培养的,极大地限制了微生物资源的利用[1]。宏基因组又称元基因组,是指特定环境中全部微小生物遗传物质的总和,主要包括细菌和真菌。宏基因组的研究方法是直接提取环境样品中的总DNA,利用合适的载体和宿主细胞构建宏基因组文库,从中筛选出目标基因及活性物质[2]。近年来,科研工作者们利用宏基因组技术已从环境样品中筛选到淀粉酶、纤维素酶、蛋白酶、果胶酶、阿魏酸酯酶、脂肪酶/酯酶、多功能酶、木聚糖酶等多种用于生物燃料生产的在极端环境中仍能保持较高活性的酶[3]。随着宏基因组学及高通量测序技术的不断发展,我们进入了宏基因组学挖掘生物酶制剂的时代。本文从宏基因组技术研究的环境样品的预处理、宏基因组DNA的提取、宏基因组文库的构建、筛选等方面着手,阐述了宏基因组技术在挖掘新型生物燃料生产酶制剂方面的研究现状,为生物催化剂的深入开发提供理论基础与研究思路。
运用宏基因组技术开发新酶的技术流程主要包括:环境样本的预处理、环境样本中核酸的提取、用于基因克隆的质粒及宿主细胞的选择、宏基因组文库构建、筛选等(图1)。从宏基因组中筛选新酶的有效方法依赖于分子生物学、微生物学以及生物信息学等多学科的交融和发展。
图1 宏基因组技术在新酶开发中的研究策略Fig.1 Metagenomic strategies for identification of genes encoding novel enzymes
环境中样品的预处理主要是指样品中目的基因的富集,通过富集处理能够增加目标基因的拷贝数,进而提高核酸提取的效率。有效的富集方法包括噬菌体展示技术、亲和捕获技术、微阵列技术、差异显示技术、稳定同位素探针技术以及抑制性削减杂交技术等。
样品中宏基因组DNA的提取,一方面要尽可能地提高样品中DNA的提取效率,另一方面要最大限度地保持DNA 片段的完整性和纯度。常用的提取方法有直接提取法和间接提取法两种。直接提取法又称原位提取法,是指样品DNA不经过富集而直接用去垢剂和蛋白酶等物质破碎微生物细胞的细胞壁,进而提取并纯化DNA的方法[4]。这种方法的优点是DNA提取效率高,但是提取的DNA纯度低、杂质较多,而且由于受到了机械损伤导致提取的DNA片段较小,不适用于构建大片段基因组文库[5]。间接提取法又称异位提取法,主要过程是从环境样本中分离出微生物,用较温和的方法提取总DNA。此种提取方法由于避免了细胞受到较大的机械损伤,从而可获得较大的DNA片段,但是DNA的提取效率低于直接提取法[6]。
宏基因组文库的构建过程中,需要根据研究目标的不同选择载体和宿主细胞。通常需要考虑提取DNA的质量、片段大小、载体、宿主细胞以及使用的筛选方法等。目前常用的载体包括用于克隆小的DNA片段(≤15 kb)的质粒载体(plasmid)[7]和构建较大的DNA片段的文库时采用的柯斯黏粒(Cosmid)、福斯黏粒(Fosmid)、细菌人工染色体载体(BAC)、酵母人工染色体载体(YAC)等。
大肠埃希菌由于其培养和代谢条件已经被广泛研究并掌握,且操作简便,是最常用于基因克隆和蛋白表达的宿主细胞。但是,运用大肠埃希菌细胞进行外源基因表达时,仅有不到40%的基因表达产物可以检测到活性[8],这可能是由于在大肠埃希菌中外源DNA的表达破坏了宿主细胞正常的转录功能,尤其当表达的外源蛋白具有细胞毒性时[9]。一些生活在高温或低pH等极端环境条件下的微生物基因,当转入到大肠埃希菌细胞时,也可能会导致载体与宿主细胞之间不相容。例如,一些极端微生物的纤维素酶系统不能在大肠埃希菌宿主细胞中有效地发挥作用[10]。因此,对于宏基因组文库的功能性筛选,需要寻找其他可替代的宿主系统[11]。枯草芽胞杆菌是可用于构建宏基因组文库的高效宿主系统[2],此外,其他一些微生物,如根癌农杆菌、伯克氏菌等也常用作构建宏基因组文库的宿主系统[13]。
经过不断改进,多种宏基因组文库的筛选方法已被用于筛选多种功能性基因,发现许多新的活性物质。常用的筛选方法包括功能驱动的筛选、化合物结构筛选、序列驱动的筛选以及底物诱导基因表达筛选(SIGEX)。
1.3.1 功能驱动的筛选 功能驱动的筛选不依赖于基因序列的信息,筛选到的基因往往与基因文库中已知的基因序列差异较大,同源性低,适用于大片段DNA文库的筛选。如通过在琼脂培养基中加入三丁酸甘油酯,筛选具有脂肪酶活性的克隆[14],七叶苷则可用于具有β-半乳糖苷酶活性克隆的筛选[15]等。Hosokawa等[16]对上述筛选方法进行了改进,运用以小液滴为基础的微流体技术进行阳性克隆的筛选,在这种微流体中,阳性克隆能够与底物形成小微囊,从而将具有脂肪水解酶活性的克隆筛选出来。与之类似的筛选方法,还有将小液滴技术与荧光激活细胞分选法相结合,通过宏基因组克隆与荧光底物结合的方法进行功能筛选[17]。
1.3.2 化合物结构筛选 化合物结构筛选根据阳性克隆与宿主细胞间色谱吸收峰的差异来进行鉴别区分。许多微生物的次生代谢产物可以用此方法来鉴定[18]。但是,由于这种方法低通量、操作繁琐且价格昂贵,不适合大规模应用。
1.3.3 底物诱导基因表达筛选 底物诱导基因表达筛选(SIGEX)是指在底物存在的条件下,酶和代谢相关基因选择性表达的一种筛选方法,由Uchiyama 等人2005年首次提出[18]。分解代谢基因的表达是由代谢产物或分解代谢酶的底物所诱导的,这些分解代谢基因的表达大多数情况下受其周围调控元件的调控[19],因此这种方法可用来排除文库中未表达的目的基因[20-21]。Kazuya等运用此方法成功地从一个地下水宏基因组文库中筛选出芳香烃诱导基因[19]。SIGEX具有较高的经济价值,可进行工业化生产。
1.3.4 序列驱动的筛选 序列驱动的筛选方法需根据已知目的基因或基因表达产物的保守序列,设计PCR引物及探针,通过PCR扩增或杂交鉴定阳性克隆。但是,序列筛选方法要求预先了解与目的基因序列类似序列的相关知识,因此它只限于具有高度保守序列的基因筛选,例如一个已知基因家族中新成员的筛选,而许多新型的基因则不易被发现。
纤维素酶广泛应用于食品加工、染料及造纸工业,同时在生物燃料生产中也颇受青睐。目前,通过宏基因组技术已在不同的环境资源中分离出大量的新型纤维素酶。Cheng等[22]构建了山羊的瘤胃宏基因组文库,从中筛选得到一个纤维素酶基因,通过蛋白研究发现,其对木聚糖和羧甲基纤维素表现出非特异性内切葡聚糖酶活性;Yang等[23]从厌氧发酵的啤酒糟中通过构建宏基因组文库,筛选得到3种新型纤维素酶(cel 7482、cel 3623、cel 36),其中cel 7482对氯化物有极强的耐受性,在2 mol/L的NaCl中仍能保持较高的活性;Matsuzawa等[24]从土壤宏基因组文库中筛选到一种新的具有β-葡萄糖苷酶和β-岩藻糖苷酶活性的纤维素酶,该酶在生物质的糖化中起到了较好的促进作用。此外,另1株来自黑山羊瘤胃宏基因组文库的纤维素酶也显示出广泛的底物范围和较高的热稳定性[25]。这些新型纤维素酶的发现,为生物燃料生产中生物质的分解开辟了新的途径。
木聚糖酶是一类降解木聚糖的复合酶系,主要包括β-1,4-内切木聚糖酶(EC3.1.2.8),β-1,4-木糖苷酶(EC3.2.1.37),α- L- 呋喃阿拉伯糖苷酶(EC3.2.1.55)。其中β-1,4-内切木聚糖酶是反应中的关键酶,在生物燃料生产过程中起到促进生物质降解的作用[26]。通过宏基因组技术,研究人员已经从来自不同生态环境的宏基因组文库中发掘出大量的新型木聚糖酶基因。Verma等[27]从土壤堆肥宏基因组文库中筛选到一个新的木聚糖酶基因,该基因编码的木聚糖酶表现出耐热和耐碱稳定性。Bahassi等[28]从鸡的盲肠中通过建立宏基因组文库,筛选获得一种对有机溶剂和高浓度盐溶液有较强耐受性的β-1,4-内切木聚糖酶。Gong等[29]从牛瘤胃中的未培养微生物中筛选得到一种新的在pH 4.0~12.0、温度4~55 ℃范围内仍具有高稳定性的木聚糖酶。随着高通量测序和宏基因组技术的发展,越来越多的木聚糖酶基因将会被筛选和定位,为生物质的分解代谢提供更广阔的酶制剂资源。
漆酶是一类含4个铜离子的多酚氧化酶(EC3.1.2.8),属铜蓝氧化酶家族,能够催化酚类和非酚类化合物的氧化,如多环芳烃、农药、工业染料以及各种烯烃等[30]。由于漆酶能够降解木质素,其在分解木质纤维素植物生产生物燃料领域具有潜在的应用价值。细菌和真菌中都存在漆酶,而对于真菌漆酶的研究更为广泛。目前,基于功能宏基因组学研究方法,已从宏基因组文库中获得许多有重要应用价值的漆酶。大多数从真菌中筛选到的漆酶,对氯化物和碱性条件敏感[31]。相反,细菌则成为获得抵抗高pH值和高浓度氯化物的新型漆酶的重要来源。Ye等[32]从红树林土壤的宏基因组文库中利用功能筛选的方法筛选到了一种漆酶,命名为Lac591,该酶在55 ℃ 和 pH 7.5的条件下酶活性最高,并且在pH 7.0~10.0范围内均具有良好的稳定性,具有潜在的工业应用价值。Fang等[31]从海洋宏基因组文库中分离得到一种细菌来源的漆酶,该酶在高pH值和高氯化物条件下能够对染料进行脱色。
果胶是植物和真菌细胞壁的重要组成成分,存在于相邻细胞壁的胞间层中,由半乳糖醛酸残基通过α-1,4-糖苷键连接组成[28]。果胶酶是能够催化果胶水解的酶类,根据作用底物的不同,分为聚半乳糖醛酸酶(PG)、果胶裂解酶(PL)和果胶甲基酯酶(PME)[33]。果胶酶在果实成熟、果汁榨取、植物病害机制研究以及生物燃料生产中发挥着重要作用。宏基因技术为新型果胶酶的开发作出了重要贡献。Singh等[34]从土壤宏基因组文库中克隆到一个编码耐热性果胶酶的基因,该基因编码的果胶酶能够在较大的pH值及温度范围内仍保持活性。Wang等[35]通过对碱性土壤的宏基因组DNA进行分析,发现了一种具有高切割效率、耐热、耐碱的新型果胶酶。
淀粉酶能够水解淀粉形成小分子葡萄糖聚合物,通过对宏基因组文库的分析,发现了新型淀粉酶。Xu等[36]从倭蜂猴排泄物中分离微生物的DNA,建立宏基因组文库,筛选到一个编码α-淀粉酶的基因,命名为AmyPL,该淀粉酶发挥活性的最优pH值为5.6,并且在60 ℃时还能保持65%的活性。Nair等[37]从阿拉伯海沉积物的宏基因组文库中分离到一种耐盐α-淀粉酶,其在2.5 mol/L NaCl条件下仍可保持51%的活性。这些新型淀粉酶将适用于多种工业应用。
蛋白酶是最重要的一种工业酶制剂,在生物燃料生产中有广泛的应用。Neveu等[38]从死亡谷和戈壁沙漠表层沙土的宏基因组文库中分离到两种蛋白酶,命名为M30和DV1,它们均属于枯草杆菌蛋白酶(S8A)家族的丝氨酸蛋白酶,具有独特的生化活性。其中,蛋白酶M30生长的最适pH值大于11,这使得它在极端环境下的生物技术应用中表现出潜在的价值。Pessoa等[39]从红树林沉积物的宏基因组文库中分离出一种PR4A3蛋白酶,此蛋白能够分解血液、牛奶、明胶以及卵黄中的蛋白组分。此外,利用宏基因组技术已分离出大量的在生物质降解方面具有潜在应用价值的蛋白酶类物质[40]。
阿魏酸酯酶(FAEs; EC 3.1.1.73)能够催化植物细胞壁中多糖和阿魏酸之间酯键断裂,释放出游离的阿魏酸。Vieites等[41]从垃圾填埋池沥出物的宏基因组文库中筛选到一个阿魏酸酯酶基因,命名为Fae6。该基因编码的酶蛋白Fae6对阿魏酸甲酯、阿魏酸乙酯和芥子酸甲酯等底物表现出很高的活性,可用于生物燃料生产过程中水解多糖阿魏酸酯中的酯键[42]。Cheng等[43]利用宏基因组技术从中国霍斯坦牛的瘤胃微生物宏基因组文库中筛选出一个新型阿魏酸酯酶,该酶对具有高pH值和热稳定性的羟基肉桂酸甲酯具有广泛的特异性,能够显著促进麦秆中阿魏酸的释放。
多功能酶是具有多种催化活性的蛋白质。Zhao等[44]通过筛选瘤胃BAC文库,分离出一种β-1,4-内切木聚糖酶,该酶具有两个家族IV型纤维素结合模块(CBMs)和两个GH家族催化结构域,且在中性pH和较宽温度范围内,表现出比其他许多木聚糖酶更高的活性。Ferrer等[45]通过对奶牛瘤胃进行宏基因组分析,鉴定出一种多功能酶R-09-02,属于GH家族,该酶具有β-1,4乳糖酶、β-1,4木糖苷酶、β-半乳糖苷酶、α-1,4葡萄糖苷酶等多种活性。Ko等[46]通过瘤胃宏基因组研究还鉴定了一个新的纤维素分解酶CelEx-BR12,该酶具有纤维素内切酶、纤维素外切酶和木聚糖酶活性。Patel等[47]通过对水牛瘤胃进行宏基因组分析,分离得到一种新酶,该酶能够作用于山毛榉、羧甲基纤维素、刺槐豆胶和果胶等物质,发挥出特有的多功能酶活性,如木聚糖酶、葡聚糖内切酶、甘露聚糖酶和果胶酶活性等。
脂肪水解酶是一种重要的工业酶制剂,能够催化酯质类物质水解和转酯作用,是生物柴油合成过程中不可或缺的重要酶类。根据其底物偏好性,脂肪水解酶可以分为水解长链酰基甘油(碳链长度>10)的脂肪酶和水解短链酰基甘油(长度≤10)的酯酶[48]。脂肪酶/酯酶能够催化脂肪酸或甘油三酯与甲醇等低碳醇的转酯反应,进而生成长链脂肪酸甲酯,即生物柴油。含有脂肪酶/酯酶的微生物可以在添加酰基甘油的固体培养基上分解酰基甘油形成清晰的空圈,由于其筛选方法简单、直接,到目前为止,脂肪酶/酯酶是从宏基因组文库中筛选得到的最为常见的酶类物质。随着宏基因组技术的发展,越来越多的新型脂肪水解酶基因从来自于不同环境样本,如各种各样的土壤、动物瘤胃、海洋沉积物、温泉、活性污泥等物质中分离出来。Seo等[49]利用功能驱动的筛选方法从沼泽沉积物的宏基因组文库中筛选得到一种耐低温的酯酶,命名为EstL28,该酶在35 ℃和pH 8.5条件下酶活性最高,且在温度低于20 ℃时仍能保持较高的活性。酯酶Est3K和脂肪酶Lip3K均来自于石油污染过的泥滩的宏基因组文库,二者在50 ℃,pH 9.0时发挥最大活性,且在甲醇中仍能保持较高的酶活[50]。Su等[51]从海绵宏基因组文库中分离到一种新型碱性脂肪酶,该酶在pH值7~12的范围均能保持较高的稳定性,且在pH 9的条件下活性最高。De等[52]从西藏冰川的宏基因组文库中筛选出一种能够分解对硝基苯酯的新型耐盐酯酶(H9Est)。具有类似性质的酯酶Est16也从宏基因组文库中筛选出来,该酶可分解包括对硝基苯丁酸酯、对硝基苯戊酸酯在内的多种底物,同时在去垢剂、重金属、有机溶剂中具有较高稳定性[53]。酯酶Est7K来自于堆肥宏基因组文库,因其对甲醇具有一定的耐受性而广泛应用于多种生物技术生产过程中[54]。Khan等[55]从森林土壤的宏基因组文库中筛选出一种在各种有机溶剂中都能保持高稳定性的广谱脂肪酶SMlipA。来自于温泉宏基因组文库的脂肪酶RK-lip479,也同样对多种有机溶剂、各种单价、二价、三价阳离子具有耐受性[56]。此外,从潮间带沉积物、海洋沉积物、永冻土等宏基因组文库中也分离到了新型脂肪酶[57-59]。
随着测序和筛选技术的发展,越来越多用于生物燃料生产的具有特殊功能的酶从宏基因组文库中筛选出来。如Ferrer等[60]从瘤胃宏基因组中筛选出一种环化糊精酶,其水解α-D-1,4糖苷键的能力比α-D-1,6糖苷键快13倍,且在70 ℃时具有最高酶活。该酶能够分解环糊精产生麦芽糖和葡萄糖,进而用于生物燃料的生产。此外,宏基因组技术也可用于筛选一些其他具有潜在的生物燃料合成相关的微生物酶,如乙醇/乙醛脱氢酶、乙醇氧化还原酶等[61-62]。
随着世界范围内能源的短缺,以及人们对环境保护的日益重视,开发生物燃料这一可再生资源来替代石化燃料的使用,既是绿色新能源开发的有效途径,又可促进我国农业的可持续发展。通过微生物酶制剂将生物质分解转化为可发酵的单糖技术,是生物燃料商业化生产的最大瓶颈之一。目前酶制剂开发的方向集中在如何提高酶在有机溶剂、温度、pH中的稳定性,增加酶专一性和水解速度,发挥多种酶之间的协同作用,以及从环境资源中开发更多的用于生物燃料生产的新型酶制剂等。
宏基因组技术作为新酶开发的有力工具,打破了传统技术中依靠微生物的分离培养进行新酶开发和探索的限制,直接从环境样品中提取DNA构建宏基因基因文库,通过基因序列的筛选和克隆,使不可培养微生物的开发和利用成为可能。随着高通量测序技术的发展,利用宏基因组技术开发的新型生物燃料生产酶的种类正逐渐增长,这些酶制剂表现出特有的催化性质和稳定性,在生物燃料生产过程中发挥着至关重要的作用。虽然宏基因组技术在新酶开发中取得了令人瞩目的成绩,但是作为一种新兴的技术手段,仍需对其进行深入的探索和广泛的应用,使其能够更有效地探索环境中微生物资源,为生命科学的发展做出更大的贡献。