占今舜,宋虎威,陈宇光,李丽立,张 彬*
(1.湖南农业大学动物科学技术学院,长沙 410128;2. 中国科学院亚热带农业生态研究所 动物生态营养与健康养殖联合实验室,农业生态工程重点实验室,长沙 410125)
随着分子生物学及基因工程的发展,利用自身基因在外源细胞中的克隆与表达也受世人关注。生物表达系统的出现满足了科学发展的要求,并渐渐成为处理工农生产以及医疗卫生等领域问题的重要手段之一[1]。近年来,蛋白表达系统已有原核表达系统、真核表达系统、哺乳动物表达系统和昆虫细胞表达系统等。不同的表达系统,其有不同的特点。如原核表达系统主要是大肠杆菌,其表达体系相对简单,目的蛋白无法经过修饰加工,对于有复杂二级结构的蛋白就不宜用此表达系统[2];哺乳动物表达系统,技术研究不够成熟,外源基因在动物体内容易受到排斥,导致表达不稳定,表达代价相对其他表达系统高很多;昆虫细胞表达系统,缺陷主要是表达量不足,而且容易产生错误的糖基化修饰[3];真核表达系统主要是酵母体系,其中对毕赤酵母(Pichia pastoris)的研究最为热门,该体系既有糖基化程度不高,对目的蛋白污染小,对生长环境要求不高,其培养基易配置,便于高密度发酵表达等特点,又具有强效的启动子,还可对复杂的外源蛋白的高级结构进行翻译后加工折叠和修饰过程,比如糖基化、蛋白折叠及生成二硫键等,是一种优秀的真核生物表达系统[4]。经过多年的研究发展,毕赤酵母表达系统已成为一个相对成熟和理想的蛋白表达系统,被国内外广泛应用于工农生产以及医疗卫生等领域。目前,已有数百种外源蛋白在毕赤酵母表达系统中获得表达。
毕赤酵母是甲醇酵母下的一个属,能在含有甲醇的培养基上快速生长。其本身的强效启动子——醇氧化酶基因(AOX)是其他酵母表达系统无法比拟的[5]。醇氧化酶只能以甲醇作为诱导剂,葡萄糖和甘油只会阻碍AOX启动子的调控途径,抑制外源基因的表达。因此,当培养基中只有甲醇时,AOX启动子就能强效严格的调控外源基因的表达[6]。研究发现,毕赤酵母兼备原核和真核两种表达系统的优点。其优点如下:
1)经过对毕赤酵母的研究,其全基因组序列已经完全被弄清楚,其基因表达机制及调控也被研究比较透彻,实际运用操作简单可行;
2)毕赤酵母中含有醇氧化酶(AOX)强效启动子,在甲醇的作用下,能以接近于大肠杆菌的繁殖速度迅猛生长,强效的调控外源基因表达;
3)毕赤酵母具有完整的线粒体,高尔基体及内质网等亚细胞结构,能使结构复杂的外源蛋白在毕赤酵母体系中表达,并对复杂外源蛋白的高级结构进行翻译、加工、折叠和修饰,使目的蛋白具有一定的生物活性;
4)毕赤酵母能与一些分泌型表达载体构建表达体系,使外源基因转化入酵母体系后,目的蛋白能分泌表达到培养液中,从而降低菌体胞内蛋白水解酶对目的蛋白的威胁,也很大程度地方便了目的蛋白的分离纯化工作;
5)毕赤酵母表达体系不会产生内毒素,也不会出现特异性病毒或支原体污染等问题,它不会对人体及自然环境的安全造成危害。
毕赤酵母作为一种甲醇利用型酵母菌,主要包括Candida 和Pichia 2个种属。当前,用于外源基因表达的毕赤酵母菌株一般由Invitrogen公司构建,主要有 NRRL-Y11430,GS115,KM 71,MC100-3,SMD1163,SMD1165和SMD1168等。 其 中NRRL-Y11430为野生型,其具有多个醇氧化酶基因启动子,需要利用大量甲醇来繁殖,由于大量的甲醇储存容易引发火灾,故在实际生产中不常用。而常用的则是通过对野生型表达菌株NRRL-Y11430的1种或多种醇氧化酶基因启动子进行剔除或替换改造而 得 到 的 GS115,KM71,MC100-3,SMD1163,SMD1165和 SMD1168等。另外,研究表明,在一定程度上,经过改造的菌株比野生型菌株更具有表达外源蛋白的优势。目前,应用最广泛的宿主菌为GS115,该菌既有AOX1,又具有AOX2,使其在含有甲醇的培养基上能够迅速生长,大量地表达外源基因,其表型为Mut+。 KM71菌中只具有AOX2,其 AOX1基因被替换,而AOX2基因对甲醇利用能力较弱,因此为甲醇利用缓慢型,其表型为Muts[7]。另外,它必须在含有精氨酸外源供给的培养环境生长。MC100-3菌既不具有AOX1,也不具有AOX2,使其不利用甲醇,其表型为Mut-。SMD1165,SMD1165 和SMD1168均含有AOX1基因,能在甲醇培养基中生长。但它们基因组中缺失编码蛋白酶A(pep4)和(或)编码蛋白酶B(prb1)的基因,大大降低或清除了蛋白酶A、蛋白酶B以及羧肽酶Y这3种酶的活性,故称为蛋白酶缺陷型菌株。由于降低或清除了蛋白酶,减弱了蛋白酶对外源蛋白的降解作用。因此,适用于分泌型表达。但其也具有明显的缺点,其生长速度比较慢,外源蛋白的表达效率不高,不太适用于大规模生产。
毕赤酵母的表达载体一般为既能在大肠杆菌中表达又能在酵母细胞中表达的穿梭型质粒。毕赤酵母细胞中的自然质粒稳定性都不佳, 只有将外源基因整合到宿主细胞的染色体基因组DNA,才能顺利实现外源表达。常用的整合位点处在酵母基因组中的AOX1或HIS4基因位置。目前,常用的巴斯德毕赤酵母表达载体的基因序列包含有乙醇氧化酶基因5′AOX1启动子和3′AOX1终止子,多克隆位点(MCS),组氨酸脱氢酶基因(His4)营养缺陷型筛选标记和复制起点(ori)。另外,分泌型载体 如:pPICZα、pPIC9 和 pPIC9K,都含有能调控外源表达蛋白分泌到胞外的信号肽序列α-factor序列。
1.2.1 启动子
毕赤酵母表达最常用的启动子是醇氧化酶AOX1。当有甲醇存在时,该启动子就会被诱导和调控,帮助外源基因高效表达。Yu[8]利用AOX1启动子表达了超氧化物歧化酶(SOD);Ghaffar 等[9]将目的基因整合入毕赤酵母GS115 中,利用表达载体的AOX1高效表达了来自嗜热毛壳菌的耐热木聚糖酶。由于甲醇对人体有毒害作用以及大量使用,容易带来火灾隐患,在实际生产生活中存在一定的风险。因此,使不用甲醇作为碳源诱导的启动子备受关注,如依赖谷胱甘肽的甲醛脱氢酶启动子(FLD1)和三磷酸甘油醛脱氢酶启动子(GAP)。研究人员利用GAP启动子成功诱导表达乙肝表面抗原、人类巨噬细胞集落刺激因子(hGM-CSF)和α-淀粉酶。另外,构建重组毕赤酵母时,根据所表达的外源蛋白的特性和需要,也可以同时利用AOX1和GAP两个启动子构建表达载体和重组酵母。吕中原等[10]在利用重组毕赤酵母表达S-腺苷甲硫氨酸合成酶时,既采用了GAP启动子又采用了AOX启动子,这两个启动子的同时存在能在一定程度上提高表达产量。
1.2.2 筛选标记
酵母表达载体上的筛选标记不仅可以提高阳性转化子,还可以提高高拷贝转化子的筛选效率。如果载体筛选标记选择恰当,可以使操作简单易行。当前,筛选标记主要有两大类,即营养缺陷型基因和抗性基因。营养缺陷型是因某一个特定氨基酸基因的缺失而常被用作阳性转化子的筛选标记,其包括his4、suc2、arg4等类型。抗性基因是依据基因剂量效应和按对抗生素的抗性水平来快速筛选出高拷贝转化子,其有G418和Zeocin等类型。目前,通常是先利用营养缺陷型基因筛选出阳性重组子,然后再利用重组子的抗性基因筛选高拷贝数重组子。然而,Lin-cereghino等[11]构建了新的表达载体pKANB 和pKANαB,此类载体上含有修饰过的Tn903kan′基因,可通过对G418的抗性直接筛选出高拷贝的酵母重组子,而且新构建的表达载体不大,实际操作更简单且易行。
1.2.3 信号肽
像pPICZα、pPIC9和pPIC9k分泌型表达载体通常有一段信号肽序列α-factor。对于酵母本身,其分泌的蛋白较少,如能实现外源蛋白的胞外分泌性表达,不仅减轻宿主细胞的代谢负荷,还减少宿主细胞蛋白水解酶对目的蛋白的降解,这为目的蛋白后期的纯化具有重要的作用,所以选择合适的信号肽是提高外源蛋白表达效率的关键。通常可供选择的信号肽分为两类: 酵母表达载体自身的信号肽和基因本身的信号肽。Yang等[12]研究发现,菌体胞外分泌表达常用的且最为有效的信号肽是α因子前导肽序列(α-factor) ,它可以通过AOX1 启动子来起始转录,从而使目的蛋白合成与菌体胞外分泌。Dong 等[13]通过α-MF 信号肽的介导,将克隆到毕赤酵母载体中的犀牛乳铁蛋白基因成功表达到菌体细胞外。另外,姚清侠等[14]研究发现,外源基因本身的信号肽也能引导外源蛋白的分泌表达, 但酵母表达载体自身信号肽可能要优于外源基因蛋白的信号肽,而且信号肽具有选择性,这就意味着在外源蛋白分泌型表达的应用中,可以考虑摘除外源基因的信号肽。
由于毕赤酵母自身分泌蛋白少,因此表达的目的外源蛋白在菌体外的培养环境中的纯度较高。研究表明,巴斯德毕赤酵母表达系统表达的外源蛋白水平可达到g/L。Huang等将克隆到毕赤酵母中的截短1,3-1,4-β-D-葡聚糖酶基因成功表达,其表达量高达3 g/L;Hao等通过巴斯德毕赤酵母蛋白表达系统表达的重组人复合α-干扰素(cIFN) 也达到1.24 g/L的水平。另外,有研究报道说明,并不是所有的外源蛋白都可以在毕赤酵母表达系统中高效表达,仍然有很多外源蛋白的表达效果不理想。在同一表达系统中表达不同的外源蛋白,其表达量千差万别,这是因为外源基因在毕赤酵母表达系统中高效表达受多方面因素的综合影响,如外源基因的自身性质、酵母的培养环境、表达的外源蛋白的特性等。研究发现,可以通过优化外源基因的内部密码子结构、完善培养环境、抑制蛋白酶的降解作用和优化发酵参数等方法来达到外源蛋白高效表达的效果。
外源基因的自身特性与表达该外源基因的毕赤酵母的特性是否相匹配,是影响外源蛋白表达与否或表达效率的重要因素之一。受影响的外源基因自身特性主要包括基因序列的UTR序列(mRNA 5′端非翻译区)、A+T含量比、基因拷贝数和偏爱密码子的出现频率4个方面。