邹晨伟,黄义德
福建师范大学 生命科学学院,福建 福州 350117
第一株毕赤酵母于1920年被Guilliermond从法国栗树上分离出来,命名为Zygosaccharomyces pastori[1]。1956年,Phaff在美国加利福尼亚的黑橡树中分离得到毕赤酵母菌株,命名为Pichia pastoris[2]。1989年,Cregg等找到了强的AOX1启动子,将毕赤酵母用于外源蛋白生产[3]。1995年,基于核糖体基因序列数据,Yamadat等将毕赤酵母归到新属Komagataella中[4]。该属目前共有6个成员,即K.pastoris、K.phaffii、K.pseudopastoris、K.poluli、K.ulmi和K.kurtzmanii[5]。其中,K.pastoris和K.phaffii目前作为外源蛋白表达宿主。常用的外源蛋白表达菌株GS115和X-33属于K.phaffii,SMD蛋白酶缺陷菌株如SMD1168则属于K.pastoris。
2019年,Schutter等对K.phaffii全基因组进行测序,获得了9.43 Mb的基因组序列,并为编码基因提供人工注释[6]。同年,Mattanovich等测定了K.pastoris的9.4 Mb基因组,并分析了分泌蛋白质组和糖转运蛋白,以此建立了一个以毕赤酵母基因组为数据基础的开放性网站(http://www.pichiagenome.org)[7]。这项工作为后来的毕赤酵母相关研究提供了便利的平台,该网站时至今日仍在维护和更新。2011年Küberl等结合454和Illumina测序技术,提供了9.35 Mb的更加精确的K.phaffii基因组数据,该工作还报道了该菌种第一个线粒体基因组的完整DNA序列[8]。随后的研究则是对之前基因组数据的不断补充更新,2016年Sturmberger等给出了一组更为精确的K.phaffii参考基因组,主要是开放读框和染色体定位的更新[9]。在基因组测序技术不断迭代更新的背景下,这些测序工作为研究人员对毕赤酵母菌株进行基因工程改造打下了坚实的数据基础。
当前毕赤酵母系统中应用最广也最为成功的信号肽是酿酒酵母的α-factor信号肽,因而它的结构和功能也得到了较为详细的研究。α-factor信号肽是酵母α细胞分泌的交配信息素(mating factor 1,MF1)N端一段α交配因子前导肽,其编码基因位于酿酒酵母的染色体XV1上[10]。
α-factor信号肽由86个氨基酸残基组成,实则包含前肽(Pre-sequence)和前导区(Pro-region)序列。1~19位氨基酸残基为Pre-sequence序列,20~86位残基为Pro-region序列。其中,Pre-sequence 又分为 N-region(1~6)、H-region(7~15)和C-region(16~19)等3个不同的功能区。N-region是带正电的极性氨基酸残基;H-region是一段疏水性氨基酸序列,它的疏水性α螺旋结构能够有效促进新生肽的转运[10];C-region由保守的中性氨基酸组成,能被Ⅰ型信号肽酶所识别切割[11]。Pro-region N端前6个氨基酸残基为进化上保守的输出信号6肽APVNTT,它们的共同特征是疏水性的脂肪链氨基酸。Pro-region是目前研究较多的部分,因为其长达66个氨基酸残基,表明它有一定的结构和功能。据Chahal等研究,Pro-region由1个α螺旋和5个β折叠组成,如果57~60区间的氨基酸残基全部被删除,会改变Pro-region的结构,从而影响它的功能[12]。此外,在酿酒酵母中研究发现,Pro-region上有3个N-糖基化位点(N23,N57,N67),消除会导致α-factor的分泌量减少但不会消失,这表明N-糖基化对于多肽通过分泌途径是重要的但不是必要的[13]。Pro-region糖基化可能有助于分泌效率的提高,研究表明适度糖基化有助于外源蛋白的表达[14]。此外,Proregion本身还存在自我聚集倾向,而N-糖基化能够防止Pro-region在内质腔内的聚焦,从而提高分泌效率[15]。Pro-region还扮演分子伴侣的角色,提高所引导蛋白的有效折叠,减少内质网内未折叠蛋白通过内质网相关降解(endoplasmic reticulum associated degradation,ERAD)途径被转运到蛋白酶体中被降解[12]。
α-factor信号肽引导的外源蛋白在毕赤酵母中分泌要经过一系列加工过程。首先,α-factor信号肽引导外源蛋白进入内质网的膜转位方式为翻译后转位[16]。在细胞质上的核糖体翻译出包含α-factor信号肽和外源蛋白在内的全长未成熟蛋白。伴侣蛋白Hsp40和Hsp70阻止核糖体翻译完成的多肽的广泛折叠,以维持α-factor信号肽序列的未折叠状态,使蛋白能够顺利靶向内质网并进入Sec复合物通道[17]。Sec复合物中主要相关的亚基有Sec61/62/63,Sec61作为多肽穿过内质网的通道,Sec63作为撑开该通道的支架,Sec62起到锚定作用[18]。细胞质中翻译完成的多肽被转运到Sec复合物中,α-factor信号肽Pre-sequence会被内质网膜上的信号肽酶复合物(signal peptidase complex,SPC)中的Ⅰ型信号肽酶(SPaseⅠ)切割[18]。蛋白进入内质网腔后,被内质网腔内热激蛋白家族成员Bip/Kar2p辅助初步折叠[19]。第二步是进入内质网腔的初步折叠Pro-region和未成熟蛋白的早期N-糖基化[20],在这个位置错误折叠蛋白的累积容易引起未折叠蛋白响应(unfold protein response,UPR)的上调[21],然后错误折叠蛋白会通过ERAD途径被运往溶酶体进行降解[22]。第三步则是Pro-region和外源蛋白通过COPⅡ囊泡转运到高尔基体,在高尔基体中进行进一步的N-糖基化修饰和折叠[23]。在此期间信号肽的Pro-region与外源蛋白连接处的2个碱性氨基酸残基KR被位于高尔基体上Kex2基因编码的类枯草菌素蛋白酶(subtilisin-like protease,一种钙离子依赖性丝氨酸蛋白酶)剪切[24]。该酶所识别的基序为KR/RR-X,这个切割过程需要钙离子作为辅助因子进行[25]。随后N端携带4个氨基酸残基(EAEA)的成熟蛋白随着分泌小泡向胞外前行,4个氨基酸残基就在此过程中被位于液泡的STE13基因所编码的二肽蛋白酶氨基肽酶A(dipeptidyl aminopeptidase A)所切割[26],它所识别的基序是EA。这个切割过程是非常迅速的,因而不能保证百分之百的切割效率[27]。因此,分泌的外源蛋白上可能会残留2或4个氨基酸残基[28]。最后,成熟的外源蛋白通过胞吐方式分泌到胞外。
Jungoh等对α-factor信号肽进行了单个密码子、密码子上下文,以及单个和上下文联用的密码子优化,发现密码子上下文的优化能够使得南极假丝酵母脂肪酶CAL-B的产量达到野生型的4倍[29]。基于Chahal等对α-factor信号肽Pro-region的二级结构与分泌水平的相关性进行研究的背景[12],Barrero等对Pro-region上的第42位亮氨酸和第83位天冬氨酸对应的密码子进行点突变,发现42位亮氨酸突变成丝氨酸后有效减少了E2-Crimison在内质网上的聚集[30]。由于前面已有研究者发现Ost1信号序列能够引导分泌蛋白进行翻译共转位[15],他们还设计了一个由毕赤酵母Ost1蛋白信号肽和α-factor信号肽的Pro-region组成的混合分泌信号肽,结果表明这种改造使得具有高级结构且难以分泌的四聚体红色荧光蛋白E2-Crimson和脂肪酶BTL2的分泌量分别增加了20倍和10倍[30]。以上研究表明对于毕赤酵母现有引导外源蛋白信号肽的改造和优化是可行的,这也为开发更为高效的信号肽提供了新的思路。
毕赤酵母自身会通过分泌途径分泌蛋白到胞外、细胞膜/壁或不同细胞器中。Mattanovich等对毕赤酵母菌株DSMZ70382(K.pastoris)基因组测序后,对其分泌组(secretome)进行预测分析,结果显示有88个蛋白分泌到胞外,另有172个开放读框预计可以进入分泌途径被转运到不同的细胞器中[7]。还有其他一些研究也对毕赤酵母分泌蛋白进行了预测,预测的分泌蛋白中许多具有典型的信号肽序列[6,31-32]。这些毕赤酵母内源信号肽可以为分泌蛋白提供除α-factor信号肽之外更为广泛的信号肽选择。表1总结了研究者利用不同报告蛋白对其中一些信号肽进行的表达研究,研究结果显示有些信号肽可有效引导外源蛋白的分泌。遗憾的是,迄今还没有人对预测的所有内源信号肽引导外源蛋白分泌效果进行系统的研究。
表1 引导外源蛋白在毕赤酵母中表达的内源信号肽
随着毕赤酵母种属信息的不断完善,越来越多的外源蛋白能够借由毕赤酵母表达系统得到不错的产量。作为非常具有产业化发展前景的表达宿主,期望它未来在医药行业发光发热。对α-factor信号肽的结构和功能及相关分泌通路的详细研究,表明信号肽在协助胞外分泌中不可或缺,而目前对信号肽的改造大多处于摸索状态。因此,后续还需要更全面更系统地对毕赤酵母αfactor信号肽的内源信号肽进行筛选和优化,以寻得能够高效引导外源蛋白分泌的信号肽。