杨起航,刘坤杰,刘 乐,王 斐,李鸿彬,谢全亮
(石河子大学 生命科学学院和农学院,新疆 石河子 832003)
天然橡胶(NR)是产胶植物自身合成的类异戊二烯聚合物。到目前为止,巴西橡胶树(H.brasiliensis,以下简称橡胶树)几乎是NR唯一来源,由于受橡胶树种植面积有限、难以遗传改良、叶枯病危害大以及人力物力有限的影响,全球NR产量达到极限[1],这一问题至今无法突破。2019年我国自主生产NR 85.6万t(约占总消费量的20%),80%的NR仍然依赖进口,面临着进口集中度高、贸易限制和国内需求不断增长等问题,一旦NR进口来源阻断,对我国各行各业都十分不利[2]。当前,NR生物合成的精确调控机制仍然不清楚,这也成为限制提高NR产量进度最主要因素。因此,橡胶树和其他产胶植物的橡胶生物合成机制仍然有待深入解析。NR生物合成机制的精确解析有利于开发新的产胶植物,以解决橡胶树橡胶来源单一的问题,同时也对NR生物合成的遗传机制研究具有深远的意义。
世界上有超过2 500种产胶植物,但仅少数产胶植物可被人类利用,例如:橡胶树、橡胶草、杜仲以及银胶菊。2013年,橡胶树基因组草图首次破解[3],2016年,C.R.TANG等[4]进一步深度测序,获得橡胶树93.8%(1.47 Gb)的基因组,约43 792个蛋白质编码基因。在橡胶树基因组中鉴定了94个属于20个基因家族的橡胶生物合成相关基因。18个基因属于甲羟戊酸(MVA)途径,22个基因属于2-C-甲基-D-赤藓糖醇-4-磷酸(MEP)途径,15个基因属于细胞质中引发剂合成;39个基因属于橡胶粒子相关的橡胶延伸基因,这其中包括18个橡胶延伸因子(REF)/小橡胶粒子蛋白质(SRPP)。2020年,J.LIU等[5]将基因组装配到橡胶树18条假染色体上,鉴定了许多与产胶相关的候选基因。2018年我国完成首个杜仲基因组测序,其环境适应机制可归因于逆境反应或次生代谢产物相关基因的高表达/显著扩张。杜仲与橡胶树的异戊二烯焦磷酸(IPP)主要来自MVA途径。而杜仲与真菊Ⅰ和Ⅱ类分化时间可追溯到约1.29亿年前,经古老的基因组3倍化复制,却无近期基因组复制发生[6]。研究显示,虽然橡胶树和杜仲中SRPP/REF基因家族都存在显著扩张的现象,但橡胶树中SRPP和REF基因同时参与顺式-1,4-聚异戊二烯的NR合成,而杜仲橡胶合成只有SRPP基因参与。杜仲中法尼基焦磷酸(FPS)基因家族存在扩张并出现功能分化,产生了具有反式长链橡胶合成功能的Ⅱ类FPS基因,所以杜仲合成以反式-1,4-聚异戊二烯为主的NR。此外,橡胶树和杜仲SRPP/REF和FPS基因家族成员属不同分支,说明双子叶植物中橡胶生物合成为多起源。
2017年橡胶草基因组测序由中国科学家率先完成并正式对外公布[7],基因组约为1.29 Gb,46 000多个基因,共鉴定102个橡胶生物合成相关候选基因,其中MVA途径有6个步骤,40个基因;MEP途径有8个步骤,23个基因,以及19个基因用于引发剂合成和20个基因用于橡胶粒子相关的橡胶延伸蛋白质。深入分析橡胶草基因组数据,可以发现一些橡胶草自交衰退相关的可能候选区域。然而,银胶菊基因组的研究还未系统展开。
NR生物合成主要发生于产胶植物细胞溶质中MVA途 径 和 质体 中MEP途 径。MVA和MEP途径合成橡胶前体单分子IPP,其中参与IPP和橡胶聚合物(IPP×n)形成的基因称为橡胶生物合成基因,这些基因在橡胶树中已被初步鉴定[4]。在MVA途径所有基因家族中,每个基因家族至少有一个基因成员在橡胶树的胶乳中鉴定并高调。然而,在MEP途径的22个基因中,仅DXS7和DXS10基因在胶乳中显著表达,这表明在橡胶树中IPP的合成以MVA途径为主,也进一步说明MVA途径是NR生物合成的主要途径。
在短角蒲公英中,鉴定了3种羟基甲基戊二酰-CoA还原酶(HMGR)基因,其功能分析表明TbHMGR1参与NR生物合成前体的调控[8]。橡胶草基因组的TkHMGR1和TkHMGR2主要在根中表达,在根胶乳中表达最高[7]。HMGR上游的3个基因,即三磷酸腺苷(ATP)、柠檬酸裂解酶(ACL)和乙酰乙酰-CoA硫解酶(AACT)的表达,与短角蒲公英胶乳中类异戊二烯合成前体的合成相关。此外,短角蒲公英胶乳中ACL,AACT和HMGR在拟南芥中过量表达导致这3种酶的活性和积累增加,从而导致甾醇、五环三萜、顺式-1,4-聚异戊二烯以及角鲨烯等次生代谢产物增加,这可能具有一定的工业价值[9]。目前,在蒲公英属和其他产胶植物中,已鉴定了几种NR生物合成相关基因,其中包括维持橡胶粒子稳定性的SRPP和REF以及控制橡胶链延长的顺式-异戊烯基转移酶(CPT)和与CPT相互作用[橡胶转移酶(RTA)或类CPT(CPTL)]的橡胶转移酶活化剂等[10]。然而,它们的相互关系以及精确调控机制仍不清楚,不同产胶植物的NR生物合成机制仍有待深入解析。
在橡胶树基因组中MVA途径6个基因已被克隆并分析了它们的表达水平。其中,HbAACT1,HMGS1,HbMVK,HbPMK和 HbMVD在 胶 乳 中 高度表达,并且在酵母中MVA途径缺失突变已补充鉴定。然而,羟甲基戊二酰-CoA合成酶(HMGS)和HMGR的多个基因具有不同的表达模式[11]。据报道[12],HMGR1参与NR生物合成,而HMGS活性与胶乳中橡胶含量正相关。HbHMGR1的过表达增加了烟草植物中的甾醇积累[12]。橡胶树和非橡胶植物朝鲜蓟(Cynara scolymus)在MEP途径和橡胶引发剂合成中酶的基因数相似,但产胶植物中MVA途径和橡胶延伸蛋白质中基因数更多[7]。橡胶粒子涉及橡胶聚合酶和蛋白质的位置,橡胶转移酶(RT-ase)复合物可能包括参与底物结合、催化、相对分子质量调节和橡胶聚合物正确引导到橡胶粒子内部的蛋白质。然而,许多其他蛋白质也与橡胶粒子有关。这些蛋白质包括膜结合蛋白质和其他仅与橡胶粒子相关的蛋白质,它们可以很容易地被置换[13],在没有可溶解RT-ase活性的情况下,明确鉴定哪些蛋白质直接参与NR生物合成的调节仍具有挑战性,并且遗传方法在鉴定尝试中也起关键作用。一些橡胶粒子蛋白质似乎与橡胶粒子的结构和完整性有关。在转录组研究方面,橡胶树鉴定了1 709个新的表达序列标签(EST)简单重复序列(SSR),并且在MVA和MEP途径的NR生物合成途径中共验证了78个单核苷酸多态性(SNP)标记[14]。橡胶草与橡胶树相比,转录组中橡胶产量相关性状的标记性状关联分析发现了与高橡胶相关的更多SNP标记[15]。有趣的是,橡胶树的MEP途径中各基因的表达丰度表明,MEP途径比MVA途径参与该物种的橡胶产量更重要。此外,在参与菊粉生产的基因中发现了比在NR生物合成中更多的SNP,表明NR生物合成基因的高度保守性。冷驯化的银胶菊转录组中总共有11 748个EST,发现大多数EST来自编码应激反应相关蛋白质基因,而只有1%的EST鉴定与NR生物合成相关[16]。
橡胶粒子膜上丰富的SRPP能与REF相互作用,这表明REF可能在橡胶粒子膜上以同多聚体或异多聚体的形式存在。SRPP同源基因已在橡胶植物和非橡胶植物(拟南芥)中鉴定,并指出SRPP家族成员是与抗逆相关的蛋白质家族[17]。REF是橡胶粒子膜上的蛋白质,可能与胶乳植物的NR生物合成有关,尽管橡胶粒子膜上蛋白质复合物的作用并未给出更多定义,但在各种橡胶树中REF的转录水平已显示与胶乳产量成正相关。通过无细胞翻译偶联系统将重组REF引入橡胶粒子洗脱液会降低其凝结作用,REF可能参与了橡胶粒子的稳定或维持。使用酵母双杂交系统筛选REF相互作用蛋白质导致分离橡胶桥链蛋白(HRBP)作为相互作用蛋白[18]。橡胶树中橡胶粒子结合蛋白质之间的相互作用网络分析表明,REF可以与HRBP相互作用。尽管REF(14.7 kDa)比SRPP(22.3 kDa)短得多,REF也可归为SRPP系列,因为REF与SRPP同源。但是在其他植物物种中并未发现REF直系同源物,这两种蛋白质具有显着的同源性(约72%的氨基酸有同源性)。REF与HRBP之间相互作用表明,HRT1-HRBP复合物可以进入橡胶粒子膜上包含丰富SRPP和REF的结构网络中,从而锚定在橡胶粒子膜上产生功能。SRPP和REF确实在橡胶树胶乳凝固和橡胶粒子稳定中起重要作用[19]。SRPP通过在脂质头基上显示一种“覆盖效应”而不干扰膜完整性来稳定橡胶粒子[20]。脂质液滴的相关研究进一步验证了这种想法,脂质液滴分隔的是三酰基甘油而不是橡胶聚合物,其中HbSRPP的同源物被鉴定为脂质液滴相关蛋白质,并且在应激条件下是维持脂质液滴所必需的[21]。银胶菊和橡胶草中橡胶粒子均分别含有HbSRPP同源物PaGHS和TkSRPP[22]。
在橡胶草基因组中,检测到1个TkREF和9个TkSRPP基因组成的家族成员。基于产胶和非产胶植物的REF/SRPP蛋白质系统发育的树,发现大多数橡胶草与橡胶树SRPP基因属于两个独立的分支,这表明橡胶粒子稳定机制在两个物种中是不同的。以前的研究也发现了类似的结论,可能是由于NR生物合成是植物界的一个独立演化过程[7]。橡胶草基因中大多数REF/SRPP基因在胶乳和根中表现出特异性高表达水平。其中SRPP有4种 同 种 型(TkSRPP1,TkSRPP2,TkSRPP3和TkSRPP4)在胶乳中的转录表达水平比在其他组织中高得多,而其他4种异构体在根中转录表达水平显著高于其他组织。这说明REF/SRPP基因可能在橡胶草的NR生物合成中起重要作用。短角蒲公英胶乳中TbREF定位于橡胶粒子中,属于非典型SRPP家族蛋白质[23]。据报道,排除TbREF在橡胶中的积累具有负面影响,该蛋白质在NR生物合成中有一定的作用,但仍不清楚是否与其他组分(如TbRTA)有相互作用。
目前研究比较广泛的橡胶植物是菊科蒲公英属的橡胶草[24]。对橡胶草环境适应性的研究[25]表明,橡胶草可广泛种植在高纬度或低纬度地区。多年生橡胶草根部可产生比橡胶树NR具有更高相对分子质量的NR。此外,橡胶草还可以产生菊粉,其为生产生物乙醇的原材料[26]。由于橡胶草具有种植面积广、成熟时间短、机械化种植和采收容易等优势,使得其成为第二大或替代橡胶树的产胶植物。由于对橡胶草更容易进行遗传改良、橡胶合成机制以及分子育种等研究,使其成为探讨NR生物合成机制的理想模式植物。野生橡胶草驯化在未来有较好的前景[27],但由于其高杂合性和自交不亲和性等因素,未来橡胶草作为商业上可行的第二大或替代传统橡胶树的产胶植物,其NR生物合成调控机制的研究仍然面临严峻挑战。
产胶植物NR生物合成调控机制精确解析与NR产量提升紧密相关,尽管研究者们对类异戊二烯生物合成途径以及NR生物合成中涉及的基因和蛋白质的解析已经取得了很大进展,但对NR生物合成分子机制的精确解析仍然存在诸多问题。目前,NR生物合成可能是从多萜醇合成酶/十一烯醇/丙烯共聚物和CPT失去了它们特定的寡聚链终止基序,使它们能够催化缩合合成。细菌、酵母和植物中的互补和异源表达,未能使长链橡胶分子产生,并且对类异戊二烯终产物的增强有限[28]。在遗传改良试验中使用顺式或无标记基因载体可以改善类异戊二烯最终产物。类似方法也可用于提高NR产率和相对分子质量。到目前为止,NR生物合成机制及其底物和活化剂的复杂性阻止了橡胶转移酶复合物及其橡胶转移酶活性的完全重构[29-30]。深入分析细胞溶质中MVA途径和质体中MEP途径之间的代谢通量,包括区室串扰和反馈环,将非常有助于选择最合适的遗传转化,以获得转基因植物并提高橡胶含量。类异戊二烯生物合成基因/蛋白质的过表达未能提高最终产物的产量,这可能与负反馈机制或下游限速酶的功能有关,但这还未解析清楚。新基因编辑、代谢组学、蛋白质组学和基因组学等其他先进技术工具的出现,应该可以研究单个或多个NR相关基因的作用,并可能提高产胶量。
NR合成生物学的出现及其与代谢工程的协同作用为创造定制的体外模拟细胞橡胶合成提供了巨大的机会。产胶植物的基因组、转录组学和蛋白质组学可能为增加橡胶基质提供有效的策略。橡胶草是一个潜在替代橡胶树的最有前景的菊科植物,此外,对橡胶REF/SRPP两个重要基因家族来说,已经发现了它们不同的进化轨迹。 但是SRPP基因家族精确调控机制还未解析清楚,相信SRPP对NR生物合成调控机制的研究会为提高NR产量提供宝贵的技术,并促进替代橡胶树的产胶作物开发和利用。这些研究结合分子机制、育种、农艺,并将收获技术与提取工艺相结合,将有助于精确解析橡胶草的NR合成机制和提高其产胶量。预计此举可以将橡胶草的NR产量提高到商业上可行的水平,在未来几年极大地加快其替代橡胶树的研究进程。