章益蜻 王宇娇 汪辰雨 刘颖 仲森林 伍慧兰 刘冠楠
(1)南京工业大学生物与制药工程学院,南京 211800;2)南京工业大学2011学院,南京 211800;3)南京工业大学药学院,南京 211800;4)天津大学前沿技术研究院,天津 301700)
细胞融合是大多数真核生物所共有的一个普遍过程,是形态发生等一系列生理事件的基础[1]。作为多功能的研究工具,细胞融合可应用于基因转移、器官分化、抗体生产、疫苗开发、细胞重编程和育种等方面[2]。酿酒酵母细胞融合的一个令人兴奋的应用是大基因组转移,这在基因组项目编写(genome project-write)中有着重要应用。如作为拥有人工合成最小基因组的细菌,JCVI-syn3.0使用酿酒酵母作为基因组合成、组装、复制和移植的临时宿主[3];再者,Brown等[4]描述了一种聚乙二醇(PEG)介导的供体酵母细胞与受体哺乳动物细胞融合方案,并通过优化融合过程使得融合效率提高了约300 倍。此外,Schultz 课题组[5]通过PEG 诱导细胞融合建立了一个大肠杆菌-酿酒酵母嵌合体。然而,物理和化学方法介导的细胞融合效率较低,因此,增加酿酒酵母细胞融合的可控性为大基因组转移提供了一种可能性。
合成生物学通过“设计-构建-测试-学习”这一循环,基于基因线路的设计原理,改进现有元件,使细胞获得新的能力以控制细胞行为,从而合理地设计生物体,使其应用于各个领域,包括药物合成、生物燃料和以低成本碳源为原料的生物材料生产等[6-7]。在酿酒酵母融合过程中,细胞响应信息素,触发促分裂原活化的蛋白激酶(MAPK)级联反应。酿酒酵母交配特异性信号通路为合成生物学应用提供了大量的元件,如信息素诱导型启动子、G蛋白偶联受体、支架蛋白、转录因子等,为双稳态开关、振荡器、调谐器以及底盘细胞等生物装置和生物系统的开发以及多细胞互作体系的构建奠定了基础[8](图1)。
Fig.1 Synthetic biology applications of MAPK signaling pathway图1 MAPK信号通路的合成生物学应用
酿酒酵母中的融合途径包括5个步骤,MAPK信号传导、交配对形成、细胞壁重塑、质膜融合和核配[9-10]。酿酒酵母两种单倍体细胞类型分泌不同的信息素(a信息素和α信息素),这些信息素分别被相反交配类型细胞表面的G 蛋白偶联受体(GPCR)识别和捕获。异源三聚体G 蛋白被激活后,Gβγ 亚基迅速与Gα 亚基分离,并将支架蛋白(Ste5)招募到质膜上。Ste5 通过招募和调节MAPK模块来启动和放大交配信号,这些模块包括促分裂原活化的蛋白激酶激酶激酶MAPKKK(Ste11)、促分裂原活化的蛋白激酶激酶MAPKK(Ste7)和MAPK(Fus3)[11](图2)。磷酸化的Fus3 与Ste5 快速分离,进入细胞核中,磷酸化核内的Dig1、Dig2 和转录因子Ste12 蛋白,触发Dig蛋白与转录因子Ste12 的解离,从而启动信息素诱导型基因的转录。Fus3 磷酸化和去磷酸化的交替状态使酵母细胞快速对信息素做出响应。MAPK信号通路被激活后,细胞就会向信息素浓度最高的方向极化生长并形成交配对[12]。随后,交配对接触部位的细胞壁发生裂解并重塑成新的连续壁,质膜随之融合形成融合孔,从而允许细胞质的混合。经过核集合、核膜融合、纺锤极体融合,核配完成并最终导致二倍体细胞的形成,二倍体子细胞从受精卵颈部出芽(图2)。
MAPK信号通路的负调控可确保信息素信号被迅速关闭,使细胞对信息素做出精确反应,避免了不同信号通路之间的串扰[13]。例如,激活的Gα亚基能够结合磷酸化Fus3,将其锚定在细胞质中,阻止其参与到MAPK 信号通路中,削弱向下游传递到细胞核的交配信号,从而减弱细胞对信息素作出的反应。此外,磷酸化的Fus3 能够作用于Ste5上4 个磷酸化位点,从而抑制信号通路的完全激活[14]。或者,磷酸化的Fus3磷酸化Gγ亚基,减小对Ste5 的募集速率,缩短Ste5 质膜定位的时间,从而间接对MAPK信号通路做出负反馈[15]。因此,挖掘对MAPK 通路起负调控的Ste5 蛋白的磷酸化位点可能对于开发交配开关提供新思路。
Fig.2 Mating process and the MAPK signaling pathway of Saccharomyces cerevisiae图2 酿酒酵母的交配过程以及MAPK信号通路
大多数细胞融合事件具有相似的过程,包括对融合细胞的识别、融合细胞黏附和质膜融合等,尤其是质膜融合具有相似的膜并置过程,因此,增加对膜融合机制的了解能够极大地促进细胞融合的研究[2,16]。
尽管已有相对详细的机制模型很好地解释了病毒和囊泡的膜融合,但一大类重要的膜融合——细胞-细胞融合仍无法解释。为了鉴定最可能的细胞融合酶,Heiman等[17]筛选了酵母细胞中受信息素诱导后表达明显上调(>3 倍)且拥有至少一个疏水结构域的蛋白质,并排除已被研究的膜蛋白,得到了介导细胞融合的关键膜蛋白Prm1。Prm1以同型二聚体的形式发挥功能[10]。细胞膜上存在反式和顺式两种类型的Prm1 二聚体,其中反式二聚体的两个Prm1单体锚定在两个细胞的对置细胞膜上,而顺式二聚体是来自同一交配细胞的Prm1 单体[18-19]。在Δprm1×野生型交配实验中仅观察到12%交配失败,且这种交配对中只存在顺式二聚体,因此推断Prm1 顺式二聚体可能是促进膜融合的主要活性形式。大部分的Δprm1×Δprm1交配对可以完成细胞壁的降解,但半数以上交配对的质膜融合受到阻碍。交配对的质膜之间保持约8 nm 的均匀间隙,质膜紧密并置在一起但无法融合,表明Prm1 在促进质膜融合方面发挥着举足轻重的功能[17]。然而,近一半的Δprm1×Δprm1交配对仍可以完成膜融合,这表明Prm1 可能不是酵母细胞融合真正的融合酶,但不可否认它是融合机器的一部分,在膜融合中起着独特的作用。细胞中可能存在另一种补偿融合机器(或Prm1 复合物中的其他亚基),并在去除Prm1 后以较低的效率继续融合过程[17]。
Prm1 在膜上的聚集受到严格调控,仅有一小部分Prm1积聚在接触位点,且高浓度的Prm1膜聚集不会提高融合效率,反而会导致轻微的融合缺陷[20]。细胞为什么要合成过量的Prm1?这对细胞来说,在理论上是不经济的做法。对Prm1 在细胞膜上这种“visit and run”现象的研究,有助于更全面地了解Prm1 在细胞融合信号途径中的调控机制和可能的潜在功能。对此,本文对Prm1 可能的运输机制和成熟过程提出了假设(图3),该假说合理地解释了Prm1在质膜上的定点聚集和调节机制。完成翻译后的Prm1 单体在内质网中完成核心糖基化并形成共价同型二聚体,Prm1 同型二聚体离开内质网进入高尔基体进一步被糖基化,而单体保留在内质网中[19]。最后,加工完成的Prm1通过两种不同的运输方式分别从高尔基体转移到质膜或核内体和液泡中。由于内吞信号的存在,质膜上的Prm1 可以通过核内体靶向到液泡中进行降解。当细胞响应信息素时,Prm1 主要被运输到质膜上,并聚集在极化位点,包括shmoos尖端和接触位点,此时质膜上的少量Prm1 具有抗降解性,这些稳定的Prm1被保留下来以促进膜融合[20]。
随着对Prm1 的结构、加工修饰、运输、成熟过程更加深入的了解,未来的工作可致力于调节Prm1 蛋白以实现细胞融合可控性。最近,AlphaFold2基于深度学习成功地实现了从序列到高精度蛋白质三维结构的预测[21],其对膜蛋白Prm1结构的解析将有助于揭示Prm1 在膜融合中的具体作用机制,并为进一步探究酵母细胞的融合酶提供线索。由于过量的Prm1 被运输至液泡并降解,因此,寻找Prm1的最佳膜聚集浓度,并调节Prm1表达量与内吞信号强弱,以期获得较高的融合效率。此外,通过pprm1启动子工程构建受人工条件精确诱导的合成启动子,将Prm1 从天然的细胞融合信号调控通路中隔离出来,可能为细胞融合的人工调控提供一个切入点。
Fig.3 The proposed process of intracellular localization and transport of Prm1图3 Prm1可能的胞内定位和运输过程
合成生物系统的构建采用的是一种“自下而上”的正向工程学方法,其构建可分为3 个层次,即生物元件、生物装置和生物系统。具有不同功能的生物系统通过彼此间的相互通信和协调进一步构成复杂的多细胞互作系统[22]。
生物元件作为一定功能的DNA 序列,是合成生物系统中最简单、最基本的生物积块,能够通过标准化的组装方法被组装成更加复杂的生物模块,从而应用于生物装置[22]。在酵母交配信号通路中,信息素诱导型启动子、G蛋白偶联受体、支架蛋白Ste5以及转录因子等元件已被重点关注和研究。
2.1.1 启动子工程化
启动子作为基本的顺式作用元件,通过招募蛋白质(如转录因子)在时空上精确控制mRNA 转录,常被用作分子开关和传感器。酵母内源性启动子包含多个基本结构:核心启动子区、转录起始位点(TSS)、上游激活序列(UAS)和核小体不利序列(poly(dA∶dT)序列)等[23]。改造这些结构有利于开发一系列不同强度的、特征明确、动态范围较广、正交性良好的信息素诱导型人工启动子[24-25]。
对于信息素诱导型启动子来说,转录因子Ste12 通过与启动子上的信息素响应元件(PRE)结合来启动下游基因的转录。共识的PRE 序列定为TGAAAC,含有一个或两个碱基突变的称为非共识性PRE[26]。信息素响应型启动子的活性与PRE 的排列密切相关,但共识或非共识性PRE 的拷贝数和方向及其相对TSS的定位对信息素诱导型启动子活性的影响仍有待研究。Su等[27]在体外系统地检测了能够赋予Ste12结合能力的共识PRE核苷酸序列,并在体内测试了PREs 的相对位置对其响应信息素能力的影响,发现两个紧密相邻的PREs可以直接重复或“尾对尾”的方式诱导转录,然而至少40 个核苷酸间隔的PREs 只有以“头对头”或“尾对尾”结构时能够诱导转录。此外,他们发现删除pcik1唯一的共识PRE 上游不远处的一个非共识PRE 后,启动子的信息素响应能力显著降低,表明该非共识PRE有助于Ste12多聚体在体内的诱导。
此外,poly(dA∶dT)序列对核小体具有低亲和力,这些核小体占有率低的区域有利于转录激活[24]。Vaishnv等[28]科学家建立了一个“从序列到表型”的模型,利用数百万个随机取样的启动子DNA 序列及其在酵母中测量的表达水平,来破译调控进化的原理。该模型具有良好的预测性能,能够指导理性设计序列。该模型可被用于探究PRE的排列对信息素响应型启动子活性的影响,从而有助于开发人工合成启动子。Aymoz等[26]将天然pfig1与-1 核小体区相关的-150 bp 序列替换为paga1的对应序列,构建了一个活性强且诱导时间短的人工合成启动子。在该嵌合启动子体的基础上,接着将pfig1的一个非共识PRE 突变为共识PRE,进一步缩短了启动子诱导表达的时间。这项研究表明,通过改变核小体不利区或PRE 等启动子基本结构,不仅能够对启动子的活性进行微调,而且能够影响其在时间维度的表达水平。这些工作将促进对交配基因表达模式的深入了解,推动人工启动子优化并调控基因线路,从而进一步被用于代谢工程和生物传感器[29]。
2.1.2 GPCR工程化
GPCRs 对多种化学物质具有亲和性,如脂肪酸、血清素、ATP、病原体特异性肽、信息素等[30],因此可以通过替换酵母MAPK 通路中的GPCR 传感单元来开发识别不同底物的生物传感器。生物传感器主要包括能够与目标分子互作的识别器、将细胞响应转换为可测量信号的转换器和扩大输出的放大器[30-31]。酿酒酵母的信息素群体感应机制,使得细胞能够基于群体密度放大信号降低检测限,有利于检测环境中更值得关注的低浓度水平分子。Mukherjee等[32]将哺乳动物细胞中响应脂肪酸的GPCR整合到酵母交配途径上,使用合成转录因子替代Ste12,提高了传感器对中链脂肪酸的响应能力。同样的,如果在传感器菌株中异源表达人血清素GPCR,则可以在酵母培养液中检测血清素的含量[33]。类似地,如果将人源P2Y2 GPCR嵌合酵母的原GPCR,那么GPCR 嵌合体能够响应细胞外ATP 以激活MAPK 信号通路,从而可以感知和抑制小鼠的肠道炎症[34]。此外,将酿酒酵母的Ste2 配对受体替换成为白色念珠菌的配对受体后,该系统能够高灵敏度地检测病原体特异性肽并转换为可见番茄红素的信号输出[35]。连在工业发酵中很难区分的酿酒酵母和裂殖酵母也可以通过GPCR嵌合体来实现,工程化酿酒酵母能够感知裂殖酵母分泌的P 因子而不是α 因子,从而发出RFP信号[36]。
2.1.3 Ste5工程化
支架蛋白对信号蛋白的特异性募集为细胞信号传导提供了一种严格控制的动态调控机制[13]。由于调控因子对通路通量的影响可以通过招募到支架而增强,因此支架蛋白有很大的潜力被设计出不同的响应行为,如加速、延迟、脉冲产生和超灵敏度,为调节信号幅度和时间提供可能性[37]。Ste5作为酿酒酵母中发现的第一个信号支架蛋白,通过删除或添加功能域为重编程细胞提供一个灵活的平台[38]。Bashor等[39]利用工程支架蛋白相互作用重塑了MAPK 通路信号动力学,通过动态调节Ste5上人工结合位点对调控因子的招募,构建了合成的正反馈和负反馈回路,获得类似双相开关的剂量反应。
2.1.4 转录因子工程化
多价转录因子通过协同自组装可以执行涉及细胞命运决策和信号处理的非线性调节行为。Bashor等[40]将这一设计原则应用于合成网络,基于复合物相互作用的构型和强度,测试了工程化协同转录因子是否可以编程酵母中的非线性基因电路行为。此外,他们还建立了一个数学模型,通过输入转录因子子单元的强度和数量,对单输入电路和多输入电路的线性和非线性调节响应进行预测调谐。结果表明,多因子协同调控以获得工程化非线性的线路行为是一种高灵活性的设计策略,使对非线性时空信号处理的精准调控成为可能。未来,可将此模型应用于指导Ste12的协同转录因子,改变信息素响应型启动子的响应模式和动态范围,从而构建“开关”型或“变阻器”型基因表达线路。
具有不同功能的生物元件按照一定的物理和逻辑关系相互连接组成复杂一些的生物装置,一系列具有互联功能的生物装置以串联、反馈或者前馈等形式连接组成更复杂的级联线路或者调控网络,即生物系统[41]。常见的生物装置与生物系统,如双稳态开关、振荡器、调谐器以及底盘细胞,在酵母MAPK通路中也有广泛应用。
2.2.1 双稳态系统开发
基因调控的双稳定性使细胞稳定地维持基因表达模式中的一种,并可以通过适当的输入在两种状态之间进行切换。酿酒酵母在没有信息素的条件下能够稳定地进行有丝分裂,但是只能在信息素存在的情况下短暂地保持细胞生长停滞,因此,该途径不是双稳态的[42]。为了将其转化为双稳态系统,Ingolia等[43]通过在MAPK途径中引入正反馈,使细胞能够长时间记忆信息素的短暂刺激。高信息素水平的短暂诱导将导致持续的通路激活,而在较低信息素水平下,部分细胞持续活跃,但其余细胞完全失活。研究还展示了细胞间的随机变化如何影响双稳态行为的。此外,他们建立了一个简单的正反馈系统随机模型,并证明了模拟结果与实验结果的一致性。
双稳态开关在利用群体响应系统对酿酒酵母进行动态代谢调控方面也有报道。与大多数需要额外添加诱导剂或依赖特定通路元件的动态调控方式不同,群体响应在细胞密度达到某定值时就会被触发,从而实现对基因表达的调控[44]。Williams等[45-46]通过引入受信息素诱导表达的RNA干扰元件,构建了能够在莽草酸途径正常代谢与高效旁路生产对氨基苯甲酸之间切换的双稳态系统。在低种群密度状态下产生的少量信息素不足以激活RNAi,此时细胞保持莽草酸代谢,随着种群密度增加到一定阈值,莽草酸代谢的关键酶被抑制,同时对氨基苯甲酸生产途径被激活,并产生副产物芳香族氨基酸。在此基础上,引入受芳香族氨基酸诱导表达α信息素的基因线路,形成正反馈群体感应线路,以维持长期细胞记忆。然而,这种系统需要群体中特定的交配类型,并影响特定的交配基因,因此限制了它的应用。
2.2.2 基因表达噪声调控
基因表达噪声是指mRNA 和蛋白质合成和降解过程中的随机变化,在基因相同的群体中产生不同数量的蛋白质,直接导致了胞内基因网络的不精确性[47-48]。为了调节噪声,可以引入负反馈回路,如转录抑制[49];或通过调节转录、翻译和降解的速率来将噪声从平均表达水平中解耦[50-51]。Mundt等[48]设计了一种噪声调谐器,在该系统中噪声在很大程度上由转录速率决定,而平均表达水平由转录速率和mRNA 稳定性共同决定,因此可以与噪声解耦。他们通过改变酿酒酵母交配通路中的基因表达噪声,证明了噪声调谐器在一个复杂调控网络中的有效性,既可以研究天然基因网络的噪声敏感性,又可以提升合成基因线路的性能。
2.2.3 底盘细胞改造
代谢工程一般通过关键前体的过表达或竞争性通路的阻断来提高目标产物的产量[52]。然而这些方法可能导致代谢失衡,如合成产物所需前体的耗尽或细胞毒性中间产物的积累等。同时,细胞对生长和代谢的能量竞争也是导致低产量的原因之一[44]。为了解决这些问题,一种可行的方法是使细胞的生长和代谢解偶联,解偶联状态能够一直维持细胞内的生物质快速大量累积,而不进入细胞生长或分裂的状态,使更多的能量可以流向目标代谢物的生产[53]。目前已有诱导真核细胞周期停滞以用于提高外源蛋白质产量的成功案例被报道[54-55],类似地,酿酒酵母响应信息素导致的生长停滞阶段也可能提高其异源产物的生产力。考虑到信息素介导的G1期阻滞为细胞融合与分裂积累了大量能量,若能使细胞维持这种状态,就能将代谢从生长中解耦,从而提高异源产物的产量,特别是对宿主有毒的中间产物[53]。Ste5 高活性突变体底盘细胞可以利用相对低成本的半乳糖激活MAPK 级联反应,将生长与代谢解偶联。然而,半乳糖诱导并不适用于工业发酵[44],未来的研究方向可致力于寻找其他诱导型启动子,从而改进该底盘细胞并扩展其应用范围。
单细胞群落对信号输出的影响有限,因此利用细胞间信号传导途径构建生物间的通信系统、控制特定种群行为以及放大线路,可实现交互式微生物菌群的组装和控制,从而增强信号的协同输出[6]。
酵母中信息素响应的MAPK 途径的细胞-细胞通信系统常被用于信号放大。例如,Ostermann 课题组[56]开发了一个人工可控的细胞-细胞通信和信号放大系统,用传感器细胞分泌的信息素驱动行动者细胞中靶蛋白的表达。该系统在细胞培养液中和细胞固定化后都能发挥功能,还建立了用于定量预测单菌种和菌群在信息素响应过程中的生长动态和基因表达的模型。类似地,Hahne等[57]构建了一个用于检测环境中醋酸含量的高灵敏度酵母传感系统。其中,传感器细胞能响应不同浓度的醋酸而分泌信息素,从而激活行动者细胞中报告基因的表达。相较于单细胞对醋酸响应和信号输出,该系统使相同浓度醋酸刺激下的报告信号增强了100 倍,降低了传感器的检测限。此外,Shaw等[58]结合GPCR受体嵌合的方法,使传感器细胞能够响应褪黑素分泌信息素以促使行动者细胞表达GFP,同时,行动者细胞组成型分泌信息素降解蛋白酶Bar1,从而建立了一个激活阈值,实现了从“变阻器”到“开关”响应模式的转换。
随着生物数据库数量和复杂性的不断增加,对强大数据分析工具和技术的需求日益提高,机器学习已被广泛应用于合成生物学领域,如理性指导启动子的设计及预测启动子活性、预测蛋白质结构、研究信号通路转导机制、分析基因线路、辅助设计合成路径和反应过程等[59-61]。
机器学习促进了对启动子序列功能作用机制的了解,指导人工启动子的合理设计和活性预测[62]。Kotopka等[63]训练了一个卷积神经网络模型以生成一个庞大的启动子文库,该模型指导人工启动子的设计并成功提高了启动子活性。此外,该模型还可用于表征转录因子与DNA 序列结合的亲和力。在另一个案例中,Xi等[64]开发了一个隐马尔可夫模型,利用酵母核小体定位序列来预测核小体占用率,从而促进天然和人工启动子的表达[64-65]。除此之外,Zeitlinger课题组[62]建立了一个使用DNA序列来预测转录因子结合谱的深度学习模型(BPNet)。该模型通过研究转录因子结合互作的基序(motif)序列识别语法规则,为揭示基因组数据中顺式调控序列的motif 和语法提供了一种强大的通用方法。以上模型对研究转录因子Ste12 与PRE的结合方式有借鉴意义,为信息素响应型启动子的工程化提供新思路。
数学模型在信息素GPCR/MAPK 信号通路的研究方面同样发挥着重要作用。Shellhammer等[66]提供了一种基于种群和单细胞分析的方法,用于定量测量不同浓度和时间尺度信息素处理下,细胞中MAPK 激活、底物磷酸化、转录诱导和细胞极化的信号输出,为构建GPCR/MAPK 信号通路的数学模型奠定了基础。Errede 课题组[67]建立了一个基于MAPK 途径的转录调控模型,预测MAPK 通路中信号模块被选择性地突变后的基因转录表达行为。此外,Ellis课题组[58]利用基因组工程构建了含最小GPCR信号通路的酵母底盘细胞,借助3次三元复合模型,揭示了G蛋白亚基水平和通路活性之间复杂的、非单调的关系,还解释了调节通路敏感性、基础活性和信号振幅的原理,有利于开发用于检测与人类疾病相关的分子传感器。
本文综述了酿酒酵母融合的基本过程和分子机制,对“融合酶”Prm1 可能的运输机制和成熟过程提出了假说。随着对细胞融合机制的理解越来越全面,细胞融合在满足特定环境或功能需求的大基因组转移方面的应用可行性也越来越高。许多创新的合成生物学工具,如微流控技术、组学研究、基因组编辑和机器学习等,使研究者能多方面考察细胞内部复杂的生理活动,促进了酵母交配信号通路中的元件和线路将在各个领域的广泛应用。相较于传统的细胞融合技术,这些新兴技术能够克服细胞配对的随机性和不可控性,提高融合效率,增加融合产物的可预测性,推动对细胞融合可控性的研究。