吴用宇,张丹丹
(福建师范大学生命科学学院,福建 福州 350117)
在微生物学中探究原核生物对不断变化的环境和入侵的外来病原作出反应和适应的信号转导途径及分子机制是一个重要研究方向。鉴于适应环境的重要性,原核生物利用多样的策略来完成这一任务,其最重要的方式是利用核苷酸衍生的小分子转导外部信号的第二信使信号通路,这些小分子第二信使通过改变转录、翻译甚至蛋白活性等发挥整体调节作用,从而导致细菌的生理行为产生变化[2]。原核中基于环寡核苷酸的抗噬菌体免疫系统就是一种新发现的第二信使介导细胞死亡的抗噬菌体系统。
在细菌与病毒(噬菌体)之间的竞赛中,噬菌体不断更新自己的侵染系统攻破细菌的防线,而细菌为防御噬菌体侵染同样进化出了一系列的防御系统,如众所周知的CRISPR-Cas,限制性修饰系统等,研究发现细菌的抗噬菌体系统都倾向于集中在原核生物基因组的“防御岛”[3],根据这种与已知防御系统共域化的特性[4],目前在细菌中发现了多个新型的抗噬菌体系统,如BREX (Bacteriophage Exclusion)、DISARM(defence island system associated with restriction-modification)等[5,6]。环二核苷酸(Cyclic dinucleotides),如c-di-GMP和c-di-AMP等是一类存在于真核细胞、细菌和古细菌的第二信使,特别是cyclic GMP-AMP(cGAMP)在真核细胞和细菌中的发现极大地拓展了我们对于第二信使的认识。真核细胞的cGAMP是由胞内的cGAMP合成酶[c-GMPAMP synthase(cGAS)]mammalian合成的,哺乳动物的cGAMP由一个GTP和一个ATP生成,包含一个2’-OH-磷酸二酯键。细菌中的cGAMP是利用GTP和ATP在DncV的催化下产生的,细菌的cGAMP却有2个3’-OH-5’-磷酸二酯键,DncV和cGAS都属于CD-NTase超家族,但是DncV和cGAS一级序列上没有同源性。
进一步的研究发现霍乱弧菌中编码DncV的基因同系物也经常倾向于出现在防御基因附近[4,5,6], 并且在霍乱弧菌中DncV合成的cGAMP第二信使激活降解细菌内膜的磷脂酶CapV[7,8],使得细胞膜被降解,膜完整性被破坏从而导致细胞死亡。DncV介导的细胞死亡发生在噬菌体能够完成其复制周期之前,因此感染细胞中不会出现成熟的噬菌体颗粒,从而使噬菌体不会扩散到附近的细胞。这种寡核苷酸环化酶介导的抗噬菌体防御方式被命名为CBASS(cyclic oligonucleotide-based anti-phage signaling system)[1]。同时CBASS系统的变体广泛存在于几乎所有细菌和古细菌的基因组中,并形成一个巨大且高度多样化的抗噬菌体防御系统家族。一般而言,CBASS系统至少由两种蛋白组成,第一种蛋白被认为是作为感知噬菌体的存在,然后产生环寡核苷酸信号,第二种是效应蛋白,作为环寡核苷酸信号受体,被激活后发挥细胞杀伤功能。
原核CBASS系统的每个部分都表现出区别于哺乳动物cGAS通路的多样性,包括寡核苷酸环化酶(cGAS/DncV-like nucleotidyltransferase,CD-NTase)及相对应的多类第二信使、多种效应细胞杀伤因子、辅助调控因子等。
CD-NTase 是一种酶,可以合成特定的寡核苷酸信号,放大通路信号和控制下游效应反应。CD-NTase在动物和细菌信号系统中是保守的,在先天免疫和抗噬菌体防御过程中发挥至关重要的作用。在人类细胞中CD-NTase能够识别异常出现在胞质中的dsDNA并与之结合从而激活自身环化酶活性产生2’-5’,3’-5’ cyclic GMP-AMP(2’3’-cGAMP)进而激活下游抗病毒免疫及干扰素信号。在细菌和古菌中,CD-NTase酶在CBASS中同样作为化学传感器发挥作用,使细菌细胞能够对噬菌体的侵染作出反应,并快速启动信号响应[9]。但是与哺乳动物细胞中的CD-NTase需要与dsDNA结合才能激活的方式不同,细菌中的大多数CD-NTase在没有配体的情况下具有催化活性,并在体外就可合成环核苷酸信号[10]。如在弧菌属中的DncV是与类叶酸化合物结合后才受到抑制,包括5-甲基四氢叶酸等核苷酸生物合成所需的代谢物。这表明,细菌中的CD-NTase的调控可以通过抑制酶活性的配体的结合来实现,也提示了这些CD-NTase通过感应细胞内代谢物的消耗或营养饥饿等条件来响应噬菌体感染[11]。在活性状态下,CD-NTase催化常见的三磷酸核苷酸前体组成环寡核苷酸信号,并进行多循环合成。这种迭代过程使得活性状态下的CD-NTase能通过相对较少的拷贝产生许多核苷酸第二信使分子,并显著放大信号响应。
CD-NTase 的结构进一步阐释CD-NTase产生环寡核苷酸信号的具体分子机制及总体特征。如大肠杆菌RmCdnE与非水解ATP和UTP复合物的结构显示天冬酰胺侧链(Asn166)与尿嘧啶碱基形成氢键,并将ATPαP定位于UTP的3′-羟基处进行攻击Asn166位于DncV和cGAS受体核苷酸口袋中丝氨酸残基的相同位置,并且在CdnE同系物中Asn166几乎是高度保守的。野生型CdnE合成cUMP-AMP,而当将CdnE N166变成S166后该位点几乎失去利用UTP的活性,但并未失去合成环寡核苷酸的活性,而是主要合成c-di-AMP。当在此位置重新引入原先的天冬酰胺则CdnE回到优先生产含嘧啶的产物。这种天冬酰胺取代足以决定CdnE产物的特异性[12]。
几乎所有CD-NTase都有三个共同的特征:⑴一个共同的DNA聚合酶β样核苷酸转移酶超家族的蛋白折叠 ;⑵ 通过活性位点的口袋,使用不保守的蛋白支架与更远的相关模板聚合酶进行可扩散分子的模板依赖性合成;⑶ 活性位点的结构允许通过活性位点盖子内的氨基酸替换使产物和磷酸二酯连接多样化。
由于活性位点盖子延伸的侧链中存在高度的氨基酸序列变异性,此变异性为CD-NTase提供识别不同化学配体和合成具有替代碱基及磷酸二酯连接特异性的不同核苷酸产物所必需的可塑性[13,14]。目前,已知的CD-NTase产物包括二嘌呤、二嘧啶,除环二核酸外CD-NTase也产生线性寡核苷酸和更大的环状核苷酸包括规范的 3’-5’磷酸二酯和不规范的2’-5’磷酸二酯连接方式的环状三核苷酸。鉴于CD-NTase的多样性,很可能还有更多类型的第二信使有待发现。
在CBASS系统中不仅存在大量不同的环寡核苷酸第二信使,同时还拥有庞大且复杂的调控组分,这些不同调控组分根据其结构域的不同,形成四类不同构型的调控系统。在各类不同的构型中,虽然许多调控组分发挥的具体功能及分子机制仍未知,但是这些不同组分已经被证明是组成CBASS系统各类构型所必不可少的。
I 型CBASS由一个紧凑的双基因系统组成。该系统具有仅由CD-NTase基因和效应基因组成的最小配置,并无其他相关辅助基因,这是在原核生物中存在最为广泛的CBASS构型,几乎可以在所有主要细菌门类中发现I型CBASS构型的存在[1]。大多数I型CBASS系统中的效应因子含有一个或七个跨膜螺旋,预测一旦被环寡核苷酸信号激活,就会在膜中形成孔隙[15]。
II 型CBASS在CD-NTase基因和效应基因组成的基础上还包括两个编码真核经典泛素化相关结构域的基因,其中,两个辅助因子被称为cap2和cap3[16]。cap2中包括真核经典泛素激活的E1酶结构域和泛素结合的E2酶结构域,而cap3仅编码一个蛋白结构域,该结构域通常发现于真核生物去泛素化酶中,且被预测为是JAB/JAMM家族的异肽酶,该酶可将泛素从靶蛋白中去除。由于cap3的基因较短,在少数II型CBASS系统中存在cap2和cap3的基因融合或cap3的基因与效应基因融合的情况。同时,有小部分II型CBASS系统具有更小的构型,即除环化酶及效应子对外,仅包括一个短的E2结构域的基因,不包括E1或JAB。
十分有趣的是,cap2和cap3是抵御部分但不是所有噬菌体所必需的,表明这些基因在CBASS系统中具有辅助功能,扩大系统抵御噬菌体的范围。但是,对于cap2和cap3的靶向分子机制并未被阐释清楚,目前也尚缺乏哪种蛋白是cap2和cap3辅助编码的泛素处理结构域靶标的证..据,同时,对于仅包含E2结构域基因的亚型,尚不清楚其是单独发挥作用,还是利用细胞中的其他基因来填补缺失的E1和JAB结构域功能。在II型CBASS系统中最常见的效应结构域是一种磷脂酶结构域,这种磷脂酶一旦被信号分子激活就会降解细菌内膜。
III 型CBASS在寡核苷酸环化酶和效应基因组成的基础上还包括编码HORMA和TRIP13结构域的基因,这些辅助编码的结构域迄今为止也都是主要在真核生物中被发现的[17]。其中一个因子cap7是具有HORMA结构域的蛋白,这类蛋白形成信号复合物控制真核生物减数分裂、有丝分裂和DNA的修复[18];第二个因子cap6具有TRIP13结构域(也称为Pch2结构域),这是一种已知的HORMA结构域蛋白活性抑制剂[19]。在真核生物中,TRIP13蛋白解离HORMA信号复合物,使得信号关闭。
在III型CBASS中HORMA结构域蛋白(Cap7)对于噬菌体防御至关重要,并且寡核苷酸环化酶只有在与HORMA结构域蛋白(Cap7)物理结合时才会变得有活性。相比之下,TRIP13结构域蛋白Cap6发挥着从寡核苷酸环化酶中解离HORMA结构域蛋白的作用,表明TRIP13是环寡核苷酸产生的负调控因子。在正常条件下,Cap6阻止Cap7与寡核苷酸环化酶结合;然而在噬菌体感染期间,Cap7识别感染(可能通过与噬菌体编码蛋白结合)并改变构象从而与寡核苷酸环化酶结合。这种结合激活环状寡核苷酸分子的产生,进而激活效应蛋白导致细胞死亡,使噬菌体无法完成其复制周期[20,21]。而III型CBASS在变形菌门中被过度表达,在厚壁菌门中却几乎不存在,在III型CBASS中除了一种具有单一的HORMA结构域蛋白(cap7)外,还存在另外一种HORMA结构域的蛋白。仅通过基于结构的比较而不是基于序列的比较,其中的一种蛋白Cap8与正常HORMA结构域相比存在相当大的差异,这种不同的Cap8的HORMA结构域在体外不能激活环化酶,猜测其可能作为脚手架的方式发挥作用。
IV 型CBASS在寡核苷酸环化酶基因和效应基因组成的基础上还包括具有核苷酸修饰结构域的辅助蛋白基因,通常IV型CBASS中的辅助因子由cap9和cap10组成,这两个蛋白是具有参与核苷酸修饰的结构域。cap9具有一个预测的QueC酶结构域,已知该结构域可将修饰的碱基7-羧基-7-脱氮鸟嘌呤(CDG)转化为7-氰基-7-脱氮鸟嘌呤(preQ0)[22,23]。cap10被预测是一种TGT酶,这类酶催化tRNA分子中特定的鸟嘌呤残基与preQ0的碱基交换[24],且可以修饰DNA上的鸟嘌呤残基[25]。
在IV型CBASS系统中也存在另一个被注释为N-糖基化酶/DNA裂解酶(OGG)的基因(cap11)。根据目前已知N-糖基化酶/DNA裂解酶可去除DNA中受损的鸟嘌呤碱基(8-oxoG),并在脱嘌呤/脱嘧啶位点使DNA产生缺口[26]。迄今为止,还没有IV型CBASS系统通过证实能防御噬菌体,其辅助基因的确切功能仍不清楚,且IV型CBASS系统较集中存在于古细菌中。
CBASS 系统中的这四类辅助操纵构型复杂且精密,而且其中许多组分结构域在之前是仅在真核细胞中发现的,同时还有许多的猜想和问题需要被验证和解释。这些调控组分可能作用于CBASS系统中的各个不同的阶段以达调控该系统的稳态,最终则由效应杀伤因子负责整个系统表观功能上的表达。
CBASS 系统中的多类效应杀伤因子作为整个系统中的最终效应因子,通过各类杀伤手段使细胞出现提前死亡的现象,其效应蛋白通常由两个结构域组成,包括环寡核苷酸感应结构域和细胞杀伤结构域。通过目前已知的结构及序列分析,CBASS中的效应杀伤因子包括一个以前未被表征过的SAVED结构域和各类型的杀伤结构域,其中新发现的SAVED结构域负责识别环寡核苷酸信号。以cap4为例,从结构上看C-末端SAVED结构域与CRISPR相关的CARF结构域蛋白有明确结构同源性,由两个单独的CARF样亚基形成伪对称的形式存在,这样的伪对称形态使SAVED结构域的单链结构允许识别不同的不对称核苷酸识别信号。N端结构域则是广泛存在于细菌中的未表征蛋白结构域4297(DUF4297)的成员,且该DUF4297结构域与II型限制性内切酶具有结构同源性,包括AgeI和HindIII酶等,发挥着降解dsDNA的杀伤作用。
影像融合首先用QuickBird多光谱影像和全色影像进行几何配准;然后分别采用彩色合成变换[4]、IHS 变换、K-L 变换[5,6]和 Brovey 变换[7]进行融合处理;最后通过统计平均值、标准差、偏差指数、信息熵和相关系数,比较不同方法[8]的融合效果。
效应杀伤结构域除了该类核酸内切酶外还包括能降解内细胞膜磷脂的patatin-like磷脂酶结构域、能够造成细胞膜穿孔的跨膜螺旋结构域、能降解蛋白的肽酶结构域、与Thoeris抗噬菌体系统相关的TiR结构域及少数的磷酸化酶/核糖核酸酶结构域。
CBASS 效应杀伤因子依靠这两个结构域分两步发挥作用。其中环寡核苷酸感应结构域一旦感知到环寡核苷酸就会被激活,随后使各类细胞杀伤结构域作用于相应靶标,对细胞产生杀伤作用,从而使细胞死亡。各类不同的杀伤结构域根据其不同的特性发挥其特有的功能对细胞产生杀伤作用。
cGAS 途径是首先发现于真核生物中的一个至关重要的抗病毒免疫通路。而细菌中的CBASS系统是在原核生物中被发现并揭示的一种CD-NTase介导的全新的抗病毒(噬菌体)机制,根据目前的研究,CBASS系统由三大部分构成,分别是寡核苷酸环化酶(CD-NTase)、四类型操纵子及各类不同的下游杀伤性效应因子。
噬菌体感染细胞的某些信号使得寡核苷酸环化酶(CD-NTase)激活产生第二信使将信号传递下去,同时在CBASS中四种不同构型的操纵子也对该系统的运作及调控发挥重大作用。在CD-NTase产生不同类型的环寡核苷酸第二信使后,这些环寡核苷酸信使被相应效应杀伤因子的SAVED结构域所识别,之后便会激活相应各类不同的杀伤结构域通过各种不同的杀伤方式使细胞提前死亡,以此来阻止噬菌体的成熟,从而达到抗噬菌体的目的。
原核CBASS系统的揭示为之前仅在哺乳动物中发现的cGAS-STING抗病毒途径拓展了一个全新的研究大方向,并且已经有越来越多的证据表明,原核CBASS系统与cGAS-STING通路存在进化上的关联,哺乳动物cGAS-STING通路极有可能是原核CBASS系统演变进化形成的。但是,目前这个新型的抗噬菌体防御系统仍有许多未知的谜题等待被发掘和解释,如CBASS系统中的CD-NTase到底是如何感应噬菌体的入侵从而转化为激活态,因为原核细胞胞质中游离着自身的dsDNA,其大概率不同于哺乳动物cGAS通路那般通过识别胞质dsDNA来实现激活,且大多数CD-NTase在体外没有其他配体的情况下具有催化活性,其在细胞内的激活与否必然依靠着其他不同的方式,但这仍需大量的研究来揭示和证明。
四类型丰富且复杂的调控模块的研究及阐释则仍处于相对空白的阶段,这些发现在真核生物中的结构域在原核生物中又具体发挥什么样的作用,如此多样且复杂的操纵模块究竟是如何作用于CBASS的调控等这些问题也仍需要大量的分析和深入的研究来解答。作为CBASS中最终的效应杀伤因子同时也有着多样的杀伤结构域,其不同的杀伤分子机制也仍待揭示。对CBASS系统的深入研究不仅是对原核中这种新型抗噬菌体系统的揭示与探究,由于其与哺乳动物cGAS-STING通路在进化上的紧密关联,使其更可能有着与哺乳动物cGAS-STING通路相关研究互相照应、互相提示的重大意义。