汪梦俊 综述,申硕 审校
武汉生物制品研究所有限责任公司病毒性疫苗研究一室,湖北 武汉 430207
近年来,由冠状病毒(coronavirus,CoV)引起的呼吸道综合征大流行愈加频繁,从2003 年的SARS(severeacuterespiratory syndrome),到2012 年的MERS(Middle East respiratory syndrome),再到 2019 年的新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)。这些病毒可在包括人类在内的多种哺乳动物间传播,并可经空气途径由呼吸道入侵机体,极易造成大范围流行。在所有的RNA 病毒中,CoV 具有最大的基因组结构。CoV 拥有一套独特且复杂的复制策略,与其庞大的基因组相适用,即由NSP1-NSP16组成的酶系统。这些NSP 由2 个大的蛋白聚合体(polypeptide1a 和 polypeptide 1a / 1b,pp1a 和pp1ab)酶切而来,能发挥各种与病毒复制相关的分子活性,如 RNA 依赖的 RNA 聚合酶活性(NSP12)、解旋酶活性(NSP13)、mRNA 封闭活性(NSP14 和 NSP16)和保真性调节活性(NSP14)等。尽管我们对CoV 的NSP 有一定了解,但严重急性呼吸综合征冠状病毒2(severe acute respiratory syndrome coronavirus 2,SARSCoV-2)在全球的快速蔓延以及新变异株的不断出现,让我们意识到对CoV NSP 的认识仍存在许多不足之处。
本文对目前已报道的CoV NSP 的结构及功能作一个系统的归纳和总结,以期进一步了解SARSCoV-2 的复制和NSP 功能,进而发现药物新靶点以及制定疫苗研制策略,为疾病预防、治疗和阻断SARSCoV-2 及其变异株在全球的传播提供参考。
CoV 指巢状病毒目(Nidovirales)冠状病毒科(Coronaviridae)冠状病毒属(Coronavirus)的病毒,目前还可细分为2 个亚科、5 个属、27 个亚属以及39 个种[1]。随着 COVID-19 疫情的发展,WHO 又将 SARSCoV-2 的变异株进一步分为 alpha、beta、gamma 和delta等变异株。所有的巢状病毒目病毒均为有包膜的单链正义RNA 病毒,不同病毒间的主要差异在于拥有的结构蛋白的数量、类型和大小不同,并由此形成了各种形态和结构不同的核衣壳及病毒颗粒。
冠状病毒科是巢状病毒目中最大的1 个科,包含 2 个亚科,分别为 Coronavirinae 和 Torovirinae,而基于血清型的差异,CoV 可分为4 个属,即冠状病毒亚科中的 α 冠状病毒(α-coronavirus,α-CoV)、β 冠状病毒(β-coronavirus,β-CoV)、γ 冠状病毒(γ-coronavirus,γ-CoV)和 δ 冠状病毒(δ-coronavirus,δ-CoV)[2],见图 1。目前,能够在人群中传播的主要为α-CoV 及β-CoV,包括引起 SARS、MERS 和 COVID-19 的几类 CoV[3]。
图1 CoV 主要分类及基因组特征Fig. 1 Classification and genomic feature of CoV
CoV 是一种有囊膜包裹的80 ~ 220 nm 的二十面体球形颗粒,主要由 S 蛋白(spike protein)、M 蛋白(membrane protein)、E 蛋白(envelope protein)和 N蛋白(nucleocapsid protein)4 种结构蛋白组成。
S 蛋白是重要的中和抗原蛋白,也是疫苗设计的常用靶点,以三聚体的形式存在于病毒颗粒表面[4-5],呈刺突状,属于Ⅰ型病毒融合蛋白,单体大小一般为126 ~ 180 kD,通常带有多位点约40 kD 的N-linked糖基化修饰基团[6],能够与宿主细胞表面特异受体结合进而介导病毒进入宿主细胞[7]。大多数CoV 的S蛋白进入宿主细胞后会被胞内的furin-like 或其他蛋白酶切割成S1 和S2 两个亚基,分别具有受体结合和膜融合功能。M 蛋白是CoV 颗粒中分子含量最高的结构蛋白,被认为与病毒颗粒的形成有关[8]。其单体大小为25 ~ 30 kD,有3 个跨膜结构域,通常会带有N-liked 的糖基化修饰[9]。小鼠肝炎病毒(mouse hepatitis virus,MHV)的相关研究表明,M 蛋白与NSP15 及N 蛋白的结合被认为是病毒颗粒选择性包装的关键[10]。E 蛋白是一个大小为8 ~12 kD的跨膜蛋白,在不同的CoV 中具有高度的特异性,由1 个短的亲水性N-末端、1 个长的亲水性C-末端及中间一段长的疏水区域组成。以多种多聚体的形式存在,并且具有离子通道活性[11]。N 蛋白能够与病毒基因组RNA 结合,构成病毒颗粒的核衣壳结构。包括2 个独立的折叠结构域:N-末端结构域(N-terminal domain,NTD)和 C-末端结构域(C-terminal domain,CTD),两者均能与 RNA 结合,且可能具有协同作用[12-13]。同时,N 蛋白可与转录调节序列(transcription-regulating sequence,TRS)以及基因组折叠信号结合,这可能与病毒基因组的表达调控有关[14-15]。而在某些 β-CoV 中,还发现 1 个短的蛋白突起(hemagglutinin-esterase,HE),具有乙酰酯酶活性,能够与宿主细胞表面的糖蛋白结合,增强S 蛋白介导的病毒侵入作用[16]。
除了CoV 外,CoV 内还存在一定数目的辅助蛋白(accessory protein)。不同CoV 中辅助蛋白的数目不同,但均对病毒的复制和功能具有重要的影响[17-19]。目前,对于辅助蛋白的具体功能尚不完全清楚,但已有研究证明,在 SARS-CoV 的 VLP 中存在 3a、ORF6、7a、7b 等辅助蛋白,在 SARS-CoV-2 中,3a 蛋白分子丰度被证明相当于或超过 M 蛋白[9,20-22]。
值得注意的是,CoV 还具有一套较前两者更为保守且独特的NSP 系统,这些NSP 由ORF1ab 编码的pp1a 和pp1ab 经酶切而来,能够形成CoV 复制所必需的复制转录复合物(replication transcription complex,RTC)。RTC 包含许多参与 RNA 复制的酶,如 3′-5′核酸外切酶(NSP14),这一蛋白酶在其他 RNA 病毒中均未被发现,被认为与RTC 的校对功能相关。
如图2 所示,CoV 的基因组主要可分为2 个部分,从 5′-端开始约 2 / 3 的区域为 ORF1a 和 ORF1b。ORF1a 可表达1 个包含NSP1 ~ NSP11 的多蛋白聚合物(pp1a),ORF1b 则被位于 NSP11 上的 ORF1a 终止子终止。但在某些情况下,当核糖体移动至NSP11区域时,CoV 能够通过一种特殊的核糖体移码机制[23-24],跳过 ORF1a 的终止密码子,使 ORF1a 和ORF1b 共表达出完整的包含16 个 NSP 的pp1ab。pp1ab 在糜蛋白酶样蛋白酶(3CLpro)/ Mpro(main protease)及木瓜蛋白酶样蛋白酶(papain-like protease,PLpro)的作用下加工成 16 种 NSP[25-26],这些NSP 能诱导细胞产生双层囊泡(double-membrane vesicle,DMV)结构,并由此组装成RTC。在RTC 的帮助下,CoV 能够以不连续转录的方式合成一套嵌套的亚基因组 RNA(subgenomic RNA,sgRNA)[27]。这些sgRNA 具有共同的 5′-前端和 3′-末端序列,其转录由位于不同ORF 之间的转录调控序列调控[28]。由于RNA 病毒复制过程中的突变率远高于DNA 病毒,RNA 病毒的基因组长度通常小于10 kb。然而,CoV 具有远大于其他RNA 病毒的基因组,这可能与其特有的NSP 系统有关,如能够发挥3′-5′核酸外切酶活性的NSP14,赋予了CoV RTC 校对活性和生存适应能力。
从 CoV RNA 基因组 3′-端开始占基因组约 1 / 3的区域是表达结构蛋白和辅助蛋白的区域,通常包含至少 4 个 ORF,分别编码 S 蛋白、M 蛋白、E 蛋白和N 蛋白。此外,CoV 通常还存在数目不定的编码辅助蛋白的开放型阅读框(open reading frame,ORF),如 SARS-CoV-2 中的 ORF3b、ORF6、ORF7a、ORF7b、ORF8 和 ORF10 等[29]。所有结构蛋白和辅助蛋白均以 sgRNA 形式编码[27]。
在不同的CoV 中,NSP 的结构及功能一般而言相对保守,这意味着这些NSP 在CoV 的生命周期中扮演着相当重要的角色。CoV NSP 的主要功能见表 1[30],根据 NSP 在 CoV 中发挥的主要功能的不同,可以把 CoV 的 NSP 分为 4 类(如图 2 中Function所示)。NSP1 和NSP2 主要通过干扰宿主细胞正常的生物学功能来抑制宿主细胞对病毒复制和增殖的影响,而其本身并不会发挥RNA 复制相关的功能。NSP3 ~ NSP6 能够介导DMV 的形成,同时具有3CLpro和 PLpro两种蛋白酶活性,能够将 pp1a / pp1ab切割成单独的NSP,是RTC 形成的必需分子[31]。NSP7 ~ NSP11 具有病毒引物合成的活性,多为其他NSP 的辅助分子。NSP12 ~ NSP16 是RNA 复制酶最核心的部分,行使RNA 复制、加帽、校对和修饰等功能。
表1 CoV NSP 的主要功能Tab. 1 Main functions of CoV NSP
图2 SARS-CoV-2 的基因组结构Fig. 2 Genomic structure of SARS-CoV-2
4. 1 NSP1 NSP1 是 CoV 基因组 RNA 编码的第 1个蛋白质,由 pp1a / 1ab 经 PLpro 酶切而来。目前主要被发现在 α-CoV 及 β-CoV 中,在 γ-CoV 及 δ-CoV中还未发现[32-33]。不同谱系CoV 间的NSP1 基因序列缺乏明显的同源性[34]。对已知CoV NSP1 的研究表明,不同CoV 阻遏宿主细胞基因表达以及对抗宿主固有免疫具有不同的机制[35-37]。
在对SARS-CoV 研究中,发现SARS-CoV 的NSP1能够通过与核糖体的40S 小亚基结合,介导宿主mRNA 5′-非翻译区(untranslated region,UTR)附近的区域被核酸内切酶酶切[38-40]。而由于病毒mRNA存在1 个5′-端前导序列,使得病毒自身的mRNA 避免被切割[41]。同时,大量的研究表明,SARS-CoV 的NSP1 在抑制宿主细胞固有免疫、诱导宿主细胞产生细胞因子和趋化因子[42]、阻滞细胞周期[43]及扰乱核孔复合物Nup93 的定位等方面也发挥着重要作用,这些功能的实现可能与SARS-CoV NSP1 上的β-barrel 结构有关[44]。而在对 SARS-CoV-2 的研究中,NSP1 与核糖体40S 小亚基之间的相互作用已被证明与其第 164 位赖氨酸残基(K164)高度相关[45]。而反向遗传学实验也证明了SARS-CoV-2 NSP1 C-末端结构域与α-干扰素的mRNA 降解相关[46]。但NSP1如何与其本身mRNA 保守的5′-UTR 之间相互作用,从而避免自身mRNA 降解的机制目前尚不清楚。
4. 2 NSP2 NSP2 主要由1 个重复的折叠结构域组成,在不同CoV 中的序列同源性较低,通常被认为不是病毒复制所必需的一个元件,但其具体的功能尚不清楚。在对MHV 的研究中,NSP2 被发现能够与 NSP1、NSP5、NSP7、NSP8、NSP9、NSP10、NSP12 和NSP13 等协同作用[47]。在对传染性支气管炎病毒(infectious bronchitis virus,IBV)的研究中,NSP2 显示出较弱的抗依赖双链RNA 的蛋白激酶(doublestranded RNA activated protein kinase,PKR)活性,意味着其可能参与了NSP1 的抗宿主细胞固有免疫反应[30]。同时,蛋白组学相关的研究发现,NSP2 能够与抑制素1 和2 结合,意味着NSP2 可能参与了病毒抗宿主细胞固有免疫的过程[48]。
4. 3 NSP3 NSP3 是CoV 中最大的多结构域非结构蛋白,且不同冠状病毒属中的CoV NSP3 拥有的结构域数量和组成也存在差异,一般包括10 ~ 16 个结构域[49],其中 8 个结构域在所有 CoV 的 NSP3 中均有发现,见图3。
图3 不同CoV NSP3 的主要结构域Fig. 3 Main structural regions of various CoV NSP3
NSP3 不同结构域在病毒复制过程中发挥着不同功能,其能够通过自身的PL1pro和PL2pro(PLpro)结构域从 pp1a 和 pp1ab 中释放 NSP1、NSP2 和自身[50],并与其他NSP 结合形成RTC。有研究表明,NSP3 能够与 NSP5、NSP6 共同诱导SARS-CoV 感染细胞中DMV 的形成,且主要由NSP3 C-末端的某一结构域所介导[31,51]。Ubl1 结构域能够与病毒基因组的 5′-UTR 和N 蛋白的丝氨酸和精氨酸富集区(SR 区)相互作用[52],这种相互作用可能是病毒感染早期RTC与病毒基因组结合的基础[15,52-53],而 MHC 中 Ubl1核心区域(19 ~ 111 位氨基酸残基)的缺失也会导致病毒无法正常复制[15,53-54]。NSP3 能够通过宿主的翻译后修饰系统来帮助病毒对抗宿主的固有免疫。以最近的1 篇关于SARS-CoV-2 的研究为例,研究者发现SARS-CoV-2 感染细胞后的去泛素化和去甲酰化修饰与MERS-CoV 相近,均高于SARS-CoV。SARS-CoV-2 的PLpro 的半胱氨酸酶和脱乙酰酶活性可能是其多种蛋白水解功能中最重要的,并且似乎具有种属特异性[55]。NSP3 中还有一个保守的大结构域(Mac1),其具有的ADP 核糖蛋白水解酶活性对于病毒的复制不是必需[56],但在病毒致病过程中发挥重要的作用。
4. 4 NSP4 NSP4 是一种长度约500 个氨基酸残基的跨膜蛋白,主要包括4 个跨膜结构域和1 个保守的位于胞浆的C-末端结构域[57]。第1 个跨膜结构域位于蛋白第32 位氨基酸残基之后,包含1 个酶切信号序列。其他3 个跨膜结构域位于280 ~ 400 氨基酸残基之间,最后留下约100 个氨基酸残基的C-末端结构域[57-58]。有研究表明,当其C-末端的结构域缺失时,病毒的复制会受到一定影响[59]。而研究人员通过酵母双杂交实验发现,NSP4 与NSP2 能够相互作用。当把不同病毒的NSP4 共表达在一个细胞时,也观察到了不同的NSP4 分子之间的相互作用[60]。在 SARS-CoV 中,NSP4 是病毒 DMV 形成的重要组分,一项利用 293T 表达的研究表明,SARSCoV 的NSP3 和NSP4 全长共表达会导致细胞膜全面配对,并且配对的膜之间会保持与自然感染SARSCoV 所形成的 DMV 相同的距离[31]。而对 MHV 的研究表明,其NSP3 和NSP4 的C-末端之间能够发生相互作用[60],这种相互作用能够影响DMV 的形成以及RTC 在DMV 上的锚定,对于CoV 的复制至关重要[61]。
4. 5 NSP5 NSP5 也被称为3CLpro,是一种大小约33. 8 kD 的半胱氨酸蛋白酶。包括2 个活性相关的结构域(Ⅰ和Ⅱ)和1 个介导NSP5 形成二聚体的结构域(Ⅲ),结构域Ⅱ和Ⅲ之间由1 个长环连接。3CLpro的活性位点位于结构域Ⅰ和Ⅱ的间隙之间,并具有 Cys-His 催化二元结构(Cys145 和 His41)[62]。之前的研究发现,在所有的巢状病毒目病毒中,NSP5均可与NSP12 及NSP13 一同构成完整的病毒RNA复制酶[63]。NSP5 的功能与糜蛋白酶相似,是CoV中一种 Mpro,主要负责 pp1a / 1ab 上 11 个特异位点的酶切[64-65],产生的酶切产物(NSP4 ~ NSP16)将会在DMV 上组装成RTC[66]。蛋白组学的相关研究表明,NSP5 可直接与NSP12 或NSP14 结合,或者与NSP10、NSP12 和 NSP14 形成的复合物结合[67-69],表明NSP5 在RNA 的复制及DMV 的形成中可能发挥着重要的作用[70]。
4. 6 NSP6 根据TMHMM 2.0 软件预测,大多数CoV的NSP6 包含7 个跨膜区域[71],但也有文献报道,NSP6 仅有6 个跨膜区域,且2 个末端均在膜的胞质侧[58,72],这些跨膜区域被认为与 RTC 能够锚定在细胞膜上有关[58]。NSP6 主要存在于宿主细胞的内质网中,其膜外区域存在多个与内质网膜高亲和力的苯丙氨酸残基,使得NSP6 能稳定与内质网膜结合[73]。NSP6 与 NSP3、NSP4 相同,均是 SARS-CoV 形成DMV所必需的[74]。当NSP6 单独表达时,能够引起宿主细胞发生膜增殖,NSP6 过度表达时,则会干扰宿主细胞的膜运输过程[58,72],导致膜泡在微管复合体周围聚集[31]。同时,NSP6 还能够诱导包含 Atg5 和LC3-Ⅱ小泡的细胞自噬[72]。一项酵母双杂交系统的实验证明,SARS-CoV 的 NSP6 能够与 NSP2、NSP8、NSP9和辅助蛋白9b 等相互作用[75]。
4. 7 NSP7 NSP7 在CoV 中是相对保守的,但在不同巢状病毒目病毒间的序列同源性较低。利用核磁共振(nuclear magnetic resonance,NMR)和 X-射线衍射对 SARS-CoV 的 NSP7 / NSP8 十二烷基复合物进行结构分析,结果表明,NSP7 包含4 个不同位置及空间方位的α-螺旋,预示着NSP7 的蛋白构型可能主要受到NSP8 相互作用的影响。NSP7 最显著的特点是3 个位于同一平面的α-螺旋,三者通过2 个环状结构连接,这种独特的结构能够通过疏水侧链间的相互作用维持NSP7 的稳定性[76]。NSP7 的二聚体能够与 NSP5、NSP8、NSP9 和 NSP3 等相互作用[77]。NSP7 与NSP8 的相互作用可能与其N-末端保守的螺旋束结构有关[41]。体外的共表达试验证明SARSCoV 的 NSP7 / NSP8 复合物能够影响 NSP12 的活性,而反向遗传学研究表明,当对SARS-CoV NSP7内特定氨基酸残基进行替换后,病毒的复制将会受到影响[78]。此外,MHV 的 NSP7 已被证明能够与NSP1 和 NSP10 特异性结合[47]。
4. 8 NSP8 NSP8 是 CoV 中 1 个高度保守的蛋白,其三级结构呈“高尔夫球杆”状,包含一个N-末端“轴”结构域和一个C-末端“头部”结构域[79]。对SARSCoV-2 NSP8 的研究表明,NSP8 的 N-末端由 1 个长的α-螺旋及2 个短的螺旋结构组成,具有高度的可变性,其表面带有正电荷,主要参与核酸与NSP7 和NSP12 的相互作用以及复合物的形成[80]。NSP8 的C-末端结构域主要包含4 个α-螺旋结构,能够与NSP7 通过5 个α-螺旋形成异二聚体。在SARS-CoV中,NSP8 能与NSP7 共同形成一个规则的十六聚体结构[81]。进一步的研究表明,这种十六聚体的形成与NSP8 N-末端的长α-螺旋有关,当水解去除NSP8 N-末端的长α-螺旋后,剩余的NSP8 结构仅能与NSP7形成1 个四聚体结构[80]。对NSP8 的功能研究表明,NSP8 能够与RNA 模板上5′-(G / U)CC-3′结合来启动互补寡聚核苷酸的合成,被认为具有次级的RdRp活性[41],能够在病毒基因组的转录和复制过程中为NSP12 提供RNA 引物[82]。反向遗传学及生物化学的研究表明,SARS-CoV 的 NSP8 的 183(P)和 190(R)位氨基酸残基与其NSP12 结合活性相关,而58(K)位氨基酸残基则能与RNA 结合[78],两者使得NSP8能够调节RNA 聚合酶活性。
4. 9 NSP9 NSP9 是 CoV 继 NSP5 后第 2 个从复制酶上脱离下来的蛋白亚基,大小约110 个氨基酸残基。其核心由1 个六股封闭的“β-barrel”和一系列向外伸出的延伸环组成。其他一些单独的“β-strand”、C-末端 α-螺旋和 N-末端“β-strand”通过环与“β-barrel”连接。在C-末端α-螺旋间范德华力的作用下,NSP9能够形成一个二聚体构象[83]。SARS-CoV NSP9 二聚体晶体结构显示,二聚体中每个NSP9 单体均含有1 个由7 条链和1 条螺旋排列成的紧凑的锥形区域,其两侧是C-末端螺旋结构,螺旋含有2 个疏水位点,其中一个面向内侧,另一个与第2 单体的螺旋相互作用,维持二聚体的稳定性[84]。
NSP9 以二聚体的形式发挥生物活性,能够以非连续方式与核酸特别是RNA 分子结合[85-87]。对NSP9 的反向遗传学研究表明,NSP9 内的点突变可阻断 CoV 的复制[86,88]。对于 NSP9 的具体功能及作用机制目前尚不明确。可以确定的是,NSP9 可与NSP8 和NSP12 相互作用,并共定位在膜复制型的细胞器上[89-90]。
4. 10 NSP10 NSP10 在 SARS-CoV 中是由 139 个氨基酸残基构成的非酶病毒蛋白,在病毒复制过程中能够通过调节NSP14 和NSP16 的活性来提高CoV复制过程中的保真性[91]。 SARS-CoV NSP10 /NSP16的异二聚体晶体结构表明,NSP10 带正电荷的疏水表面能够与NSP16 表面带负电荷的疏水囊相互作用,稳定NSP10 与S-腺苷甲硫氨酸的结合位点。NSP10 的中心存在 1 对反平行的“β-strand”,其一侧被重叠的“loop”结构包围,另一侧被1 个螺旋结构域包围,螺旋结构域和“loop”结构形成2 个“zinc finger”结构[92]。
酵母双杂交试验表明,NSP10 二聚化后能够与NSP1、NSP7、NSP14 和 NSP16 相互作用[47,93]。在一项针对MHV 温度敏感型突变株的研究中,发现NSP10突变会导致病毒的负链RNA 合成不足[94-95]。最近的一项研究表明,NSP10 在与NSP14 和NSP16 相互作用的同时,还能够调控后两者的ExoN 活性及Ribose-2’-O-MTase*’-O-MTase)活性[92]。但 NSP10 对ssRNA和dsDNA / dsRNA 的亲和力较弱,表明该蛋白可能是作为复合体的一部分发挥作用。
4. 11 NSP11 NSP11 是 pp1a /pp1ab 上紧接着 NSP10的一段高度可变的、长度为11 ~ 23 个氨基酸残基的多肽段。其对应的RNA 区域中包含一段读码转换的信号,能够介导翻译到该位点的核糖体发生移位,使ORF1b 能够正确地移码后表达。在SARSCoV 中,NSP11 是 1 个包含 13 个氨基酸残基的多肽,由 pp1a 在 NSP10 / NSP11 连接处的 C-末端加工而来。而位于 NSP10 / NSP11 连接处与 ORF1a / 1b移码位点之间NSP11 的N-末端序列,移码后也可作为 NSP12 N-末端的一部分。NSP10 / NSP11 复合体的晶体结构显示,尽管寡聚和堆积的晶体在整体结构上存在一定的差异,但其核心的NSP10 结构几乎无差异,表明NSP11 可能主要是作为核糖体翻译转换机制的一部分发挥功能,而对于NSP10 的功能则无显著影响。
4. 12 NSP12 现有研究表明,NSP12 包含至少2 个结构域,即具有核苷酸转移酶活性的NiRAN(nidovirus RdRp-associated nucleotidyl transferase)结构域和 C-末端的 RdRp(RNA-dependent RNA polymerase)结构域。NiRAN 结构域的三维结构呈“right hand shaped fold”,可划分为“finger”、“palm”和“thumb”3 个亚结构域,“finger”结构域包括 1 个特征性“helixloop-helix”结构和 2 个“stranded β-sheet”结构。而“palm”结构域由 2 个螺旋结构和 1 个“β-hairpin”结构组成,包含核苷酸转移酶的活性位点[96]。“fingerthumb”之间的相互作用形成了NSP7-NSP 异二聚体结合位点,其中NSP12 和NSP7 之间的大部分接触是在该位点形成的[97]。此外,SARS-CoV 的NSP12还具有2 个Zn2+结合结构域,被认为与蛋白结构的维持有关,但不直接参与酶的活性[98]。
单独NSP12 仅能显示出较弱的RNA 聚合酶活性,而当其与NSP7 和NSP8 结合后,自身的活性将得到极大提高[78]。在已研究的SARS-CoV-2 NSP12-NSP7-NSP8 复合物晶体结构中,NSP7-NSP8 异二聚体与NSP12 的相互作用主要发生在面向NTP 进入通道的聚合酶“thumb”结构域上。NSP12“finger”结构域存在于“thumb”结构域和NSP7-NSP8 复合物之间,被认为有助于NSP12 与其他RNA 合成必要的成分相互作用,以便其结合至病毒复制复合物中[97]。
4. 13 NSP13 NSP13 和 NSP12 是 CoV RTC 中 2 个最核心的成分。其中NSP12 主要发挥RdRp 功能,而NSP13 则起到解旋酶的作用。在SARS-CoV-2 NSP13的结构预测模型中,NSP13 位于ORF1ab 中,含有596个氨基酸残基,空间构象呈三角金字塔形,包括5 个与SARS-CoV 和MERS-CoV 类似的结构域,其中1A、2A 和1B 结构域构成了金字塔的三角形基部,而连接锌指结合域(zinc binding domain,ZBD)和 1B 结构域的茎环结构域位于金字塔的顶端[99]。
研究发现,基因组大于7 kb 的正链RNA 病毒通常均会编码解旋酶。这些解旋酶可被划分成6 个主要的超家族(SF1 ~ SF6),在细胞核酸代谢的各个方面均发挥作用。而在我们目前发现的所有解旋酶中,均具有1 个耦合NTP 水解和蛋白构象变化的核心结构域,同时也均具有一些起辅助作用的结构域,如帮助解旋酶定位的核蛋白结合结构域[55,100]。生物信息学分析表明,CoV NSP13 属于超家族SF1,具有包括 NTP 和 dNTP 水解酶、5′-3′的 DNA 和 RNA 解旋酶以及RNA 5′-三磷酸酶在内的多种酶活性[100]。
4. 14 NSP14 CoV NSP14 在病毒复制中发挥着重要作用,其 N-末端具有核酸外切酶(exonuclease,ExoN)活性,而C-末端则具有依赖S-腺苷蛋氨酸(S-adenosyl methionine,AdoMet)的鸟苷 N7-MTase 活性[101-103]。根据SARS-CoV 的NSP10 ~ NSP14 的晶体结构显示,ExoN 结构域包含1 个活性中心以及1 个由5 个“βstrand”组成的扭曲“β-sheet”。NSP14 的 N7-MTase结构域整体呈现为1 个“MTase”折叠,主要由5 个“βstrand”组成[102]。
NSP14 的ExoN 活性可能与CoV RNA 复制酶的保真性有关[104]。研究表明,用丙氨酸取代ExoN前2 个活性位点后,SARS-CoV 在细胞中复制时的保真性会下降15 ~ 20 倍[105-106]。另一项研究表明,体外表达的SARS-CoV NSP14 在体外能够通过与NSP10 结合,切除错配的核苷酸序列,证明NSP10 能够稳定并显著增强NSP14 的酶活性[78]。此外,NSP14的ExoN 在RNA 合成、抗病毒核苷类似物的抗性、适应性、免疫拮抗性和毒力等方面均具有重要作用。其还被认为能够增加病毒基因组的重组率,促进病毒在自然状态下的进化[107]。对SARS-CoV-2 NSP12 蛋白晶体的X 射线衍射分析结果显示,NSP14 的N-末端和C-末端结构域之间具有重要的功能性相互作用,其中有3 个外显子对维持N7-MTase 底物结合部位核心的α-螺旋结构至关重要[108]。在一项研究中,研究人员利用反向遗传学手段证明SARS-CoV 的N7-MTase 能够通过介导GTP 和dGTP 甲基化,来修饰自身和宿主细胞的mRNA。同时,研究人员还通过点突变的方法确定了N7-MTase 结构域上10 个与GTP 甲基化相关的氨基酸残基[109]。此外,位于NSP14 331 ~ 336 和414 ~ 428 之间的氨基酸残基也被认为是维持NSP14 活性所必需的位点。
4. 15 NSP15 NSP15 是CoV 中一种高度保守的蛋白质,能够在Mn2+的参与下切除病毒负链RNA 5′-端的多聚尿苷,帮助病毒逃避宿主免疫系统识别,确保病毒能够顺利在宿主细胞中复制[110-111]。SARSCoV-2 的 NSP15 共包含 10 个 α-螺旋和 21 个“β-strand”,可划分为3 个结构域,即N-末端结构域、中间结构域和C-末端结构域。N-末端结构域由1 个反平行的“β-sheet”组成,包含 2 个 α-螺旋(α1 和 α2),能够介导NSP15 形成六聚体。中间结构域由10 个“β-strand”组成。C-末端结构域具有核酸内切酶活性,由2 个反平行“β-sheet”和 1 个活性催化位点组成[41]。
在NSP15 突变的CoV 中,若NSP15 活性降低或彻底失活,依赖于DMA5(IF1H1,一种模式识别受体)的IFN 的表达就会增加,并激活宿主细胞对dsRNA的识别,进而激活机体的免疫保护机制,诱导受感染细胞发生凋亡[110]。有文献报道,NSP15 的过度表达可帮助病毒更好地应对机体的固有免疫反应,但目前尚未在实际的病毒感染中发现相应的现象[112]。
4. 16 NSP16 NSP16 的氨基酸序列在不同的CoV中是高度保守的,并且,不同CoV 中NSP16 的结构域和功能均很相似。如SARS-CoV 和MERS-CoV 的NSP16 / NSP10 复合物就表现出相似的结构[113-114]。对 SARS-CoV-2 NSP10 / NSP16 的异二聚体的晶体结构分析表明,NSP16 包含298 个氨基酸残基,内部含有“Rossmann-like β-sheet”折叠,被 11 个 α-螺旋、7 个“β-strand”和 2’-O-MTase 催化核心中的“loop”结构包围。“loop”和 α-螺旋之间夹杂着由 7 个“β-strand”形成的“β-sheet”[92]。
NSP16 包含 1 个 2’-O-甲基转移酶(2’-O-MTase)结构域,与NSP14 一样能甲基化位于GTP 上的“cap”结构。猫冠状病毒(feline coronavirus,FCoV)的NSP16能单独与含“cap”结构的RNA 特异性结合,并将其甲基从AdoMet 转移至第1 个N7 甲基化底物核苷酸的 2’-O 位置[114-116]。之前的研究表明,敲除 CoV的 NSP16 可阻断病毒 RNA 合成和复制[117]。当NSP16失活后,宿主细胞内的模式识别受体对病毒RNA的识别就会增强,进而抑制病毒在宿主细胞的复制增殖,这一现象在SARS-CoV、人冠状病毒229E(human coronavirus 229E,HCoV 229E)和 MHV 中均有发现[117]。值得注意的是,在NSP10/NSP16相互作用中包含的NSP10 残基在CoV 中是高度保守的。最近的研究表明,不同 CoV(FCoV、MHV、SARS-CoV、MERSCoV)的 NSP10 均能够激发 NSP16 的 2’-O-MTase活性。因此,针对NSP10 / NSP16 相互作用的化合物可能具有广谱的抗CoV 效应,而且已有实验证明了这一观点[116,118]。
CoV 是人类生命健康的一个巨大威胁,自本世纪以来,由CoV 引起的大流行已发生过3 起。与此同时,由于CoV 可在包括人类在内的多种哺乳动物间传播,很难彻底战胜这类病毒。而随着病毒在自然界不断变异和重组,未来我们还可能面临更多由CoV 带来的威胁。
目前,对于病毒流行性传染病的防治策略主要集中在疫苗及抗病毒药物的开发上。两者均需对病毒蛋白的结构及其在病毒复制过程中的功能有一个全面且清晰的认识。CoV 的 NSP 被认为在CoV 的复制和转录过程中扮演着重要地角色。而目前对SARS-CoV-2 的研究也证明,ORF1a / 1b 基因及蛋白产物的突变,可能对变异株的传播力、致病性和免疫原性具有一定地影响。
然而,相较于结构蛋白而言,我们对NSP 结构及功能的认识尚不足,因此对其研究是必要且急需的。通过对CoV NSP 结构及功能的研究,我们将会更深入地了解CoV 的复制过程和发病机制,这将为CoV 疫苗的设计(如减毒疫苗株或以减毒株为骨架的灭活疫苗株)及抗病毒药物开发提供更可靠的方向和途径,如以某个NSP 缺陷为基础,可进行SARSCoV-2 减毒型或复制缺陷型毒株的研发,这将为灭活疫苗的生产提供安全、高效的途径。而针对CoV复制过程中的一些重要且保守的功能位点,还可设计广谱且高效的抗CoV 药物。这些均将有助于我们更好地应对未来还可能出现的CoV 大流行。