赵 澄,卢芳国
(湖南中医药大学 1. 中西医结合学院; 2. 医学院,湖南 长沙 410208)
冠状病毒最先于1937年从鸡身上分离出来,1965年从普通感冒患者鼻洗液中分离出,并相继从人胚肾细胞和人胚气管中分离。1975年由国际病毒命名委员会正式命名为冠状病毒科[1]。根据血清学特性及基因序列的差异,分为α、β、γ、δ四属,其中α、β两属仅感染哺乳动物,另外两属表现为禽类易感。冠状病毒在人类和动物群体中广泛分布,可引起呼吸道、肠道、肝脏和神经系统疾病。普通型冠状病毒感染常呈现流涕、不适等感冒症状,症状轻微,具有自限性[2]。而高致病性冠状病毒侵袭人体,则表现为严重呼吸道症状,全身多器官受累甚至死亡。近年高致病冠状病毒多次肆虐全球,其中,包括2002年冬至2003年春流行的严重急性呼吸综合征冠状病毒(severe acute respirator syndrome coronavirus, SARS-CoV)、2012年流行的中东呼吸综合征冠状病毒(Middle East respiratory syndrome coronavirus, MERS-CoV)以及2019年冬至今流行的严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)[3-4]。目前,对于高致病性冠状病毒,尚无特效药治疗,疫苗也还处于研发阶段。据此,本文从病毒基因结构的特点出发,探析高致病性冠状病毒的致病机制,为高致病性冠状病毒感染的预防和治疗提供参考。
冠状病毒是已知基因组最大的单股正链RNA病毒,基因组长约27~32 kb,由6~11个开放阅读框(open reading frame,ORF)组成[5],编码非结构蛋白(nsp)、结构蛋白以及特异性辅助蛋白。其中,基因组5’端的三分之二序列属于ORF1,编码两个大的多聚蛋白pp1a和pp1ab,由病毒nsp3编码的木瓜蛋白酶结构域和nsp5的3C样蛋白酶分别识别切割nsp1-4和nsp4-16区域位点,形成16个非结构蛋白nsp,负责病毒的转录和复制[6]。基因组3’端的三分之一序列编码四种主要结构蛋白及辅助蛋白,按S(刺突蛋白)-E(包膜蛋白)-M(膜蛋白)-N(核衣壳蛋白)-3’端的顺序排列,辅助蛋白基因散布其间,共同介导入侵宿主细胞、参与病毒生命全周期以及致病过程[7]。
大基因结构的特性在适应和修饰基因方面赋予冠状病毒较大的可塑性[8],因而冠状病毒基因的重组率高,易出现变异和进化。目前,已发现七种可以感染人类的冠状病毒,其中SARS-CoV、MERS-CoV和SARS-CoV-2为高致病性冠状病毒,皆为β属冠状病毒[3]。研究者通过对病毒全基因组核苷酸序列的分析,发现这三种高致病性冠状病毒基因序列相似,其中SARS-CoV-2与SARS-CoV、MERS-CoV基因组序列同源性分别为79%和50%[9],序列差异主要在编码pp1a和S蛋白的基因上[10]。追溯高致病性冠状病毒的来源,研究者通过对SARS-CoV-2与Bat-CoV RaTG13的基因序列进行比对,发现两者相似度达96%[11],而SARS-CoV与蝙蝠冠状病毒同源性有87%~92%[12],说明体内携带多种病毒的蝙蝠可能是高致病性冠状病毒的天然宿主,是研究和防控的重点[13]。
SARS-CoV基因组长约29.7 kb,含有14个ORF,5’端和3’端有长约265 bp和342 bp的非翻译区,从5’端到3’端依次有ORF1a-ORF1b-ORF2-ORF4-ORF5-ORF9a编码两个多蛋白和S、E、M、N四个结构蛋白。另外还有八个特有基因(ORF3a、ORF3b、ORF6、ORF7a、ORF7b、ORF8a、ORF8b和ORF9b)排列于ORF2和ORF9a之间,编码辅助蛋白[14]。 这些基因编码的蛋白在SARS-CoV的致病过程中发挥重要作用。病毒增殖是其致病的基础,病毒增殖过程包括:吸附、穿入、脱壳、生物合成、组装和释放。病毒对宿主细胞的吸附是病毒增殖的第一环节。ORF2编码的S蛋白中S1亚基受体结合域(RBD)通过与宿主细胞的血管紧张素转换酶2(ACE2)受体结合,介导吸附;S2亚基随之发生构象改变,介导病毒包膜与宿主包膜融合,从而使病毒穿入宿主细胞中。ORF1a和ORF1b编码的非结构蛋白,组装成复制酶-转录酶复合物以及其他病毒复制所需酶类,负责病毒的转录和复制。ORF4、ORF5、ORF9a编码的E、M、N三个结构蛋白则参与SARS-CoV增殖过程的装配和释放。另外,ORF3a和ORF7a编码的3a和7a蛋白与S、M蛋白相互作用,参与病毒的吸附、装配和释放[15]。
ACE2是SARS-CoV与宿主细胞结合的主要受体之一[16],由于其广泛表达于肺泡上皮细胞、气管、支气管、支气管浆液腺、肺泡单核细胞、巨噬细胞以及肾、心、大脑等组织中[17-18],因此,SARS患者常表现为多组织多器官损伤。临床尸检报告发现,SARS患者除有弥漫性肺泡损伤、水肿、透明膜形成、组织纤维化及巨噬细胞、淋巴细胞浸润等肺部特征表现外,有三分之一以上的病例伴有急性肾小管损伤、心肌纤维水肿、脾萎缩以及淋巴细胞减少,少数病例还出现神经元水肿变性、腹泻等消化道症状[19-22]。
SARS-CoV的致病机制还与过度的免疫应答触发免疫病理损伤有关,其中包括单核细胞、巨噬细胞和中性粒细胞浸润增加,促炎细胞因子和趋化因子失调等[23-24]。特有基因编码的辅助蛋白在此过程发挥关键作用。其中3a和7a蛋白不仅能够激活NF-κB和JNK通路,上调促炎因子和趋化因子的表达,从而诱导免疫炎症反应的发生;还具有诱导宿主细胞凋亡、使细胞周期停滞等作用[15, 25]。3b和6蛋白有干扰素拮抗的作用,可通过不同机制抑制干扰素活性,对抗机体的抗病毒作用[26]。有学者对14例临床确诊SARS患者的细胞因子进行分析,发现患者早期血清中γ-干扰素诱导型蛋白10(IP-10),白介素-2(IL-2)和IL-6的水平显著升高,同时发现干扰素γ(IFN-γ)诱导的IL-8和IL-10水平升高[27],在其他重症患者中,也发现IL-6水平比轻症患者高[28],因此,说明辅助蛋白诱导的干扰素过度表达,可能是SARS-CoV感染患者后期出现免疫病理损伤的重要原因[29]。
MERS-CoV基因组全长约30 kb,由10个ORF组成。具有冠状病毒的一般特性,即5’端为ORF1a和ORF1b两个大的开放阅读框,编码16个非结构蛋白(nsps);3’端的ORF2、6、7、8编码S、E、M、N四个典型的结构蛋白。其特有的基因为ORF3,ORF4a,ORF4b和ORF5[30]。与SARS-CoV相似,MERS-CoV致病的第一环节由ORF2编码的S蛋白介导。不同的是,S1亚基需要双肽肽酶4(DPP4,又称CD26)作为其宿主细胞受体实现吸附[31],才能触发S2亚基的构象变化达到入侵目的。值得注意的是,ORF6、7、8编码的结构蛋白(E、M、N)、ORF1a、1b编码的非结构蛋白(nsp1、nsp4、nsp6、nsp8、nsp12、nsp13、nsp16)以及ORF3、4a辅助蛋白(3、4a)广泛参与病毒增殖过程中的生物合成、组装和释放[32]。
DPP4是一种多功能的细胞表面蛋白,广泛表达于肾、小肠、肝、前列腺的上皮细胞和活化的白细胞上,在呼吸道中,主要表达在肺泡上皮细胞,而在鼻腔和支气管则无表达[33]。这一分布特性在感染模型中得到充分体现。MERS-CoV动物感染模型中肺部有中性粒细胞和巨噬细胞浸润,同时伴有肺泡水肿[32]。而肾由于DPP4受体的高表达,MERS-CoV感染通过直接损伤或缺氧损伤引起肾功能障碍[34]。Assiri等[35]通过对47例临床确诊MERS患者进行观察,发现所有患者胸部X片出现异常,98%的患者出现发热症状,超过70%的患者出现咳嗽、呼吸急促等肺炎表现,20%左右的患者出现腹痛、腹泻、呕吐等胃肠道表现。另外,重症MERS患者92%具有休克、急性肾损伤及血小板减少等肺外表现[36]。可见,MERS-CoV感染患者的临床表现与病毒增殖过程中第一阶段(吸附)所需要的辅助蛋白(DPP4)的分布关系密切。另外,DPP4作为T细胞活化和T细胞免疫应答共刺激信号的关键因子,其大量表达也与MERS-CoV的致病密切相关[32]。
宿主免疫功能失调是MERS-CoV的另一致病机制。一方面,MERS-CoV通过感染人类巨噬细胞和树突状细胞,帮助病毒直接破坏宿主免疫系统,诱导细胞因子和趋化因子失调,引起宿主IFN-γ、IP-10、IL-8、IL-12、CCL-2、CCL-3、CCL-5、MHC-II类(HLA-DR)和共刺激分子CD86表达升高,这些细胞因子的促炎和过度免疫作用,可引起宿主严重炎症和组织损伤[37-38]。另一方面,其基因编码的辅助蛋白通过干扰宿主的免疫应答而实现其致病作用。如辅助蛋白4a、4b、5以及结构蛋白M是有效的干扰素(IFN)拮抗剂,抑制IFN的产生和其应答元件的信号传导,从而逃避宿主的抗病毒作用[39];4b和5蛋白还可以干扰NF-κB介导的先天免疫反应,影响宿主炎症因子的表达,减轻对病毒的损伤[40];蛋白激酶R(PKR)介导的应激反应也是重要的先天免疫反应之一,4a蛋白阻止了dsRNA介导的PKR激活,从而拯救了翻译抑制并防止了应激颗粒的形成,确保病毒转录和复制[41]。
SARS-CoV-2(NC_045512.2)基因组长约29.9 kb,具有编码12种蛋白的11个ORFs,与SARS-CoV和MERS-CoV类似的是SARS-CoV-2具有典型的5’端和3’端基因结构,编码非结构蛋白和结构蛋白,同时3’端还有编码六个辅助蛋白(3a、6、7a、7b、8和10)的特有基因。与SARS-CoV相比,SARS-CoV-2的ORF1ab中7个保守复制酶结构域的氨基酸序列具有94.4%的同一性,但是其总氨基酸序列存在380个替换,其中nsp3和nsp2中分别有102和61个氨基酸替换,S蛋白存在27个氨基酸替换,与之同源性约为75%[3,42],这些差异是否会影响SARS-CoV-2的宿主倾向和传播特性尚需进一步研究。
SARS-CoV-2与SARS-CoV具有相同的吸附、穿入机制,即通过ORF2编码的S蛋白与宿主细胞ACE2受体结合,并与宿主蛋白酶主要是跨膜丝氨酸蛋白酶2(TMPRSS2)协同作用,促进病毒穿入宿主细胞[43]。与SARS-CoV和MERS-CoV类似的是,SARS-CoV-2基因编码的蛋白广泛参与病毒增殖及致病过程。ORF1a和ORF1ab编码的非结构蛋白nsp7和nsp8形成异二聚体刺激nsp12(RNA依赖性RNA聚合酶)的合成,促进病毒增殖;nsp10、nsp13、nsp14、nsp16共同参与5’端甲基化帽形成,保证mRNA的输出,保护病毒免受宿主先天免疫反应;nsp8、nsp13和ORF5编码的M蛋白促进病毒感染期间高尔基体重构;nsp2、nsp6、nsp7、nsp10以及ORF4编码的E蛋白和ORF3a编码的3a蛋白修饰内膜区室促进病毒复制[44-46];nsp3则是病毒释放所必须的蛋白。
SARS-CoV-2的致病机制与S蛋白及其受体ACE2紧密联系。在病毒吸附、穿入环节,与SARS-CoV相比,SARS-CoV-2能力更强,这是因为其S蛋白受体结合结构域氨基酸序列发生突变,产生的Q493和P499氨基酸残基与ACE2受体结合更稳定[47-48]。另外,由于ACE2受体在肺部高水平表达,当SARS-CoV-2入侵宿主与其结合后,会下调ACE2水平而不影响ACE,造成肺内ACE2和ACE失衡[49],血管紧张素Ⅱ水平升高,过度激活肺部血管紧张素1型受体(angiotensin type 1 receptor,AT1R),导致肺部毛细血管通透性增加[50],引发肺水肿,进一步损害肺功能,继而可导致急性呼吸窘迫综合征(ARDS)。研究发现,ACE2表达水平在人群中男性高于女性,老年男性患者更容易出现合并症[51]。因此,ACE2受体作为SARS-CoV-2致病的重要一环,是疫苗开发的可考虑途径。
“细胞因子风暴”所引发的免疫病理损伤是SARS-CoV-2致病机制的重要环节。研究者经过冷冻电镜观察,SARS-CoV-2的ORF2编码的S蛋白三聚体结构相对紧凑,通过多糖屏蔽表位,帮助病毒实现免疫逃避[47]。SARS-CoV-2虽然可抑制IFN-I等干扰素的表达,但是IL-6、IL-8、CCL-2等炎症因子和趋化因子不受影响的升高,吸引更多的白细胞聚集,加速“细胞因子风暴”的发生[52]。其具体作用基因尚不明确,需进一步研究。相关临床报道也证实了“细胞因子风暴”的作用,研究者对首批41例确诊新型冠状病毒肺炎(COVID-19)疾病住院患者血清炎症因子进行检测,发现重症监护病房(ICU)的重症患者有更高水平的GCSF、IP10、MCP1、MIP1A和TNFα,说明“细胞因子风暴”可能是SARS-CoV-2感染患者由轻症向危重症转化及危重患者死亡的重要原因[53]。另外,有学者对463例COVID-19患者进行调查,发现重症患者的总淋巴细胞、CD3+、CD4+和CD8+T淋巴细胞数量减少,说明SARS-CoV-2可对人淋巴细胞施加重击,导致致命性肺炎[54]。这些致病机制与病毒基因所编码蛋白特性有关。
三种高致病性冠状病毒的基因结构和致病机制有相似之处,除了编码相似的结构蛋白和非结构蛋白外,还分别编码特有的辅助蛋白,共同在侵袭宿主的过程中发挥重要作用。一方面,介导病毒入侵宿主细胞,并迅速组装、释放病毒颗粒,直接损伤宿主细胞;另一方面,介导宿主的免疫应答,攻击宿主免疫细胞,干扰先天免疫应答,实现免疫逃逸,同时,病毒蛋白还可通过上调宿主炎症因子和趋化因子的表达水平造成组织免疫病理损伤。因此,关于高致病性冠状病毒感染的防治,可以针对起相关作用的病毒基因及其编码的蛋白开发相应药物,如:S蛋白受体拮抗剂、nsp3靶向抑制剂、特异性辅助蛋白抑制剂等,通过抑制病毒的增殖,减轻对宿主免疫应答的影响而达到防治目的。另外,除了病毒的攻击外,宿主的免疫应答在高致病性冠状病毒疾病的发展过程中也扮演着重要的角色,在此类感染性疾病中,老年人和有慢性基础疾病者病死率高,因此,尽早进行免疫治疗,也是应关注重点之一。