韩鹏宇,郑慧芳,毕秀欣,孙殿兴
冠状病毒(Coronavirus ,CoVs)在系统分类上属冠状病毒科(Coronaviridae)冠状病毒属,因其外包膜突起颗粒形似冠状而得名。CoV基因组是单股正链RNA(+ssRNA),大小约为27~32 kb,序列长度在所有RNA病毒基因组中排名第2。相比其它RNA病毒,之所以CoV具有较大基因组,主要与其复制保真度有关,而庞大的基因组又进一步促进了CoV获取额外的基因,用来编码辅助蛋白,从而适应特定宿主[1]。因此,重组、基因交换和基因插入或删除引起的基因组变化在CoVs中很常见。由于下一代测序技术的广泛应用,新的CoV正在不断被发现,病毒亚系也在迅速扩展。根据最新的国际病毒分类委员会(ICTV)分类,CoV共有4个属(α, β, γ, δ),由亚系的38个独特物种组成[2]。因为目前仍然有许多未分类的CoVs, 未来CoVs的物种数量还将继续增加[3-4]。CoVs 会导致家畜,野生动物和人类患病,其中α和β 属CoVs主要感染哺乳类动物,γ和δ属CoV主要感染鸟类[5]。
SARS冠状病毒(severe acute respiratory syndrome-corona virus,SARS-CoV)起源于中国,然后蔓延到世界其它地区,在2002-2003年大流行期间感染了大约8 000人,总病死率为10%。MERS冠状病毒(Middle East Respiratory Syndrome- corona virus,MERS-CoV)自2012年在中东出现以来,传播到27个国家,导致2 249例实验室确诊病例,平均病死率为35.5%(截至2018年9月)[6]。除上述两种CoV外,α-CoVs 229E,NL63,β-CoVs OC43 和HKU1 也可引起较轻微的人类呼吸道疾病[7]。此外,CoVs在家畜和野生动物中也可引起疾病大流行[8-9]。猪急性腹泻综合征冠状病毒(swine acute diarrhea syndrome corona virus, SADS-CoV)最近被确定为引发2016年广东省清远市猪群致死性腹泻疫情的病因,该疫情导致2万多头仔猪死亡[8]。分别属于α-CoV 和猪δ- CoV(PDCoV)的流行性猪腹泻病毒(PEDV)和传染性胃肠炎病毒(TGEV)是对食品产业冲击较大的新发和再发病毒,此外,冠状病毒也与水貂的胃肠炎(MCoV)和鲸鱼死亡(BWCoV-SW1)有关[9]。
2.1疫情概况 SARS于2002年底首次出现于中国广东省,导致一种新型临床重症疾病(“非典型肺炎”),其特征是发热、头痛及随后出现的呼吸道症状,包括咳嗽、呼吸困难和肺炎。SARS在人类中快速传播,迅速蔓延至中国香港及其他省份,随后蔓延至其他28个国家[13-14]。截止2003年7月,全球范围内共报道8 069例SARS确诊病例,波及29个国家,其中死亡病例774例(9.6%)。2004年又新增4例病例,并未出现死亡病例和传播扩散[15]。
2.2基因结构分析 冠状病毒基因组在5′至3′的特征基因顺序方向上有6~7个主要开放阅读框(ORF)。其中,ORF1a和1b,约占CoV基因组的三分之二,负责编码非结构多蛋白;下游4个ORF编码结构蛋白:spike蛋白(S)、envelope蛋白(E)、membrane蛋白(M)和nucleocapsid蛋白(N)。有些冠状病毒在ORF1b和S之间具有血凝素-酯酶(HE)基因。冠状病毒除保守基因序列外,SARS-CoV基因组还包含许多特定的附属基因,包括ORF3a、3b,ORF6、ORF7a、7b,ORF8a、8b和9b[16-18]。
相比SARS,MERS-CoV 编码5种独特的附属基因:ORF3、ORF4a、ORF4b、ORF5和ORF8b。在发现MERS-CoV时,上述附属基因均未被证明与其他已知的冠状病毒基因相关。MERS-CoV中7个保守复制酶序列的氨基酸(aa)特征与先前发现的两种蝙蝠冠状病毒:BtCoV-HKU4和BtCoV-HKU5相似。根据国际病毒分类委员会(ICTV)的分类标准,SARS-CoV和MERS-CoV代表了β病毒属中2种新的冠状病毒物种。β冠状病毒的成员被分成4个谱系,A、B、C和D。SARS-CoV和MERS-CoV分别聚集在谱系B和C[19-21]。
2.3.1最初猜测 流行病学调查显示,2002-2003年“非典”早期病例和2004年出现的4例病例均有动物接触史。分子生物学检测和病毒分离研究显示,引起“非典”流行的SARS-CoV可能源于在农贸市场中交易的果子狸,而后续对果子狸的大规模扑杀也使得“非典”疫情逐渐得到控制,似乎也间接印证了果子狸是非典疫情的源头。
2.3.2后续追踪调查 由于早期SARS病例为在餐馆工作并接触野生动物的工作人员,所以先期的调查重点为市场销售的野生动物。研究人员调查了深圳一家动物市场,被抽查的动物包括7种野生动物和1种家养动物,它们来自中国南方的不同地区,在到达市场之前一直存放在单独的仓库里,这些动物在市场里停留了一段时间,每个摊主只售卖几只特定物种的动物,研究者对市场内不同摊位的动物进行了取样,收集鼻腔和粪便样本,其中,从果子狸的鼻拭子中分离的两个病毒(SZ3和SZ16)被完全测序,其全长基因组序列与人类SARS-CoV有99.8%的同源性。通过对比动物SL-CoV(SARS-like CoV)病毒与人类SARS-CoV的S基因发现,动物病毒与人类病毒分属不同谱系。完整基因组比较发现,相比于动物,人类SCoV的N基因上有29nt的删除,删除点位于N基因起始密码子上游246 nt。动物病毒中额外的29nt序列导致开放阅读框ORF10和11融合为编码122个氨基酸的新ORF。4种动物SLCoVs和11种人类SARS-CoVs的S基因序列拥有38种核苷酸多态性,其中26种为非同义变化。4种动物SLCoVs之间的S基因有8个核苷酸差异,而11种人类病毒之间存在20个核苷酸差异。因此,动物SLCoVs虽然是从一个市场分离的,但却与从香港、广东、加拿大和越南分离的人类病毒具备相似的多样性[22]。
在2004年1月果子狸扑杀开始前,研究者在广州市新源动物交易市场的18家供应商中,随机挑选出91只果子狸(Paguma larvata)和15只浣熊狗(Nyctereutes procyonoides)进行采样,通过对样本N基因和P基因的实时荧光定量PCR和巢式RT-PCR检测发现,所有样本SL-CoV呈阳性反应[24]。此外,与前期研究相同的是,在人类SARS-CoV中删除的29nt序列在此次所有动物样本中均可检测到。为了追踪SL-CoV病毒的地理来源,研究者从市场销售商声称的动物交易来源省份抽取了1 107只果子狸进行检测。这些来源省市包括安徽、北京、福建、广西、河南、河北、湖北、湖南、江苏、江西、山西和陕西。然而,2004年1月至9月期间,采用同种方法,在以上地区采集的1 107个果子狸SL-CoV检测却均呈阴性[23]。新源动物市场销售的动物种类多,包括活驴、小牛、山羊、绵羊、小猪、美国水貂、浣熊狗、养殖狐狸、猪獾、豪猪、狸獭、豚鼠、兔子和鸟类。对果子狸(2003年和2004年)和人类患者(2004年)病毒的5个主要编码序列(ORF1ab、S、E、M和N)进行突变率分析表明,SARS-CoV和SL-CoV在人类和果子狸中以相对恒定的速率进化[24]。
当时,研究者怀疑,果子狸、浣熊狗和雪貂都是被一种迄今仍不为人知的动物宿主所感染,而由于中国南方的烹饪习俗,城市中销售的野生动物很可能通过中间宿主传染人类。
2.3.3跨物种传播屏障 随着研究的深入,人们发现血管紧张素转化酶2(ACE2)是SARS-CoV进入细胞的受体,SARS-CoV S 蛋白的193 个氨基酸片段(aa 318-510)可有效地结合ACE2,并被定义为SARS-CoV的受体结合域(Receptor Binding Dormine,RBD)。晶体结构分析显示, 与ACE2直接接触的(aa 424-494)子域为受体结合引发域(Receptor Binding Motif,RBM)。在RBM中,几个关键氨基酸物对受体结合至关重要,而不同SARS-CoV分离毒株中关键氨基酸的改变会导致其与受体结合能力的变化[25-27]。
在随后的研究中,人们从晶体结构角度解释了果子狸SL-CoV不能直接传染人类的原因。人类流行性感染病毒株hTor02中的479氨基酸残基为天冬酰胺(asparagine),但果子狸病毒株cSz02的479氨基酸残基为赖氨酸(lysine,Lys)。人类ACE2 Lys31 在疏水环境中与人类ACE2 Glu35 形成盐桥,果子狸Sz02毒株的Lys479 会与人类Lys31竞争Glu35, 使受体结合不稳定。而果子狸ACE2 的Thr31不与Glu35竞争形成盐桥,从而使得有足够的Glu35与果子狸Sz02 Lys479形成盐桥从而稳定结合接口,所以,拥有Lys479的果子狸病毒株对果子狸ACE2有较高的亲和力,而非人类ACE2。此外,人类毒株hTro02中的487残基为苏氨酸(threonine),果子狸毒株cSz02中的487残基为丝氨酸(serine),在疏水环境中,Lys353与人类ACE2的Asp38形成盐桥,这个过程需要甲基化的Thr487,而低致病性的人类毒株hcGd03中的487残基为丝氨酸,这也解释了为何其不能在人间传播。相比而言,果子狸ACE2 中的Glu38侧链比人类ACE2 中的Asp38 长,在没有甲基化Thr487支持的情况下,也可以与 Lys353 形成盐桥,因此,带有Ser487的果子狸病毒株可以在果子狸中传播,但不能人传人。因此,果子狸毒株不能感染人体细胞,因其不适应人类ACE2,而SARS-CoV已经进化,通过逐步突变在RBD上获得可以持续感染人类细胞的氨基酸残基479和487[28]。
2.3.4突破 为进一步探寻SARS的真正自然宿主,研究者在中国云南省昆明市的1个调查点对中华菊头蝠 (Rhinolophus sinicus)群落进行了纵向调查(2011年4月至2012年9月),并从蝙蝠肛拭子和粪便样本中发现了两种新毒株,即RsSHC014和Rs3367。毒株全长基因组序列被确定,大小均为29 787 bp(不包括多聚腺苷酸尾)。两个新发现的毒株基因组与人类SARS-CoV(Tor 2)的基因组同源性为95%,显著高于之前在中国(88%~92%)和欧洲观察到的蝙蝠SL-CoVs(76%)。研究者从SL-CoV PCR阳性样品中成功分离出活体病毒株。序列分析表明,分离出的毒株与Rs3367几乎相同,两者拥有 99.9%的基因同源性,而S1区氨基酸序列更是达到了100%相同。该分离株被命名为SL-CoV-WIV1。
通过病毒转染表达和不表达ACE2的不同细胞,研究者发现WIV1能够使用包括不同物种来源的ACE2作为受体,并在表达ACE2的细胞中有效复制。这是人类首次发现能够使用ACE2作为受体的野生型蝙蝠SL-CoV,为证明SARS-CoV起源于蝙蝠提供了最明确的证据[29]。在另一项研究中,研究者在中国云南省1个马蹄蝠栖息洞穴中对SL-CoVs进行了5年的持续监测,发现了11个新的SL-CoV毒株,这些新毒株在S基因,ORF3和ORF8上具有多样性。细胞学实验表明,11个新毒株中有3个毒株能够使用人类ACE2作为受体,且其S蛋白序列也各不相同[30]。
这项发现为认识SARS-CoV的起源和演变提供了新的见解,同时也警示人们,未来出现类似SARS的疾病的可能性。由于蝙蝠群落中存在基因池丰富的SL-CoVs,科学界普遍认为,由蝙蝠传播的CoVs很可能重新出现,导致下一次疾病暴发,而中国可能是下一个暴发地。
3.1疫情初始 2019年12月下旬,湖北武汉多家医疗机构报告,发现不明原因肺炎患者。2019年12月27日,武汉1家医院收治了3名重症肺炎患者。患者甲为49岁妇女,乙为61岁男子,丙为32岁男子。临床资料显示,患者甲无潜在慢性疾病,报告发热 (体温37 ℃到38 ℃) ,咳嗽,胸部不适,发病4天后,咳嗽和胸部不适恶化,但发烧减退。甲的职业是海鲜批发市场的零售商。患者乙最初于2019年12月20日报告发热和咳嗽,呼吸窘迫在发病7天后出现,并在接下来的2 d内恶化,流行病调查显示,乙经常光顾海鲜批发市场。患者甲和丙于2020年1月16日康复出院,患者乙于2020年1月9日死亡[31]。
3.2分子生物学调查 2019年12月30日,武汉金银潭医院采集了患者的支气管肺泡灌洗液,并进行检测,未发现HCoV-229E, HCoV-NL63, HCoV-OC43, HCoV-HKU1等病毒。通过联合Illumina 和nanopore 测序技术,实验人员在一个样本中发现了1株与蝙蝠SL-CoV(bat-SL-CoVZC45, MG772933.1)同源性达85%的新病毒序列。该病毒随后被成功分离并命名为2019-nCoV。经检测,3名患者均为2019-nCoV阳性。序列分析显示,从患者支气管肺泡灌洗液中得到的两个近乎全长的冠状病毒序列与先前公布的蝙蝠SL-CoV(SL-CoVZC45,MG772933.1)具有86.9%的同源性。进化树分析显示,3名患者的2019-nCoV基因组聚集在一起,显示出典型的β冠状病毒组织结构[31]。
随后的研究又陆续得到6个几乎相同的新型冠状病毒基因组,研究人员选取WH-human_1基因组作为代表与SARS-CoV 和 MERS-CoV进行比对发现,其与SARS-CoV基因组的序列同源性更高。WH-human_1与SARSCoV_Tor2之间的序列差异主要集中于ORF1a和S蛋白基因,WH-human_1与中东呼吸综合征(MERS-CoV)的序列同源性较差。谱系分析显示,蝙蝠可能是武汉CoV的原生宿主,同时,还可能存在从蝙蝠传播到人类的中间宿主。基于武汉CoV在遗传谱系中的独特位置,它很可能与SARS或SARS样冠状病毒有共同祖先,但由于其进化过程中发生的频繁的重组事件,导致其谱系路径变得模糊。
总体而言,2019-nCoV和SARS-CoV 之间存在较大的遗传学距离,这种距离在对比MERS-CoV时更为明显[32]。同源重组是生物进化的重要力量,其发生在许多病毒中,包括登革热病毒、人类免疫缺陷病毒、乙型肝炎病毒、丙型肝炎病毒和经典猪瘟病毒等[33-37]。研究发现,发生在2019-nCoV上21 500~24 000 bp 的同源重组源于蝙蝠-冠状病毒和1种未知病毒的结合,而这种在S基因蛋白上的重组可能是促进2019-nCoV跨物种传播到人类的关键[38]。
3.3病毒感染机制分析 由于2019-nCoV与SARS-CoV和MERS-COV的遗传学距离较远,那么2019-nCoV是采用与SARS-CoV或MERS-CoV相同的跨物种传播机制,还是涉及一种新的、不同的传播机制呢?如前所述,冠状病毒的S蛋白分为两个功能单元,S1和S2,S1 通过与受体结合来促进病毒感染宿主。S1包含两个域,N 终端域和 C-终端 RBD 域(直接与宿主受体作用)。尽管2019-nCoV与SARS-CoV的S蛋白序列同源性较低,但在RBD域却有几段与SARS-CoV_Tor2和HP03-GZ01高度同源性的序列。先前的研究指出,SARS-CoV中S蛋白的442、472、479、487和491氨基酸残基参与组成受体界面复合结构,对SARS-CoV的跨物种和人际传播至关重要,而2019-nCoV中 S蛋白的RBD域高度保守,以上5个关键位点仅保留了Tyr491,但令人惊奇是,尽管其442、472、479和487位置的氨基酸被替换,其S蛋白的空间结构并未改变。此外,2019-nCoV和SARS-CoV 的S蛋白在RBD域的三维结构近乎相同,从而在受体交互界面产生相似的范德华力和静电特性,因此,2019-nCoV的S蛋白被认为对人类ACE2具有较强的结合亲和力,并可能通过S蛋白-ACE2结合途径在人际间传播[39]。另一项关于COVID-19蛋白结构的研究也表明,虽然其S蛋白受体结合域关键残基与SARS-CoV不同,但其与人类ACE2作用时,却仍能产生类似于SARS-CoV与人类ACE2结合时的空间结构与亲和力[40]。
为进一步证实COVID-19是否通过ACE2途径感染人类,中国武汉病毒研究所的人员开展了病毒感染实验,使用表达和不表达ACE2蛋白的细胞进行病毒转染实验,结果显示,COVID-19仅可以进入表达人类、果子狸、猪和中华菊头蝠ACE2的赫拉细胞,从而进一步证实了COVID-19是通过ACE2途径感染人类[41]。通过晶体结构分析发现,COVID-19 RBD区域与ACE2受体的整体结合模式与SARS-CoV RBD几乎相同,COVID-19中结合ACE2的氨基酸残基或高度保守,或与SARS-CoV RBD中残基具有相似的侧链特性,这种结构和序列上的相似性提示COVID-19和SARS-CoV RBD之间存在融合进化现象[42]。此外,值得注意的是,近期的研究显示,不同于早期病例体内发现的病毒序列,后期二代病例体内的COVID-19在开放阅读区1ab、7a、8及S蛋白编码区有17个非同义突变,提示这些位点的突变可能增加了病毒人际间传播的能力[43-44]。后续的研究应持续关注病毒变异的情况,及时掌握其适应人类ACE2受体的进化方向。
在关注ACE2途径的同时,需要注意的是,冠状病毒跨物种或人际传播的风险也受宿主免疫反应、病毒复制效率、病毒突变率等许多其他因素的影响。
3.4自然宿主相关研究 最近一项基于病毒全基因组数据分析的研究对COVID-19的进化来源进行分析,通过对比96个COVID-19病毒序列全基因组,发现120个变异位点并得到58种单倍型,为了解病毒进化路径提供了参考[45]。然而,由于上述研究的样本量较小,为更准的预测病毒来源和进化路径,还需要对更多样本进行测序,掌握更多地区和时间段发病病例的病毒基因组序列。最近的一项研究发现,蝙蝠冠状病毒(Bat SARSr-CoV RaTG13)与COVID-19的基因序列同源性高达96%,研究者据此推断蝙蝠可能是COVID-19的原生宿主[46]。然而,蝙蝠携带的CoVs很少直接感染人类,所以蝙蝠不太可能是导致该流行病的直接原因。最新的一项研究调查了2019年3月-12月被海关和广东林业厅收缴的走私马来穿山甲 (Manis javanica),其体内分离的冠状病毒在E、M、N和S蛋白区域与COVID-19分别具有100%、98.2%、96.7%和90.4%的氨基酸同源性,值得注意的是,穿山甲冠状病毒的S蛋白的受体结合域与COVID-19的受体结合域几乎相同,仅存在一个氨基酸差异,此外,晶体结构分析显示,穿山甲冠状病毒与穿山甲ACE2有一定亲和力[47]。然而,还需要通过感染实验进一步证实穿山甲体内发现的冠状病毒是否采用ACE2受体作为感染途径。此外,基于现有基因组数据的研究提示,COVID-19可能源于穿山甲-CoV的病毒与蝙蝠-CoV-RaTG13病毒的重组[48-49]。
自2003年以来,冠状病毒第3次在人类历史上引发了严重疾病流行。根据最新的研究显示,2019-nCoV 可在用于培养SARS-CoV和MERS-CoV的相同细胞中繁殖,值得注意的是,2019-nCoV在人类呼吸道上皮细胞中生长更好,这点与SARS-CoV或MERS-CoV不同。相比之下,MERS-CoV自发现以来,序列并没有发生实质性变异,其感染人类的能力也未见提高。所以,2019-nCoV 可能更像 SARS-CoV,通过增强与人类ACE2 的结合力而适应人类宿主。为了及时掌握病毒的变异情况,必须尽可能多的获取不同时间、地理位置发病患者病毒分离物的序列,动态评估病毒变异的程度,判别这些突变是否朝着适应人类宿主的方向发展。
尽快确定病毒的来源是另一个急需解决的问题。冠状病毒可感染哺乳动物、鸟类和爬行动物,包括人类、猪、牛、马、骆驼、猫、狗、啮齿动物、鸟类、蝙蝠、兔子、白鼬、水貂、蛇等[50-52]。然而,目前还未从任何野生动物中发现2019-nCoV。近年来,分子生物学领域技术迅猛发展,不同于“非典”疫情时期,现在的基因测序技术可以在短时间内得到病毒的全基因组数据,在未知病原体检测方面发挥了重要作用。尽管如此,截至目前,人们尚未发现2019-nCoV的原始宿主,病毒进化的速度似乎又一次领先了科学的发展速度。冠状病毒在自然界中的宿主广泛,而其本身又变异频繁,贩卖野生动物的行为不仅为病毒提供了多物种的基因资源,同时也为病毒探索如何感染人类提供了实验机会。病毒在挑战人类科学水平和生存意志力的同时,也启示人们需要对自己的行为进行反思。