贾宝迁 肖艳 王营 任丽丽 王健伟
作者单位:100730中国医学科学院病原生物学研究所
2013-2015年人冠状病毒OC43基因型分布特点的研究
贾宝迁 肖艳 王营 任丽丽 王健伟
作者单位:100730中国医学科学院病原生物学研究所
目的 研究人冠状病毒(Human Coronavirus,HCoV)OC43的基因型分布特点,为阐明HCoV-OC43的分子流行规律提供数据参考。方法 从2013年-2015年HCoV-OC43检测阳性的呼吸道样本中提取核酸,用逆转录方法扩增cDNA,利用特异性引物扩增全长纤突蛋白基因(S)、聚合酶基因(RdRp)和核蛋白基因(N)。用Mega 6.0软件进行序列拼接、进化树构建和S蛋白氨基酸比对。结果 从16份HCoV-OC43阳性样本中获得全长S、RdRp和N基因。其中2013年的1株为D基因型,2014年的8株均为D基因型,2015年的7株中包括3株B、3株D和1株E(CH)基因型。B和D基因型的S蛋白分别有9个和16个氨基酸位点的突变与分离年份有关,B基因型中氨基酸突变呈累加现象,D基因型中出现连续突变和回复突变。结论 HCoV-OC43表现为多基因型共流行,D基因型高流行。抗原蛋白S的氨基酸突变在各基因型流行中起重要作用。本研究为完善和丰富对HCoVOC43的分子流行特征的认识提供了数据参考。
【主题词】 人冠状病毒OC43;基因型;突变;流行
Fund programs:Nationa1 Major Science&Techno1ogy Project for"Contro1 and Prevention of Major Infectious Diseases of China" (2012ZX10004206);New Century Exce11ent Ta1ents in University (3332013127)
人冠状病毒(Human Coronavirus,HCoV)是常见的呼吸道病毒,为巢病毒目冠状病毒科冠状病毒属成员,是有包膜的单股负链RNA病毒[1]。在已经发现的六种HCoV(229E、NL63、OC43、HKU1、SARSCoV和MERS-CoV)中,HCoV-OC43在人群中的检出频次最高,且由于其从1967年就被发现,是用于研究HCoV分子流行特点的重要模型[1,2]。HCoVOC43基因组全长约30.7 kb。编码包含16个非结构蛋白的开放阅读框架1ab、ORF2a、血凝素-酯酶蛋白、纤突蛋白(Spike,S)、ORF5a、小囊膜蛋白、膜蛋白和核衣壳(Nuc1eocapsid,N)蛋白[1]。其中抗原基因S、聚合酶RdRp和N蛋白的基因是HCoV进化分析的主要功能基因[2-4]。
基因重组和基因突变是病毒进化采用的两种策略[5]。现有研究发现 HCoV-OC43有多种基因型[2-4,6],由重组产生的新基因型不断出现[2,3,6]。基于全长的S、RdRp和N基因的分型研究表明,有A、B、C、D、E(中国命名,CH)和E(法国命名,FR)6个基因型及 F和 G分枝[2-4]。前期对我国 2005-2012年的HCoV-OC43的研究发现存在B、C、D基因型共流行,在2010年后出现重组产生的新 E (CH)基因型[2]。上述发现对初步阐释HCoV-OC43的流行趋势提供了重要参考,而明确病毒的流行规律还需要更长的研究时间和更多的基因序列信息。因此,我们对2013年至2015年流行的HCoV-OC43开展了进化分析,以完善和丰富对其分子流行特点的认识。
1.1样本来源 HCoV-OC43阳性的呼吸道样本来自2013年至2015年采集自北京儿童医院、北京协和医院、深圳市第三人民医院和哈尔滨医科大学附属第二医院的呼吸道感染病例,样本采集均具备知情同意。
1.2核酸提取与基因扩增 用easyMAG全自动核酸提取仪(法国生物梅里埃)提取总核酸,最终洗脱体积为55μ1。取6μ1总核酸为模板,用SuperScriptTMIII逆转录试剂盒、随机引物pN(6)和O1igod(T)(美国Invitrogen产品)进行逆转录。取1 μ1 cDNA为模板进行PCR扩增。扩增S、RdRp和N基因的特异性引物及PCR反应条件参考Zhang等的报道[2]。PCR扩增产物进行直接测序或者克隆测序。
1.3全基因组序列的拼接与进化分析 获得的测序序列在MEGA(版本6.0)软件中进行拼接,以GenBank中发表全序列为参考,牛冠状病毒(Bovincoronavirus,BCoV)mebus株为外源序列构建进化树[7]。
1.4氨基酸突变位点分析 将本研究获得的S蛋白氨基酸序列按照基因型分组,与GenBank中发表的序列用MEGA(版本6.0)中C1usta1W比较分析S蛋白氨基酸突变情况。B和D基因型氨基酸位点参比株分别为 87309-BE03(AY903459)和 HK04-02 (JN129835)。
2.1基因扩增结果 通过对研究期间HCoV-OC43病例样本的基因扩增,从其中16例病例样本中获得S、RdRp和N全基因序列,病例年龄分布1个月~64岁。病例的各年分布分别为2013年1例,2014 年8例,2015年 7例。序列 GenBank编号为KU745533-KU745580。
2.2序列进化分析 将获得的S、RdRp和N基因与GenBank中发表的参考基因序列进行比对,以BCoV Mebus株为外源序列构建了进化树。如图1所示,在S基因进化树上,本研究分离的3株HCoVOC43毒株与已知的B基因型位于同一进化分枝,12株与已知的D基因型进化关系较近,1株与本课题组前期发现并命名的E(CH)基因型进化关系较近。基于N和RdRp基因的进化分析结果与S基因的结果相似。
2.3各基因型年分布特点 为进一步明确各基因型的年度分布特点,将明确分型的16株样本按采集年份绘图。如图2所示,2013年的1例和2014年的8例均为D基因型,2015年的7例分别为3例B、3 例D和1例E(CH)基因型。
2.4S蛋白氨基酸位点的突变分析 在B基因型中,与 2003年首次鉴定的毒株 87309-BE03 (AY903459)比较,其后获得的毒株S蛋白有9个氨基酸位点突变与分离年份相关。如表1所示,2004年后毒株均出现L69I突变,2006年后增加R34I和F481L,2008年后增加F31L,2010年后增加K184N、D266N和E805D,2012年的毒株增加了N470D和L504S。在各年分离的D基因型有16个位点的氨基酸突变与分离年份相关。如表2所示,与2004年的HK04-02(JN129835)比较,其后分离的毒株序列有4个氨基酸位点出现连续突变,包括L/R265P、G/Y/H521S、P/F535L和C/T546S;4个位点为回复突变N/D33N、T/K93T、D/H120D和L/S195L;8个位点为单向突变,包括 P22T、P38L、K90L、K184N、S263R、D266K、I267D和T276S。
●本研究获得的毒株图1 HCoV-OC43 S、N和RdRp基因进化树●Strains in this studyFig.1 Phy1ogenetic trees of HCoV-OC43 S,N and RdRp genes
图2 HCoV-OC43阳性样本基因型时间分布Fig.2 Genotype distributions of HCoV-OC43 over time
HCoV-OC43基因遗传多样性首次于2005年由比利时的研究小组报道[6]。2011年Lau等首次用2004-2011年在中国香港收集的29株HCoV-OC43病例样本将HCoV-OC43分为A-D 4个基因型,2004年出现基因重组来源的D基因型[3]。本课题组前期对我国2005-2012年北京等地区采集的65株序列的研究,发现存在B、C和D基因型的共流行,2010年出现重组产生的新E基因型[2]。随后,Kin等对2001-2013年15株来自美国和法国的序列分析,提出存在E基因型,基于RdRp和N基因分析提出存在F和G分枝[4]。但Kin等提出的E(FR)基因型与基于我国样本发现的E(CH)基因型毒株序列并不在同一个进化分枝上。本研究结果表明我国2013-2015年的HCoV-OC43仍为B、D和E(CH)基因型。这与已有的研究结果一致[2],提示近年我国HCoV-OC43基因型的稳定流行。
抗原基因S氨基酸突变在HCoV-OC43流行中具有重要作用[7]。以往研究发现B基因型中也存在S蛋白氨基酸的突变[7]。基于本研究增加的2015年B基因型序列,进一步明确在S1区域氨基酸突变位点随分离年份呈逐年累加的特点。在D基因型中发现已有报道的N33D、K90L和K184N仍存在2013年后的D基因型中[7],但是93、120和195位出现回复突变,而521位点由Y/H连续突变到S,263R和265P仅在2015年后的D基因型中检测到,D基因型中的回复突变和连续突变在以往的研究中未见报道。上述从B和D基因型中发现的氨基酸突变位点和特征,对深入探讨S基因在CoV进化中的突变容量极限提供了重要的数据参考。
对HCoV-OC43遗传多样性的研究报道来自多个国家和地区,但各基因型或分枝的出现具有明显的时间分布特征,包括E(FR)1983-2005年,F1995-1996年,B2003-2006年/2010-2015年,C2004-2006年,D2004-2015年,E(CH)2010-2015年,G2012年[2-4,6,7]。表明HCoV-OC43在全球具有相似的分子流行特征。本研究关于基因型分布特点的分析为完善和丰富对HCoV-OC43的分子流行特征的认识提供了数据参考。
表1 不同时间分离的B基因型S蛋白氨基酸位点突变分析Tab.1 Amino acids mutations of S protein for B genotype over time
表2 不同时间分离的D基因型S蛋白氨基酸位点突变分析Tab.2 Amino acids mutations of S protein for D genotype over time
致谢:感谢首都医科大学附属北京儿童医院、中国医学科学院北京协和医院、深圳市第三人民医院和哈尔滨医科大学附属第二医院的临床工作人员协助采集临床样本。
[1] Michae1 MCL,Stan1ey P,Larry JA.Fie1ds viro1ogy.Lippincott:Wi11iams&Wi1kins,2007,1305-1327.
[2] Zhang Y,Li J,Xiao Y,et a1.Genotype shift in human coronavirus OC43 and emergence of a nove1 genotype by natura1 recombination.J Infect,2015,70:641-650.doi:10.1016/j. jinf.2014.12.005.
[3] Lau SK,Lee P,Tsang AK,et a1.Mo1ecu1ar epidemio1ogy of human coronavirus OC43 revea1s evo1ution of different genotypes over time and recent emergence of a nove1 genotype due to natura1 recombination.J Viro1,2011,8:11325-11337.doi:10.1128/ JVI.05512-11.
[4] Kin N,Miszczak F,Lin W,et a1.Genomic ana1ysis of 15 human Coronaviruses OC43(HCoV-OC43s)circu1ating in France from 2001 to 2013 revea1s a high intra-specific diversity with new recombinant genotypes.Viruses,2015,7:2358-2377.doi:10.3390/v7052358.
[5] Lai MM.RNA recombination in anima1 and p1ant viruses. Microbio1 Rev,1992,56:61-79.
[6] Vijgen L,Keyaerts E,Lemey P,et a1.Circu1ation of genetica11y distinct contemporary human coronavirus OC43 strains.Viro1ogy,2005,337:85-92.doi:10.1016/j.viro1.2005.04.010.
[7] Ren L,Zhang Y,Li J,et a1.Genetic drift of human coronavirus OC43 spike gene during adaptive evo1ution.Sci Rep,2015,5:11451.doi:10.1038/srep11451.
The characteristics of genotype distributions for human coronavirus OC43 between 2013 to 2015
JiaBaoqian,Xiao Yan,Wang Ying,Ren Lili,Wang Jianwei Institute of Pathogen Biology,Chinese Academy of Medical Sciences,Beijing 100730,China
Ren Lili,Email:renliliipb@163.com
Objective To identify the characteristics of HCoV-OC43genotype in recent years. Methods Nuc1eic acids were extracted from HCoV-OC43-positive respiratory specimens co11ected from 2013 to 2015.The cDNA were generated by reverse transcription.Specific primers were used to amp1ify the fu11 1ength of spike(S),RNA dependent RNA po1ymerase(RdRp)and Nuc1eocapsid(N)genes.The sequences assemb1ing,phy1ogenic ana1yzing and amino acids a1ignments were performed by using Mega 6.0 software.Results The genes were successfu1 amp1ified from 16 HCoV-OC43 c1inica1 samp1es.Of the 16 strains,1 from 2013,a11 8 from 2014 and 3 from 2015 be1onged to genotype D,and 3 from 2015 be1onged to genotype B,and 1 from 2015 be1onged to genotype E named by China,E(CH).The coding po1ymorphisms were found in S protein,with 9 sites in B and 17 sites in D genotypes were between chrono1ogica11y distinct strains.Accumu1ations of amino acids mutations were observed during the evo1ution of B genotype,whi1e reverse and successive changes were found in D genotypes.Conclusions Mu1tip1e genotypes of HCoVOC43 co-circu1ated,with dominant epidemic of D genotype.The genetic drift in S gene p1ays an important ro1e in the epidemic of specific genotype of HCoV-OC43.Our resu1ts provide insights to c1arify the mo1ecu1ar epidemic characteristics of HCoV-OC43.
Human Coronavirus OC43;genotype;mutation;epidemic
“艾滋病和病毒性肝炎等重大传染病防治”科技重大专项(2012ZX10004206);协和青年基金和中央高校基本科研业务费专项资金资助(3332013127)
任丽丽,Emai1:ren1i1iipb@163.com
10.3760/cma.j.issn.1003-9279.2016.02.016
2016-02-24)