王猛,陈莉,靳旺杰,孙朋辉,王莎莎
(1 南方医科大学南方医院,广州 510515;2 中山大学中山眼科中心/眼科学国家重点实验室)
脊髓灰质炎(简称脊灰)是由脊髓灰质炎病毒(简称脊灰病毒)引起的一种高发于儿童的急性肠道传染病,感染脊灰病毒可致患者肢体肌肉出现弛缓性麻痹,并留下终身残疾,重者可致死亡。脊灰病毒为含有一个开放阅读框(ORF)的单股正链RNA无包膜病毒,属于小RNA病毒科肠道病毒属。VP1是脊灰病毒重要的结构蛋白,也是其主要的抗原决定簇,根据VP1编码区域的不同,脊灰病毒可分为Ⅰ型、Ⅱ型和Ⅲ型三个基因型[1,2]。随着消灭脊灰工作的推进,人类在与脊灰病毒的战争中取得了较大的成就。2017年,仅巴基斯坦和阿富汗有脊灰野毒株的传播,并报告病例22例,达到历史最低[3]。另外,全球自1999年后未再发现Ⅱ型脊灰病例,2013年后未再发现Ⅲ型脊灰野毒株病例,目前流行的脊灰病毒仅为Ⅰ型[4,5]。密码子是蛋白质编码基因中的基本结构单位,也是生物体遗传和变异的基本单位。密码子的使用自认知之初就被标上偏好性的标签。密码子使用偏好性无处不在,从病毒到脊椎动物均存在不同的密码子使用偏好模式,而且近缘物种普遍拥有相似的密码子使用偏好性[6,7]。对密码子使用偏好性的分析研究,不仅可用于进一步掌握物种的遗传和进化信息,并准确预测相关基因功能,而且还可以发现基因偏好使用的最优密码子[8,9]。本研究对Ⅰ型脊灰病毒基因密码子使用偏好性进行分析,现报告如下。
1.1 Ⅰ型脊灰病毒毒株基因信息的获取 从NCBI基因数据库(GenBank)检索并筛选出40条Ⅰ型脊灰病毒株的基因信息,见表1。
1.2 Ⅰ型脊灰病毒基因相对同义密码子使用度(RSCU)值的计算 RSCU是指某一特定的密码子在编码对应氨基酸的同义密码子间的相对使用概率。RSCU值的计算方法为某一密码子所使用的频率与其在无偏好性使用时预期频率之间的比值,计算公式见文献[10]。如果某一密码子使用模式无偏好性,则RSCU值=1;如果机体在使用该密码子时存在偏好性,则RSCU值≠1;另RSCU值≥1.5表示密码子使用偏好性较强,RSCU值≤0.5表示密码子使用偏好性较弱。
1.3 Ⅰ型脊灰病毒基因有效密码子数(ENc)计算 ENc是密码子使用偏好性的重要参考指标,其值在20~61。Wright[11]认为,假如一个基因所有的同义密码子都是平均使用,则该基因的ENc值趋于61,说明密码子使用偏好性极弱;反之,同义密码子之间均偏好使用其中特定的一个密码子,则该基因的ENc值趋于20,说明密码子使用偏好性极强。ENc值35为一重要临界点,ENc值<35提示密码子使用偏好性强,ENc值>35提示密码子使用偏好性弱。本研究中,Ⅰ型脊灰病毒的ENc采用JEMBOSS 1.5软件包中CHIPS程序计算得来。
表1 40条Ⅰ型脊灰病毒毒株基因信息
1.4 Ⅰ型脊灰病毒ENc与(C+G)3%关联性分析 (C+G)3%是指碱基C和G位于第三位的密码子占所有密码子的百分比,该数值通过CodonW软件计算得来。之后将获得的(C+G)3%值与Ⅰ型脊灰病毒的ENc值绘制散点图,并与(C+G)3%标准曲线进行比较。基因位于(C+G)3%标准曲线上或散布在(C+G)3%标准曲线附近时,说明该基因的密码子使用模式主要受碱基组成所决定,即密码子的偏好性受突变压力影响较大;反之,若基因分布在偏离(C+G)3%标准曲线较远的位置,则说明其密码子使用偏好性受自然选择的影响较大[11,12]。
1.5 不同时间和地域的Ⅰ型脊灰病毒基因密码子使用偏好性分析 采用主成分分析法(PCA)对Ⅰ型脊灰病毒基因密码子的RSCU值进行分析,并利用获得的主因子绘制散点图,观察不同时间和地域的Ⅰ型脊灰病毒基因密码子使用偏好性。
2.1 Ⅰ型脊灰病毒基因密码子RSCU值 40株Ⅰ型脊灰病毒毒株基因密码子的RSCU值见表2。由表2可知,密码子AGA、AGG、CCA、UCA和GUG的RSCU值均≥1.5,提示Ⅰ型脊灰病毒在这些密码子的使用上偏好性较强;密码子GCG、CGA、CGG、CGC、UCG和ACG的RSCU值均≤0.5,提示Ⅰ型脊灰病毒在这些密码子的使用上偏好性较弱。
表2 40株Ⅰ型脊灰病毒毒株基因密码子的RSCU值
2.2 Ⅰ型脊灰病毒ENc值 1~40号Ⅰ型脊灰病毒毒株的ENc值分别是53.710、53.741、53.749、53.137、53.082、52.924、53.370、54.230、53.291、53.506、53.204、53.356、53.705、53.194、53.914、53.276、53.435、54.508、54.038、54.059、54.554、53.338、53.396、53.450、53.401、53.491、53.301、53.810、54.640、53.856、54.414、53.231、53.351、54.090、54.126、54.386、53.404、53.066、53.236、53.345,平均值为53.633,说明Ⅰ型脊灰病毒在密码子使用偏好性上处于较弱水平。
2.3 Ⅰ型脊灰病毒ENc与(C+G)3%关联性分析结果 Ⅰ型脊灰病毒ENc与(C+G)3%关联性分析结果见图1。由图1可知,40株Ⅰ型脊灰病毒毒株均位于(C+G)3%标准曲线以下,并聚集在一起,说明自然选择在Ⅰ型脊灰病毒基因密码子使用偏好性上起主要作用。
图1 Ⅰ型脊灰病毒ENc与(C+G)3%关联性
2.4 不同时间和地域的Ⅰ型脊灰病毒基因密码子使用偏好性分析结果 经主成分分析获得主因子1(Fac1)=19.802和主因子2(Fac2)=18.342,并以此为基础绘制散点图,见图2。由图2可知:①2009年之前分离出来的毒株均位于图的下方,提示2009年之前分离出来的Ⅰ型脊灰病毒毒株基因密码子使用模式基本相同;②2009年之后,分离于不同国家或地区的毒株分别聚集于图的一处,说明其有明显的地域性,如分离于中东地区(包括以色列和埃及)和1株巴基斯坦的毒株分布于图表的右上角,且明显区别于其他地区分离的毒株;分离于非洲地区(包括喀麦隆、赤道几内亚和乍得)的毒株分布于X轴的远端,且该区域仅有非洲分离毒株;分离于中亚地区(俄罗斯、哈萨克斯坦、塔吉克斯坦和土库曼斯坦)的毒株加上3株巴基斯坦的分离毒株聚集于一处,提示2009年之后,不同地域分离出来的Ⅰ型脊灰病毒基因密码子使用使用模式不同。
虽然我国自1994年后就无脊灰野毒株病例的报道,但WHO至今仍将中国列为脊灰输入高风险国家,主要原因为2017年全球未阻断本土脊灰野病毒传播的国家仅剩尼日利亚、阿富汗和巴基斯坦3个国家,而其中2个国家均与我国接壤。而且随着海外劳务输出和进口贸易的规模逐年增大,导致脊灰病毒传入我国的风险居高不下,以致2011年我国新疆维吾尔族自治区发生了由巴基斯坦输入的脊灰野病毒引起的疫情。与此同时,研究人员从急性弛缓性麻痹病例的粪便标本中发现了疫苗衍生脊灰病毒,说明对脊灰病毒的防范一刻都不能松懈[13,14]。
图2 40株Ⅰ型脊灰病毒毒株的主成分分析图
本研究对40株Ⅰ型脊灰病毒基因密码子RSCU值的分析发现,Ⅰ型脊灰病毒在AGA、AGG、CCA、UCA、GUG等密码子的使用上偏好性较强,在GCG、CGA、CGG、CGC、UCG、ACG等密码子的使用上偏好性较弱。Ⅰ型脊灰病毒ENc值分析发现,Ⅰ型脊灰病毒在密码子使用偏好性上处于较弱水平。进一步进行的ENc与(C+G)3%的关联分析,揭示了自然选择在Ⅰ型脊灰病毒的进化过程中担当了主要角色。之后的主成分分析结果显示,自然选择通过地理和时间因素影响了Ⅰ型脊灰病毒的进化方向,尤其是地理因素将不同区域的毒株隔离开来,即同一区域分离的毒株在密码子使用模式上具有较多的相似性,而不同区域则差异较大。
巴基斯坦作为紧邻中亚的穆斯林国家,其独特的地理和宗教因素导致其与中亚以及中东国家有较多经济和文化联系[15~17]。2013年,在巴基斯坦同时分离出与中东地区和中亚地区相似密码子使用模式的毒株,意味着Ⅰ型脊灰病毒在巴基斯坦流行毒株的遗传多样性[18,19]。近年来,随着“一带一路”的提出,中巴经济文化的往来频繁,两国关系不断升温,这也加大了我国对脊灰病毒防疫的任务。
综上所述,Ⅰ型脊灰炎病毒密码子使用偏好性较弱,自然选择在Ⅰ型脊灰病毒基因密码子使用偏好性上起主要作用,不同时间和地域的Ⅰ型脊灰病毒基因密码子使用模式差异较大。今后对Ⅰ型脊灰病毒乃至整个脊灰病毒的防疫工作依旧面临诸多问题和挑战,也需要科研人员的进一步努力。