刘艳莉 王艳芳 赵彦宏 柏新富 刘林德
摘要:【目的】分析大麦黄矮病毒(BYDV)株系的生物学信息,为深入研究BYDV各株系的遗传特性及防治提供参考。【方法】从NCBI数据库搜索BYDV的全基因组序列,利用DNASTAR 7.1对其进行序列比对分析,并以MEGA 7.0构建BYDV系统发育进化树。用CodonW分析BYDV的密码子使用偏好性;运用NCBI中的E-Utilities工具搜索BYDV各株系的基因及蛋白,采用SWISS-MODEL预测BYDV蛋白的三级结构。【结果】BYDV各株系碱基序列相似性存在明显差异,其中PAV株系组内核苷酸序列最低相似性最低,仅为77.9%,表明该株系全基因组序列变异较多。PAV、Ker-II、GAV和RPV株系存在碱基突变,均以C—T碱基突变数目最多,且碱基变异倾向于碱基转换。BYDV各株系分为五大分支,其中分离地相近的株系或同一株系BYDV间亲缘关系较近,来自法国克尔格伦群岛的Ker-II株系与PAV株系亲缘关系较近,来自美国的MAV株系与来自我国的GAV株系亲缘关系较近,来自我国的GPV株系(NC-012931)与美国的RPV、RMV和RPS株系亲缘关系较近。BYDV密码子使用无明显的偏好性。PAS、MAV和GAV株系的基因组中均包含7个基因,而PAV株系基因组包含8个基因。在BYDV各株系gp1~gp4蛋白中,gp4蛋白的三级结构保守性最强,而gp1蛋白的空间结构发生一定变异,正是不同BYDV株系的传播媒介及对寄主植物侵染能力存在差异的原因。【结论】BYDV各株系普遍发生分子变异,但变异程度不同,以PAV株系变异程度最大;推测GPV和RMV株系隶属于马铃薯卷叶病毒属。
关键词: 大麦黄矮病毒;株系;基因组序列;多序列比对;分子变异;亲缘关系;密码子偏好性
中图分类号: S435.123 文献标志码:A 文章编号:2095-1191(2018)09-1760-08
0 引言
【研究意義】大麦黄矮病毒(Barley yellow dwarf virus,BYDV)是隶属于黄症病毒科(Luteovirade)的正单链RNA病毒,经蚜虫传播,可侵染多种禾本科植物(尤其是麦类作物)而引发黄矮病(杨洋等,2011;Jaro?ová et al.,2016;Ju et al.,2017),对禾本科作物生产造成巨大经济损失(Choudhury,2018)。探究BYDV的遗传和变异特征将有利于揭示BYDV的致病机制,为有效防治黄矮病提供理论参考,对禾谷类作物尤其是麦类作物的生产具有重要意义。【前人研究进展】国内外研究人员已对BYDV开展了大量研究,早期主要集中在BYDV株系鉴定分类和生物学特征等方面。根据传播介体专化性,在美国BYDV被分为PAV、MAV、SGV、RPV和RMV 5个株系(Rochow and Muller,1971),在我国BYDV被分为GPV、GAV、PAV和RMV 4个株系,其中GPV株系与美国的5个株系均无血清学关系,为我国特有株系(张淑香和周广和,1987)。早期的研究一直认为,BYDV各株系均隶属于黄症病毒科黄症病毒属(Luteovirus),但随着基因组序列和结构研究的深入,BYDV的分类学地位也随之发生变化(Zhang et al.,2009)。其中,PAV、MAV和GAV株系仍归属于黄症病毒属,而RPV和RPS株系归属为黄症病毒科马铃薯卷叶病毒属(Polerovirus),其名称被改为CYDV-RPV和CYDV-RPS(Van Regenmortel et al.,2000;Bouallegue et al.,2014),但SGV、GPV和RMV株系至今尚未确定其分类学地位(Jaro?ová et al.,2016)。PAV株系又被分为三个亚类:BYDV-PAV-Ⅰ(PAV)、BYDV-PAV-Ⅱ(PAS)和BYDV-PAV-Ⅲ(PAV-CN)(Bisnieks et al.,2004;Liu et al.,2007;Wu et al.,2011;Jaro?ová et al.,2013)。随着分子生物学的发展,众多科研人员对BYDV的分子变异和进化(Bisnieks et al.,2004;王伟等,2010;翟浩和刘艳,2011)、基因组结构及基因功能与表达(Vincent et al.,1991;Wang et al.,2001)等进行了大量研究,并取得长足进展。研究发现,BYDV基因组长度约5700个核酸,基因组一般包含6个开放阅读框,能编码外壳蛋白(CP)和运动蛋白(MP)等(Vincent et al.,1991),其中,CP基因序列高度保守,多用于BYDV分子变异和进化等方面的研究(Wang et al.,2001;Ali et al.,2013)。近30年来,BYDV各株系也相继完成了全基因组测序,如BYDV-RPV(Vincent et al.,1991)、BYDV-MAV(Ueng et al.,1992)、BYDV-GAV(Jin et al.,2004)、BYDV-GPV(Zhang et al.,2009)、BYDV-PAV(Wu et al.,2011)和BYDV-RMV(Krueger et al.,2013)等,分布在不同国家和地区的同一株系全基因组序列也相继被报道。这为深入研究大麦黄矮病毒的遗传特征与致病遗传机理及有效防治大麦黄矮病提供了丰富的科研数据。【本研究切入点】目前,越来越多有关BYDV的数据已提交至GenBank、EMBL、DDBJ等生物学数据库中,但大部分数据孤立且零散,鲜见采用生物信息学方法对其进行系统、充分挖掘分析的研究报道。【拟解决的关键问题】基于GenBank、EMBL、DDBJ等生物学数据库中已有的BYDV相关数据,利用生物信息学分析方法从NCBI中检索BYDV的全基因组序列,通过序列比对分析其各株系全基因组序列的分子变异情况,构建BYDV系统发育进化树,并对各株系的密码子偏好性进行分析,找出各株系中所含基因及其对应的蛋白,同时对其结构和功能进行分析,以期探究不同BYDV株系的遗传变异特性,为了解其遗传机制及防治BYDV侵染提供理论参考。
1 材料与方法
1. 1 全基因组序列的获取
从NCBI数据库搜索BYDV的全基因组序列,并删除不完整序列和冗余重复序列,将最终获得的全基因组序列按株系进行分组。
1. 2 碱基突变分析
利用DNASTAR 7.1的ClustalW算法进行BYDV多序列比对分析,并根据序列相似性分析其碱基突变的倾向性。
1. 3 系统发育进化树构建
基于BYDV多序列比对结果,利用MEGA 7.0以邻接法(Neighbor-joining,NJ)构建BYDV系统发育进化树,参数设置为默认值。
1. 4 密码子偏性分析
利用CodonW分析BYDV各株系的密码子使用偏好性,参数设置为默认值。
1. 5 蛋白质功能注释
运用NCBI的E-Utilities工具从GenBank的Gene和Protein两个子数据库中搜索BYDV各株系的基因序列,并找出其编码蛋白的氨基酸序列,对其进行功能注释。
1. 6 蛋白质三级结构预测分析
利用SWISS-MODEL预测BYDV各蛋白的三级结构。
2 结果与分析
2. 1 BYDV全基因组序列获取结果
截至2017年1月1日,从NCBI数据库中共检索到303条BYDV全基因组序列,去掉不完整序列和冗余重复序列,最终获得来自中国、美国和日本等9个国家9个BYDV株系(PAV、GAV、PAS、MAV、RMV、RPV、GPV、RPS和Ker-II)的66條全基因组序列(表1),其中PAV株系序列数目最多,为34条,GAV为15条,RPV为6条,Ker-II为3条,MAV、RMV和PAS各2条,GPV和RPS均为1条。将66条全基因组序列按株系分成9组。
2. 2 序列相似性及碱基突变分析结果
利用DNASTAR 7.1的ClustalW进行BYDV全基因组多序列比对分析,用Sequence Distance对各组中序列数目≥2的株系进行组内核苷酸序列相似性分析,结果如表2所示。PAV株系组内核苷酸序列最低相似性最低,仅为77.9%,其原因是PAV株系地理分布较广泛,目前已有8个国家发现该株系,致使该株系全基因组序列变异较多。MAV、PAS和RMV株系的组内核苷酸序列最低相似性均达100.0%。Ker-II株系组内的3个序列虽然均来自法国克尔格伦群岛,但其中2个分离物最低相似性仅为85.0%,说明该株系基因组序列保守性较差。GPV和RPS株系各含1条序列,无法进行组内序列相似性分析。
通过Residue Substitutions对9个株系组内核苷酸的突变情况进行统计分析,结果如表3所示。仅PAV、Ker-II、GAV和RPV株系存在明显碱基突变,各株系C-T碱基突变数目和突变率均最高,其中GAV和RPV株系的C-T碱基突变率高达50.00%以上;A-G碱基突变次之,各株系的A-G碱基突变率为30.00%左右;C-G和G-T碱基突变率较少。从总体来看,在BYDV各株系中碱基转换的比例明显大于碱基颠换的比例。
2. 3 BYDV系统发育进化树分析结果
基于66条基因组序列构建的BYDV系统发育进化树如图1所示。BYDV可分为五大分支,I、II和III分支主要是来自美国的PAV和PAS株系,还有来自日本、巴基斯坦和伊朗的3个PAV株系及法国克尔格伦群岛的Ker-II株系;IV分支为来自我国的GAV株系和来自美国的MAV株系;V分支为来自美国的RPV、RMV和RPS株系及来自我国的1个GPV株系(NC_012931)。分离地相近的株系及同一株系BYDV间亲缘关系较近,来自法国克尔格伦群岛的Ker-II株系与PAV株系亲缘关系较近,来自美国的MAV株系与来自我国的GAV株系亲缘关系较近,来自我国的GPV株系(NC_012931)与美国的RPV、RMV和RPS株系亲缘关系较近。
2. 4 密码子使用偏好性分析结果
有效密码子数(Nc)通常为20.0~61.0个,数值越小,说明密码子的使用偏好性越大;反之,密码子的使用偏好性越小。利用CodonW分析BYDV的密码子偏好性,结果如表4所示。BYDV基因的有效密码子数为57.20~59.83,数值较大,表明BYDV无明显的密码子使用偏好性。处于系统发育进化树I、II和III分支的PAV、GAV、PAS和MAV株系及Ker-II株系GC含量均低于50.00%,Ker-II株系(KC571999)的GC含量仅为46.53%,处于IV、V分支的株系GC含量则高于50.00%,RPS(NC_002198.2)的GC含量高达52.76%。
编码同一氨基酸时各密码子的相对使用概率即同义密码子使用度(RSCU)。当RSCU>1时表示该密码子使用相对较频繁;而RSCU<1时表示该密码子使用次数相对较少;RSCU=1时表示密码子使用无偏好性;使用CodonW分析所得BYDV各株系的RSCU。对BYDV各个株系密码子的使用情况分析后表明BYDV对密码子的使用无明显偏好性。
2. 5 BYDV各株系基因与蛋白分析结果
通过搜索GenBank数据库,从中找出各株系所包含的基因及其对应的蛋白,结果见表5。PAS、MAV和GAV株系的基因组中均包含有7个基因,而PAV株系基因组包含8个基因。根据各基因在基因组中的位置(图2)可知,BYDV中的各基因存在相互重叠甚至包含的关系,如gp1包含gp2,gp3包含gp4等,反映了低等原核生物典型的基因组特点,即基因组小但紧凑,基因密度大,甚至存在重叠。供试的BYDV基因均可编码蛋白,1个基因编码1个蛋白,其功能注释见表5。不同株系间相对应的基因及蛋白具有相似的序列和功能。
利用SWISS-MODEL预测BYDV各蛋白的三级结构,共获得25个蛋白的三级结构,还有4个较小的蛋白因找不到对应的同源模板而未预测出其三级结构。BYDV各株系gp1~gp4蛋白的三级结构预测结果(图3)表明,gp4蛋白的三级结构保守性最强,而gp1蛋白的空间结构发生一定变异,推测其是造成不同BYDV株系的传播媒介及对寄主植物侵染能力存在差异的原因。
3 讨论
植物病原分子变异和进化是其生物学性状及致病性变化的内在原因(Paximadis et al.,1999),对BYDV开展相关研究可为其群体结构特征分析、分子鉴定、株系分类及BYDV的发生和流行规律研究提供参考依据。基于全基因组序列研究BYDV分子变异可获得更全面、可靠的结论。然而,早期由于BYDV全基因组序列信息缺乏,均是通过高度保守的CP基因等的核苷酸序列或蛋白氨基酸序列来研究其分子变异和进化关系(Wang et al.,2001;王伟等,2010;翟浩和刘艳,2011;Bouallegue et al.,2014)。近年来,随着BYDV各株系全基因组序列陆续被测出,利用全基因组序列研究BYDV分子变异和群体结构特征的研究越来越多。吴兴泉等(2011)根据45条BYDV全基因组序列及其59条CP基因序列对BYDV分子变异进行分析,并构建BYDV系统发育进化树。Wu等(2011)对我国的多个BYDV-PAV全基因组序列进行了分子进化分析。上述研究主要集中在特定株系或特定地域的BYDV,且分析的全基因组序列较少。本研究从NCBI数据库搜索获得来自9个国家的303条BYDV全基因组序列,去掉冗余和不完整序列后,筛选得到涉及9個BYDV株系的66条完整的BYDV全基因组序列。相对于前人研究,本研究分析的BYDV全基因组序列较多,有助于提高进化分析的代表性和准确性。
本研究发现,同一株系或相同地理分布的BYDV基因组序列均表现出较近的亲缘关系,如PAV株系虽然地理分布广泛,碱基变异较多,但34条PAV基因组序列在系统发育进化树上的分布仍较集中,PAV又可分为3个亚类(BYDV-PAV-Ⅰ、BYDV-PAV-Ⅱ和BYDV-PAV-Ⅲ),其中BYDV-PAV-Ⅱ与近年来从法国克尔格伦群岛采集分离到的Ker-Ⅱ株系(Svanella-Dumas et al.,2013)处于同一进化分支,由此推测Ker-Ⅱ株系可能属于PAV株系中的BYDV-PAV-Ⅱ亚类。PAV、MAV和GAV株系隶属于黄症病毒属,在本研究构建的系统发育进化树中处于同一个大分支,亲缘关系较近,而隶属于马铃薯卷叶病毒属的RPV与RPS株系在另一个较远的分支。由此可见,本研究的分子变异和进化分析结果与目前BYDV各株系的生物学分类相符。同时,本研究还发现尚未确定具体归属的两个株系RMV和GPV在系统发育进化树上远离PAV、MAV和GAV株系,而与RPV和RPS株系处于同一个进化分支,其中GPV株系与RPV株系亲缘关系最近。因此,推测目前尚未确定归属的RMV和GPV株系可能隶属于马铃薯卷叶病毒属。Bisnieks等(2004)对BYDV株系CP基因进行进化分析,也发现GPV、RPV和RMV株系处于同一进化分支,说明GPV与RPV株系亲缘关系较近。Zhang等(2009)首次报道GPV株系的全基因组序列,并将其与其他株系进行序列比较,结果发现GPV株系与RPV株系序列相似性最高;在全基因组水平上,GPV与RPV株系的相似性为77.0%,与RPS株系的相似性为75.0%,而与其他株系的相似性均低于40.0%。Krueger等(2013)报道了RMV株系的全基因组序列,并基于23条BYDV各株系全基因组序列构建了系统发育进化树,结果表明RMV株系与RPV、RPS和GPV株系处在同一个进化分支,亲缘关系较近,而与其他株系亲缘关系较远。本研究结果与上述研究所得出的结论基本一致。另外,从本研究各株系的基因组结构来看,GPV、RMV、RPV和RPS株系较相似,而与其他株系(PAV、MAV和GAV)存在明显差异;BYDV基因组碱基突变中,C-T碱基突变率最高,A-G碱基突变率次之,碱基转换率明显高于碱基颠换率,与Ge等(2007)、Duffy和Holmes(2009)的研究结果类似;PAV株系和Ker-II株系内的碱基突变率较高;其他5个株系碱基突变率在5.00%以下,表明二者基因组较保守、突变较少。在BYDV防治时,需根据不同株系的保守特性制定不同的防治方案。
4 结论
BYDV各株系普遍发生分子变异,但变异程度不同,以PAV株系变异程度最大。推测2个未确定分类学地位的GPV和RMV株系隶属于马铃薯卷叶病毒属。
参考文献:
王伟,刘艳,王锡锋,吴蓓蕾,郑传临. 2010. 大麦黄矮病毒合肥分离物的鉴定及CP基因进化分析[J]. 安徽农业科学,38(23):12520-12522. [Wang W,Liu Y,Wang X F,Wu B L,Zheng C L. 2010. Identification of the Barely ye-llow dwarf virus strain isolated in Hefei and analysis of the evolution of coat protein gene[J]. Journal of Anhui Agriculture Science,38(23):12520-12522.]
吴兴泉,陈士华,张晓婷,张苗青,刘应举. 2011. 大麦黄矮病毒株系间分子变异与系统进化关系研究[J]. 河南农业大学学报,45(3):339-344. [Wu X Q,Chen S H,Zhang X T,Zhang M Q,Liu Y J. 2011. Studies on the relationship between molecular variation and phylogene among different strains of Barley yellow dwarf virus[J]. Journal of Henan Agricultural University,45(3):339-344.]
杨洋,刘金虎,赵震,吴云锋. 2011. 陕西小麦黄矮病病原种类的多重PCR检测[J]. 西北农业学报,20(11):170-174. [Yang Y,Liu J H,Zhao Z,Wu Y F. 2011. Simultaneous detection of Barley yellow dwarf virus by multiplex PCR in Shaanxi[J]. Acta Agriculturae Boreali-accidentalis Sinica,20(11):170-174.]
翟浩,刘艳. 2011. 青海省大麥黄矮病毒的种类鉴定及基于CP基因的分子进化研究[J]. 中国农学通报,27(24):253-257. [Zhai H,Liu Y. 2011. Identification of Barley yellow dwarf virus(BYDVs) strains in Qinghai Province and analysis of evolution based on CP gene[J]. Chinese Agricultural Science Bulletin,27(24):253-257.]
张淑香,周广和. 1987. 一种由麦二叉蚜、禾缢管蚜非专化性传毒的小麦黄矮病毒株系鉴定[J]. 植物病理学报,17(2):102-105. [Zhang S X,Zhou G H. 1987. Identification on strain of Wheat yellow dwarf virus(WYDV) transmitted by Schizaphis graminum and Rhopalosiphum padi[J]. Acta Phytopathologica Sinica,17(2):102-105.]
Ali M,Tahir M,Hameed S,Ashraf M. 2013. Coat protein based molecular characterization of Barley yellow dwarf virus isolates identified on oat plants in Pakistan[J]. Acta Viorlogica,57(3):383-385.
Bisnieks M,Kvarnheden A,Sigvald R,Valkonen J P T. 2004. Molecular diversity of the coat protein-encoding region of Barley yellow dwarf virus-PAV and Barley yellow dwarf virus-MAV from Latvia and Sweden[J]. Archives of Virology,149(4):843-853.
Bouallegue M,Mezghani-Khemakhem M,Bouktila D,Makni H,Makni M. 2014. Molecular characterization of Barley yellow dwarf virus in Tunisia[J]. Acta Virologica,58(3):214-222.
Choudhury S. 2018. Agronomical,biochemical and histological response of resistant and susceptible wheat and barley under BYDV stress[J]. PeerJ,doi:10.7717/peerj.4833.
Duffy S,Holmes E C. 2009. Validation of high rates of nucleo-tide substitution in geminiviruses:Phylogenetic evidence from East African cassava mosaic viruses[J]. Journal of General Virology,90(6):1539-1547.
Ge L M,Zhang J T,Zhou X P,Li H. 2007. Genetic structure and population variability of tomato yellow leaf curl China virus[J]. Journal of Virology,81(11):5902-5907.
Jaro?ová J,Beoni E,Kundu J K. 2016. Barley yellow dwarf virus resistance in cereals:Approaches,strategies and prospects[J]. Field Crops Research,198:200-214.
Jaro?ová J,Chrpova J,S?p V,Kundu J K. 2013. A comparative study of the Barley yellow dwarf virus species PAV and PAS:Distribution,accumulation and host resistance[J]. Plant Pathology,62(2):436-443.
Jin Z B,Wang X F,Chang S J,Zhou G H. 2004. The complete nucleotide sequence and its organization of the genome of Barley yellow dwarf virus-GAV[J]. Science in China(Series C:Life Sciences),47(2):175-182.
Ju J,Kim K,Lee K J,Lee W H,Ju H J. 2017. Localization of Barley yellow dwarf virus movement protein modulating programmed cell death in Nicotiana benthamiana[J]. The Plant Pathology Journal,33(1):53-65.
Krueger E N,Beckett R J,Gray S M,Miller W A. 2013. The complete nucleotide sequence of the genome of Barley yellow dwarf virus-RMV reveals it to be a new Polerovirus distantly related to other yellow dwarf viruses[J]. Frontiers in microbiology,4:205.
Liu F,Wang X,Liu Y,Xie J,Gray S M,Zhou G,Gao B. 2007. A Chinese isolate of Barley yellow dwarf virus-PAV represents a third distinct species within the PAV serotype[J]. Archives of Virology,152(7):1365-1373.
Paximadis M,Idris A M,Torres-Jerez I,Villarreal A,Rey M E,Brown J K. 1999. Characterization of tobacco geminiviruses in the old and new world[J]. Archives of Virology,144(4):703-717.
Rochow W F,Muller I. 1971. A fifth variant of Barley yellow dwarf virus in New York[J]. Freshwater Crayfish,13(6):849-853.
Svanella-Dumas L,Candresse T,Hullé M,Marais A. 2013. Distribution of Barley yellow dwarf virus-PAV in the su-b-antarctic Kerguelen Islands and characterization of two new Luteovirus species[J]. PLoS One,8(6):e67231.
Ueng P P,Vincent J R,Kawata E E,Lei C H,Lister R M,Larkins B A. 1992. Nucleotide sequence analysis of the genomes of the MAV-PS1 and P-PAV isolates of Barley yellow dwarf virus[J]. Journal of General Virology,73(2):487-492.
Van Regenmortel M H,Mayo M A,Fauquet C M,Maniloff J. 2000. Virus nomenclature:Consensus versus chaos[J]. Archives of Virology,145(10):2227-2232.
Vincent J R,Lister R M,Larkins B A. 1991. Nucleotide sequence analysis and genomic organization of the NY-RPV isolate of Barley yellow dwarf virus[J]. Journal of General Virology,72(10):2347-2355.
Wang X,Chang S,Jin Z,Li L,Zhou G. 2001. Nueleotide sequences of the coat protein and readthrough portein genes of the Chinese GAV isolate of Barley yellow dwarf virus[J]. Acta Viorlogica,45(4):249-252.
Wu B,Alexandra L B,Liu Y,Zhou G,Wang X F,Elena S F. 2011. Dynamics of molecular evolution and phylogeography of Barley yellow dwarf virus-PAV[J]. PLoS One,6(2):e16896.
Zhang W W,Cheng Z M,Xu L,Wu M,Waterhouse P,Zhou G,Li S. 2009. The complete nucleotide sequence of the Barley yellow dwarf GPV isolate from China shows that it is a new member of the genus Polerovirus[J]. Archives of Virology,154(7):1125-1128.
(責任编辑 陈 燕)