刘青, 周书玉, 崔冬丽, HESLOP HARRISON John Seymour
1. 中国科学院 植物资源保护与可持续利用重点实验室/中国科学院 华南植物园, 广州 510650;2. 中国科学院 核心植物园, 广州 510650; 3. 中国科学院大学, 北京 100049;4. 莱斯特大学 遗传学和基因组生物学系, 英国莱斯特 LE1 7RH
病毒粒子是一种由核酸和蛋白质外壳组成的细胞内寄生病原物, 具有生长、 遗传和变异等生物特性和侵染活性[1]. 植物病毒寄生引起植物病毒病, 被人们称为“植物癌症”. 国际病毒分类委员会(International Committee on Taxonomy of Viruses, ICTV)第10次病毒分类报告(2017年第10版)中, 病毒分类系统包括9目、 131科、 46亚科、 802属和4 853种, 其中侵染植物的病毒有5目、 28科、 5亚科、 121属、 1 440种, 与ICTV第9次病毒分类报告相比, 病毒种类增加了3目、 44科、 27亚科、 453属、 2 569种[2]. 通过宏基因组测序获得丰富的基因组信息, 并运用到病毒分类和命名, 该技术获得ICTV的认可. 2017版病毒分类系统中病毒数量倍增的根本原因, 在于大范围取样和宏基因组测序的应用[3]. 宏基因组测序则是利用HTS技术直接对环境中所有微生物进行测序, 真实客观地检测环境中存在的病毒, 因此, HTS技术的发展在病毒检测和分类中发挥关键作用. 近年来, 蔬菜、 粮食、 果树等均有被新病毒侵染的报道, 2020年, 农业农村部公布的《一类农作物病虫害名录》中包括7种病害, 其中南方水稻黑条矮缩病的病原体为南方水稻黑条矮缩病毒(southern rice black-streaked dwarf virus, SRBSDV)[4], 病害严重影响着作物的产量和品质. 农药和化肥的过度使用、 全球变暖以及环境的恶化, 加剧了植物病毒的传播和发展, 而治理植物病毒病的前提是建立有效的植物病毒检测方法.
传统的植物病毒检测方法有: 生物学检测法、 电子显微镜观察法、 血清学检测法和分子生物学方法[5]. 生物学检测法借助对病毒敏感的植物来检测病毒, 检测速度慢, 目前应用较少; 电镜观察法根据病毒形态、 大小和染病组织超微结构等检测病毒, 在研究病毒对寄主和环境的影响[6]、 观察病毒形态等方面十分重要, 缺点是检测设备昂贵; 血清学检测法在植物和昆虫病毒检测中被广泛应用, 可同时检测大量样品, 缺点是实验技术要求高, 如酶联免疫吸附试验(enzyme-linked immunesorbent assay, ELISA); 分子生物学方法采用核酸杂交来检测病毒, 如核酸杂交技术、 反转录PCR(reverse transcription-polymerase chain reaction, RT-PCR)、 荧光定量PCR及DNA微阵列技术等, 灵敏度高, 成本也高.
HTS技术可以快速获得植物病毒基因组序列, 结合生物信息学分析, 用于已知病毒、 新病毒和仅有裸露RNA分子的类病毒鉴定. 新病毒可以是全新的病毒种类, 也可以是已知病毒种类在新寄主、 新介体和新地理范围的新兴病毒. 自2009年Rwahnih等[7]提取葡萄总RNA作为测序模板发现了7个已知病毒和1个新病毒——西拉葡萄病毒1号(grapevine Syrah virus-1, GSyV-1)以来, 高通量测序被广泛应用于植物病毒检测, 截至2016年已发现100多种新的病毒和类病毒[8], 现已成为植物病毒检测的主要手段. 本文总结了高通量测序技术的发展及其在植物病毒检测中的应用案例, 旨在为植物病毒病防治提供依据.
DNA测序技术经历了里程碑式进展, 包括以Sanger电泳法为代表的第一代测序技术、 以短读长高通量测序为代表的第二代测序技术和以长读长测序为代表的单分子实时合成测序技术[9].
20世纪70年代, Sanger和Coulson开发的双脱氧终止法标志着第一代测序技术的问世. 双脱氧终止法因避免使用有毒化学物质和放射性同位素, 成为其后30年里的主流DNA测序方法, 并通过该方法获得了第一个人类基因组序列[10].
第二代测序技术相比一代测序技术有质的飞跃, 包括杂交测序和合成测序. 杂交测序依赖特定探针序列来检测目标序列, 例如鉴定特定基因序列中与疾病相关的单核苷酸多态性或鉴定总体染色体异常[11]; 合成测序如Roche公司454焦磷酸测序技术和美国Illumina公司Solexa测序技术. 二代测序常用Illumina平台的MiniSeq,MiSeq,NextSeq,NovaSeq和HiSeq等测序仪, 其中HiSeqX效率较高, 每年可生产1 800个30倍覆盖度的人类基因组[12]. Illumina测序平台具有快速、 灵敏和成本低等优势, 是目前植物病毒检测的主要测序平台. Wang等[13]应用Illumina技术检测25个笋瓜(Cucurbitamaxima)样品, 经序列分析发现24种植物病毒, 通过RT-PCR发现存在西葫芦黄花叶病毒(zucchini yellow mosaic virus, ZYMV)、 西瓜花叶病毒(watermelon mosaic virus, WMV)和黄瓜花叶病毒(cucumber mosaic virus, CMV)混合侵染现象.
第三代测序技术的代表有太平洋生物科学公司(Pacific Biosciences, PacBio)的单分子实时测序和牛津纳米孔技术公司(Oxford Nanopore Technologies, ONT)的单分子纳米孔测序. PacBio测序基于边合成边测序的原理, 设备实时捕获并记录荧光信号, 转化为单碱基信息, 获得具有单碱基分辨率的高精度序列[14]; PacBio使用的是光信号, 可通过多次测序来提高准确度, 但酶的活性决定了测序长度不会特别长[15]. ONT测序基于电信号, 挑战是电信号的持续稳定性, 且对于一条DNA分子最多测序两次, 无法像PacBio测序一样对同一条链进行多次测序, 因此相对前者ONT测序准确度低. 这两种方法都可以捕获DNA甲基化修饰[16]、 直接测序RNA[17], ONT测序理论上也可以测序蛋白质, 但蛋白的氨基酸类型多、 形成多肽后构象复杂并且蛋白的修饰多, 因此目前还没有重大突破[18]. 2018年, Bronzato等[19]首次报道了使用Oxford MinION测序仪检测植物和昆虫样品中的植物病原体. 由于第三代测序技术对样品核酸质量要求高, 测序的错误率和成本远高于第二代测序, 加之病毒基因组远小于动植物基因组, 所以目前病毒基因组的测序工作主要采用第二代测序技术.
植物病毒的遗传保守性使某些病毒物种相对稳定, 而变异性使得一些病毒物种高度进化. 植物病毒基因组中核苷酸突变、 基因重组、 基因重排等导致的新分离物或新病毒种类, 又引起毒力、 寄主、 传播方式等特性的变化, 从而造成新的植物病毒病害流行[20]. 目前针对植物病毒病害防治还缺乏有效药剂, 因此病害早期的检测和鉴定尤其重要, HTS技术已被证明是植物病毒检测和鉴定的有效方法, 该技术不需要预知病原物的染病特征、 靶向扩增序列及病原基因组序列, 短时间内以低成本测定样品基因组或转录组, 获得细菌、 真菌、 病毒、 寄生虫等的病原特征. Wang等[21]利用HTS技术发现一种新的侵染烟草(NicotianatabacumL.)的重组芸薹黄化病毒(brassica yellows virus, BrYV)分离物, 命名为BrYV-NtabQJ.
HTS技术分为全基因组测序、 宏基因组测序、 转录组测序和小RNA测序, 基于病毒序列的生物信息学分析, 可将病毒鉴定到种甚至株系. 2017年, ICTV已允许根据基因组序列证据鉴定新病毒[3], 根据基因组测序方法鉴定出的病毒种类, 已远超过传统方法鉴定的病毒数量. ICTV于2019年2月启用域、 亚域、 界、 亚界、 门、 亚门、 纲、 亚纲、 目、 亚目、 科、 亚科、 属、 亚属和种的15个分类阶元, 其中域、 界、 门、 纲、 目、 科、 属、 种为主要等级, 其余为衍生等级[22]. 同时公布了不同分类阶元病毒的界定标准(https: //talk.ictvonline.org/), 以病毒全基因组核苷酸序列的同源性为依据, 进行病毒株系或种的划分己成为分类的一个常规手段. 在Potyviridae中, 属的界定标准是完整开放阅读框(open reading frame, ORF)的核苷酸同源序列小于46%, 种的界定标准为完整ORF核苷酸同源序列小于76%或氨基酸同源序列小于82%, 单个蛋白编码区域从第一蛋白(the first protein, P1)编码区域的58%到其他区域的74%~78%, 对于外壳蛋白(coat protein, CP)基因, 最优的物种划分标准是76%~77%的核苷酸和80%的氨基酸同源性[23]; 同科不同属的物种界定标准不同, 在Geminiviridae中Begomovirus的物种界定标准是全基因组核苷酸同源序列小于91%[24], 而Mastrevirus属的物种界定标准是全基因组核苷酸同源序列小于78%. 周俊[25]根据Betaflexiviridae下Trichovirus的物种划分标准, 即相关蛋白或CP之间核苷酸同源序列低于72%、 氨基酸同源序列低于80%[26], 将分离物RP19-1,RP19-2,Ta Tao 5与苹果褪绿叶斑病毒(apple chlorotic leaf spot virus, ACLSV)的核苷酸、 氨基酸序列比对, 进行系统发育分析, 鉴定了桃褪绿叶斑病毒(peach chlorotic leaf spot virus, PCLSV)为Trichovirus的新种. 目前ICTV可以仅根据序列信息对病毒进行分类, 在缺乏表型数据的情况下, 可以从病毒编码序列数据中推断出基因组结构、 同源基因的存在以及可能的寄主范围等病毒特征, 用来鉴定病毒.
应用HTS技术检测植物病毒的流程包括: 样品制备、 文库构建、 平台测序、 数据分析和结果验证[27]. 首先, 测序样品有总RNA、 总DNA、 双链RNA(double-stranded RNA, dsRNA)、 病毒粒子相关核酸(virion-associated nucleic acids, VANA)、 小RNA(small RNA, sRNA)等[28]. 提取总RNA和VANA可检测到ssRNA、 dsRNA、 ssDNA、 dsDNA等核酸类型的病毒; 提取总DNA可检测到ssDNA和dsDNA核酸类型的病毒; dsRNA测序能获得病毒的特异序列[29]; sRNA测序可同时检测DNA、 RNA病毒和内源性病毒元件(endogenous viral elements, EVEs), 病毒来源的sRNA在序列上是重叠的, 可组装sRNA获得病毒基因组. 常提取总RNA作为测序模板, 使用聚腺苷化RNA转录本去除核糖体RNA, 可获得更高的覆盖率[30]. 其次, 文库构建包括核酸片段化, RNA反转录, 添加接头、 引物和样品序列标签, PCR富集和文库质检[31]. 再次, 应选择合适的测序平台. Illumina测序平台优势有高通量、 低成本; Ion Torrent平台适用于微量DNA测序, 可能有同聚物区域测序错误; PacBio平台优势是长读长、 覆盖均匀, 但成本高; Nanopore平台优势是超长读长, 缺点是错误率高[32](表1). Illumina测序平台在高通量测序检测植物病毒方面得到广泛应用. Illumina测序仪采用边合成边测序的方法, 主要流程有: ① 文库构建; ② 桥式扩增成簇反应; ③ 边合成边测序过程: 将不同荧光标记的dNTP、 聚合酶、 引物等加入到测序通道中, 伴随碱基加入会激发荧光, 由光学采集系统记录荧光, 直到合成全部双链DNA[33-35]. 生物信息学分析则基于Illumina测序平台[36]获得原始数据, 用Geneious[33]软件去除寄主基因组序列, 如线粒体、 叶绿体和核糖体RNA序列等, 筛除不能比对到病毒参考基因组(非目标大类基因组)序列, 获得干净读长[37]; 采用装配工具从头组装, 用NCBI-BLASTn搜索同源病毒核酸序列, 参考NCBI序列来组装病毒基因组; BLASTx搜索同源蛋白序列, 采用Find ORF工具鉴定开放阅读框, 在BLASTp中鉴定同源序列和保守区域, 序列比对采用ClustalW[38], 基于MEGA v.7.0.26[39]构建系统发育树, 揭示病毒亲缘关系. 最后, 结合测序结果和参考病毒序列设计病毒的特异引物, 开展RT-PCR扩增, 检测病毒种类. 如能扩增到特异条带, 说明样品染毒, 对阳性条带克隆测序, 通过NCBI-BLASTn搜索鉴定病毒. 刘雪建[40]使用此方法鉴定了采自浙江省和江西省蔬菜样品中的辣椒斑驳病毒(pepper mottle virus, PepMoV)、 辣椒隐症病毒(pepper cryptic virus, PCV)、 大豆褪绿斑驳病毒(soybean chlorotic mottle virus, SoyCMV)等6种病毒.
表1 第二代和第三代测序技术对比[32]
迄今已知的植物病毒种类超过1 000种[2], 一种病毒可侵染多种植物, 而同种植物又可被多种病毒侵染. 采用HTS技术, 在蔬菜、 粮食、 水果等作物中均检测到多种病毒[41], 研究案例总结如下.
我国广泛种植豆科、 十字花科、 茄科和葫芦科等常见蔬菜, 病毒病已经成为危害我国蔬菜生产的第一类病害[42]. 严重危害蔬菜作物病毒主要有: 烟草花叶病毒(tobacco mosaic virus, TMV)、 番茄斑萎病毒(tomato spotted wilt virus, TSWV)、 CMV、 马铃薯Y病毒(potato virus Y, PVY)、 马铃薯X病毒(potato virus X, PVX)、 花椰菜花叶病毒(cauliflower mosaic virus, CaMV)等[42]. TMV可侵染茄科、 十字花科等30多科300多种植物[43]; TSWV的染病特征是成熟果实上有亮黄色环纹或古铜色斑点[44]; 马铃薯Y病毒侵染后可引起马铃薯植株叶脉坏死、 叶面黄化褪绿、 块茎环斑坏死等症状, 复合侵染危害较大[45].
Wei等[46]采集了11个大豆(Glycine max)样本, 提取总RNA进行Illumina测序, 鉴定3个样品存在豇豆轻度斑驳病毒(cowpea mild mottle virus, CPMMV)单独侵染, 8个样品存在CPMMV和大豆花叶病毒(Soybean mosaic virus, SMV)复合侵染. Tang等[47]首次报道了感染小白菜(BrassicacampestrisL. ssp. chinensis)的一种新病毒, 并将其命名为brassica campestris chinensis cryptic virus 1(BCCV1), 通过对RNA依赖的RNA聚合酶(RNA dependent RNA polymerase, RdRp)和CP进行同源性分析和系统发育分析, 确定BCCV1为Partitiviridae下Deltapartitivirus新成员. Beris等[48]采用Illumina测序技术, 首次报道侵染茄子(Solanummelongena)的茄斑驳皱纹病毒(eggplant mottled crinkle virus, EMCV). Pecman等[49]采用Illumina测序技术测序样品小RNA, 发现一种番茄新病毒——天仙子花叶病毒(henbane mosaic virus, HMV). HTS技术可以快速鉴定样品中存在的病毒, 结合分子生物学实验技术可以验证病毒的致病性和样品是否存在多种病毒复合侵染; 结合生物信息学数据确定病毒的同源性和系统进化关系, 为新病毒鉴定提供证据, 对明确研究病毒的生物学特征和确定其分类地位具有十分重要的作用.
由于昆虫群体等传毒介体的作用, 以及作物品种抗病性较低, 使得我国粮食作物如水稻、 玉米等的多种病毒病危害严重, 发生面积扩大及危害程度迅速上升. 通过HTS技术对病毒来源sRNA测序, 是检测作物病毒的重要方法.
当病毒入侵寄主细胞后, RNA病毒的基因组复制中间物或DNA病毒的mRNA转录产物间会形成双链dsRNA中间体, 这些病毒的dsRNA会被细胞内核酸内切酶Dicer识别并产生大量病毒来源长度为21~24 nt的小干扰RNA(small interfering RNA, siRNA)[50]. Kreuze等[51]提出通过深度测序获得sRNA序列, 用来鉴定新病毒. Xu等[52]通过sRNA测序和生物信息学方法, 分析SRBSDV的siRNA序列, 证实了SRBSDV可以调控水稻RNA沉默通路相关基因的表达, 使寄主染病. 我国玉米的主要侵染病毒有: 水稻黑条矮缩病毒(rice black-streaked dwarf virus, RBSDV)、 甘蔗花叶病毒(sugarcane mosaic virus, SCMV)、 玉米褪绿斑驳病毒(maize chlorotic mottle virus, MCMV)等12种病毒[53]. 陈莎[54]采用sRNA深度测序技术, 鉴定了云南省和贵州省玉米病毒病的病原种类, 通过重叠群拼接和比对共筛选了7种病毒, 其中3种新病毒是玉米黄化花叶病毒(maize yellowing mosaic virus, MYMV)、 玉米相关的形影病毒(maize-associated umbravirus, MAUV)以及玉米相关的整体病毒1(maize-associated totivirus 1, MATV1). 利用sRNA测序可同时检测RNA病毒、 DNA病毒和类病毒, 是一种高通量检测病毒的方法. 在植物未出现明显症状的感染早期, 小RNA的高通量测序可对病毒进行快速准确的检测, 为后续的病毒病防治争取时间.
高通量测序技术已在柑橘[55]、 苹果和梨[56]等果树上应用. 果树被病毒侵染之后树体周身带毒且终生受害, 建立高灵敏度的病毒检测技术对果树病毒病预警和预防有重要意义.
Matsumura等[57]使用Illumina平台对柑橘突然死亡和无症状植物的转录组和小RNA测序分析, 发现柑橘衰退病毒(citrus tristeza virus, CTV)是引起柑橘突然死亡的主要病毒, 其次还有柑橘突然死亡相关病毒(citrus sudden death-associated virus, CSDaV)以及柑橘内源性逆转录病毒(citrus endogenous pararetrovirus, CitPRV), 还发现citrus jingmen-like virus(CJLV)和citrus virga-like virus(CVLV)两种新病毒. 根据侵染特点, 引起苹果病毒病的病毒可分为非潜隐性病毒和潜隐性病毒两大类, 非潜隐性病毒在苹果上的症状易于识别, 特征明显, 潜隐性病毒对苹果生长结实无明显影响, 但易引起果实个小晚熟, 产量品质下降. Lim等[58]通过Illumina测序技术检测到了非潜隐病毒苹果绿皱相关病毒(apple green crinkle associated virus, AGCaV), 以及苹果茎痘病毒(apple stem pitting virus, ASPV)、 苹果茎沟病毒(apple stem grooving virus, ASGV)两种潜隐病毒, 并首次发现apple hammerhead viroid(AHVd)病毒感染苹果树. 杨洁萍等[59]利用Illumina测序技术检测出梨树已知病毒ASPV、 ASGV和ACLSV, 以及梨树中新发现的BrYV; Read等[60]通过Illumina测序和生物信息学分析, 发现了葡萄柚病毒分离物, 为单基因水平的重组事件和种群精细定位提供证据. 因此, 高通量测序技术也为病毒遗传变异研究提供证据[61].
高通量测序技术鉴定植物病毒的核心工作是测序数据分析, 公共数据库中大量的病毒基因组序列是病毒检测的关键, 构建完善的病毒基因组序列资源库, 对于精准防控植物病毒或类病毒是十分迫切的需求.
高通量测序技术的优点有: ① 灵敏性高, 快速, 高通量. 可以在一天内得到全部病毒样品的序列信息, 能够快速诊断某些暴发性病害及疑难杂症的病原, 为病害防治提供依据; ② 通过公共数据库资源比对来鉴定新病毒, 通过重叠siRNA方法也能鉴定新病毒, 如葡萄藤新类病毒的发现[62]; ③ 检测不同类型核酸, 提高病毒检测的广泛性[63], 例如提取总RNA可检测到ssRNA,dsRNA,ssDNA,dsDNA等核酸病毒, 在实际应用中根据需求构建不同的测序文库; ④ 可同时检测来自于不同地区不同寄主中的病毒, 为研究病毒变异和进化研究提供线索; ⑤ 可鉴定无明显症状的潜隐性病毒, 例如Darko等[64]首次报道马其顿共和国北部地区柿子潜隐病毒(persimmon cryptic virus, PeCV), 丰富了病毒公共数据库资源.
目前, 利用HTS技术检测病毒的主要困难有: ① 难以获取高质量病毒核酸库, 需要构建小RNA文库来富集病毒序列, 提高测序灵敏度; ② 某些病毒基因组含量极低, 不易获得, 使用Trizol法提取植物总RNA制备测序文库、 制备小RNA文库和去除核糖体RNA建库来降低寄主基因组含量; ③ 难以获得低丰度病毒的完整基因组序列, 一方面读长拼接时会产生缺口, 需要借助常规PCR补平, 另一方面病毒5’或3’端序列缺失, 需要根据已知病毒序列设计特异性引物, 用RACE扩增和Sanger测序补平; ④ 目前被列入检疫名录实施管理的致病病原种类有限, 需要将病株接种到健康植物上验证是否致病, 加强对新病毒和类病毒的管理; ⑤ 研究者的知识积累与辨别能力, 影响病毒鉴定结果的准确性与可靠性, HTS技术检测植物病毒产生大量的遗传信息数据, 而测序结果的组装、 比对等是鉴定病毒的关键, 科研工作者应该积累遗传学、 生物信息学等基础知识和掌握先进技能, 以提高检测结果的准确性.
病毒病导致作物品质下降, 减产甚至绝收, 制约了蔬菜、 粮食、 水果等产业发展. 然而目前对病毒病种类、 分布、 危害等缺乏系统研究, 对某些病毒及新病毒防治甚至缺乏研究, 另外病毒变异速度快, 增加了病毒病防治的研究难度. 高通量测序技术可一次性鉴定出样品携带的多个病毒, 快速实现植物样品中所有转录组的具体分析, 为植物病毒普查和防治提供一定的理论依据.