叶福强 李鹏 韩一芳 张琪 林彦锋 王凯英 王太武 宋宏彬 王长军 汪春晖 张锦海★
近年暴发的西非埃博拉出血热(2014年)、巴西寨卡病毒病(2015年)和尼日利亚拉萨热疫情(2018年)等新发传染病对疫区民众的生命健康造成巨大威胁[1-6]。为了有效遏制传染病蔓延,亟需快速有效的病原体检测确认技术。常用的聚合酶链式反应(polymerase chain reaction,PCR)扩增技术对未知病原或高突变率病原检测能力有限。现有的二代高通量测序平台虽然具备鉴别病原微生物的能力[1,7-11],但对实验室环境要求苛刻,文库制备流程复杂,也限制其大规模的现场快速检测应用。
由Oxford Nanopore Technologies(ONT)开发的三代测序平台MinION,通过捕捉DNA/RNA 经过纳米孔时引起的电流变化来鉴别核苷酸[12-13]。其在病原体现场快速检测方面具有诸多优势:①便携。总质量仅为87 g,可应用于现场检测[14-17]。②供电方式简单。USB 3.0 接口即可保证测序仪稳定运行。③测序数据实时产出即时分析。④读长长。现有报道的最长测序读长~2.3 Mb[12]。当前该平台已用于人类血液、尿液和呼吸道样本里的病毒和细菌病原体检测[7,18-19],也为西非埃博拉病毒病以及巴西寨卡病毒暴发疫情的病原确认和流行病学调查提供了关键线索[5,20-22]。为了验证纳米孔测序技术在呼吸道病毒病原体应急检测中的可行性,笔者使用MinION 对上呼吸道感染患者的咽拭子标本进行快速测序及病原学分析,并采用PCR 实验验证测序结果。
咽拭子标本由东部战区疾病预防控制中心于2019年3月在流感网络实验室运行期间采集于某部1 名士兵,该患者因出现发热、咳嗽、流涕等症状就医,初步诊断为上呼吸道感染,病原不明。
病毒核酸抽提试剂盒Qiagen QIAamp Min-Elute Virus Spin Kit 购自德国Qiagen 公司,Qubit 3及配套定量试剂耗材、磁力架购自美国Invitrogen公司,cDNA 合成试剂盒NEBNext Ultra II RNA First Strand Synthesis Module 和NEBNext Ultra II Non-Directional RNA Second Strand Synthesis Module 购自美国NEB 公司,AMPure XP 磁珠购自于美国Beckman 公司,快速建库测序试剂盒(SQKRADSP4)、测序芯片制备试剂盒(EXP-FLP001)、测序芯片(FLO-MIN106,R9.4)、测序仪MinION Mk1B 购自英国ONT 公司,核酸抽提试剂盒TaKa-Ra MiniBEST Viral RNA/DNA Extraction Kit 及实时荧光定量PCR 检测试剂盒One Step Prime-ScriptTMRT-PCR Kit(Perfect Real Time)购自日本Takara 公司。
1.2.1 病毒总核酸抽提及定量
对用于MinION 测序的样本病毒总核酸(DNA/RNA),除不进行离心过滤、不加入核酸酶和溶菌酶外,其余实验步骤均按说明书操作进行。收集核酸后,取2 μL 样本核酸按仪器说明书测定dsDNA 和RNA 浓度。
1.2.2 逆转录合成cDNA 及定量
首先使用NEBNext Ultra II RNA First Strand Synthesis Module 合成cDNA 的第一链,然后使用NEBNext Ultra II Non-Directional RNA Second Strand Synthesis Module 合成cDNA 的第二链。使用Beckman AMPure XP 磁珠按说明书的方法对cDNA 产物进行纯化收集。取1 μL 产物,使用Qubit 3 对dsDNA 浓度进行测量,测量过程按仪器说明书进行。
1.2.3 MinION 文库构建及测序
测序在MinION Mk1B 测序仪上进行。首先按说明书要求进行测序芯片质检,质检通过后依照快速建库测序试剂盒及测序芯片引发试剂盒操作流程构建测序文库并加样至测序芯片中,在加样过程中避免将气泡引入加样孔中。在测序仪控制软 件MinKNOW(v 3.1.19,ONT 官 网https://nanoporetech.com/下载)上对测序参数进行设置,测序运行时间设为”48 h”。
1.2.4 MinION 测序数据生物信息学分析
使用MinKNOW 实时读取测序仪产生的fast5文件,使用Albacore 软件(v 2.3.4,ONT 官网下载)将fast5 文件转换成fastq 文件,碱基质量分数低于7的序列将被剔除。使用Nanoplot 软件(v 1.22.0)[23]查看测序数据质量及读长分布。使用Centrifuge(v 1.0.4)[24]对测序数据进行初步比对分析:将所有通过质控的序列与人(Grch38.p12)和病毒参考基因组(NCBI Refseq 数据库ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/,2019年3月21日下载,共计8 588 个病毒全基因组序列)进行快速比对,参数设置为“--min-hitlen 15-k 5”,3 min 内即完成比对过程。
为进一步了解物种构成,采取“先比对后剔除”的策略,先使用Minimap2 软件(v 2.16)[25]将所有质控后序列与人参考基因组比对,参数设置为“-ax map-ont-k 15”,使用samtools(v 1.9)[26]对比对产生的sam 文件进行处理,得到的未匹配序列用于下一步操作。然后将上步获得的序列与NCBI病毒参考数据库进行比对,参数为“-ax map-ont -k 7”,获得的未匹配序列用于下步比对。最后,将上步未匹配序列使用BLASTN(v 2.8.1)与NCBI 细菌和古细菌参考基因组比对(包括12 668 个细菌和283 个古细菌全基因组序列,2019年3月21日下载),参数为“-perc_identity 90-word_size 16-evalue 0.000 001”,未匹配的序列定义为“未分类序列”。
为进一步了解比对详情,将匹配到NCBI 病毒Refseq 参考数据库的序列提取出来,进行在线BLAST 比对,参数设置同上,并挑选出比对一致性较好的基因组,用于下游分析并统计比对情况,包括比对一致性、查询序列覆盖度等信息。使用samtools 及Qualimap(v 2.2.2)[27]计算参考基因组覆盖度。使用自有Perl(v 5.22.1)脚本查看序列的产出时间并进行统计排序。
1.2.5 实时荧光定量PCR
使用实时荧光定量PCR 来验证MinION 测序获取的病原阳性结果。Adv7 引物序列:HAdV7-F:5′-GAGGAGCCAGATATTGATATGGAATT-3′,HAdV7-R:5′-AATTGACATTTTCCGTGTAAAGCA-3′ ,探针序列为FAM-AAGCTGCTGACGCTTTTTCGCCTGA-BHQ1。H3N2 引物:H3F:ACCCTCAGTGTGATGGCTTCCAAA,H3R:TAAGGGAGGCATAATCCGGCACAT,探针序列为FAM-ACGCAGCAAAGCCTA CAGCAACTGT -BHQ1。使用无核酸酶的水作为阴性对照。使用的总核酸从咽拭子病毒保存液中抽提,使用试剂盒配制PCR 反应体系。反应条件为42℃5 min,95℃10 s,95℃5 s(40 个循环),60℃34 s。Ct 值<35 时,认为PCR 检测阳性。
样本抽提后RNA 浓度为20.8 ng/μL,dsDNA浓度为52.0 ng/μL。逆转录合成cDNA 后的定量结果为77.2 ng/μL,以cDNA 作为模板建立MinION文库并测序。MinION 运行15 h,共产生236 764 条序列(图1),其中188 063 条序列(占比79.43%)通过数据质控(高质量序列,碱基质量分数均不低于7),其余序列未通过质控(低质量序列)。
图1 MinION 测序通量Figure 1 The sequencing throughput of MinION
通过质控的测序数据用于下游生物信息学分析。其中最长读长为102 326 bp,最短读长为23 bp,总碱基数为246.7 M。平均读长为1 311.8 bp,平均质量分数为9.1,读长中位数为3 281 bp。
快速比对分析结果表明样本中同时存在两种呼吸道病原体:人呼吸道腺病毒7 型(DNA 病毒)和甲型流感病毒H3N2 亚型(RNA 病毒)。仅2 min 50 s 即完成比对过程,获得初步鉴定结果。
质控后的数据中共有145 861 条序列(占比77.56%)来自于人,病毒序列数为6 876(占比3.66%),细菌/古细菌比对数为6 057(占比3.22%,主要包括来自口动菌属、奈瑟氏菌属、链球菌属、普氏菌属、克雷伯菌属、梭菌属、嗜血杆菌属、韦荣球菌属等口咽部细菌),未分类序列数为29 269(占比15.56%),分类结果见图2。
图2 测序数据构成Figure 2 The composition of sequencing data
进一步的生物信息学分析同样在样本中同时鉴别出两种呼吸道病原体:人呼吸道腺病毒7 型和甲型流感病毒H3N2 亚型,分别有19 条和4 条序列比对到参考基因组。进行在线BLAST 比对后,选取比对一致性较好的人呼吸道腺病毒7 型(Adv7,Genbank 序列号:MG696128.1,基因组大小为35 233 bp)和甲型流感病毒H3N2 亚型(H3N2,Genbank 序列号:MK633737.1-MK633744.1,共8 个基因区段,基因组大小分别为1 701 bp、982 bp、1 410 bp、1 497 bp、838 bp、2 151 bp、2 274 bp 和2 280 bp)基因组进行下一步分析。
19 条Adv7 序列与参考基因组的比对一致性介于84.83%和96.55%之间,查询序列覆盖度介于70.63%和99.58%之间(表1)。19 条序列中,读长排名前三的分别为14 910 bp,14 720 bp 和12 097 bp。对Adv7 参考基因组覆盖度为87.65%,覆盖深度介于1X 和5X 之间(图3)。4 条H3N2 序列比对到参考基因组的3 个区段上,分别是区段2(PB1和PB1-F2基因,MK633743.1),区段3(PA和PA-X基因,MK633742.1)和区段6(NA 基因,MK633739.1),比对一致性介于91.43%和94.74%之间,对3 个区段的覆盖度分别为32.81%,6.79%和7.02%。
至此,鉴定出该患者为呼吸道腺病毒7 型和甲型流感病毒H3N2 亚型混合感染。
MinION 的文库制备具有简易快速的优点,从获得样本到建立文库并上机测序,仅用时约3.5 h(215 min)(图4)。纳米孔测序技术还具有实时产出数据的优势,测序开始仅9 s 后即有可用于下游分析的原始数据产生。测序1 h 内,共计产生18 151 条序列,占总产出数据的比重为7.67%,其中通过质控的序列数为15 559,占所有可用数据的比重为8.27%。测序开始仅8 min 后,MinION 即产出第1 条Adv7 序列,读长为12 097 bp,与MG696128.1 参考序列一致性为90.80%,比对覆盖度高达99.58%(表1)。测序开始后的9 h 内,78.95%的Adv7 序列均已产出,读长最长为14 910 bp。14 h 以后,所有Adv7 序列均已产出。对于H3N2 数据而言,测序开始69 min 后即产生第1 条序列,9 h 内产出所有H3N2 序列。测序进行15 h后终止,进行快速宏基因组比对分析,仅需3 min即获得微生物初步分类结果。综上,从拿到样本到获得初步鉴定结果,共耗时约18.6 h,低于当前二代台式测序平台所需时长。值得注意的是,测序开始9 h 内,匹配到Adv7 和H3N2 参考基因组的绝大部分序列已经产生。此时终止测序亦可获得类似鉴定结果,因此实际流转时间可控制在13 h以内。
图4 MinION 测序流转时间Figure 4 The sequencing turnaround time of MinION
扩增曲线表明,Adv7 和H3N2 均为PCR 阳性(图5)。PCR 结果与测序结果吻合。同时,对该份送检标本,未检出流感网络实验室监测的其它呼吸道病原(包括其它亚型甲型流感病毒、乙型流感病毒、支原体、衣原体、冠状病毒等,数据未显示)。
图5 实时荧光定量PCR 结果Figure 5 The results of real-time fluorescence quantitative PCR
作为经典、常见的微生物快速检测方法,PCR技术灵敏度和准确度高,在目标微生物参考序列已知的情况下,能在4 个小时左右获得对单一病原的鉴定结果。但对于新发、未知病原体,由于缺乏病原序列先验知识,通常需要针对多种潜在病原设计多对引物,进行多轮PCR 进行筛查,工作量大且仍有可能无法获得病原检测结果。当前主流二代测序平台文库制备流程一般较为繁琐,测序周期长,同时数据分析必须在测序完成后进行,限制其在病原体快速检测方面的应用。基于纳米孔测序技术的MinION 能有效解决以上不足,已应用于埃博拉病毒病、寨卡病毒病的病原体现场快速检测中。
呼吸道病毒病原体包括DNA 病毒和RNA 病毒,为了全面捕获咽拭子保存液里的病毒序列,在病毒种类不明确时,必须采取病毒DNA 和RNA 同时测序的策略,所以,对于应急检测的样本而言,逆转录合成cDNA 这一步必不可少,其耗时一般在2~3 h。对于病原体快速测序而言,逆转录合成cDNA 会是限速步骤之一,在今后的检测过程中,还需探索快速合成cDNA 的实验方法。
从获得样本到建立文库并上机测序,仅用时约3.5 h,远低于当前主流二代台式测序平台所需的至少6 h 的建库时间[28]。从取样到获得初步鉴定结果,MinION 测序流转时间约为18.6 h,其中测序时长15 h。对于培养样本或者具有病原先验知识的样本而言,可以针对性选择核酸富集(核酸含量符合建库要求无需富集、PCR 扩增富集DNA 样本、逆转录合成cDNA)或文库制备流程(快速建库、连接建库、RNA 直接测序、cDNA 直接测序等),测序仪运行时长也可针对性进行调整。当前单个R9测序芯片总数据产量可达到10~15 Gb,单个细菌或病毒的培养样本一般测序数据产量达到1Gb(细菌基因组的覆盖度此时一般可达100X-200X)时,即可考虑终止测序,测序耗时一般不超过5 h,远低于本研究中的15 h。而对于非培养样本而言,则需要动态监测产出数据,测序时长也会相应增加。本研究中,测序开始9 h 内,匹配到Adv7 和H3N2 参考基因组的绝大部分序列已经产生。测序开始5 h内,至少有50%的Adv7 和H3N2 序列已产生。因此,应急检测的流转时间还有望进一步减少。
本文使用一步法RT-PCR 对测序结果进行验证。可以发现Ct 值与匹配序列数目和数据产出时间具有一定相关性。Ct 值越小,核酸含量相对越高,匹配到参考基因组的序列就越多,其数据产生的时间越早;反之,匹配到参考基因组的序列则越少,数据产出时间越晚。
本文的研究结果表明,MinION 用于呼吸道病原体的快速检测具有可行性,且具备同时检测多种病原体并对病原分型的能力,但仍有一些技术问题需要解决,如在快速检测背景下,人的临床样本,尤其是咽拭子、血液、尿液等样本,其宿主核酸含量占比一般较高,病原体核酸含量极低,这就导致测序数据中宿主相关序列占绝大部分。如何有效地富集病原体核酸将会是该技术应用于现场快速检测需要解决的重难点问题。笔者相信,随着纳米孔测序技术及相关试剂的升级完善,MinION 有潜力成为病原体快速检测和临床诊断的常规工具。