林彦锋,李鹏,刘雪林,宋宏彬
1.军事科学院军事医学研究院,北京100850;2.中国人民解放军疾病预防控制中心,北京100071
近年来,新发突发传染病成为威胁人类健康与公共卫生的重要因素,埃博拉、寨卡等疫情的不断暴发给人们敲响了警钟,这些病原体的快速检测对于传染病疫情的防控至关重要。新一代测序(next-generation sequencing,NGS)技术可以获得病原体基因组序列信息,解决传统分子生物学方法难以应对未知或变异病原检测的瓶颈问题[1-4],提高病原体识别确认能力,并通过基因组序列分析实现病原体的快速鉴定、精准分型、传染源追溯及传播演化规律分析,有效降低新发突发传染病造成的公共卫生影响[5-6]。比如,利用高通量测序预测H1N1 的传播流行规律,与传统的流行病学预测结果一致,为流感防控提供了重要参考[7]。在埃博拉疫情中应用高通量测序研究埃博拉病毒的演化规律,为深入的流行病学调查提供了关键信息[8]。
然而,现有的NGS 技术平台体积大不易搬运,测序周期长,且依赖于大量实验室辅助设备和专业人员操作,在面临疫情暴发或严重感染性疾病的处置中难以实现快速实时检测,无法应对致病病原识别时效性的需求[9]。且受限于短读长,NGS 测序难以获得具有重复序列的复杂基因组结构的病原体序列全长,不利于后续变异和溯源分析[10-11]。纳米孔测序技术利用碱基穿过纳米孔时电信号的改变实现实时测序[12],Oxford Nanopore Technology(ONT)公司基于该技术研发了掌上测序仪MinION,仅有U 盘大小,可通过笔记本电脑USB 接口实现供电和数据生成读取,不受外界环境和辅助设备限制,实时获得数据,按需终止测序[13]。MinION 测序也无须对核酸进行片段化,最快可在10 min 内完成样本建库,并可获得更长读长,目前单条序列读长已达到882 kb[14]。引起感染的病原体种类极其复杂,使用宏基因组测序可以同时检测样本中的病毒、细菌、寄生虫等病原体[15],MinION 在超长读长、实时测序和高便携性等方面的优势,使其在病原体检测和疾病暴发监测方面的应用日益广泛。
Greninger 等[16]首次利用MinION 对4 例患者血液样本进行实时宏基因组病原检测,病毒含量为107~108拷贝/mL 时,4~10 min 即可完成对埃博拉病毒和基孔肯雅病毒的检测;病毒含量为105拷贝/mL 时,40 min 内检测到丙型肝炎病毒,且与二代测序仪MiSeq 的结果一致。该方法可将“样本~检测”的整个周转时间缩短至6 h 以内,有效缩短了对传染性疾病的早期诊断的时间。
引起肝脓肿的病原体种类繁多,目前的诊断主要依赖于病原体培养,周期长且常导致培养结果的偏倚。Gong 等[17]对非培养肝脓肿样本进行纳米孔测序以鉴定引起感染的病原体,通过差速离心去除人源完整细胞,借助DNA 酶消化去除人源线性DNA,对处理后的样本进行MinION 测序,并用ONT 公司的What′s In My Pot(WIMP)生物信息分析流程进行实时病原体鉴定,在4 h 内识别出样本中的肺炎克雷伯菌2 个亚型,并进一步发现了emrB、macB 等7 个耐药基因,极大地缩短了病原体鉴定的时间,为临床感染实时诊断与抗生素用药提供了重要参考。
蚊子是病原体的重要传播媒介,但其携带的病原含量极其有限,为病原监测带来极大的困难。Batovska 等[18]从一例感染罗斯河病毒的白纹伊蚊中直接提取RNA,采用MinION 和MiSeq 对反转录产物进行测序,前者成功测定病毒基因组全长,且2 个平台测序准确率均达到98%以上。美国佛罗里达州研究者采用相似方法,对收集的20例库蚊样本混样后进行现场测序,检测到委内瑞拉马脑炎病毒,并基于序列分析确定为大沼泽地病毒亚型[9]。该研究仅需手持式qPCR 仪、MinION测序仪及笔记本电脑,即可在现场完成对环境样本的测序和生物体的种属鉴定,对仪器设备的要求低,且无需额外PCR 扩增步骤,为现场快速生物监测提供了可借鉴的方法。
疟疾作为一种重要的蚊媒传播的寄生虫传染病,现有实验室诊断方法仍难以满足现场快速准确的检测需求。Imai 等[19]针对5 种可引起人类疟疾的疟原虫的18S rRNA 序列设计特异性引物,对环介导等温扩增后的产物进行MinION 测序,对疟原虫最低检测限达到每个反应体系10~100 拷贝,与巢式PCR 法对疟原虫种属鉴定结果一致,但该方法对实验设备要求低,适于在实验室条件匮乏的地区开展检测。
病毒遗传信息多以RNA 为载体,现有测序技术须将RNA 反转录为cDNA,易引入碱基匹配错误或反转录偏倚,也难以了解RNA 原始状态[20]。ONT 公司研发团队[21]用MinION 首次完成了对酵母中poly(A)+RNA 的直接测序,无须进行反转录或扩增就可直接获得酵母全长链特异性的RNA序列。研究者进一步对该样本RNA 反转录后的cDNA 分别进行MinION 和MiSeq 测序,3 次测序结果与酵母转录组数据的匹配均在79%以上,且RNA 直接测序与反转录后测序具有较高的相关性。Keller 等[22]针对甲型H1N1 病毒基因组3′端高度保守区设计探针,用MinION 对捕获的病毒原始RNA 直接测序,获得influenza rA/Puerto Rico/8/1934 毒株完整的编码序列,随后又用该方法对甲型流感病毒H1N1、H3N2、H5N1 和H7N9 进行RNA直接测序,与反转录后PCR 和MiSeq 测序结果的一致性达98%,且超过96%的序列可以匹配到对应病毒基因组,表明MinION 在病毒RNA 直接测序方面的巨大潜力,为进一步直接研究病毒RNA进化变异和碱基修饰提供了重要参考。
长读长测序为病原体鉴定提供更高的分辨率。Peritz 等[23]对大肠杆菌7 个血清型的混合DNA 文库进行纳米孔测序,以测试MinION 测序对大肠杆菌的分型与鉴别能力。测序结果显示共获得63 297 条有效序列,平均读长为5.9 kb,过滤掉小于4.0 kb 的序列后剩余44 245 条序列。将这些序列与大肠杆菌O 抗原基因簇数据库比对,其中58 条序列特异性匹配到7 种血清型的O 抗原,且每一个O 抗原簇至少匹配4 条序列。通过与大肠杆菌全基因组数据库比对,显示5096 条(11.5%)序列为特异性匹配序列,这其中99.6%的序列与该7 种血清型匹配,仅0.4%的序列与其他血清型匹配。该方法表明MinION 测序对于复杂混合样本的病原体分型依然具有较高的分辨率,在病原体快速分型中具有明显优势。
16S rRNA 基因(~1500 bp)与rrn 操纵子(16S-ITS-23S)是进行微生物种属鉴定的重要标志,二代测序由于读长短难以对细菌进行更精细的分型,采用纳米孔测序获得16S rRNA 和rrn 的全长序列,也有助于更全面和更快地检测复杂生态系统中的微生物物种多样性。Cuzco 等[24]利用MinION 分别对葡萄球菌样本的16S rRNA 和rrn进行测序,发现两者的扩增子比对到正确物种的比例分别达~68%和~98%。为了研究微生物多样性,研究者设计新的多位点方法并利用MinION 平台对模拟样本进行16S 扩增子测序,在单次测序中获得约380 万条序列,完成了对模拟样本中超过90%的16S rRNA 基因序列的重建,检测到20个不同物种,并计算出所有物种的相对丰度[25]。该课题组进一步结合多位点与长扩增子测序方法,使用引物对样本中的rrn 区域进行PCR 扩增后用纳米孔测序,最终分析和提取67 000 多个细菌基因组中的rrn 序列,完全重建了模拟群落中的微生物多样性,且其分型准确率优于单独基于16S、ITS 或23S 的分型结果[26]。
2014~2016 年西非埃博拉疫情导致11 299 人死亡,引起了全世界的关注。快速获得基因组信息有助于阐明埃博拉病毒的传播规律,然而疫区地处偏远,缺乏良好的实验室和样本运输的条件。Loman 团队[27]首次将MinION 带到几内亚疫情现场,建立基因组实时监测系统,收集并完成142例埃博拉患者样本测序,最快可在24 h 内获得测序结果。基于测序数据,研究者发现几内亚流行的病毒主要属于GN1 和SL3 种系,且这2 个种系也出现于塞拉利昂,提示病毒在2 个国家之间发生传播。Hoenen 等[28]则在利比里亚开展埃博拉病毒现场测序,获得8 份样本的埃博拉基因组序列,发现该地区的病毒序列与塞拉利昂或几内亚的病毒序列存在明显差异,但与利比里亚其他地区序列属于同一簇,进化分析结果显示该地区的埃博拉病毒可能由同一个或亲缘关系较近的祖先进化而来,为疫情防控提供了重要的科学依据。
2015 年巴西暴发寨卡疫情,随后超过45 个国家报道了寨卡病毒在本国的传播。为获得寨卡病毒的基因组序列及传播规律,针对寨卡感染样本中病原含量低、背景复杂、直接测序难以获得病毒序列全长的问题,研究者基于寨卡病毒特定编码序列设计了引物池,通过多重PCR 进行富集扩增,建立基于MinION 的现场测序方法,从而在1~2 d 内获得病毒的一致性序列,该方法在病毒拷贝数低至50 时仍能有效检测到病毒[29]。基于上述方法,Faria 等[30]进一步发起“巴西寨卡病毒实时分析计划”,利用MinION 部署移动实验室,直接对临床样本进行现场测序,获得了54 株寨卡病毒基因组序列,发现疫情毒株与来自东南亚及太平洋地区的寨卡病毒亚洲基因型亲缘关系较近,推测寨卡病毒从巴西东北部向中美洲、加勒比海及南美洲其他地区传播。后续的地理学分析结果和前述基础病毒增殖数量预测结果一致,为研究病原体的传播轨迹和进化规律提供了更为及时和精确的信息[31]。
2018 年尼日利亚拉沙热疫情暴发,拉沙病毒高变异性为基于PCR 的扩增测序带来极大困难。为了明确毒株变异特征以及疫情暴发的分子流行病学机制,研究者们[32]通过随机反转录和单引物扩增法对36 例临床样本中提取的病毒RNA 进行扩增,并采用MinION 进行现场实时测序与分析,发现疫情毒株主要为拉沙病毒Ⅱ型和Ⅲ型,系统发育学分析显示这2 种病毒亚型主要存在于啮齿动物中,推测此次疫情为散发的人畜共患病传播事件,排除了拉沙病毒在人际间大规模传播的可能,指导卫生部门将工作重点从切断人间传播转向啮齿动物控制、环境卫生和食品安全等方面,为疫情防控指明了正确的方向。
医院中病原体感染传播可能导致重症患者死亡,造成社区范围内的大规模播散,病原体的快速检测与分型是院内感染防控的首要环节。2015 年英国伯明翰一家医院暴发了沙门菌疫情,超过30 人感染,感染来源难以确定。Loman 等[33]用MinION 测序仪分别对腹泻患者粪便样本和环境拭子样本分离的菌株进行测序,在20 min 内确定感染病原体为肠炎沙门菌,在2 h 内完成沙门菌与感染暴发间的关联分析,发现其中一例测序菌株与其他疫情菌株归属于同一进化分支,而另一例非疫情相关菌株归属其他分支,综合后续Illumina 测序结果,37 例疫情菌株中,8 例来自医院工作人员,3 例来自病房内的无症状携带者,提示这是一起沙门菌的院内感染暴发。进一步研究发现,最终暴发菌株确定为PT 14b 型,MLVA 分型为2-11-9-7-4-3-2-8-9,且暴发菌株的MLVA分型与先前的法国、奥地利、德国暴发的肠炎沙门氏菌PT 14b 仅有1 个位点的差异,最终确定源头来自德国的一家鸡蛋生产商,提示可能存在着欧洲不同国家间肠炎沙门菌的传播,为及早采取措施控制疫情传播争取了宝贵的时间。
基孔肯雅病毒自2013 年在加勒比地区首次检测到后,已经传播到51 个美洲地区国家,然而关于其基因多态性与动态性变化的流行规律缺乏系统研究。Naveca 等[34]针对2014~2018 年在巴西亚马孙地区暴发的基孔肯雅病毒疫情,使用MinION 测序获得了20 例基孔肯雅ECSA 基因型(CHIKV-ECSA)病毒株的基因组,分析发现亚洲基因型虽然在2015 年传入巴西地区,但此次疫情是由起源于巴西东北部的ECSA 基因型引起的,且ECSA 基因型正在取代亚洲基因型成为优势亚型。进一步的流行病学分析表明,病毒基本再生数为1.66,据此估计该地区约39%的人口感染基孔肯雅ECSA 基因型。另外,研究者发现Google搜索的活跃度与当地实验室确认的基孔肯雅病毒感染病例之间存在密切联系。这一研究显示出将传统监测与便携式纳米孔基因组测序技术和数字流行病学相结合的潜力,为探索病原体的流行规律提供重要信息。
黄热病毒自然情况下在原始森林中循环与传播,巴西的黄热病毒感染病例近年来明显上升,然而黄热病毒在人群间的传播规律仍不明确。研究者们[35]使用纳米孔测序对感染人类和非人灵长类动物的黄热病毒株进行全基因组测序,结合流行病学、地理学和基因组学数据,发现病毒的传播与人类病例的年龄和性别分布密切相关,且黄热病毒在自然界传播的地域范围不断扩大,引起疫情的病毒株在感染人之前便已在非人灵长类动物中循环传播,最终导致2016 年人群中疫情的暴发。基于纳米孔测序技术的黄热病毒传播实时监测体系,有助于制定消除未来黄热病毒流行的全球战略。
多重耐药编码质粒是细菌间抗生素耐药基因传播的重要介质,而大量重复序列的存在导致难以通过二代测序获得质粒完整序列,给解析病原菌耐药的流行传播规律带来极大困难。为研究携带NDM-1 基因的细菌在医院内和医院间的传播规律,Phan 等[36]收集了罗马尼亚2 家医院的粘质沙雷菌、肺炎克雷伯菌和阴沟肠杆菌菌株,结合MinION 和Illumina HiSeq 测序结果,获得了9例样本的完整质粒序列,发现其结构均与质粒pKOX_NDM1 类似,为研究耐药质粒在不同物种间传播的分子流行病学机制提供了重要参考。
纳米孔测序为病原体快速检测尤其是疫情现场判别提供了新的思路,但其测序数据信噪比低,导致测序错误率高,须通过提高测序深度或与二代测序平台联用提高准确率[37-38]。此外,测序需要较高的核酸质量,探索适于不同类型临床样本的现场处理和测序方案,减少对实验室设备的依赖,进一步优化完善样本处理与文库制备操作流程,有助于提高快速检测的时效性和准确性。我们课题组采用样本混合富集的方法,对腺病毒感染非培养样本进行了直接测序,在3 h 内即获得了腺病毒完整基因组,为疫情实时检测提供了宝贵经验[39]。ONT 公司近期推出的VolTRAX实现了测序文库构建的自动化,进一步缩短了样品文库制备时间,但目前还在试用阶段[40]。英国伦敦大学学院(UCL)启动了PATHSEEK 项目,研究如何对临床样本中的特定病原体进行自动化靶向富集和测序分析,并对流感病毒、人巨细胞病毒、结核分枝杆菌等病原体的临床检测进行了应用评估,为复杂样本处理提供了重要参考[41]。
MinION 作为一种新型的测序技术,具有便携性、实时性等诸多优势,且无须对样本进行PCR扩增,因此降低了样本起始量和测序错误率,实现了真正的单分子测序。不仅可以实时测序,也可以“剔除”不感兴趣的序列,对感兴趣的序列持续进行测序,以便于从样本宿主背景中获取更多的病原序列信息[42]。基于EPI2ME 平台开发的生物分类工作流WIMP[24]可以对测序数据中细菌、病毒、真菌、古细菌等进行识别,也为临床病原体检测提供了可定量化实时分析工具。随着平台及分析工具的不断发展与完善,纳米孔测序技术将在现场病原体检测、临床微生物诊断以及实时病原监测等领域中具有日益广阔的应用前景。