郭喜玲 葛以跃 赵康辰 朱小娟 祁贤 陈银 史智扬 朱凤才 周明浩 崔仑标
210009 南京,卫生部肠道病原微生物重点实验室 江苏省疾病预防控制中心病原微生物研究所
·论著·
1例上呼吸道感染病例的高通量测序病原鉴定
郭喜玲 葛以跃 赵康辰 朱小娟 祁贤 陈银 史智扬 朱凤才 周明浩 崔仑标
210009 南京,卫生部肠道病原微生物重点实验室 江苏省疾病预防控制中心病原微生物研究所
目的 以高通量测序技术对1例上呼吸道感染病例的可能病原进行鉴定并对样品前处理方法进行优化。方法 以核酸酶和/或核糖体RNA探针杂交预处理患者咽拭子样本,非序列依赖单引物扩增(sequence-independent single primer amplification,SISPA)后制备测序文库,利用MiSeq高通量测序,对测序结果进行生物信息分析及Real time RT-PCR验证。结果 测序reads经拼接后与病毒数据库比对发现存在乙型流感病毒序列,进化分析该毒株属于Yamagat系一株新的变种,核酸酶结合核糖体RNA探针杂交处理样本可提高高通量测序目标序列数及覆盖率。结论 应用核酸酶和/或核糖体RNA探针杂交处理样本结合高通量测序技术可用于快速高效地鉴定不明原因感染的病原。
Fund programs: Science & Technology Demonstration Project for Emerging Infectious Diseases Control and Prevention of Jiangsu Province (BE2015714); 333 Outstanding Projects of Jiangsu Province; Natural Science Foundation of Jiangsu Province of China(BK20141030);National Major Science & Technology Projects for Infectious Disease Control and Prevention (2012ZX10004401-006)
明确疾病的病原体是传染病防控的关键,研究快速高通量的病原体筛查技术对于明确病原至关重要[1,2]。近年来发展的筛查技术如代表性差异分析(RDA)技术、基于保守序列的聚合酶链反应(Consensus Sequence Based PCR)、基因芯片、随机引物PCR及由其发展而来的序列不依赖的单引物扩增(SISPA)技术等大量用于病原体的筛查,但存在着检测灵敏度低、扩增失败、操作繁琐、耗时长等缺点;再次,疾病的感染往往比较复杂,大量病例存在混合性感染,同时对多种病原体进行甄别也对现有的核酸检测方法提出了挑战。基于高通量测序技术的病毒宏基因组改变了微生物基因组研究的进程[3],也为病毒的检测鉴定开辟了新的技术路径,克服了现有分子检测手段的缺陷[4]。其基本原理是对生物样本中所有DNA或RNA序列无选择地进行分析,建立序列数据库,从中查找与某种病原体有同源的序列或发现新病毒序列。本研究利用高通量测序技术鉴定了一例上呼吸道感染病例的病原并对测序前样品处理方式进行优化。
1.1 病例及样本采集 患者于2015年1月21日出现不明原因发热、全身酸痛无力,药物治疗前采集患者咽拭子样本,-80 ℃保存。
1.2 仪器与试剂 MagNA pure LC全自动核酸提取仪、MagNA pure LC total Nucleic Acid isolation kit(Roche公司,瑞士); Rotor Gene 3000荧光定量PCR仪(Qiagen公司,德国);Qubit 2.0荧光计、SuperScript® III First-Strand Synthesis System、Platinum-PCR super mix(Invitrogen公司,美国);Benzonase® Nuclease HC ( EMD chemicals,Merk,德国);RNase H、Klenow Fragment (3′→5′ exo-)(NEB公司,美国);DNase I (Takara公司,日本);MiSeq高通量测序仪、Nextera XT DNA Sample Preparation Kit、MiSeq Reagent V3 Kit(600-cycles)(Illumina公司,美国)。
1.3 样本核酸酶处理 咽拭子标本反复冻融两次,低速离心后取上清200 μl,加入0.5 μl 核酸酶(250 U/μl) 37 ℃孵育1 h后,用MagNA Pure LC全自动核酸提取仪提取核酸。
1.4 核酸杂交 提取的核酸参照文献中SDRNA方法2进行核糖体RNA探针杂交、RNaseH和DNaseI酶等处理后[5],用MagNA Pure LC全自动核酸提取仪提取核酸。
1.5 SISPA扩增 上述不同方法或联合2种方法处理得到的核酸样本,参照文献建立的方法[6],依次进行cDNA第一链、第二链合成及PCR扩增。
1.6 高通量测序 Qubit 2.0荧光计将双链cDNA准确定量后,稀释成0.2 ng/μl。取5 μl作为测序模板,按照Nextera XT DNA Sample Preparation Kit操作说明构建测序文库。主要步骤包括:DNA的Tagmentation、PCR扩增、纯化、文库标化及混合。取1 000 μl混合样加入MiSeq测序试剂样品孔,进行2×300 bp配对末端测序。
1.7 统计学方法 对测序原始数据使用CLC Gen-omic Workbench 7.5进行过滤低质量序列、过短序列以及去除SISPA扩增接头等处理。处理后reads进行overlapping拼接,拼接的序列与本地化病毒数据库进行Blast比对。对基因片段不完整的部分在gap两端设计引物进行PCR扩增填补。采用MEGA5.1分析病毒进化,采用邻近归并法(Neighbor-Joining)法,构建系统发生树,用Bootstrap重复抽样1000次对进化树进行验证。
2.1 MiSeq测序及分析 四种样品(未处理样、核酸酶处理样、探针杂交样及核酸酶处理+探针杂交样核酸)测序各产生两个配对末端fastq格式序列文件,经过序列处理后得到reads数分别为257 415、290 120、379 697、353 132,平均读长为281.1、281.4、282.5和282.1bp。选取overlapping后长度超过400 bp的片段经Blast比对病毒数据库,以e-value<10-5为限值,发现均为乙型流感病毒,提示样本中存在乙型流感病毒核酸。
2.2 乙型流感病毒基因进化分析 将空缺的基因片段补全后与GenBank下载的乙型流感病毒代表毒株进行序列分析并构建进化树。将该毒株命名为B/Jiangsu/01/2015,GenBank登录号:KP976410-KP976417。根据HA基因进化分析表明,该毒株与B/Massachusetts/3857/2014同源性较高,属于Yamagat系clade 3,该clade以S150I、N165Y及G229D替换为特征(图1)。与2014年WHO推荐的Yamagat系疫苗株B/Massachusetts/2/2012相比HA基因核苷酸及氨基酸同源性分别为97.2%和97.6。发生了氨基酸K48R、A108P、N116K、S150I、N165Y、C172Q、A180T、N202S、G229D、V266I、K298E、E312K突变。受体结合位点F95、R136、W158、 H191、 Y202,与疫苗株相同。25、59、145、167、196、303、332、491、517、530、562位糖基化位点与疫苗株相比没有发生改变。
2.3 不同样本预处理方法比较 以B型流感病毒B/Taiwan/94748/2012为参考毒株,4种不同类型前处理样本测序reads与其进行mapping,结果如表1。可见,未经处理的样本其一致性序列长度(Consensus length)、匹配上的reads数量(Total read count)以及平均覆盖率(Average coverage)均较处理后样本差,而核糖体RNA探针杂交处理效果好于单独使用核酸酶处理,联合使用这2种处理方式可显著提高一致性序列长度、匹配上的reads数量以及平均覆盖率。
表1 不同样本处理方式对高通量测序的影响
图1 乙型流感病毒HA基因遗传进化树Fig.1 Phylogenetic tree of HA gene of influenza B viruses
基于高通量测序对病毒性感染进行鉴定在病毒检测鉴定中具有显著的优势。该技术不需要对病毒进行分离培养,实现了对病毒的快速检测;利用该技术不依赖病毒核酸序列,不仅可对已知病毒进行鉴定,最令人注目的是可以对缺乏核酸序列信息的新发病毒进行鉴定。本研究利用该技术对1例上呼吸道感染病例的可能病原进行筛查并以Real time RT-PCR确认患者为乙型流感病毒感染。与WHO推荐的Yamagat系疫苗株B/Massachusetts/2/2012相比,本研究检测的乙型流感病毒HA基因编码氨基酸发生了12个位点改变,均存在于HA1分子上。研究表明,乙型流感病毒HAl蛋白分子的抗原决定簇主要包括了4个区域,分别是120环(116-137)、150环(141-150)、160环(162-167)和190螺旋(194-202)及邻近区域,其中Victoria系的120环还包括了75和77两个位点[7]。本研究发现该患者感染的乙型流感病毒120环的116位、150环的150位、160环的165位、190螺旋的202位与疫苗株相比均存在变异。一般认为,HAl区出现4个以上氨基酸序列发生替换,而且这4个替换分布在2个以上抗原决定簇区可认为该病毒为新的抗原漂移变种[8],本研究发现的该乙型流感病毒符合上述条件,可作为一个抗原发生漂移的新的乙型流感病毒变种株。然而,该毒株的11个糖基化位点没有发生变化,糖基化的主要作用是稳定血凝素蛋白结构、防止血凝素水解以及阻碍抗体的识别,糖基化位点的改变影响着病毒的抗原性[9]。因而,WHO推荐的Yamagat系疫苗株B/Massachusetts/2/2012是否对该毒株起免疫保护作用有待进一步研究。本毒株的受体结合位点均未发生改变,提示人群对该病毒普遍易感。进化分析显示该病毒分布于Yamagata系clade 3分支,Real time RT-PCR也确认了该病毒属于Yamagata系。因而,通过高通量测序不仅可以筛查感染的病原,还可明确亚系。
通过SISPA扩增结合核酸酶处理样品可极大提高高通量测序靶序列数量,降低宿主背景,已被大量研究广泛采用[10-13]。尽管如此,临床样本中提取的RNA还含有大量的核糖体RNA(rRNA)及线粒体RNA(mtrRNA),核糖体RNA占据了总RNA的85%左右[3],而线粒体含有包膜,其中RNA不能被核酸酶消化。降低或消除rRNA及mtrRNA对于降低测序背景非常重要。近年来,多种降低rRNA的技术发展起来,如Endoh等人设计了非rRNA的6引物特异性扩增非rRNA的序列用于下游的测序[14],Morlan等设计rRNA及mtrRNA特异探针[5],先将提取的RNA与探针杂交形成RNA/DNA杂合体,再以RNase H消化消除rRNA及mtrRNA,然后以DNaseⅠ消除DNA探针,得到非rRNA及mtrRNA的RNA用于下游扩增、测序。我们综合比较了这几种样本处理方法对高通量测序结果的影响,结果发现联合使用核酸酶结合核糖体RNA探针杂交处理样本后,无论是得到的靶标reads数量,还是一致性序列长度、覆盖率均较单独使用一种方法好。Real time RT-PCR检测发现几种样本处理后CT值基本相同,提示几种处理方法对乙型流感核酸没有损耗。
综上所述,应用核酸酶结合核糖体RNA探针杂交处理样本结合高通量测序技术可用于鉴定不明原因感染的病原,为未知病原的筛查提供了快速高效的技术手段。
[1] 张静娜,王译葵,蒋岩,等.高通量测序技术用于丙型肝炎病毒感染溯源调查[J].中华预防医学杂志, 2016,50(6):530-534.doi:10.3760/cma.j.issn.0253-9624.2016.06.011.
[2] 邹晓辉, 赵翔, 冯兆民,等.两种等温扩增技术在二代测序病毒鉴定中的应用[J].中华实验和临床病毒学杂志,2016,30(2): 228-230. doi: 10.3760/cma.j.issn.1003-9279.2016.02.029.
[3] Metzker ML. Sequencing technologies-the next generation[J]. Nat Rev Genet, 2010, 11(1):31-46.doi: 10.1038/nrg2626.
[4] Victoria JG, Kapoor A, Li L, et al. Metagenomic Analyses of Viruses in Stool Samples from Children with Acute Flaccid Paralysis[J]. J Virol, 2009, 83(9):4642-4651. doi: 10.1128/JVI.02301-08.
[5] Morlan JD1, Qu K, Sinicropi DV.Selective depletion of rRNA enables whole transcriptome profiling of archival fixed tissue[J]. PLoS One,2012,7(8):e42882.doi: 10.1371/journal.pone.0042882.
[6] Malboeuf CM, Yang X, Charlebois P, et al. Complete viral RNA genome sequencing of ultra-low copy samples by sequence-independent amplification[J]. Nucleic Acids Res, 2013,41(1):e13. doi: 10.1093/nar/gks794.
[7] Biere B, Bauer B, Schweiger B. Differentiation of influenza B virus lineages Yamagata and Victoria by real-time PCR[J]. J Clin Microbiol, 2010, 48(4):1425-1427.doi: 10.1128/JCM.02116-09.
[8] Wang Q, Cheng F, Lu M, et al.Crystal structure of unliganded influenza B virus hemagglutinin[J]. J Virol,2008, 82(6):3011-3020.doi: 10.1128/JVI.02477-07.
[9] 郭元吉,程小雯.流行性感冒病毒及其实验技术[M].北京:中国三峡出版社,1997:2-43.
[10] 于娟,饶华祥,李红,等. 青海省2011-2012 年乙型流感病毒HA1 基因特性研究[J].中国人兽共患病学报,2014,30(1):32-35.doi:10.3969/cjz.j.issn.1002-2694.2014.01.007.
[11] Van Borm S, Rosseel T, Vangeluwe D, et al. Phylogeographic analysis of avian influenza viruses isolated from Charadriiformes in Belgium confirms intercontinental reassortment in gulls[J]. Arch Virol, 2012, 157(8):1509-1522.doi: 10.1007/s00705-012-1323-x.
[12] Rosseel T, Scheuch M, Höper D, et al. DNase SISPA-Next Generation Sequencing Confirms Schmallenberg Virus in Belgian Field Samples and Identifies Genetic Variation in Europe[J]. PLoS One, 2012, 7(7):e41967.doi: 10.1371/journal.pone.0041967.
[13] Grard G, Fair JN, Lee D, et al. A Novel Rhabdovirus Associated with Acute Hemorrhagic Fever in Central Africa[J]. PLoS Pathog, 2012, 8(9):e1002924. doi: 10.1371/journal.ppat.1002924. Epub 2012 Sep 27.
[14] DaijiEndoh, Tetsuya Mizutani, RikioKirisawa, et al. Species-independent detection of RNA virus byrepresentational difference analysis usingnon-ribosomal hexanucleotides for reversetranscription[J]. Nucleic Acids Research, 2005, 33(6) e65.doi:10.1093/nar/gni064.
Identifying the pathogens of one patient with upper respiratory infection using high throughput sequencing technology
GuoXiling,GeYiyue,ZhaoKangchen,ZhuXiaojuan,QiXian,ChenYin,ShiZhiyang,ZhuFengcai,ZhouMinghao,CuiLunbiao
KeyLaboratoriesofEntericPathogenicMicrobiology(MinistryofHealth),InstituteofPathogenicMicrobiology,JiangsuProvincialCenterforDiseaseControlandPrevention,Nanjing210009,China
CuiLunbiao,Email:lbcui@jscdc.cn
Objective To identify the possible pathogens of a patient with upper respiratory infection using high throughput sequencing technology and to optimize the methods for sample pre-treatment. Methods After pre-treating the sample with Benzonase Nuclease and/or ribosomal RNA (rRNA) probes, RNA was amplified with sequence independent single primer amplification (SISPA). The amplicons were used to prepare the sequencing library. Then the high throughput sequencing and bioinformatics analysis were performed. Results After resembled reads were blast against viruses library, we found the presence of influenza B virus sequences. Furthurmore, phylogenetic analysis showed that the influenza B virus belonged to Yamagat linage. Treatment with nuclease and ribosomal RNA (rRNA) probes provided more target sequences and higher coverage for the high throughput sequencing. Conclusions Combination of using nuclease and ribosomal RNA (rRNA) probes to treat sample and high throughput sequencing can rapidly identify the pathogen of unknown infection.
Influenza B virus;high throughput sequencing;nuclease;ribosomal RNA
崔仑标,Email:lbcui@jscdc.cn
10.3760/cma.j.issn.1003-9279.2016.05.002
流感病毒,乙型;高通量测序;SISPA;核酸酶;核糖体RNA
江苏省重大新发传染病综合防控科技示范工程(BE2015714);江苏省“333”人才;江苏省自然科学基金(BK20141030);艾滋病和病毒性肝炎等重大传染病防治(2012ZX10004401-006)
2016-06-07)