王利静 刘林 李建东 李伟红 张硕 梁米芳 李德新
102206北京,中国疾病预防控制中心病毒病预防控制所
基于核酸杂交的病毒基因组特异性纯化富集方法的初步研究
王利静 刘林 李建东 李伟红 张硕 梁米芳 李德新
102206北京,中国疾病预防控制中心病毒病预防控制所
目的 探索实验室高通量检测前临床样本中病毒核酸特异性纯化富集的方法。方法
以负链RNA病毒发热伴血小板减少综合征病毒(SFTSV)为模拟样本,针对病毒基因组S、M和L三个片段设计杂交探针,并进行5'端生物素修饰,与链霉亲和素修饰磁珠共价结合,纯化样本中SFTSV核酸,比较研究特异性纯化富集对样本二代测序效果的影响。结果 cDNA文库制备时全转录组扩增前或后进行特异性富集纯化均较不开展富集纯化有显著改善,有效数据比例分别为5.57%、6.39%、2.71%,差别具有显著性(χ2=9 799.8,P<0.001)。对全转录组扩增前或后进行特异性富集纯化对测序结果进行比较分析时发现,扩增后进行纯化优于扩增前(P<0.001)。结论 基于核酸杂交的病毒基因组特异性富集纯化方法可有效降低二代测序中背景值,提高测序效率,具有高通量检测前特异性纯化富集样本的作用。
【主题词】 病毒基因组;纯化;富集;二代测序
Fund programs:China Mega-Project for Infectious Diseases Grants from the Ministry of Science and Techno1ogy and the Ministry of Hea1th:Emergency response and detection p1atform construction for infectious disease(2013ZX10004-101)
基因组高通量测序即二代测序技术(Next-Generation sequencing techniques,NGS)在病原体筛查鉴定以及基因组信息相关的研究方面应用日趋广泛,具有高分辨率、高敏感性和高准确性等优点[1]。病毒基因组高通量测序前样本处理及cDNA文库构建一般采用基于随机引物的扩增技术[2-3]建库提高二代测序技术的病原体筛查检测效率,需要在测序前的样本处理、测序过程以及序列结果分析等方面进行优化完善。本研究以负链RNA病毒发热伴血小板减少综合征病毒(Severe fever with thrombocytopenia syndrome virus,SFTSV)为模拟样本,通过设计特异性杂交探针,建立基于磁性微球的特异性富集纯化病毒基因组的方法。并通过不同处理间SFTSV三个片段质量比例比值及二代测序中有效数据比例的比较,以期在测序前建库处理中,达到纯化富集核酸样本,有效降低二代测序非目的数据目的。
1.1模拟样本的制备 以SFTSV HB29毒株为模拟标本,经vero细胞培养后,收获上清,将培养上清13000/min、4℃、离心10 min,取上清经0.22微米滤器过滤,收取待用。
1.2核酸杂交探针从Genbank下载白蛉病毒属中可引起出血热的病毒(SFTSV)、Rift Va11ey fever virus(RVFV)、Heart1and virus(HLV)基因组序列,应用Mega 6.0软件分别对S、M、L三个片段进行序列比对,在相对保守区域,设计针对三个片段的杂交探针。根据三个片段长度不等,分别设计出1、2、3条不等的探针,并应用primerprimier 5.0对特异性探针进行评价比较,由上海生物工程生物公司合成,对探针5′端进行生物素修饰。
1.3SFTSV荧光定量PCR标准曲线 用于绝对定量标本中的SFTSV S、M、L片段的引物探针序列来自文献[4]。使用AgPath-IDTM One-Step RT-PCR Kit(App1ied Biosystems,USA)在 CFX96 Rea1 Time System(Bio-Rad,USA)仪器上进行荧光定量PCR检测。反应体系的总体积为25 μ1,引物浓度为0.4μmo1/1,探针浓度为0.12μmo1/1,模板为5 μ1,其余成分参考试剂盒说明。反应条件为95℃ 10 min;95℃15 s,60℃ 45 s,40个循环。分别利用含有SFTSV S、M、L片段的质粒,经体外转录得到各片段对应的模板RNA。再经Nanodrop定量后,根据模板的碱基长度,通过相应公式
换算为拷贝数/μ1,将体外转录得到的模板RNA,经过定量、换算和DEPC处理水进行10倍梯稀释至浓度为103~1010拷贝/μ1的RNA标准品,以此为模板,进行荧光定量RT-PCR检测。每个稀释度设置3个复孔,以得到的CT值绘制标准曲线。
1.4核酸提取 取收集的 HB29毒株上清使用RNeasy Mini Kit(Qiagen,Germany)按照产品说明书分别进行 SFTSV及 vero细胞 RNA提取,使用
Nanodrop进行RNA定量。二者核酸以1:3比例混合以模拟临床样本。
1.5核酸纯化 取样本核酸3 000 ng,混于50 μ1漂洗/结合缓冲液中65℃加热10 min,冰浴3 min;取50 μ1链霉亲和素磁珠于离心管中,加入100 μ1漂洗结合缓冲液,涡旋漂洗,置磁场,弃上清;分别取10 μ1(8 pmo1/μ1)生物素标记的探针,置于磁珠,室温孵育10 min,混匀,置磁场,弃上清;将上述总RNA样本置于结合探针的磁珠里,杂交温度(60℃)下孵育30 min,混匀,置磁场,弃上清,加入100 μ1漂洗/结合缓冲液(保持60℃),涡旋振荡,置磁场,弃上清;依次用漂洗/结合缓冲液及低盐缓冲液(保持60℃)重复漂洗,弃上清;后加40 μ1去离子水,95℃,加热1 min解离探针与RNA;置磁场,转移上清于离心管中。
1.6全 转 录 组 扩 增 (wholetranscriptome amplification,WTA)使用 REPLI-g®WTA Sing1e Ce11 Handbook(Qiagen,Germany)试剂盒对样本进行扩增。取核酸 RNA 8 μ1,加入3 μ1变性缓冲液,95℃加热3 min,后向反应体系中加入2 μ1去gDNA缓冲液,42℃加热10 min;向反应体系中加入4 μ1逆转录/聚合酶缓冲液,2 μ1随机引物,1 μ1逆转录酶混合液,42℃,60 min,95℃热失活3 min,向前述反应产物中加入8 μ1连接酶缓冲液,2 μ1连接酶混合液,24℃,30 min,95℃热失活5 min,加入29 μ1,REpL1-g sc反应缓冲液,1 μ1 REpL1-g Sensi Phi DNA聚合酶,30℃,,2 h,65℃,热失活5 min,全转录组扩增。
1.7Ion Torrent测序 将样本分别加入1.8倍体积AMPure XP Beads进行纯化;定量后分别取100 ng纯化的三种样本核酸酶切纯化产物;应用加接头试剂盒,末端补平两端加接头,加入 1.8倍体积AMPure XP Beads纯化;运行E-Ge1选择回收片段(约350 bp),对胶回收产物进行精细定量。取5 pmo1的工作库进行油包水PCR,最后将带有模板的微粒溶液离心使其进入到318C芯片的微孔中,上机测序。
1.8实验分组 按照对样本处理的方式不同,分为A、B、C、D四组。其中样本A:提核酸RNA后,不做任何处理;样本B:提核酸RNA,探针纯化,WTA,建库,上机测序;样本C:提核酸RNA,WTA,探针纯化,建库,上机测序;样本D:提核酸RNA,WTA,建库,上机测序。
1.9统计学方法 采用分类样本卡方检验对样本不同有效数据比例进行比较。采用 IBM SPSS statistics 19.0软件进行统计分析。P<0.05认为在统计学上有差异。
2.1杂交探针 根据S、M、L三个片段的保守区,设计病毒的纯化探针。5'端生物素修饰。序列如下:S1:ACAATSATKWKCTTNGYATCCTTCNCCCA;M1:TGTGGWGGAG CDGCVTGYGGSTGYTTTAATG;M2:TTGYTACTCYTGCATBRCAGGGGCCAVAGTCW GC;L1:ATHTTYGTCMTWATCAAGCCSACYAM;L2:TTGGSATTTAYCCTCAGAGAARTCMACAG;L3:CA GGHACWSTGGGDGGMTTCAGCAAG。序列中出现兼并碱基,其中S表示G C,K表示G T,N表示A C G T,Y表示C T,D表示G A T,V表示G A C,W表示A T,H表示A T C,M表示A C。
2.2荧光定量PCR标准曲线
分别以三个片段的RNA标准品拷贝数的对数值为横坐标(X),以Ct值的平均值为纵坐标(Y),建立标准曲线。三个片段标准曲线分别为S:y= -3.497x+39.797,R2=0.995;M:y=-3.498x+ 43.882,R2=0.998;L:y=-3.576x+49.539,R2= 0.998。相关系数均达到0.99以上,具有很好的线性关系。
2.3SFTSV样本中三个片段质量比例比较
根据三个片段标准曲线及样本测得的Ct值,计算得各样本拷贝数。再由上述公式分别计算得样本中SFTSV三个片段的浓度,进而计算得三个片段的质量比例(各片段浓度与总浓度比值),详见表1。WTA前,纯化样本B相较于未纯化样本A,SFTSV三个片段质量比例的比值分别为0.1、0.6、0.3;WTA前,纯化样本C相较于未纯化样本D,SFTSV三个片段质量比例的比值分别为2.0、3.6、2.3;WTA后纯化样本C相较于WTA前纯化样本B,SFTSV三个片段质量比例的比值分别为74、18、46。上述结果提示对样本进行核酸纯化处理能够降低非目的核酸的含量,且WTA后再对其进行纯化,效果更好。
2.4高通量测序结果
核酸样本经过磁珠的纯化处理后,所测得样本序列reads数中,目的核酸序列所占有的有效reads数是不同的。对结果进行统计学卡方检验,三种处理间具有统计学意义。详见表2。其中纯化样本B与样本C所测得的有效数据比例均大于不经过纯化样本D所测得的有效数据比例,说明经过纯化后样本中非目的核酸序列得到了弃除,样本更纯净,背景含量更低。且样本B与C进行比较,测得的有效数据成分样本C高于样本B,提示在WTA后对样本进行探针纯化,纯化效果更好,约为样本D有效数据比例的2.5倍。
表1 WTA前后样本间SFTSV三个片段质量比例Tab.1 Mass proportion of SFTSV three fragments in the samp1es before and after WTA
表2 三种不同处理间SFTSV有效成分比例比较Tab.2 Comparison of SFTSV effective component proportion in three different treatment groups
临床样本除含有所研究目的核酸外,还含有人类细胞基因组,其他微生物核酸等,样本含有的核酸种类繁多,各自含量不等,背景复杂。非特异PCR技术通过非特异的引物与模板DNA错配而进行复制的技术的广泛应用,故病毒基因组扩增的同时,样本中源自宿主细胞或其他微生物的DNA及RNA片段也得以大量扩增,甚至占据扩增优势,这样大大增加了序列结果中非目的基因数据,浪费检测试剂成本,延长数据分析时间,影响高通量测序效果。
本研究以SFTSV培养上清为模拟标本,应用链霉亲和素修饰磁珠与生物素修饰探针共价结合的原理纯化核酸样本,通过比较纯化前后样本目的核酸有效成分比例来评价背景值降低及纯化富集效果。WTA前纯化样本B相较于非纯化样本A,SFTSV三个片段的有效成分比例的比值分别为0.1、0.6、0.3,均小于1,WTA后纯化样本C相较于非纯化样本D,SFTSV三个片段的质量比例的比值分别为2.0、3.6、2.3,均大于1。WTA前对样本进行纯化处理会使得样本在一定程度去除非目的核酸的同时,目的核酸损失量也较大,这对目的核酸含量本身不高的临床样本是不利的;而WTA后,SFTSV三个片段的质量比例的比值均>1,提示WTA后对样本核酸进行纯化处理,效果较好。在进一步的二代测序结果中,验证了上述结果。二代测序结果得到WTA前纯化样本B,WTA后纯化样本C及不进行纯化样本D三者测序结果有效数据比例分别为5.57%、6.39%、2.71%,也就说明三种不同处理,对样本核酸的纯化即背景值降低效果有不同的影响。其中WTA后进行的纯化,背景值降低效果最好,有效数据比例最高,约为样本C有效数据比例的2.5倍。二代测序中,因背景非目的核酸数据占据较高,成本较高[5],使其广泛应用得到限制。故可将上述基于磁性微球纯化方法应用于建库处理中,降低测序的时间及资金成本。同时特异性纯化富集目的核酸样本,可减少背景值即减少无效数据的含量,提高有效数据比例,进而提高检测效率。
本研究中所用的探针为兼并探针,一种探针就可用来富集纯化多种病毒,可减少探针间相互杂交干扰。然而这种特异性富集的方法也存在新病毒或变异较大的病毒难以被探针捕捉而被遗漏的缺陷。因此开展已知病原体筛查检测时需增加探针池的容量与多样性,同时要严格设计探针,避免各属间纯化探针相互干扰等现象。对临床血清样本及属内其他病毒进行检测可以验证该方法的实用性。
[1] Rothberg J M,Leamon J H.The deve1opment and impact of 454 sequencing.NatBiotechno1,2008,26:1117-1124,doi:10.1038/nbt1485.
[2] Dean F B,Ne1son J R,Gies1er T L,et a1.Rapid amp1ification of p1asmid and phage DNA using Phi 29 DNA po1ymerase and mu1tip1y-primed ro11ing circ1e amp1ification.Genome Res,2001,11:1095-1099.
[3] Detter J C,Jett J M,Lucas S M,et a1.Isotherma1 stranddisp1acementamp1ificationapp1icationsforhigh-throughput genomics.Genomics,2002,80:691-698.
[4] Sun Y L,Liang M F,Qu J,et a1.Ear1y diagnosis of nove1 SFTS bunyavirus infection by quantitative rea1-time RT-PCR assay.J C1inViro1,2012,53:48-53,doi:10.1016/j.jcv. 2011.09.031.Epub 2011 Oct 22.
[5] Bea1e S,Sanderson D,Sanniti A,et a1.A scoping study to exp1ore thecost-effectivenessofnext-generationsequencing compared with traditiona1 genetic testing for the diagnosis of 1earning disabi1ities in chi1dren.Hea1th Techno1 Assess,2015,19:1-90,doi:10.3310/hta19460.
Preliminary study of specific purification and enrichment method for viral genome based on nucleic
acid hybridization
Wang Lijing,Liu Lin,Li Jiandong,Li Weihong,Zhang Shou,Liang Mifang,
Li DexinNational Institute for Viral Disease Control and Prevention,Chinese Center for Disease Control and Prevention,Beijing 102206,China
orresponding author:Li Dexin,Email:lidx@chinacdc.cn
Objective To exp1ore the specific purification and enrichment method for the vira1 genome in c1inica1 samp1es before high-throughput detection.Methods The negative chain RNA virus fever with thrombocytopenia syndrome(SFTSV)as was taken the simu1ate samp1es and the hybridization probes of the segment S,M and L were desiqned respective1y,modified the probes with biotin in 5'ends to cova1ent bonded with streptavidin magnetic beads to purify the vira1 genome and compared the inf1uence of specific purification on the effect of high-throughput detection.Results Specific enrichment and purification for vira1 genome before sequencing can significant1y increase the proportion of va1id data and who1e genome coverage.The va1id data proportions of the groups purified before or after who1e transcriptome amp1ification (WTA)were improved significant1y compared to group without purifying.The va1id data proportion respective1y were 5.57%,6.39%,2.71%,and the difference was significant((χ2=9799.8,P<0.001)). And the effect of the group purified after who1e transcriptome amp1ification was better than group purified before who1e transcriptome amp1ification(P<0.001).Conclusions Vira1 genome specific enrichment and purification method based on nuc1eic acid hybridization can effective1y reduce the background va1ues in the second generation sequencing,improve the sequencing efficiency and p1ay the ro1e of purification and enriching the nuc1eic acid in samp1es specifica11y before high-throughput detection.
Vira1 genome;Enrichment;Purification;Next-Generation sequencing
传染病防治科技重大专项:重大传染病应急处置检测技术平台(2013ZX10004-101)
李德新,Emai1:1idx@chinacdc.cn
10.3760/cma.j.issn.1003-9279.2016.02.025C
2016-02-24)