陈昕昶 张文宏
结核病是由结核分枝杆菌引起的传染性疾病,其致死率、致残率已超过艾滋病,高居全球第一。2016年,据估计全世界新发结核病患者约为1040万例,约140万例患者死于结核病。随着测序技术的成熟、测序成本的降低、生物信息学的发展,全基因组测序技术已经广泛应用于结核分枝杆菌的研究当中。笔者对全基因组测序技术的研究方向及成果进行回顾,提出其局限性,并展望其应用前景。
传统的分型方法主要有基于IS6110的限制性片段长度多态性(IS6110-based restriction fragment length polymorphism,IS6110-RFLP)、间隔区寡核苷酸分型(spoligotyping)、分枝杆菌多位点数目可变串联重复序列分析(mycobacterial interspersed repetitive unit-variable number tandem repeats,MIRU-VNTR)等,这些分型方法广泛应用于鉴定结核分枝杆菌的传播和暴发事件。但是这些方法所分析的基因组信息仅为全基因组的1%以下,信息量小、分辨率低,难以判断细菌传播的方向和过程[1]。全基因组测序可以鉴定菌株间的单核苷酸多态性(single nucleotide polymorphisms,SNP)差异,结核分枝杆菌自发突变率低且回复突变极少见,因此,可以通过SNP鉴定其传播方向和传播链。
在对加拿大温哥华一次吸毒相关结核病暴发事件的调查中,研究者对全部41株菌株进行了全基因组测序和MIRU-VNTR分型。MIRU-VNTR鉴定所有菌株为同一基因型,但是全基因组测序结果揭示这是由来源于共同祖先的、具有相同的MIRU-VNTR基因型的2个菌株引起的2次暴发。因此,全基因组测序可以鉴定传播事件,弥补MIRU-VNTR分型方法分辨率低的不足,并且可以识别所谓的超级传播者(super spreaders),即传染性极强的个体,避免将他们的毒株传染给其他人群[2]。
一项英国的回顾性研究在社区和家庭传播的成簇菌株中发现,遗传距离大于5个SNP的患者之间都没有流行病学联系,因此,推断遗传距离大于5个SNP可以排除传播[3]。随后的研究也得到了相似的结论,但根据分析方法、地域特点等不同,排除传播所用的SNP差异数阈值有所不同[4-5]。比如,一项研究收集了2007—2012年在英国牛津郡分离的所有可用的结核分枝杆菌,并对其进行全基因组测序,根据SNP差异聚集成簇的菌株相差0~7个SNP,而无联系的菌株间的SNP差异数的中位数为1106个SNP[6]。在中国上海的一项研究中,研究者收集了上海市疾病预防控制中心2009—2012年全部的耐多药结核分枝杆菌菌株(multidrug-resistant MTB,MDR-MTB),发现MIRU-VNTR一致且具有流行病学联系的菌株间最大相差12个SNP[7]。以上研究提示,对于流行病学上直接相关的菌株,基因组间SNP差异数应该很少;距离较近的近期传播,SNP差异数可能为0,仍然无法仅根据全基因组测序数据分辨传播方向[8],要依靠流行病学调查提供确凿的证据;但是,当SNP差异很多时,可以排除直接传播。
微进化的另一部分重要内容是宿主体内结核分枝杆菌菌株的多态性,这种多态性主要归因于2个方面:一是混合感染,即宿主感染了2种不同菌株;二是结核分枝杆菌感染宿主后在其体内发生的微进化。分辨混合感染和微进化的策略主要有以下几种:一是同时感染的2种结核分枝杆菌的比例较为特殊,且其遗传背景差异较大时,可以根据其差异SNP位点处碱基类型及其比例,将2种亚群分开[9];二是用现有SNP以最大似然法构建进化树,可以发现该菌株出现在2个进化过程或不同谱系中,即认为是混合感染[2];三是根据SNP差异个数,有研究定义同一例患者同时取痰液培养的多个菌株或者同一例患者先后多次取痰液培养的菌株之间SNP差异数不超过11个SNP即为微进化,大于等于475个SNP即为混合感染[6]。这个策略也应用于分辨复燃还是再感染。
结核分枝杆菌复合群(Mycobacteriumtuberculosiscomplex,MTBC)是通过一系列染色体缺失从一个共同的祖先菌株进化而来的[10]。目前认为,与MTBC 原始祖先菌株亲缘关系最近的是一种仅在东非吉布提分离的平滑菌落菌株——坎纳分枝杆菌(M.canettii)[11]。对M.canettii基因组进行测序,发现比其他MTBC成员的基因组大10~115 kb,并且显示出比所有其他MTBC菌株加起来更大的基因组多样性和更多的SNP差异,且有很明显的生物学特性上的差异[12]。
根据SNP的差异和缺失可以将结核分枝杆菌菌株分为几个主要的谱系(lineage)。古代谱系包括lineage 1(Indo-Oceanic),主要分布在菲律宾和印度洋海岸线。现代谱系中的lineage 2(East Asian),包括北京家族,主要分布在东亚、中亚和俄罗斯;lineage 3以印度和东非为中心;lineage 4(Euro-American)主要分布在欧洲、美洲、非洲和中东地区[13]。有研究将一个由220个结核分枝杆菌基因组序列构建的系统发育树与人类线粒体基因组的系统发育树进行比较,两个进化树最深的分支进化枝都是非洲起源的,这与人类和结核分枝杆菌都起源于非洲的观点一致。同时发现MTBC大约在七万年前出现,伴随着现代人类迁徙到非洲,并由于新石器时代人口密度的增加而扩大。这一长期的共同进化过程与MTBC所展示出高度适应性是一致的[14]。
现有的耐药分子检测手段主要基于PCR、分子杂交技术等,已有多种商业化试剂盒,基本完成了利福平及异烟肼的耐药诊断,敏感度及特异度可以达到90%以上[15],即耐多药结核病(MDR-TB)的快速诊断基本得到了解决。但是,现有的分子诊断方法面临以下几个问题:一是随着耐药机制研究的深入,更多的耐药相关突变不断被发现;二是诊断为MDR-TB后,没有其他抗结核药物的耐药信息,导致在药物敏感性试验(简称“药敏试验”)结果回复前无法给予患者最佳的治疗方案,或出现了不良反应后无法根据耐药情况调整方案[16]。
已知的耐药突变位点不能解释所有表型耐药,科学家们想通过全基因组关联性分析(genome-wide associated study,GWAS)研究SNP与表型之间的关系;2013年有2篇论文先后发表于NatureGenetics上。Farhat等[17]对116株菌株进行全基因组测序,并对同一个系统发育树内的敏感菌株及耐药菌株进行GWAS,以排除种系发生相关的SNP,最终找到了39个可能与耐药相关的基因区域,这些基因与细胞壁生物合成、药物泵、转录调控及DNA修复有关。Zhang等[18]对来自中国的包括敏感株、耐多药、广泛耐药的161株菌株进行了全基因组测序及分析,发现了约121个与耐药相关性很强的SNP,这些SNP可能会调控下游基因的表达,影响小RNA的转录。但是以上2项研究所筛选出的SNP没有重叠的部分。2015年,Walker等[19]共收集了3000多株临床分离株进行全基因组测序及GWAS,并没有发现新的可靠的耐药突变位点。现在我们意识到,由于临床菌株的遗传背景差异很大、耐药及进化的机制远比预想的复杂,仅通过增加样本量、利用表型与基因型的相关性分析很难找到可信的耐药突变,需要开发新的策略和算法,这需要生物信息学家和微生物学家的共同努力。
随后,全球多个团队利用体外诱导及全基因组测序的方法,在体外筛查出多个结核耐药基因,如与吡嗪酰胺耐药相关的rpsA和panD[20-21],与环丝氨酸耐药相关的Rv0678和Rv1979c[22],与利奈唑胺耐药相关的rrl和rplC[23]等,以上耐药相关基因的诊断价值已经在临床分离菌株中得到了验证[24-25]。
现有的全基因组测序方法仍然需要基于培养。有研究团队尝试在早期培养物或者直接在痰液中进行核酸的富集后测序,使得更快地获得全基因组信息成为可能;但是由于操作繁琐、价格高昂,近期内无法推广[26-27]。在英国等结核病低负担的发达国家,已经尝试将全基因组测序作为结核病诊断及结核病耐药诊断的常规实验室项目纳入临床诊治流程。2015年和2016年,2个英国团队分别在LancetRespiratoryMedicine、NatureCommunications上发文,他们用前瞻性队列研究发现全基因组测序诊断耐药平均需要6~10 d,而传统方法需要14~32 d,证实了全基因组测序所需时间更短,且经济可行[28-29]。但是2017年同一团队再次发表研究结果,全基因组测序对核酸总量和质量要求很高,导致测序失败率高于PCR和线性探针的传统分子检测手段,且由于分析流程繁琐、数据量过大导致分析时间远长于预期,传统方法与全基因组测序方法分别需要20和21 d。因此,与传统诊断方法比较,全基因组测序可以更准确地诊断物种及药物敏感型别,但是并没有缩短检出时间[30]。
在微进化与传播的研究中,与原有分型方法比较,全基因组测序技术已经大大提高了分辨率,推进了分子流行病学的研究,可以更好地监控结核病传播和鉴定传播源头;但是现有的研究异质性很高,不同研究采用不同测序平台、分析流程等致使分析结果难以相互比较[31]。
在耐药诊断的研究中,全基因组测序能够快速、全面、一次性获得临床菌株对现有全部抗结核药物的耐药信息,以指导临床医生的治疗方案。这与近年来一直提倡的精准医疗思路一脉相承,都强调了针对菌株耐药情况进行抗结核药物治疗方案调整,使患者最大程度受益。结核分枝杆菌的耐药机制非常复杂,过去我们常把表型与基因型耐药情况的不一致归因于机制研究的不足。但事实上,造成全基因组测序局限性的不仅是机制研究不全面,还包括临界浓度、原发或者获得性耐药、测序的检出限度、随机误差、基因型和表型之间错误的关联等多种原因。比如,有一些基因型与表型的不一致是由于表型出了错误,以吡嗪酰胺和乙胺丁醇为例,其药敏试验结果重复性很差,低度耐药无法检测[32]。
尽管如此,目前还有很多问题尚未解决。比如:不同条件下结核分枝杆菌的进化速率、为什么某些谱系仅存在于特定的地理区域内、新发现的基因组差异是如何引起耐药或适应性变化的,等等。全基因组测序在结核病低负担的高收入国家已经列入常规诊断流程,其诊断耐药的准确性不劣于现有方法,但是还没有稳健、快速的分析方法或软件,而且实验室之间结果的异质性较大,可比性差。这些问题还亟待解决。
[1] Roetzer A, Diel R, Kohl TA, et al. Whole genome sequencing versus traditional genotyping for investigation of aMycobacteriumtuberculosisoutbreak: a longitudinal molecular epidemiological study. PLoS Med, 2013, 10(2): e1001387.
[2] Gardy JL, Johnston JC, Ho Sui SJ, et al. Whole-genome sequencing and social-network analysis of a tuberculosis outbreak. N Engl J Med, 2011, 364(8): 730-739.
[3] Walker TM, Ip CL, Harrell RH, et al. Whole-genome sequencing to delineateMycobacteriumtuberculosisoutbreaks: a retrospective observational study. Lancet Infect Dis, 2013, 13(2): 137-146.
[4] Guerra-Assunção JA, Crampin AC, Houben RM, et al. Large-scale whole genome sequencing ofM.tuberculosisprovides insights into transmission in a high prevalence area. Elife, 2015,4.
[5] Lee RS, Radomski N, Proulx JF, et al. Reemergence and amplification of tuberculosis in the Canadian arctic. J Infect Dis, 2015, 211(12): 1905-1914.
[6] Walker TM, Lalor MK, Broda A, et al. Assessment ofMycobacteriumtuberculosistransmission in Oxfordshire, UK, 2007-12, with whole pathogen genome sequences: an observational study. Lancet Respir Med, 2014, 2(4): 285-292.
[7] Yang C, Luo T, Shen X, et al. Transmission of multidrug-resistantMycobacteriumtuberculosisin Shanghai, China: a retro-spective observational study using whole-genome sequencing and epidemiological investigation. Lancet Infect Dis, 2017, 17(3): 275-284.
[8] Kato-Maeda M, Ho C, Passarelli B, et al. Use of whole genome sequencing to determine the microevolution ofMycobacteriumtuberculosisduring an outbreak. PLoS One, 2013, 8(3): e58235.
[9] Köser CU, Bryant JM, Becq J, et al. Whole-genome sequencing for rapid susceptibility testing ofM.tuberculosis. N Engl J Med, 2013, 369(3): 290-292.
[10] Brosch R, Gordon SV, Marmiesse M, et al. A new evolu-tionary scenario for theMycobacteriumtuberculosiscomplex. Proc Natl Acad Sci U S A, 2002, 99(6): 3684-3689.
[11] Pfyffer GE, Auckenthaler R, van Embden JD, et al.Mycobacteriumcanettii, the smooth variant ofM.tuberculosis, isolated from a Swiss patient exposed in Africa. Emerg Infect Dis, 1998, 4(4): 631-634.
[12] Supply P, Marceau M, Mangenot S, et al. Genomic analysis of smooth tubercle bacilli provides insights into ancestry and pathoadaptation ofMycobacteriumtuberculosis. Nat Genet, 2013, 45(2): 172-179.
[13] Comas I, Coscolla M, Luo T, et al. Out-of-Africa migration and Neolithic coexpansion ofMycobacteriumtuberculosiswith modern humans. Nat Genet, 2013, 45(10): 1176-1182.
[14] Brites D, Gagneux S. Co-evolution ofMycobacteriumtuberculosisand Homo sapiens. Immunol Rev, 2015, 264(1): 6-24.
[15] Denkinger CM, Schumacher SG, Boehme CC, et al. Xpert MTB/RIF assay for the diagnosis of extrapulmonary tuberculosis: a systematic review and meta-analysis. Eur Respir J, 2014, 44(2): 435-446.
[16] Schön T, Miotto P, Köser CU, et al.Mycobacteriumtuberculosisdrug-resistance testing: challenges, recent developments and perspectives. Clin Microbiol Infect, 2017, 23(3): 154-160.
[17] Farhat MR, Shapiro BJ, Kieser KJ, et al. Genomic analysis identifies targets of convergent positive selection in drug-resis-tantMycobacteriumtuberculosis. Nat Genet, 2013, 45(10): 1183-1189.
[18] Zhang H, Li D, Zhao L, et al. Genome sequencing of 161Mycobacteriumtuberculosisisolates from China identifies genes and intergenic regions associated with drug resistance. Nat Genet, 2013, 45(10): 1255-1260.
[19] Walker TM, Kohl TA, Omar SV, et al. Whole-genome sequencing for prediction ofMycobacteriumtuberculosisdrug susceptibility and resistance: a retrospective cohort study. Lancet Infect Dis, 2015, 15(10): 1193-1202.
[20] Shi W, Chen J, Feng J, et al. Aspartate decarboxylase (PanD) as a new target of pyrazinamide inMycobacteriumtuberculosis. Emerg Microbes Infect, 2014, 3(8): e58.
[21] Zhang S, Chen J, Shi W, et al. Mutations in panD encoding aspartate decarboxylase are associated with pyrazinamide resistance inMycobacteriumtuberculosis. Emerg Microbes Infect, 2013, 2(6): e34.
[22] Zhang S, Chen J, Cui P, et al. Identification of novel mutations associated with clofazimine resistance inMycobacteriumtuberculosis. J Antimicrob Chemother, 2015, 70(9): 2507-2510.
[23] Zhang S, Chen J, Cui P, et al.Mycobacteriumtuberculosismutations associated with reduced susceptibility to linezolid. Antimicrob Agents Chemother, 2016, 60(4): 2542-2544.
[24] Gu Y, Yu X, Jiang G, et al. Pyrazinamide resistance among multidrug-resistant tuberculosis clinical isolates in a national referral center of China and its correlations withpncA,rpsA, andpanDgene mutations. Diagn Microbiol Infect Dis, 2016, 84(3): 207-211.
[25] Simons SO, Mulder A, van Ingen J, et al. Role ofrpsAgene sequencing in diagnosis of pyrazinamide resistance. J Clin Microbiol, 2013, 51(1): 382.
[26] Lee RS, Pai M. Real-time sequencing ofMycobacteriumtuberculosis: are we there yet. J Clin Microbiol, 2017, 55(5): 1249-1254.
[27] Votintseva AA, Pankhurst LJ, Anson LW, et al. Mycobacterial DNA extraction for whole-genome sequencing from early positive liquid (MGIT) cultures. J Clin Microbiol, 2015, 53(4): 1137-1143.
[28] Bradley P, Gordon NC, Walker TM, et al. Rapid antibiotic-resistance predictions from genome sequence data for Staphylococcus aureus andMycobacteriumtuberculosis. Nat Commun, 2015, 6: 10063.
[29] Pankhurst LJ, Del Ojo Elias C, Votintseva AA, et al. Rapid, comprehensive, and affordable mycobacterial diagnosis with whole-genome sequencing: a prospective study. Lancet Respir Med, 2016, 4(1): 49-58.
[30] Quan TP, Bawa Z, Foster D, et al. Evaluation of whole genome sequencing for Mycobacterial species identification and drug susceptibility testing in a clinical setting: a large-scale prospective assessment of performance against line-probe assays and phenotyping. J Clin Microbiol, 2017, pii: JCM.01480-17.
[31] Hatherell H, Colijn C, Stagg HR, et al. Interpreting whole genome sequencing for investigating tuberculosis transmission: a systematic review. BMC Med, 2016, 14: 21.
[32] Horne DJ, Pinto LM, Arentz M, et al. Diagnostic accuracy and reproducibility of WHO-endorsed phenotypic drug susceptibility testing methods for first-line and second-line antituberculosis drugs. J Clin Microbiol, 2013, 51(2): 393-401.