沙门菌CRISPR 的结构与功能研究进展

2015-03-23 16:51蔡银强李求春蒋道军潘志明焦新安
动物医学进展 2015年2期
关键词:沙门血清型间隔

蔡银强,李求春,陶 静,蒋道军,潘志明*,焦新安

(1.扬州大学江苏省动物重要疫病与人兽共患病防控协同创新中心,江苏扬州225009;2.扬州大学江苏省人兽共患病学重点实验室,江苏扬州225009;3.江苏全福农牧实业有限公司,江苏溧阳213353)

沙门菌是全球范围内最重要的几种食源性致病菌之一,给人类卫生保健系统造成了严重的经济负担。在美国,沙门菌每年引起约140万例感染事件,造成15 000人住院,超过400人死亡[1]。在中国,大约70%~80%的食源性疾病的暴发流行是由沙门菌引起的[2]。沙门菌可分离于多种食物(CDC 食源性疾病暴发在线数据库http://wwwn.cdc.gov/foodborneoutbreaks/),同时,这些污染沙门菌食物的广泛分布,使得在沙门菌食源性疾病暴发流行期间,人们很难对它们进行调查和溯源。

目前,已建立起多种鉴定沙门菌的方法,如传统的生化鉴定、血清型鉴定及PCR 鉴定等。近年来,应用于沙门菌鉴定的方法,大多以核酸为基础,包括环介导等温扩增(loop-mediated isothermal amplification)[3]、实 时 荧 光 定 量PCR(real-time fluorescence quantitative PCR,real-time PCR)[4]、脉 冲 场凝 胶 电 泳(pulsed field gel electrophoresis,PFGE)[5]、规律成簇间隔的短回文重复序列(clustered regularly interspaced short palindromic repeats,CRISPR)[6]等。PFGE目前被认为是食源性致病菌亚分型的金标准,并得到了广泛应用。CRISPR 是细菌基因组中进化最快的一种遗传元件,它普遍存在于约90%古细菌和40%细菌的基因组中,包括沙门菌[7]。近年来,CRISPR 的研究已成为生物界的一大热点,沙门菌便是其中的一个代表。

1 沙门菌的CRISPR 系统

1.1 沙门菌CRISPR 位点的发现

1987年,Ishino Y 等[8]在对大肠埃希菌的碱性磷酸酶同工酶Ipa 所对应的核酸序列进行分析时,发现在该产物编码区的下游存在着一个由29个碱基组成、重复出现的、并且高度保守的核酸序列;同时,在两个重复的核酸序列之间,存在着长度大致相等、独特的非重复核酸序列,将它们间隔开来。2000年,Mojica F J等[9]通过比对数种古生菌和细菌的核酸序列,发现大肠埃希菌和伤寒沙门菌的核酸序列中,存在着高度同源的大小为29bp的重复序列,当时称之为SRSRs(short regularly spaced repeats,SRSRs)序 列,直 到2002 年,Jansen R 等[10]才 将 其正式命名为CRISPR,即规律成簇间隔的短回文重复序列,并一直沿用至今。

1.2 沙门菌CRISPR 位点的结构

在已发现的含有CRISPR 位点的细菌中,该位点的数量从1个~3个不等[11]。比较而言,沙门菌中普遍存 在2 个CRISPR 位 点[10],由 前 导 区(leader),序列高度保守的重复区(repeat),以及间隔区(spacer)3个部分组成。其中,序列高度保守的重复区与间隔区交替出现,最终形成一个完整的CRISPR 位点。前导区一般位于CRISPR 位点的上游,由AT 富集的、大小为300bp~500bp的碱基组成。该区在种内相对保守,但是在种间却存在着显著水平的差异[10]。研究表明,前导区的存在,很可能起着CAS(CRISPR-associated)相关蛋白的识别位点的作用。重复区一般由平均长度为29bp的碱基组成,序列高度保守,但也存在如其他细菌一样的被称为退化重复(degeneration repeats,DRs)的变异[12]。Touchon M 等[13]研究发现,重复区的序 列具有二重对称性,意味着它们能够形成发夹般的、稳定的二级结构;同时,重复区的数量与CAS系统的完整程度呈现正相关,即CAS系统越完整,CRISPR位点中的重复区数量越多;而在其他细菌中,尚未发现如此的规律。间隔区一般由平均长度为32bp的核苷酸序列组成,它们的插入和丢失,导致了沙门菌CRISPR 位点的多样性,被形象地称为“CRISPR 微进化”。值得注意的是,沙门菌的CRISPR 间隔区特有地与血清型密切相关,在一定程度上,可以用CRISPR 来代替沙门菌血清学分型[6]。在同一个CRISPR 中,基本上不存在相同或是较相似的间隔区。长期的研究表明,部分间隔区序列与已知的质粒、噬菌体的序列相匹配[14]。目前,CRISPR Data-Base数据库中的间隔区序列,仅存在约2%能在GenBank中找到其相应的匹配,其原因可能是目前全基因测序的噬菌体和质粒还比较少。随着全基因组测序技术的进一步发展,测序的噬菌体和质粒越来越多,而相应匹配的间隔区比例也在不断上升[15]。

1.3 沙门菌CRISPR/CAS系统的结构

尽管CRISPR 大量发现于多种古细菌和细菌中[7],但是鉴于CRISPR 的非编码区特性,如要发挥其功能,还必须依赖于其相关的蛋白。2002 年,Jansen R 等[10]对CRISPR 侧翼序 列 进 行 比 对,发 现在不同的细菌基因组间,都含有4个基因;同时,这些基因表现出显著的同源性,说明这些基因与CRISPR 位点存在很大的关联。迄今为止,已鉴定出40多种与CRISPR 位点相关的、多样化的cas基因[16],它们主要编码与CRISPR 相关的蛋白,这些蛋白存在RNA 结合蛋白、聚合酶等结构域,与核酸的重组修复等功能有关。每个CRISPR 位点都伴有一类特异的CRISPR 相关的cas基因。Marraffini L A 等[17]根据45种cas基因对应的CAS蛋白的序列同源性、组成情况和功能,将CRISPR 系统分成9种亚 型,即 Ecoli、Ypest、Nmeni、Dvulg、Tneap、Hmari、Apernn、Mtube和RAMP module。

在已测定的E.coli亚型的沙门菌中,CRISPR/CAS系统倾向存在于CRISPR1 位点的一侧,且8个连续的cas基因按照cas2、cas1、cse3、cas5、cse4、cse2、cse1、cas3的顺序排列[13],与其他在染色体或质粒上按照cas4-cas3-cas1-cas2顺序排列的细菌略有不同,同时还存在诸如cas3及其后所有cas基因缺失等现象[6]。这些cas基因分为两大类,各自编码不同功能的蛋白质。一类称为核心基因,包括cas1~cas6,其中,cas1和cas2 基因编码的蛋白,主要在新重复序列的获得中发挥作用,cas3编码的蛋白被预测具有核酸酶和解旋酶的功能,在靶标基因的剪切中扮演重要角色[18]。另一类称为亚型特异性基因,包括cse、csy、csn、csd、cst等,其中只有少部分已经确定。除cas基因以外,还存在另一类非cas基因。Medina Aparicio L等[19]发现,伤寒沙门菌中的LeuO 和LRP基因,对于CRISPR 的活性具有直接的调控作用,参与crRNA 的加工、DNA 的剪切及调节外源DNA 的进入等。

2 沙门菌CRISPR 系统的作用机制与功能

2.1 CRISPR 系统的作用机制

CRISPR 的作用机制类似于免疫防疫,可分为适应阶段、表达阶段和干扰阶段。①适应阶段,CRISPR 系统将一段与入侵的质粒亦或噬菌体上的同源短片段(原间隔序列proto-spacers),插入到前导序列与第一段重复序列之间,同时伴随一次重复区的复制,进而形成了一个新的重复区-间隔区单元,使得CRISPR 基因座留下入侵的噬菌体或是质粒的序列信息,为随后的两个阶段提供结构基础[20]。②表达阶段,CRISPR 基因座被转录成一段长的CRISPR RNA(crRNA)前体(pre-crRNA),该前体在相应Cas蛋白的作用下,被切割并加工成小的、成熟的crRNA。随后,成熟的crRNA 与Cas蛋白结合形成Cas/crRNA 蛋白复合体。③干扰阶段,由crRNA 充当向导,Cas/crRNA 蛋白复合体找到与crRNA 同源的外源核酸靶序列,通过碱基互补配对原则进行配对,随后Cas/crRNA 蛋白复合体将靶标序列降解。在CRISPR 免疫的3个阶段中,适应阶段的机制,在不同的CRISPR 系统中高度保守,主要通过Cas1和Cas2蛋白发挥功能。后两个阶段,不同于第一个阶段,它们属于执行阶段,在不同的CRISPR 系统中差异性较大,发挥作用的蛋白也有所差别[21]。

CRISPR 干扰与已发现的RNA 干扰有诸多相似性,但是它们在蛋白结构、作用靶标、防御机制等方面存在诸多差异。目前,已发现的CRISPR 的功能还仅仅局限于防御外源基因的入侵,而真核生物则能通过RNAi相关通路,调节胞内的基因表达等[17]。

2.2 沙门菌CRISPR 系统的功能

除去与其他细菌CRISPR 类似的抵御外源质粒和噬菌体DNA 的入侵的功能以外,沙门菌CRISPR还能介导自身短期表型的变化,也能介导长期的亚类进化[22];同时,由于沙门菌的CRISPR 特有地与血清型密切相关,使得我们能在沙门菌食源性疾病暴发期间能快速地对其进行溯源。最近有研究表明,沙门菌的CRISPR 结构与它的耐药密切相关。当然,更多的功能目前还尚不清楚,还有待进一步的研究。

3 CRISPR 在沙门菌分型中的应用

CRISPR 间隔区的插入及丢失,形成了间隔区特有的高度多态性,进而间接造成了CRISPR 的多元性。因此,可通过设计相应的引物,扩增细菌中的CRISPR 位点并测序,获得CRISPR 序列信息,通过CRISPR 软件分析,了解CRISPR 间隔区的数量,大小及排列情况。通过比对和分析这些序列信息,可对细菌进行分型研究。同时,鉴于间隔区在细菌核酸序列中是按照外源核酸序列入侵先后的顺序排列,所以可利用CRISPR 对细菌进行遗传进化研究。

2012年,Fabre L 等[6]通 过 对783 株130 种 血清型的沙门菌进行CRISPR 分析,发现CRISPR 存在高分辨率,高实用性等优点,与PFGE 相比,它能够有效区分暴发流行中相同血清型的菌株,耗时更短,自动化程度更高,还能用于研究沙门菌的多态性;同时发现CRISPR 的多元性与血清型及ST 型(sequence type)密切相关。建议鉴于CRISPR 与血清型的高度相关性,只需根据两个CRISPR 位点的大小,就能初步对沙门菌进行分型。其次,可以用软件对CRISPR 位点的间隔序列进一步分析,得到更细致的分型结果。

CRISPR 除了单独应用于沙门菌的分型之外,还能与其他分型方法联用。近年来,基于沙门菌的两个毒力基因(fimH,sseL)的MLST 及CRISPR 两种分型方法的结合,建立了一种新的沙门菌分型方法,命名为CRISPR-MVLST,并成功应用于沙门菌的研究中。2011 年,Liu F 等[23]将该方法应用于171株9种血清型的临床沙门菌分离株的分型研究,发现该方法较PFGE 而言,具有更高的分辨率,能将暴发菌株及高度克隆的菌株区分开来,可作为沙门菌暴发流行时一种重要的分型方法。2013年,Shariat N 等[24]将该方法应用于175株海德堡沙门菌和鼠伤寒沙门菌的分型研究中,表明该方法具有实用性强、分辨力高、流行病学一致性高等优点,同时认为可以将该方法作为PFGE分型方法的一种补充,用于沙门菌的分型研究。

CRISPR 技术以核酸序列为基础,具有良好的可操控性,可用于下游的进化分析。Fricke W F等[22]比对了28株沙门菌的基因组发现,CRISPR 介导的免疫能够控制细菌短期的表型变化,也能介导长期的沙门菌亚类的进化,认为CRISPR 分析对评估沙门菌亚类的潜在进化性至关重要,能够帮助和预防未来沙门菌的暴发流行。Timme R E 等[25]通过对156株78种血清型的肠道沙门菌进行序列测定,发现CRISPR 反映了与系统进化不同的进化模式,同时,有可能因为水平基因的转移或共享环境的获得,影响着目前沙门菌的分布情况。

4 小结与展望

在CRISPR 结构中,间隔区的插入和丢失、间隔序列与外源DNA 的高度同源性、cas基因家族及其所编码蛋白的多种功能,使它被广泛地应用于沙门菌及其他细菌的分型和进化分析研究。无论是单独使用,还是与其他方法联用,都表现出诸多优越性。但是,现阶段应用CRISPR 进行细菌分型研究,数据尚不充分,数据库也不健全,还没有形成特定的标准。另外,目前对于CRISPR 的研究还仅仅局限于它的防御机制,是否还有其他功能,以及已发现的关于CRISPR 的各种现象的原因,如新间隔序列的获得及选择性缺失,都未得到明确的解答。此外,迄今发现,CRISPR 只存在于90%的古细菌和40%的细菌,在数量上差异如此之大,是因为目前测序的细菌数量过少,还是由于与细菌共进化的噬菌体中,也存在CRISPR,亦或是存在类似于CRISPR 的其他元件,都值得探究。CRISPR 作为一个新的研究领域,鉴于它特殊的结构及强大的功能,应用前景广阔。CRISPR 也许会像RNAi一样,将揭开生物学领域的又一层面纱。

[1] Voetsch A C,Van Gilder T J,Angulo F J,et al.FoodNet estimate of the burden of illness caused by nontyphoidal Salmonellainfections in the United States[J].Clin Infect Dis,2004,38(Suppl.3):127-134.

[2] 王 军,郑增忍,王晶钰.动物源性食品中沙门氏菌的风险评估[J].中国动物检疫,2007,24(4):23-25.

[3] 邓显文,谢芝勋,谢丽基,等.肠炎沙门菌LAMP检测方法的建立[J].动物医学进展,2012,33(5):27-30.

[4] 李丹丹,徐义刚,王绥家,等.动物性食品中沙门菌实时荧光定量PCR 快速检测方法的建立[J].动物医学进展,2014,35(5):24-30.

[5] 唐 攀,崔恩慧,刘万华,等.鸡源沙门菌PFGE 分型及耐药性研究[J].动物医学进展,2013,34(11):1-5.

[6] Fabre L,Zhang J,Guigon G,et al.CRISPR typing and subtyping for improved laboratory surveillance of Salmonella infections[J].PLoS One,2012,7(5):e36995.

[7] Sorek R,Kunin V,Hugenholtz P.CRISPR-a widespread system that provides acquired resistance against phage in bacteria and archaea[J].Nat Rev Microbiol,2008,6:181-186.

[8] Ishino Y,Shinagawa H,Makino K,et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J].J Bacteriol,1987,169(12):5429-5433.

[9] Mojica F J,Díez-Villasenor C,Soria E,et al.Biological significance of a family of regularly spaced repeatsin the genomes of archaea,bacteria and mitochondria[J].Mol Microbiol,2000,36(1):244-246.

[10] Jansen R,Embden J D,Gaastra W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43:1565-1575.

[11] Grissa I,Vergnaud G,Pourcel C.The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8(172):1-10.

[12] Shariat N,DiMarzio M J,Yin S,et al.The combination of CRISPR-MVLST and PFGE provides increased discriminatory power for differentiating human clinical isolates of Salmonella enterica subsp.enterica serovar Enteritidis[J].Food Microbiol,2013,34(1):164-173.

[13] Touchon M,Rocha E P.The small,slow and specialized CRISPR and anti-CRISPR of Escherichia and Salmonella[J].PLoS One,2010,5:e11126.

[14] Mojica F J,Ferrer C,Juez G,et al.Long stretches of short tandem repeats are present in the largest replicons of the Archaea Haloferax mediterranei and Haloferax volcanii and could be involved in replicon partitioning[J].Mol Microbiol,1995,17(1):85-93.

[15] Heidelberg J F,Nelson W C,Schoenfeld T,et al.Germ warfare in a microbial mat community:CRISPRs provide insights into the co-evolution of host and viral genomes[J].PLoS One,2009,4(1):e4169.

[16] Hale C R,Zhao P,Olson S,et al.RNA-guided RNA cleavage by a CRISPR RNA-Cas protein complex[J].Cell,2009,39(5):945-956.

[17] Marraffini L A,Sontheimer E J.CRISPR interference:RNAdirected adaptive immunity in bacteria andarchaea[J].Nat Rev Genet,2010,11(3):181-190.

[18] Han D,Krauss G.Characterization of the endonuclease SSO2001from Sulfolobus solfataricus P2[J].FEBS Lett,2009,583(4):771-776.

[19] Medina-Aparicio L,Rebollar-Flores J E,Gallego-Hernández A L,et al.The CRISPR/Cas immune system is an operon regulated by LeuO,H-NS,and leucine-responsive regulatory protein in Salmonella enterica serovar typhi[J].J Bacteriol,2011,193(10):2396-2407.

[20] Barrangou R,Fremaux C,Deveau H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315(5819):1709-1712.

[21] Makarova K S,Haft D H,Barrangou R,et al.Evolution and classification of the CRISPR-Cas systems[J].Nat Rev Microbiol,2011,9(6):467-477.

[22] Fricke W F,Mammel M K,McDermott P F,et al.Comparative genomics of 28 Salmonella enterica isolates:evidence for CRISPR-mediated adaptive sublineage evolution[J].J Bacteriol,2011,193:3556-3568.

[23] Liu F,Barrangou R,Gerner-Smidt P,et al.Novel virulence gene and clustered regularly interspaced short palindromic repeat(CRISPR)multilocus sequence typing scheme for subtyping of the major serovars of Salmonella enterica subsp.enterica[J].Appl Environ Microbiol,2011,77:1946-1956.

[24] Shariat N,Sandt C H,DiMarzio M J,et al.CRISPR-MVLST subtyping of Salmonella enterica subsp.enterica serovars Typhimuriumand Heidelbergand application in identifying outbreak isolates[J].BMC Microbiol,2013,13:254.

[25] Timme R E,Pettengill J B,Allard M W,et al.Phylogenetic diversity of the enteric pathogen Salmonella entericasubsp.entericainferred from genome-wide reference-free SNP characters[J].Genome Biol Evol,2013,5(11):2109-2123.

猜你喜欢
沙门血清型间隔
一株鸡白痢沙门菌噬菌体的发酵及后处理工艺研究
瑞安市腹泻患者沙门菌耐药性和分子分型研究
间隔问题
间隔之谜
饮食和服务行业健康人群携带沙门菌调查
2013-2017年北京市顺义区腹泻病例中沙门菌流行特征
广东地区水禽大肠杆菌血清型鉴定
上楼梯的学问
肺炎链球菌血清型鉴定的分子生物学检测方法
多重PCR检测肺炎链球菌血清型方法及临床应用*