志贺菌成簇的规律间隔短回文重复序列的检测及同源性分析

2015-11-29 04:52王鹏飞王颖芳段广才王琳琳郭向娇薛泽润郗园林杨海燕
吉林大学学报(医学版) 2015年2期
关键词:噬菌体碱基同源

王鹏飞,王颖芳,段广才,3,王琳琳,郭向娇,薛泽润,郗园林,杨海燕

(1.郑州大学公共卫生学院流行病学教研室,河南 郑州 450001;2.河南科技大学医学院公共卫生教研室,河南 洛阳 471003;3.新乡医学院分子诊断与医学检验技术河南省协同创新中心,河南 新乡 453003)

成簇的规律间隔短回文重复序列(clustered regularly interspaced short palindromic repeats,CRISPR)是近年发现的一种对外源核酸片段具有获得性免疫能力的结构,主要由一段不连续的正向重复序列和插入其中的间隔序列组成[1]。重复序列相对保守,具有回文结构,体现细菌在进化中的保守性,间隔序列高度可变,研究[2]显示间隔序列来源于外源可移动遗传因子。重复序列与间隔序列构成的单元经常被整体删除,使得CRISPR系统迅速进化,一定程度上也反映了细菌在进化中的保守性和包容性[3]。志贺菌引起的细菌性痢疾(简称菌痢)是一个全球性的公共卫生问题,尤其对发展中国家造成了重大危害,其引起的感染性腹泻给我国带来了巨大的经济和社会负担[4-5]。随着抗生素广泛应用,志贺菌耐药形势越来越严重,且多耐药菌株也越来越多,而外源性耐药基因的获得,即耐药基因的水平转移,是细菌增强耐药性的主要方式之一[5-7]。CRISPR及其相关蛋白Cas组成的CRISPR/Cas系统,能够形成特异免疫机制来处理外来遗传物质入侵,可能与致病菌耐药性的变迁有密切关系。每个CRISPR元件的重复序列对应着一种潜在的CRISPR/Cas靶标,CRISPR/Cas系统获得新的间隔序列后,能够在未来识别相应的病原体而发挥作用,故间隔序列是CRISPR/Cas系统最终发挥功能作用的核心序列元件[8]。目前,国际上对细菌CRISPR研究逐渐增多,本研究针对实验室保存的志贺菌株CRISPR序列进行检测,同时对实验室和数据库中志贺菌的重复序列及间隔序列进行同源性分析,了解CRISPR的结构特征,探讨间隔序列的可能来源及其与同源质粒或噬菌体的关系,为进一步揭示CRISPR的结构特征及其作用机制提供依据。

1 材料与方法

1.1 菌种、试剂、仪器和软件

志贺菌种(mel-ss2004103/sx、 melsf2007065/hn、S51203)均为河南省分子医学重点实验室购买、收集和保存,9株全基因组志贺菌,菌株基本信息均来自于NCBI(http://www.ncbi.nlm.nih.gov/)。见表1。

表1 志贺菌基本信息Tab.1 General informations of Shigella

细菌基因组提取试剂盒(购自上海莱枫生物科技有限公司),酵母浸粉和胰蛋白胨(购自英国Oxoid公司),琼脂粉(购自美国Sigma公司),水解酪蛋白(Mueller-Hinten,MH)和琼脂(购自上海化学试剂有限公司),pH精密试纸(购自天津市金达化学试剂厂),其他常规试剂均为国产分析纯,液体培养基在本实验室按配方配制。LabcyCler basic梯度PCR仪(购自德国SensoQuest公司),DYY-Ⅲ2型稳压稳流定时电泳仪和DYC31B型水平电泳槽(购自北京六一仪器厂),Gene Genius Bio imaging System(购自美国Syngene公司),THZ-92C台式恒温振荡器(购自上海跃进医疗器械厂),BP221S电子天平(购自德国Sartorius公司),HVE-50型自动电热压力蒸汽灭菌器(购自日本Hirayama公司)。本研究采用的本地软件及网络服务器包括:Primer premier 5、DNAMAN、ClustalX、Bioedit、CRISPR database (http://crispr.upsud.fr/crispr/)、RNAfoldwebserver(http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi ) 及 weblogo(http://weblogo.berkeley.edu/logo.cgi)。

1.2 志贺菌CRISPR序列引物设计

根据Database公布的志贺菌的CRISPR信息,依据侧翼序列进行分组比较,选取其中的3组进行CRISPR序列的引物设计,分别为:P1(正向:5′-ACCGCTGGCATCGTTGTTG-3′,反 向:5′-ATGAGCGTGGACGAAGTGC-3′)、P2(正 向:5′-AAGCACAAGGCGGAAGCAG-3′,反 向:5′-ATCCTGACGGGCGACAAAG-3′)和P7(正向:5′-CGCTGTATTATCAGAACACCCG-3′,反 向:5′-GGGCTACGACCCTGAATGGAAT-3′),引 物设计采用Primer premier 5软件。

1.3 PCR反应

采用梯度PCR方法确定3对引物的退火温度,采用小剂量扩增体系,以mel-sf2007065/hn菌株基因组DNA为模板,根据电泳结果确定最佳退火温度T,利用该3对引物分别对菌株基因组进行CRISPR序列进行扩增。引物梯度扩增体系(12.5μL):10× PCR 反 应 缓 冲 液 1.25 μL,dNTPs 2μL,上下游引物各0.5μL,模板DNA 1μL,Taq 酶 0.18 μL,ddH2O 7.07 μL。CRISPR序列扩增体系(50μL):10×buffer(含Mg2+)5μL,dNTPs 8μL,上下游引物各2μL,模 板 DNA 4 μL,Taq 酶 0.5 μL,ddH2O 28.5μL。PCR 反应条件:94℃ 预变性 5min;94℃变性60s,退火60s,72℃ 延伸1min,共进行32个循环;最后72℃延伸10min。

1.4 CRISPR检测及同源性分析

委托上海生物工程股份有限公司对扩增产物核酸序列进行纯化、测序,获得测序结果后,构建出该菌株的CRISPR序列结构以及重复序列和间隔序列信息。依据P1、P2和P73对引物序列,识别全基因组志贺菌CRISPR序列,获得相应的重复序列及间隔序列,进行多序列比对,分析重复序列的碱基频率并对其二级结构进行预测。分析间隔序列的特点,并用BLAST对间隔序列的同源质粒/噬菌体进行检索,并对其进行分析。

2 结 果

2.1 志贺菌CRISPR的识别

分别用P1、P2和P73对引物对 melsf2007065/hn菌株基因组进行梯度扩增,退火温度 梯 度 为 54.6℃、55.5℃、56.7℃、57.9℃、59.3℃、60.7℃、62.1℃、63.3℃、64.5℃和65.4℃。3对引物扩增产物的效率随着温度有递增或递减,其退火温度范围为54.6℃~55.5℃、60.7℃~63.3℃和60.7℃~63.3℃,故确定其最佳退火温度分别为55℃、62℃和62℃。根据最佳退火温度,分别用P1、P2和P7对3株志贺菌的CRISPR序列进行扩增,对PCR产物进行测序。经CRISPRs Finder及多序列比对进行CRISPR序列查找。菌株的CRISPR详细信息见表2。

根据引物序列及实验室菌株CRISPR信息,获得12株全基因组志贺菌相应的重复序列及间隔序列模式图(图1)。在鲍氏和痢疾志贺菌中,P7-CRISPR序列中仅保存一个重复序列片段,P2-CRISPR中仅存在1个间隔序列。P1-CRISPR与P2-CRISPR广泛分布在志贺菌的4个群,其间隔序列的数目有差异。

2.2 间隔序列的特性及同源性

2.2.1 不同CRISPR间隔序列的特点 在88、ss046和ss53g的菌株中,P1-CRISPR序列几乎一致,均存在4个间隔序列,且间隔序列具有很高的同源性;在其他菌株中,P1类型的间隔序列仅有1个。仅在P1-CRISPR-88间隔序列的首尾存在个别碱基的差别,而在P2-CRISPR中却不存在该情况,2个间隔序列完全不同,此特点体现出间隔序列的多样性,含P7-CRISPR的菌株,其间隔序列均相同。见图2。

表2 志贺菌CRISPR信息Tab.2 CRISPR informations of Shigella

图1 12株志贺菌CRISPR模式图Fig.1 CRISPR pattern diagram of 12strains of Shigella

2.2.2 间隔序列与侧翼序列的联系 在P1-CRISPR中,第一个重复序列上游侧翼序列20bp与spacer 4的末端序列一致,末端重复序列下游23bp与spacer 4的前端序列一致。在其他菌株的P1-CRISPR中,也存在相同的现象,说明此现象的普遍性,可能发挥着独特的功能。在P7-CRISPR同样存在相似的现象,第一个重复序列上游侧翼序列25bp与间隔序列的末端序列一致,但在下游,仅12bp的序列在上游侧翼序列中存在,而在P2-CRISPR中不存在该现象。

图2 P1-CRISPR-88(A)和P7-CRISPR-88(B)间隔序列与侧翼序列的多序列比对图Fig.2 Comparison chart of multiple alignment between spacers and flanking sequences P1-CRISPR-88(A)and P7-CRISPR-88(B)

2.2.3 间隔序列的同源性 将间隔序列进行BLAST(数据库包括1683个质粒和1429个噬菌体,E<1.0),在同源质粒/噬菌体中获得该序列对应的编码区序列,对其进行多序列比对。在间隔序列中并未发现完全匹配的序列,但个别间隔序列对应的编码区的产物很丰富,猜测某些间隔序列可能是2个或多个外源序列的拼接融合。有的间隔序列并没有对应的编码区,有的间隔序列则并未发现同源质粒/噬菌体。见表3。

P7-spacer对应的编码产物有复制蛋白、TniQ蛋白和络氨酸重组酶等,有的序列处于非编码区,因此推测此间隔序列是多个基因特殊序列的拼接重组,通过分析,这些基因与信息基因和操纵基因有关。两类基因形成P7spacer后,当外源遗传元素再次作用于P7spacer时,首先通过复制蛋白基因(信息基因)进行识别,然后结合其他基因或是非编码的调控,来指导功能基因(操纵基因)发挥作用。见图3。

表3 间隔序列的同源质粒/噬菌体Tab.3 Homologous plasmids or phages of spacers

图3 间隔序列可能的形成及功能机制图Fig.3 Diagram of possible forming and functional mechanism of spacers

2.3 重复序列的特点及同源性

2.3.1 重复序列的多序列比对 在宋内志贺菌菌株中,P1-CRISPR存在5个重复序列,其余均是2个重复序列。将P1-CRISPR的重复序列进行多序列比对,获得相应的碱基频率图(图4A),P1-CRISPR的重复序列差异主要集中在第20、21和34位。P2-CRISPR的重复序列形成2种碱基频率图,P2-DR-1(图4B)和P2-DR-2(图4C),其中P2-DR-2是 CRISPR最末端的重复序列。P2-DR-1的差异仅在第25位碱基,P2-DR-2的差异在第17和18位,两者仅是3′端的碱基具有较大差异,5′端具有很好的一致性。P7-CRISPR的重复序列则比较保守,并不存在碱基的差异(图4D)。

2.3.2 重复序列的二级结构预测 依据重复序列的碱基频率,对重复序列做出相应的二级结构预测(图5),并记录形成结构的最小自由能。P1-CRISPR重复序列形成 “多茎”结构,其最小自由能为-14.90kcal·mol-1,第20和21位于环上,第34若由T变为G,即GC相连,则该二级结构变的更为稳定。P2-CRISPR重复序列形成的均为 “单茎”结构,P2-DR-1的最小自由能为-9.00kcal·mol-1,其差异位于游离部分,P2-DR-2的最小自由能为-1.10kcal·mol-1,其差异同样位于游离部分,但两者茎区长不同,前者为5碱基,后者为3碱基,故两者最小自由能有较大的差异。P7-CRISPR重复序列形成的也为 “多茎”结构,其最小自由能为-20.70kcal·mol-1,其重复序列比较保守,形成的二级结构较稳定。

图4 重复序列的碱基频率图Fig.4 Frequency diagram of bases of repeats

2.3.3 重复序列的同源性 对不同CRISPR重复序列进行同源聚类分析,对其进化关系进行探索(图6),P7-CRISPR的重复序列不存在碱基差异。P1-CRISPR不同位置的重复序列存在差异,鲍氏及痢疾志贺菌的重复序列与宋内或福氏志贺菌的末端重复序列一致,宋内志贺菌的DR2-DR4序列几乎一致,DR1同样如此;P2-CRISPR的末端重复序列与CRISPR的5′端重复序列存在较大差异,10号与88号菌株的末端重复序列一致,而CRISPR的5′端重复序列却存在差异。CRISPR的5′端重复序列临近的间隔序列是菌株新近得到的外源序列,CRISPR5′端重复序列会随着间隔序列的改变而进化,从而影响CRISPR功能。依据P1-CRISPR 5′端重复序列(即DR1)聚类分析,可将10个菌株分为3类,同样P2-CRISPR则为2类(共11个菌株),某些特殊的重复序列可能是该菌株新功能的体现。

图5 重复序列的二级结构预测示意图Fig.5 Schematic diagram of secondary structures of repeats

分别对3个重复序列进行BLAST(最大显示数默认为100,E<0.1),此3个重复序列存在于大肠杆菌,这与其菌属亲缘关系具有一定的一致性。但在不同菌属间也存在相应的重复序列,如P1中的Salmonella,P2中的Pectobacterium和P7中的Uncultured bacterium,说明志贺菌的CRISPR系统中存在同源不同种的现象。见图7(插页三)。

3 讨 论

本研究结果表明:本室保存的志贺菌与数据库中志贺菌的重复序列相同或是相似,将CRISPR序列与其进行多序列比对后发现其同源性较高,此为同一种CRISPR结构;同时,部分序列存在差异,可能是因为细菌为了适应不同的生存环境,而产生的分化或是进化[1,9]。

由重复序列的多序列比对及二级结构的预测可知,不同CRISPR的重复序列保守性并不相同,重复序列位点的差异或在茎,或在环,或在游离部分。茎上的差异会影响RNA二级结构的稳定性,P2-DR-1与P2-DR-2的茎区长相差2碱基,其最小自由能变化很大,后者二级结构的稳定性降低;环上的差异同样会影响其二级结构的稳定性,P1-CRISPR重复序列中环内碱基不同,其结构的稳定性存在差异;游离部分的差异有可能影响RNA与蛋白质等结合位点的变化。研究[10]显示:重复序列的3′端是包含PAM motif的最后几个碱基,而PAMs最后的碱基不保守,因此重复序列的3′端游离部分才会有位点的变化。

重复序列的茎区GC水平相对较高,G∶C碱基对之间是以3个氢键相连,分子相互作用力更强,能够释放更多的自由能,更为稳定;同时增强了转录后RNA二级结构的保守性,也突出重复序列在 CRISPR结构及功能上的重要性[9,11]。P2-DR-2是 CRISPR 的末端重复序列,其3′端与P2-DR-1的3′端有较大变化,同时其稳定性也较差,而P1-CRISPR重复序列和P3-CRISPR重复序列的茎区则未见此差异。由重复序列的同源聚类分析可知,随着菌株的进化,CRISPR也会随之进化,其5′端重复序列会有个别位点的突变来维持自身的生存,更好地适应外界环境。CRISPR 5′端重复序列进行的志贺菌聚类分析,为利用CRISPR来发现某些特殊类型的志贺菌提供了可能。

图6 P1-CRISPR(A)和P2-CRISPR(B)重复序列的同源树Fig.6 Homology tree of repeats of P1-CRISPR(A)and P2-CRISPR(B)

间隔序列可能来源于质粒或噬菌体,被作为外源遗传物质入侵细菌留下的特异性标记,在此次研究中,并没有显示出100%匹配,且部分间隔序列并没有同源噬菌体或质粒,其原因可能是由于质粒或噬菌体的进化导致该基因的缺失或是目前尚未获得此类质粒或噬菌体[10]。尽管如此,间隔序列的部分序列与质粒或噬菌体存在同源性,且某些间隔序列可包含同源质粒或噬菌体的多个序列编码产物,提示某些间隔序列可能是多个间隔序列或同源质粒或噬菌体中特殊序列的整合。rep基因与质粒复制子(ori)间有密切联系,rep基因编码的Rep蛋白可结合ori内部多个位点发挥作用;P7spacer的部分序列与质粒的rep基因序列一致,因此某些间隔序列发挥作用时,质粒ori可能参与其中。据此推测,间隔序列在形成时,至少有2类基因的重组融合,一类是起到识别和调控的信息基因,另一类是起功能作用的操纵基因。在某些CRISPR中,间隔序列的部分序列与侧翼序列存在同源性,说明CRISPR中普遍存在基因重组现象,其有利于CRISPR维持自身的生存及进化,保持自身基因组的稳定性。在同一个CRISPR中,多个间隔序列具有很高的相似性,该现象在CRISPR中并不常见,其具体作用尚未明确,有可能作为一种增强机制来维护CRISPR功能。

不同CRISPR在不同种群中的分布不同,在不同亲缘关系中的重复序列具有较高的同源性,说明CRISPR同源性与菌株亲缘性之间的关系并不密切,可能与CRISPR序列的水平基因转移有关,而这一现象已在多种菌种中发现[9,12-14]。研究[15]显示:水平基因转移是细菌抗生素抗药的主要原因,并且在进化过程中发挥着重要的作用。多项研究[12,16-17]已经证实:在乳酸菌和金黄色葡萄球菌中,CRISPR与耐药性之间有关联。因此,通过CRISPR限制志贺菌中耐药性基因在细菌间的传播成为可能,从而为志贺菌耐药问题提供研究思路。

本研究采用PCR法扩增出志贺菌中存在的CRISPR,虽然所用菌株数量少,但也说明PCR方法在检测志贺菌CRISPR中的实用性。同时分析了志贺菌CRISPR的重复序列,间隔序列的特点及同源性,说明CRISPR系统的多样性及复杂性,以及未来应用的可行性。目前广泛应用的CRISPR/CAS9基因编辑技术仅是CRISPR应用的一个方面,如何利用CRISPR的特点来探索、控制或改善志贺菌耐药需要更多的研究。

[1]邓凯波,霍贵成.嗜热链球菌中CRISPR序列的检测与同源性分析 [J].食品科学,2013,34(3):153-157.

[2]王 建,邱少富,宋宏彬,等.CRISPR在细菌分型和进化中的研究进展 [J].生物技术通讯,2013,24(3):414-417.

[3]Biswas A,Gagnon JN,Brouns SJ,et al.CRISPR Target:bioinformatic prediction and analysis of crRNA targets [J].RNA Biol,2013,10(5):817-827.

[4]Wang Y,Song C,Duan G,et al.Transposition of ISEcp1 modulates blaCTX-M-55-mediated Shigellaflexneri resistance to cefalothin [J].Int J Antimicrob Agents,2013,42(6):507-512.

[5]杨海燕,段广才,张卫东,等.河南省睢县2001-2008年志贺菌群分布及其耐药分析 [J].中华流行病学杂志,2010,31(3):351-353.

[6]Yang H,Sun W,Duan G,et al.Serotype distribution and characteristics of antimicrobial resistance in Shigellaisolated from Henan province,China,2001-2008 [J].Epidemiol Infect,2013,141(9):1946-1952.

[7]Yang H,Duan G,Zhu J,et al.Prevalence and characterisation of plasmid-mediated quinolone resistance and mutations in the gyrase and topoisomeraseⅣgenes among Shigellaisolates from Henan,China,between 2001and 2008 [J].Int J Antimicrob Agents,2013,42(2):173-177.

[8]Staals RH,Agari Y,Maki-Yonekura S,et al.Structure and activity of the RNA-targeting TypeⅢ-B CRISPR-Cas complex of Thermus thermophilus [J].Mol Cell,2013,52(1):135-145.

[9]邓凯波,霍贵成,柳国霞.CRISPRs在德氏乳杆菌中的检测与同源性分析 [J].东北农业大学学报,2011,42(11):19-23.

[10]Richter C,Chang JT,Fineran PC.Function and regulation of clustered regularly interspaced short palindromic repeats(CRISPR)/CRISPR associated(Cas)systems [J].Viruses,2012,4(10):2291-2311.

[11]Kunin V,Sorek R,Hugenholtz P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats [J].Genome Biol,2007,8(4):R61.

[12]Marraffini LA,Sontheimer EJ.CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA [J].Science,2008,322(5909):1843-1845.

[13]Nozawa T,Furukawa N,Aikawa C,et al.CRISPR inhibition of prophage acquisition in Streptococcus pyogenes [J].PLoS One,2011,6(5):e19543.

[14]薛泽润,王颖芳,段广才,等.志贺菌成簇规律间隔短回文重复序列相关蛋白基因cas1和cas2研究 [J].中华流行病学杂志,2014,35(5):581-584.

[15]Keen EC.Paradigms of pathogenesis:targeting the mobile genetic elements of disease [J].Front Cell Infect Microbiol,2012,2:161.

[16]Burley KM,Sedgley CM.CRISPR-Cas,aprokaryotic adaptive immune system,in endodontic,oral,and multidrug-resistant hospital-acquired Enterococcus faecalis [J].J Endod,2012,38(11):1511-1515.

[17]Palmer KL,Gilmore MS.Multidrug-resistant enterococci lack CRISPR-cas [J].Microbiology,2010,1(4).doi:10.1128/mBio.00227-10.

猜你喜欢
噬菌体碱基同源
两岸年味连根同源
不同富集培养方法对噬菌体PEf771的滴度影响
以同源词看《诗经》的训释三则
高效裂解多重耐药金黄色葡萄球菌的噬菌体分离及裂解酶的制备
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
“铤”有“直”义的词源学解释——兼说/直/义的同源词族
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
虔诚书画乃同源