沙门氏菌PFGE分型非计量多维尺度分析法的研究*

2014-03-10 05:25曹际娟贾俊涛许龙岩赵丽青
中国卫生统计 2014年3期
关键词:凝胶电泳沙门氏菌相似性

曹际娟贾俊涛许龙岩赵丽青

沙门氏菌PFGE分型非计量多维尺度分析法的研究*

曹际娟1贾俊涛2许龙岩3赵丽青2

目的探讨沙门氏菌脉冲场凝胶电泳(PFGE)分型非计量多维尺度分析法(NMDS)。方法从国内不同地区分离得到的24株沙门氏菌进行PFGE分型,然后以非计量多维尺度法对PFGE分型进行分析。结论将24株沙门氏菌显示在三维空间,从视觉上直接揭示了表型特征相近的不同国家和地区沙门氏菌之间的相关性,为PFGE谱图的分析提供了一种有用的工具。

沙门氏菌 脉冲场凝胶电泳分型 非计量多维尺度分析法

在食源性致病菌中,沙门氏菌(SA)的危害性极为严重,因此应将其列为首选控制目标。脉冲场凝胶电泳技术(pulsed field gel electrophoresis,PFGE)具有分型能力强、分辨能力高、可重复性强等优点,是目前细菌分子分型方法的金标准[1]。

细菌PFGE带型属于高维数据,即每个菌株拥有很多不同的带型。高维数据由于数据结构复杂无法直接表示在低维空间(二维平面或三维空间),其数据特征很难被发现。多维尺度法(multidimensional scaling,MDS)是一种无监督的用于高维数据降维的可视化工具。MDS可以分为计量多维尺度法(metric multidimensional scaling,MMDS)和非计量多维尺度法(nonmetric multidimensional scaling,NMDS)。本研究首先采用聚类分析法对进出口食品中分离的沙门氏菌PFGE图谱进行分子分型,同时,探索采用NMDS来反映食品中不同沙门氏菌PFGE带型之间的差异程度,为沙门氏菌的分子流行病学研究及沙门氏菌引起的食源性疾病溯源提供技术基础。

材料与方法

1.材料

从国内不同地区分离得到的24株沙门氏菌。PFGE相对分子量标准用布伦登卢普沙门氏菌H9812(Salmonella Braenderup),由广东省疾病预防控制中心赠送。

一次性血琼脂平板,广州环凯公司;限制性内切酶Xba I、Trisbase,美国Promega公司;SLS(Sodium lauroyl Sarcosine)、SDS,美国Sigma公司;蛋白酶K,德国Merck;SeaKem Gold琼脂糖,美国Biorad公司。Chef Mapper脉冲场电泳仪、Gel Doc XR凝胶成像系统,美国BIO-RAD公司。

2.脉冲场凝胶电泳[4]

参照美国PulseNet的沙门氏菌PFGE分子分型标准方法。将酶切后的胶块置于10孔梳齿上,缓慢倒入1%SKG琼脂糖。待凝固后,放入盛有2.2L 0.5× TBE缓液的电泳槽中。在14℃、脉冲时间2.16~63.8s条件下,电泳18h;电泳完毕后,用EB染色30m in,脱色90m in,最后用GelI 3ac EQ拍摄图像。

3.脉冲场凝胶电泳图谱的非计量多维尺度分析

设X为高维数据矩阵,即原始空间中的点的集合,

式(1)中,x为观察对象向量,n为X中观察对象的个数。

D={dij}为X中第i个和第j个观察对象的距离构成的矩阵,1≤j<i≤n。

计量MDS的目标是寻找二维或三维构造空间中的n个点组成的点集Y={y1,y2,…,yn},Y为n×k(k=2或3)维构造矩阵,使其距离矩阵H={hij}与D中对应元素相对大小保持一致,即将D的对角线下方元素按升序排列di1j1≤di2j2≤…≤dimjm,m=n(n-1)/2,H的对角线下方元素也满足hi1j1≤hi2j2≤…≤himjm,m=n(n-1)/2。

采用Kruskal算法求解Y[5]:

式(2)中Stress为胁强系数,表示构造矩阵与原始矩阵的距离偏差占原距离矩阵的比重。

在k固定的情况下,按照最小二乘单调回归求得胁强系数的最小值,此时对应的Y就为k维最佳拟合构造矩阵,从而实现了X的降维。

将24株沙门氏菌进行PFGE分析,获得菌株两两之间的Dice相似性矩阵S(S={sij})。按如下方法将相似性矩阵转换为距离矩阵D(D={dij}):

式(3)中,i和j为菌株在矩阵X中的序号。

在MATLAB R2009b(Version 7.9.0.529)中完成NMDS分析的所有步骤。

首先计算k=2时的胁强系数,如果其小于0.20,则根据Y绘制二维平面图;否则k=3,再次计算胁强系数,如果其小于0.20,则根据Y绘制三维图,如果胁强系数仍大于0.20,则表示X的数据结构无法用计量MDS实现降维。

用Shepard图来显示NMDS的拟合效果。

结果与分析

1.脉冲场凝胶电泳结果

制备染色体全基因组DNA,用限制性内切酶Xba I酶切,经PFGE分离,产生10~16条DNA片段,所有菌株的基因组DNA显示出良好的分型能力(图1,图2),分子质量大小在(20~1100)kb之间。

图1 沙门氏菌PFGE电泳图(M:沙门氏菌H9812;1-12:SA1-SA12)

图2 沙门氏菌PFGE电泳图(M:沙门氏菌H9812;1-12:SA13-SA24)

3.非计量多维尺度分析

(1)沙门氏菌PFGE分型NMDS图

k=2时,胁强系数为0.22,大于0.20,因此在二维构造空间中无法找到合适的点;

k=3时,胁强系数为0.14,小于0.20,因此在三维构造空间中可以找到合适的点,可以表示原始空间中的点。用MATLAB绘制NMDS三维图(图3)。

图5显现了24株沙门氏菌相似程度的远近,距离近的两个点的相似性高,距离远的两个点的相似性低。

图3 沙门氏菌PFGE图谱NMDS三维图

图3结合图4可以准确发现各点之间的相似程度:

从整体上看,24株沙门氏菌可以分成3群:SA2、SA5、SA11、SA19、SA21、SA22、SA23和SA29;SA1、SA8、SA12、SA18和SA20;SA4、SA6、SA10、SA13、SA14、SA15、SA16、SA17和SA24。SA3和SA7位于前两群的交界处,分类不明显。

进一步观察NMDS图的局部。SA2、SA9和SA11非常接近,表明这3株菌相似性非常高。SA2和SA11都是德尔卑沙门氏菌,分别从欧洲进口冻猪肚和从广州出口冻鸡中分离到的。SA9是从广州同一家禽厂出口冻鸡中分离出的乌普萨拉沙门氏菌。SA13-17是此次分离的5株伤寒沙门氏菌,这5株菌都位于第三群中,从图3和图4可以看出这5株菌之间相似的关系。它们大体上空间位置排列依次为:SA14、SA13、SA16、SA15和SA17。SA13和SA14相似性高,SA15、SA16和SA17相似性高,而排序两端的菌之间相似性低。SA14、SA15和SA17是从广东的出口食品中分离的,NMDS图显示这3株菌并不完全相关。SA13和SA16是从欧洲进口的肉制品中分离到的,NMDS图显示这两株菌也不相关。SA2、SA4和SA11是此次分离的3株德尔卑沙门氏菌,从图3可以看出SA4与另外两株菌的距离很远,SA4与另两株菌相似性差别较大。

按24株沙门氏菌不同来源分析,SA20分离自美国食品,它位于最外围;SA8和SA21分离自澳大利亚食品,它们在NMDS图中较为接近;SA12、SA19和SA23分离自乌拉圭食品,它们在NMDS图中也较为接近;其余的18株沙门氏分离自广东出口食品和欧洲进口食品,这两个来源的菌相互交错分布无法分开。

(2)拟合分析结果

NMDS的拟合效果Shepard图见图5。

Shepard图是构造空间中各点之间距离对原始空间中各点之间距离的散点图,可以帮助确定NMDS分析的拟合效果。在NMDS分析中,Shepard图也显示了原始空间中各点之间的距离对其单调转换的散点图。图5中圆圈的分布延1:1线向下弯曲,说明构造空间中各点之间距离对原始空间中各点之间距离偏离较大,这也是NMDS比MMDS更灵活的体现,MMDS试图寻找构造空间中的点,使各点之间的距离尽可能地接近原始空间中各点之间的距离;而NMDS试图探寻原始空间中各点之间距离的单调转换,使构造空间体现这种单调转换的顺序关系(相对距离)。

图4 沙门氏菌PFGE图谱NMDS三维图的3个方向视图

图5 沙门氏菌PFGE图谱NMDS拟合效果Shepard图

讨 论

非计量多维尺度分析法和传统UPGMA聚类分析法是两种常用的PFGE图谱分析方法,在实际应用过程中两者在不同方面各有优劣[2-3]。聚类分析法的实验结果是以聚类树状图来呈现的。在树状图中,相似性高的菌株在高相似性(“树枝”方向)处聚为一类,相似性低的菌株在低相似性(“树根”方向)处被归为一类。因此,可通过树状图直接判断哪些菌株归属于同一类群。NMDS三维图虽然可以清晰的表示各点之间的远近关系,但无法直接产生类似于聚类分析法中的类群信息。为了解决这一问题,可以通过K-均值聚类将NMDS三维图中的点进行聚类。本研究对此次分析的数据按3-5类别分别进行K-均值聚类后发现,其聚类结果与传统PFGE分析采用的UPGMA聚类结果十分接近(数据未列出)[4]。

聚类分析法仅能将相近的菌株放在一簇,却并不能体现菌株两两之间的异同。相比于聚类分析法,NMDS方法能更进一步地显示菌株之间的相似性关系,即能够发现任意两株菌之间的相似性关系。例如:从图3可以看出5株伤寒沙门氏菌的空间位置排列依次为:SA14、SA13、SA16、SA15和SA17,这5株菌两两菌株之间的相似性关系一目了然。

NMDS是一种高维数据降维技术,对原始数据会有信息损失,这是任何降维方法不可避免的问题。例如:SA2、SA9和SA11这3个点相似性100%,在高维空间中是重合的,但在NMDS图上3点却是分开的。这是因为NMDS虽然在低维空间显示了高维空间的数据,却在局部改变了原始的数据信息。因此,NMDS更适合做“全局”分析,在“局部”点的分析上应该结合聚类分析法等不改变原始数据信息的方法综合进行。

本研究分离的24株沙门氏菌分布在3个群、15种血清型中,虽然PFGE分型结果显示型别较分散,无明显规律,但通过本研究初步了解了进出口食品中沙门氏菌的分子型别,为今后建立沙门氏菌分子分型数据库、分析进出口食品中沙门氏菌的分子流行趋势提供基础数据[5]。同时,本研究建立了进出口食品中沙门氏菌PFGE谱图的NMDS分析方法,对进出口食品中分离的24株沙门氏菌的高维带型信息进行降维,成功将24株沙门氏菌显示在三维空间,从视觉上直接揭示了表型特征相近的不同国家和地区沙门氏菌之间的相关性,为PFGE谱图的分析提供了一种有用的工具,进一步促进PFGE方法在食品中病原菌污染源的追踪和溯源、进出口食品把关以及食源性疾病的控制等方面的应用。

1.李燕俊,赵熙,杨宝兰,等.肠炎沙门氏菌脉冲场凝胶电泳分型研究.卫生研究,2005,34(3):338-340.

2.王丽丽,徐建国.脉冲场凝胶电泳技术(PFGE)在分子分型中的应用现状.疾病监测,2006(21)5:276-279.

3.陈太基.封幼玲.脉冲场凝胶电泳用于李斯特菌分型及分子流行病学研究.中国人兽共患病杂志,2000,16(1):90-93.

4.许龙岩,袁慕云,刘静宇,等.进出口食品中沙门氏菌PFGE分型及耐药研究.检验检疫学刊,2010,20(2):14-17.

5.Kruskal JB.Multidimensional scaling:a numerical method.Psychometrika,1964,29(2):115-129.

(责任编辑:郭海强)

辽宁省自然科学基金项目(项目编号20102080)

1.辽宁出入境检验检疫局(116033)

2.山东出入境检验检疫局

3.广东出入境检验检疫局

猜你喜欢
凝胶电泳沙门氏菌相似性
一类上三角算子矩阵的相似性与酉相似性
广东、广西、福建省和上海市零售鸡肉源沙门氏菌的血清型和基因型
鱼粉中沙门氏菌杀灭方法的研究
食品中沙门氏菌检验虚拟仿真实验研究
浅析当代中西方绘画的相似性
全错位排列问题的DNA计算模型
低渗透黏土中氯离子弥散作用离心模拟相似性
基于DNA计算的最大权团问题设计
V4国家经济的相似性与差异性
2007-2011年宁夏地区沙门氏菌分布特征分析*