食源性致病菌近红外光谱改进贝叶斯判别模型的建立

2018-06-29 03:36刘建学马凯旋韩四海陈浩宇
农产品加工 2018年12期
关键词:食源性致病菌贝叶斯

刘建学 ,马凯旋 ,韩四海 ,陈浩宇

(1.河南科技大学食品与生物工程学院,河南洛阳 471023;2.河南省食品原料工程技术研究中心,河南洛阳 471023)

食源性致病菌引起的食源性疾病在食品安全事件中占很大比例,对人类的身心健康和食品卫生行业的发展造成严重影响。其中,大肠杆菌(Escherichia coli,E.coli)、单增李斯特菌(Listeria monocytogenes,LM)、金黄色葡萄球菌 (Staphylococcus aureus)是几种典型的食源性致病细菌,在我国各省区乃至全世界检出率都较高,严重时可导致死亡[1]。因此,如何快速高效地检测食源性致病菌已成为近年来的研究热点。传统的微生物检测方法虽灵敏性高、准确,但试验操作繁琐、耗时长、试剂昂贵,不适于实现同时在线和现场的快速检测[2-3]。

傅里叶变换近红外光谱分析技术相比传统的检测手段更快速、简便、环保,易于实现大批量处理样品,在各个领域的定量分析得到广泛应用,且在鉴别、定性分析方面也有独特功能[4-5]。近红外光谱分析技术用于食源性致病菌的检测,其优越性在于可避免或减少复杂的前处理,而且有可能应用于活菌的检出和鉴别[6-8]。路春霞和王磊等人[9-10]利用傅里叶变换中红外光谱技术对大肠杆菌O157∶H7、肠炎沙门氏菌等4种致病菌进行了聚类分析,得到了很好的区分效果。Feng Y Z等人[11]利用可见和近红外光谱研究大肠杆菌O157∶H7、英诺克李斯特菌(Listeria innocua)的分类鉴别方法;王若男等人[12]利用近红外光谱对标准菌的种间分类进行初步研究,并证实了在微生物快速鉴定的可行性。

在利用近红外光谱对细菌进行鉴别分析时,光谱之间存在信息叠加与相互干扰,容易产生误判,在一定程度上会影响鉴别模型的准确性。贝叶斯判别分析与其他算法相比有着最小的判别错误率,考虑了总体各自出现的概率大小,具有计算效率高、精确度高和适用性强的优点。主成分分析可消除信息叠加问题和相关性不大的变量,提取特征变量。目前,利用主成分分析(Principal component analysis,PCA)与贝叶斯判别分析(Bayes discriminantanalysis,BDA) 相结合作为一种改进的贝叶斯判别分析对食源性致病菌快速鉴别的新型方法尚缺乏相关报道。因此,试验采集了大肠埃希氏菌O157∶H7、单增李斯特菌和金黄色葡萄球菌3种典型食源性致病菌的菌体细胞的近红外透射光谱图,分别采用主成分分析、贝叶斯判别分析和改进贝叶斯判别分析,通过对比3种方法的判别正确率以确定最优的食源性致病菌近红外光谱判别模型。

1 材料与方法

1.1 材料与试剂

菌种:金黄色葡萄球菌、大肠埃希氏菌O157∶H7,中国科学院微生物研究所提供;单增李斯特菌,河南省洛阳市疾病预防与控制中心提供。

培养基:营养肉汤培养基、营养琼脂培养基,北京奥博星公司提供。

试剂:0.9%生理盐水,溴化钾(光谱纯),二次蒸馏水。

1.2 仪器与设备

VECTOR-33型傅里叶变换红外光谱仪,德国布鲁克公司产品;FD-1D-50型冷冻干燥机,北京比朗实验设备有限公司产品;DHP-9272型电热恒温培养箱,上海一恒科学仪器有限公司产品;SW-CJ型超净工作台,苏州安净净化科技有限公司产品。

1.3 试验方法

1.3.1 细菌培养与干菌体的制备

取-80℃保藏的菌种放置室温中,无菌操作吸取1 mL于营养肉汤培养基,于37℃条件下,以转速180 r/min振荡培养12 h;蘸取菌液接种于营养琼脂培养基,于37℃条件下培养使其复苏;挑取纯化培养后的单菌落接种于营养肉汤培养基,于37℃条件下,以转速180 r/min振荡培养12 h;用紫外分光光度计测其OD600,用于估计菌液浓度;将培养后的菌悬液在4℃条件下,以转速5 000 r/min离心10 min高速冷冻离心机分离菌体;用0.9%生理盐水洗涤2次,再用蒸馏水洗涤1次后放置冷冻干燥机至完全干燥。

1.3.2 样本的采集

选取典型的单菌落为一个独立的样本,共采集80个样本,为了使所选样品更具代表性,以隔四取一的方式从80个样本中选取64个作为训练集样本,余下16个作为验证集样本。训练集样本重新编号后,1~24代表大肠埃希氏菌O157∶H7(Ⅰ),25~45代表单增李斯特菌(Ⅱ),46~64代表金黄色葡萄球菌(Ⅲ);验证集样本重新编号后,1~6代表大肠埃希氏菌O157∶H7(Ⅰ),7~11代表单增李斯特菌(Ⅱ),12~16代表金黄色葡萄球菌(Ⅲ)。

1.3.3 检测样品近红外光谱的采集

采用溴化钾压片法制备检测样品,将干菌体与溴化钾完全混合研磨,制成厚度均一的薄片。利用傅里叶变换近红外光谱仪采集样品透射光谱,背景为溴化钾薄片,扫描范围8 000~4 000 cm-1,分辨率4 cm-1,扫描次数32次,每个样品重复测3次,取其平均光谱作为该样本的近红外光谱数据储存,以备建立数学模型。

1.3.4 光谱数据的预处理

利用The Unscrambler X10.4分析软件(挪威CAMO公司)对3种致病菌所采集的近红外光谱进行预处理[12]:①基线校正,消除基线漂移、倾斜现象;②光谱平滑(平滑点数为9),消除噪音对信号的干扰,提高信噪比;③矢量归一化处理,防止因样品量、厚度不同导致的谱图测量误差;④一阶导数,强化谱带特征。

1.3.5 鉴别模型的建立

(1)主成分分析(PCA) 是一种较为成熟的多元统计分析方法,是数据压缩和特征信息提取技术。运用PCA方法可以减少数据维数、转换原变量,并且不会降低光谱间的差异信息,这类分析方法可在事先未知类别的情况下对光谱数据进行分析。

(2) 贝叶斯判别分析(BDA) 是通过计算总体各自出现的概率大小,对未知类别的样品进行归类,归属于概率最大的一类。具体分析步骤如下:

步骤1:首先计算出训练样本的先验概率。假设有k个p维总体G1,G2,···,Gk,概率密度函数为f1(x),f2(x),···,fk(x)。样品x来自总体Gi的先验概率为 pi(i=1,2,···,k),则有 p1+p2+···+pk=1。

步骤2:再计算出其后验概率进行判别。已知样品x来自总体Gi的后验概率为:

步骤3:预测样本类别根据各类的后验概率进行比较,归属于最大后验概率所属的类。

(3)改进贝叶斯判别分析是将主成分分析与贝叶斯判别分析相结合的一种方法。运用PCA可消除信息叠加问题和属性间的相关性,提取特征主成分数,将特征主成分作为BDA模型的最优判别因子,建立改进BDA模型。

使用MATLAB R2014a软件(美国Math Works公司)对数据进行无监督学习算法PCA与有监督学习算法BDA模型的建立。根据前述1.3.2所选样本集,提取训练集64个样本的近红外光谱,以主成分分析、贝叶斯和改进贝叶斯判别分析等分类方法进行数据处理,建立各方法的近红外光谱鉴别模型。而后利用所建模型对16个验证集样本判别,考查模型的准确率。

2 结果与讨论

2.1 光谱数据的预处理分析结果

大肠埃希氏菌O157∶H7、单增李斯特菌和金黄色葡萄球菌在8 000~4 000 cm-1波数范围的近红外透射光谱图见图1。

图1 3种致病菌的近红外透射光谱图

由图1可看出,这3种致病菌对近红外光谱的吸收峰位差异性很小,并不能通过直接标记吸收峰位置找到致病菌在近红外区的特征吸收。为进一步区分比较3种致病菌的异同,利用The Unscrambler X10.4软件对3种致病菌的近红外光谱经矢量归一化处理后进行一阶求导,以增强光谱的分辨率。

3种致病菌的一阶导数近红外光谱图见图2。

图2 3种致病菌的一阶导数近红外光谱图

选取具有特征波数6 000~4 000 cm-1的一阶导数近红外数据进行研究分析(图2)。由图2可以看出,3种致病菌的一阶导数近红外图谱的差异性初步体现出来,但仍无法将3种致病菌很好的区分。因此需要先进行数学预处理,提取特征光谱信息,采用统计学运算并结合化学计量学分析方法作进一步的数据处理。

2.2 PCA分类结果

3种食源性致病菌的光谱数据经矢量归一化和一阶求导预处理后,选取6 000~4 000 cm-1波段的数据进行PCA分析。

前10个主成分累积贡献率趋势见图3。

图3 前10个主成分累积贡献率趋势

图3 显示了前10个主成分的累积贡献率已达到99.86%。理论上,累积贡献率达到100%是最佳的状态,但是此时的模型性能不一定最好。不同主成分方差贡献率第1个最大,接着依次降低,对定性分析模型的训练和预测结果有明显的影响。若主成分数过多,则有可能引入过多噪声干扰,降低信噪比,使模型性能降低。因此,要对主成分因子数进行优化,选择最佳的主成分和合适的主成分数来建立模型。从图3可以看出,前3个主成分的累积贡献率已经非常接近100%,解释了原始变量98.93%的信息,能全面的对3种致病菌近红外光谱特性进行分析。

在主成分分析中,对微生物间正确分类起主要贡献的可能是前2个主成分,也可能是前3个主成分。以PC1,PC2和PC3作为聚类依据,80个致病菌样品近红外光谱前2个和前3个主成分的得分如图4所示。

3种致病菌的PCA聚类分布见图4。

主成分分析表现的是样品原始光谱即样品本身的特征信息,3种致病菌虽然可以正确分类,但是每种菌分布区域不明显,尤其是大肠埃希氏菌与金黄色葡萄球菌、单增李斯特菌有重叠,且大肠埃希氏菌分布不集中,出现有异常点,可能是试验误差等因素所致。考虑到在采集菌体谱图的过程中易受到细胞结构、样品采集量、采集光谱的环境所造成的影响,在剔除异常样品后,3种菌得到正确分类,相互间的差异较小。

2.3 贝叶斯及改进贝叶斯判别分析结果

图4 3种致病菌的PCA聚类分布图

为进一步提高食源性致病菌识别分类的准确性和高效性,利用主成分分析对3种致病菌的谱图数据进行降维,作为贝叶斯判别分析的特征变量,建立基于贝叶斯判别分析的食源性致病菌鉴别模型的研究。

运用MATLAB R2014a软件构建3种食源性致病菌BDA模型,分别对64个训练集样本和16个验证集未知样本进行判别预测。

训练样本的判别分类结果见表1,验证样本的判别分类结果见表2。

表1 训练样本的判别分类结果

从表1和表2处理结果来看,该方法所建模型对于训练集样本误判14个,验证集未知样本误判4个,判别正确率分别为78%和75%,其结果并不理想。

表2 验证样本的判别分类结果

为此,将BDA方法改进,即利用前述PCA方法得到的前2个和前3个主成分分别作为BDA模型的判别因子,建立改进BDA模型。用该模型对64个训练样本进行判别,判别结果见表1,其中利用前2个主成分和前3个主成分分别作为BDA模型的判别因子,均使得3种食源性致病菌正确归类,判别正确率为100%,显然改善了BDA方法,提高了正确判别率。综合主成分分析的结果和表1的分析结果,选择前2个主成分作为BDA模型的最优判别因子,能全面表示样品近红外光谱的特征信息,并减少由主成分数的选择过多对判别结果的影响,同时减少了计算机的运算量、节约运算时间,所构建的改进BDA模型的准确性能达到食源性致病菌间分类鉴别的实际要求。

根据训练好的改进BDA模型对16个未判样本进行判别,并与BDA判别结果相比较,由表2可知,改进BDA模型对16个未判样本的判别正确率为100%,而BDA模型误判了4个,判别正确率为75%。结果表明,用改进的BDA模型对3种食源性致病菌进行分类鉴别,其训练集和验证集的判别正确率均达到100%,从而可以确定6 000~4 000 cm-1波数范围是菌体近红外敏感组分光谱的研究范围之一。BDA模型判别率低于改进BDA模型,应为原始光谱数据较多,噪声信号也随之较多,且每种菌株的光谱数据之间存在信息叠加所导致。同时,BDA方法在建立判别模型时增加了工作量,需要大量的运算时间,由于3种致病菌的近红外谱图差异性较小,在贝叶斯判别中通常会以样本出现的频率大小作为各总体的先验概率,引入了一些相关性不大的变量,对判别分析的精确度造成干扰,继而出现误判,PCA则有效地剔除多余变量,保留了特征变量。因此,将PCA作为BDA判别因子建立的改进判别模型是可靠的,是鉴别食源性致病菌能力较优的方法。

3 结论

将贝叶斯判别与主成分分析相结合,对大肠埃希氏菌O157∶H7、单增李斯特菌和金黄色葡萄球菌等3种典型食源性致病菌进行了有效的快速鉴别方法研究。

(1)经光谱预处理后,利用主成分分析法将近红外光谱信息进行压缩、降维,分别采用前2个主成分和前3个主成分进行聚类分析,能够较好地将3种致病菌分类,但菌种之间有交叉,分类不彻底。

(2)建立了基于近红外光谱的贝叶斯判别方法,对训练集样本和未知样本的判别正确率分别为78%和75%。

(3)建立了基于主成分分析的改进贝叶斯判别方法,以前2个主成分作为BDA模型的2个最优判别因子建立改进BDA模型,对64个训练样本进行判别,其判别正确率达到100%;对16个未知样品进行验证,其判别正确率达到100%。可见,改进贝叶斯模型对未知样品的判别正确率由原来的75%提高到了100%,说明该方法对食源性致病菌种类的判别可行。

[1]Pan W,Zhao J,Chen Q.Classification of foodborne pathogens using near infrared(NIR) laser scatter imaging system with multivariate calibration[J].Scientific Reports,2015 (3):9 524.

[2]Maitri T,Sigurdur O,Jongseok L,et al.Data mining for recognizing patterns in foodborne disease outbreaks[J].Journal of Food Engineering,2010 (2):213-227.

[3]Brandily M L,Monbet V,Bureau B,et al.Identification of foodborne pathogens within food matrices by IR spectroscopy[J].Sensors&Actuators B Chemical,2011(1):202-206.

[4]李娟,梁漱玉.近红外快速无损检测食用油品质的研究进展 [J].食品与机械,2016,32(11):225-228.

[5]Mandal P K,Biswas A K,Choi K,et al.Methods for rapid detection of foodborne pathogens:An overview[J].American Journal of Food Technology,2011,6 (2):87-102.

[6]Huck-Pezzei V A,Seitz I,Karer R,et al.Alps food authentication,typicality and intrinsic quality by near infrared spectroscopy[J].Food Research International,2014,62(8):984-990.

[7]Vasconcelos H,Saraiva C,Almeida J M M M D.Evaluation of the spoilage of raw chicken breast fillets using fourier transform infrared spectroscopy in tandem with chemometrics[J].Food&Bioprocess Technology,2014,7(8):2 330-2 341.

[8]Sahar A,É.Dufour.Use of Fourier transform-infrared spectroscopy to predict spoilage bacteria on aerobically stored chicken breast fillets[J].Food Science and Technology,2014,56 (2):315-320.

[9]路春霞,刘源,孙晓红,等.应用傅里叶变换红外光谱区分鉴定四种食源性致病菌的研究 [J].化学学报,2011,69 (1):101-105.

[10]王磊,唐颖,徐凯,等.食源性致病菌傅里叶变换红外光谱快速鉴别方法 [J].中国食品学报,2011,11(1):202-207.

[11]Feng Y Z,Downey G,Sun D W,et al.Towards improvement in classification of Escherichia coli,Listeria innocua,and their strains in isolated systems based on chemometric analysis of visible and near-infrared spectroscopic data[J].Journal of Food Engineering,2015(1):87-96.

[12]王若男,岳田利,袁亚宏,等.基于傅里叶变换近红外光谱的脂环酸芽孢杆菌种间分类鉴定 [J].光谱学与光谱分析,2015,35(11):3 073-3 077.◇

猜你喜欢
食源性致病菌贝叶斯
秋冬季高发食源性疾病的危害与预防
食源性寄生虫病流行趋势与控制策略
论食品安全与食源性疾病的控制
夏季食品安全头号杀手——食源性疾病
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
重症监护室机械通气患者发生多重耐药菌的危险因素分析
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
急性盆腔炎的致病菌分析及治疗