郭培源++刘艳芳++邢素霞++王昕琨
摘 要:针对近年来备受关注的腊肉酸价和过氧化值超标、褪色、出油、发黏等品质问题,提出一种快速、准确、实用的检测技术。采用支持向量机(support vector machine,SVM)将近红外光谱(near infrared spectroscopy,NIR)检测到的酸价、过氧化值、挥发性盐基氮和显微图像处理得到的微生物菌落总数进行多数据融合,建立腊肉品质等级检测模型,并利用粒子群优化(particle swarm optimization,PSO)算法进行模型优化。结果表明:支持向量机的分类方法取得了与生化方法相同的腊肉分级预测结果,且采用粒子群优化后的分类模型准确率由97.5%提升到100%。证明粒子群优化支持向量机模型能够迅速对腊肉等级进行准确检测。
关键词:腊肉品质;近红外光谱;图像处理;支持向量机;粒子群优化算法
Predication of Chinese Bacon Quality Grades Based on Support Vector Machine and Particle Swarm Optimization Algorithm
GUO Peiyuan, LIU Yanfang*, XING Suxia, WANG Xinkun
(School of Computer and Information Engineering, Beijing Technology and Business University, Beijing 100048, China)
Abstract: In recent years, quality problems of Chinese bacon such as acid values and peroxide values exceeding the national standard, color fading, oil exudation and sticky feeling to the touch have received growing attention. With that in mind, a fast, accurate and practical detection method to evaluate Chinese bacon quality is presented in this paper. We established a predictive model for bacon quality detection by using the support vector machine (SVM) approach based on the near-infrared spectral data (acid value, peroxide value, volatile base nitrogen) and microscopic image data (the total number of microbial colonies). Moreover, the model was optimized by using particle swarm optimization (PSO) algorithm. It was found that the prediction results of the SVM model and the biochemical method were consisted for bacon quality classification. Besides, the predictive accuracy of the classification mode was increased from 97.5% to 100% after optimization. The SVM model optimized by PSO proved to be able to quickly and accurately detect Chinese bacon quality.
Key words: Chinese bacon quality; near infrared spectroscopy (NIR); image processing; support vector machine (SVM); particle swarm optimization (PSO)
DOI:10.7506/rlyj1001-8123-201703006
中圖分类号:TS251.1 文献标志码:A 文章编号:1001-8123(2017)03-0030-05
引文格式:
郭培源, 刘艳芳, 邢素霞, 等. 基于支持向量机及粒子群算法的腊肉品质等级检测[J]. 肉类研究, 2017, 31(3): 30-34. DOI:10.7506/rlyj1001-8123-201703006. http://www.rlyj.pub
GUO Peiyuan, LIU Yanfang, XING Suxia, et al. Predication of Chinese bacon quality grades based on support vector machine and particle swarm optimization algorithm[J]. Meat Research, 2017, 31(3): 30-34. DOI:10.7506/rlyj1001-8123-201703006. http://www.rlyj.pub
中国腊肉是世界饮食文化的宝贵遗产,腊肉以其独特的风味闻名于世,其制作工艺要求不高,在贮藏和运输过程中很容易出现质量问题。随着生活水平的提高,人们对食品安全的关注度也相应提高。腊肉主要成分包括脂肪和蛋白质,评价脂肪的降解指标是酸价和过氧化氢值,评价蛋白质的降解指标是挥发性盐基氮[1-3],这些也是传统饮食安全的主要检测指标。在实际腊肉样品检测中发现微生物菌落总数对腊肉的品质也有重要的影响[4]。目前,对于腊肉品质的检测主要以理化检测为主,但是其检测时间过长,且具有破坏性,不利于卫生检疫部门对腊肉品质的快速检验,因此急需一种新型的快速准确实用的无损检测技术。
近红外光谱(near infrared spectroscopy,NIR)作为一种新型的光学检测技术在食品检测中的应用越来越广泛,尤其是在肉类品质检测中对肉制品的保水性、肉色、新鲜度等的检测具有突出优势[5]。近年来国内外学者对腊肉的食用品质检测做了很多研究,杨昆程等[6]以腊肉为对象,探讨了高光谱技术在亚硝酸盐含量快速检测的可行性,贺稚非等[7]对川味腊肉在货架期间的品质变化做了研究。这些研究虽然使我们对影响腊肉食用品质的因素以及腊肉品质变化的过程有了更深入的了解,但是腊肉食用品质检测方法仍有待改进。本实验以腊肉为主要研究对象,采用支持向量机(support vector machine,SVM)将近红外光谱检测到的酸价、过氧化值、挥发性盐基氮和显微图像处理得到的微生物菌落总数进行多数据融合,建立腊肉品质等级检测模型,并利用粒子群优化(particle swarm optimization,PSO)算法进行模型优化。以期为检疫执法部门提供一种快速检测技术,保证消费者的食用安全。
1 材料與方法
1.1 材料
广式腊肉 广州皇上皇集团有限公司。
1.2 仪器与设备
FoodScan近红外全光栅透射光谱分析仪 丹麦Foss公司;BI-2000医学图像摄像电子显微镜 成都泰盟科技有限公司;恒温恒湿箱 北京雅士林试验设备有限
公司;8011S组织捣碎机 美国Waring Commercial公司;OPUS6.0光谱处理软件 德国布鲁克光谱仪器公司。
1.3 方法
1.3.1 数据采集
将不同批次共计10 个腊肉样品粉碎成肉糜状,18 ℃恒温箱保存。每隔12 h分次进行酸价、过氧化值、挥发性盐基氮的理化数据及光谱数据的采集,并采集样品的微生物菌落总数,采集12 次,共得到120 组包含理化、光谱、微生物菌落信息的样本数据。其中酸价与过氧化值按GB/T 5009.37—2003《食用植物油卫生标准分析方法》[8]
测定;挥发性氨基氮按GB/T 5009.44—2003《肉与肉制品 卫生标准的分析方法》中半微量定氮法来测定[9];近红外光谱数据采用福斯近红外光谱仪,每个样品连续扫描32 次,取平均值,得到120 个光谱数据;微生物菌落总数采用电子显微镜,采集100物镜下的显微图像,并将样品菌落图像进行平滑去噪处理然后进行黏连菌落分割计数,最后进行归一化。
1.3.2 基于支持向量机的腊肉品质等级检测模型建立
首先将采集的120 组样品数据随机分成校验集(80 组)和预测集(40 组)2 部分。
其次利用自组织映射(self organizing maps,SOM)神经网络[10]将生化实验测得的酸价、过氧化值以及微生物菌落总数进行模式识别及分类,将腊肉样品的品质等级在相关国家标准[11]的基础上划分为4 级:放心食用、可食用、不推荐食用和不可食用,从而细化分类等级,满足人们生产生活的实际需要。
然后将近红外光谱[12]采集到的校验集的酸价、过氧化值、挥发性盐基氮光谱与样本所对应的理化值利用偏最小二乘方法建立定量分析模型[13]并用遗传算法进行特征光谱选择,将优选后的波段作为支持向量机的特征向量。同时利用计算机视觉获取样品显微菌斑图像[14],将菌斑图像进行平滑去噪处理然后进行黏连菌落分割计数,并对计数结果归一化,将归一化后的结果作为支持向量机的另一特征向量。
最后采用支持向量机[15-18]对处理后的酸价、过氧化值、挥发性盐基氮数据和微生物菌落进行多数据融合,建立腊肉品质检测模型,对腊肉的品质等级进行快速识别。图1为支持向量机多数据融合结构图。
2 结果与分析
2.1 基于支持向量机的腊肉品质等级检测模型预测结果
2.1.1 近红外光谱处理结果与分析
利用近红外检测技术采集校验集样品光谱得到如图2a所示的原始光谱图,其横坐标为波长,纵坐标为样品进行归一化处理后的吸光度。图2b、c、d是用遗传算法进行特征光谱选择后得到的酸价、过氧化值、挥发性盐基氮的结果图,深色纵带为图中指标所对应的波长段。优选的波段主要集中在863~873 nm、895~900 nm、930~963 nm和1 012~1 022 nm这几个波段,虽然检测指标不同,所选取的波段不同,但是所用波长总数依然是整个波段波长数(198=1048-850)的1/3。可以看出遗传算法对波段进行波长选择,能使模型精度提高,建模所用波长数减少。
2.1.2 微生物菌落处理结果与分析
图3a、c、e分别是第6、14、28天某样品的微生物菌落原始图像,其中白色代表菌斑;图3b、d、f是样品菌斑图像进行平滑去噪以及黏连菌落分割处理后的图像。第6天菌斑是作为发酵剂的微生物所引起的,国标中允许在腊肉表面残留一定的微生物,这些作为发酵剂的微生物有利于增加腊肉的特有风味。第12天菌相开始发生变化,说明在这个时间样品的优势菌种已经发生改变,而且此时菌斑数量明显增多。第28天菌斑数量较之第12天增加更多,通过计数得知,此时的菌落总数为32 854 CFU/g,已经超过了国标[28]中10 000 CFU/g的标准。
图4是一个月内校验集样本微生物菌落总数变化图,通过数字图像处理方法得到的菌落总数与通过国标人工计数的方法得到的菌落总数几乎相同,这证明了通过数字图像处理技术可以获得微生物菌落总数,提高效率。
2.1.3 支持向量机模型分类预测结果与分析
SVM是Vapnik在多年研究统计学习理论线性分类的基础上,提出的一种设计最佳准则,其最终决策函数只有少量的支持向量决定,所以具有较好的鲁棒性,简单高效[29]。由于本研究只有酸价、过氧化值、挥发性盐基氮、菌落总数4 项指标,所以建立SVM腊肉品质检测模型可以很迅速地实现腊肉品质的准确分类。
本研究样品存在非线性不可分的情况,可以用低维空间的非线性问题转化为高维空间的线性问题,然后在这个新空间中求解最优超平面。这种非线性转化是通过定义适当的内积核函数实现的[30]。选择正确的内积核函数可以使原空间到高维空间的非线性映射计算量大大减少。
为得到新空间中的函数集合,需要选取最佳的惩罚参数c和核函数参数g。采取交叉验证(cross validation,CV)的方法,可以避免欠学习和过学习的现象。本研究在采用k-CV方法时,得到的分类结果准确率是97.5%。这种算法虽然可以找到最佳的c和g,可是因为本研究寻找最优c和g的网格范围较大,用k-CV方法会遍历网格内的所有参数点,较为费时,而且准确率还有待提高,所以采用粒子群优化算法来进行模型优化。
2.2 基于PSO算法的优化模型分类预测结果与分析
粒子群优化(PSO)算法是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。每个PSO算法的“粒子”表示的空间中可能的解,每个粒子具有由适应度函数来确定一个相应的适应值。PSO粒子群算法优化SVM分类预测参数选择结果如图5所示。
图 5 PSO粒子群算法优化SVM分类预测参数选择结果
Fig. 5 Selection of parameters for predictive classification of Chinese bacon quality by the optimized SVM model
由图5可知,得到最佳惩罚参数c和核函数参数g分别为0.707 1和1.414 2。将预测参数选择出的最佳惩罚参数c和核函数g参数带入到SVM算法函数集合式中,得到经PSO算法优化后的支持向量机分类预测模型的准确率为100%。所以,采用PSO算法寻找最佳惩罚参数c和核函数参数g,不但可以解决人工选取惩罚参数c和核函数参数g没有相关的理论依据,解决人工反复实验选取的问题,而且还可以优化已建立的支持向量机分类预测模型,提高模型的精确度和泛化能力。
2.3 优化支持向量机模型与生化方法分级预测结果对比
表1是用生化方法对腊肉进行分级预测的结果。利用优化后的SVM模型对预测集40 个样品采集的数据进行预测,结果如表2所示。
对比两表中各项数据可以看出,2 种方法所得分级预测结果基本相同,证明可以用粒子群优化支持向量机模型对腊肉等级进行准确检测。
3 结 论
本研究对腊肉品质进行分级预测的结果与使用生化方法对腊肉进行分级预测的结果基本相同,证明所建支持向量机预测模型可以对腊肉品质等级进行准确的分类检测。而且经粒子群算法优化后的支持向量机分类预测模型准确率从97.5%提高到100%,运算时间缩短5.3 s,模型的准确率和效率得到了很大提高。
本研究在国家相关食品标准的基础上,通过支持向量机对影响腊肉品质的因素进行多数据融合,建立了腊肉品质等级检测模型,并利用粒子群算法进行模型优化从而对样品腊肉品质等级进行模式识别及快速判别。本研究建立的检测模型较传统理化检验方法有如下优点:1)传统理化检验操作复杂,检验周期为15 d左右,而本研究模型在保证精度的同时可以简单迅速进行现场实时检验;2)传统理化检验是一种破坏性的检验,而本研究为无损检验。所以本研究可以为相关部门提供一种快速检测技术,保证消费者的食用安全。
参考文献:
[1] 郭昕, 张春江. 湘西腊肉品质评价指标间的相关性研究[J]. 食品工业, 2015, 36(1): 281-283.
[2] 赵杰文, 惠喆, 黄林, 等. 高光谱成像技术检测鸡肉中挥发性盐基氮含量[J]. 激光与光电子学进展, 2013, 50(7): 1-3. DOI:10.3788/LOP50.073003.
[3] 周令国, 肖琳, 祝义伟, 等. 近红外光谱技术快速检测腊肉酸价和过氧化值[J]. 肉类研究, 2012, 26(3): 30-33. DOI:10.3969/j.issn.1001-8123.2012.03.009.
[4] 陈美春, 杨勇, 石磊. 四川腊肉生产过程中理化及微生物特性的研究[J]. 食品科学, 2008, 29(5): 1002-6630.
[5] 黄伟, 杨秀娟, 张燕鸣, 等. 近红外光谱技术在肉类定性鉴别中的研究进展[J]. 肉类研究, 2014, 28(1): 31-34.
[6] 杨昆程, 郭培源, 刘硕, 等. 高光谱技术在腊肉亚硝酸盐含量检测的应用[J]. 科技通报, 2016, 32(4): 70-74. DOI:10.13774/j.cnki.kjtb.2016.04.015.
[7] 贺稚非, 薛山. 川味腊肉货架期间的品质变化[J]. 食品工业科技, 2013, 34(18): 318-321. DOI:10.13386/j.issn1002-0306.2013.18.081.
[8] 中華人民共和国卫生部, 中国国家标准化管理委员会. GB/T 5009.37—2003 食用植物油卫生标准分析方法[S]. 北京: 中国标准出版社, 2003.
[9] 中华人民共和国卫生部, 中国国家标准化管理委员会. GB 5009.44—2003 肉与肉制品 卫生标准的分析方法[S]. 北京: 中国标准出版社, 2003.
[10] 赵建华. 基于SOM神经网络的半监督分类算法[J]. 西华大学学报(自然科学版), 2015, 34(1): 36-40. DOI:10.3969/j.issn.1673-159X.2015.01.029.
[11] 王昕琨, 郭培源, 林岩. 基于多数据融合技术的腊肉品质分级方法[J]. 食品科学, 2014, 35(2): 217-221. DOI:10.7506/spkx1002-6630-201402042.
[12] RUST S R, PRICE D M, SUBBIAH J, et al. Predicting beef tenderness using near-infrared spectroscopy[J]. Journal of Animal Science, 2007, 86(1): 211-219. DOI:10.2527/jas.2007-0084.
[13] 励建荣, 王丽, 张晓敏, 等. 近红外光谱结合偏最小二乘法快速检测大黄鱼新鲜度[J]. 中国食品学报, 2013, 13(6): 209-214. DOI:10.16429/j.1009-7848.2013.06.015.
[14] 赵俊华, 郭培源, 邢素霞, 等. 基于高光谱成像的腊肉细菌总数预测建模方法研究[J]. 中国调味品, 2016, 41(2): 74-78. DOI:10.3969/j.issn.1000-9973.2016.02.015.
[15] LI Weijun, LIU Zhenyu. A method of SVM with normalization in intrusion detection[C]//Proceedings of the 2011 2nd International Conference on Challenges in Environmental Science and Computer Engineering. Haikou: Procedia Environmental Sciences, 2011: 256-262.
[16] ZHONG Jingjing, TSE P W, WANG Dong. Novel Bayesian inference on optimal parameters of support vector machines and its application to industrial survey data classification[J]. Neurocomputing, 2015, 211(26): 159-171. DOI:10.1016/j.neucom.2015.12.132.
[17] 陈烨, 刘渊. 基于参数优化SVM融合的网络异常检测[J]. 计算机应用于软件, 2013, 30(9): 39-43. DOI:10.3969/j.issn.1000-386x.2013.09.012.
[18] 王健峰, 张磊, 陈国兴, 等. 基于改进的网格搜索法的SVM参数优化[J]. 应用科技, 2012, 39(3): 28-31. DOI:10.3969/j.issn.1009-671X.201112016.
[19] 刘志康. 一种改进的混合核函数支持向量机文本分类方法[J]. 工业控制计算机, 2016, 29(6): 113-114. DOI:10.3969/j.issn.1001-182X.2016.06.050.
[20] 胡局新, 张功杰. 基于K折交叉验证的选择性集成分类算法[J]. 科技通报, 2013, 29(12): 115-117. DOI:10.3969/j.issn.1001-7119.2013.12.039.
[21] 谷文成, 柴宝仁. 基于粒子群优化算法的支持向量机研究[J]. 北京理工大学学报, 2014, 34(7): 705-709. DOI:10.15918/j.tbit1001-0645.2014.07.014.
[22] 杜军岗, 魏汝祥, 刘宝平. 基于PSO优化LS-SVM的小样本非线性协整检验与建模研究[J]. 系统工程理论与实践, 2014, 34(9): 2322-2331.
[23] CAI Zhuoran, ZHAO Honglin, YANG Zhutian, et al. A modular spectrum sensing system based on PSO-SVM[J]. Sensors, 2012, 12(11): 15292-15307. DOI:10.3390/s121115292.
[24] ALI B, HASHEMI, MEYBODI M R. A note on the learning automata based algorithms for adaptive parameter selection in PSO[J]. Applied Soft Computing Journal, 2011, 11(1): 689-705. DOI:10.1016/j.asoc.2009.12.030.
[25] 陈治明. 改进的粒子群算法及其SVM参数优化应用[J]. 计算机工程与应用, 2011, 47(10): 38-40. DOI:10.3778/j.issn.1002-8331.2011.10.011.
[26] 张庆, 刘丙杰. 基于PSO和分组训练的SVM参数快速优化方法[J]. 科学技术与工程, 2008, 8(16): 4613-4616. DOI:10.3969/j.issn.1671-1815.2008.16.045.
[27] 匡芳君, 徐蔚鴻, 张思扬. 基于改进混沌粒子群的混合核SVM参数优化及应用[J]. 计算机应用研究, 2014, 31(3): 671-687. DOI:10.3969/j.issn.1001-3695.2014.03.007.
[28] 中华人民共和国卫生部, 中国国家标准化管理委员会. GB 2726—2005 熟肉制品卫生标准[S]. 北京: 中国标准出版社: 2005.
[29] 易辉, 宋晓峰, 姜斌, 等. 柔性支持向量回归及其在故障检测中的应用[J]. 自动化学报, 2013, 39(3): 272-284. DOI:10.3724/SP.J.1004.2013.00272.
[30] 荣海娜, 张葛祥, 金炜东. 系统辨识中支持向量机核函数及其参数的研究[J]. 系统仿真学报, 2006, 18(11): 3204-3208. DOI:10.3969/j.issn.1004-731X.2006.11.050.