基于主成分分析法提取高光谱图像特征检测香肠亚硝酸盐含量

2017-01-12 17:24陈晓东
肉类研究 2016年12期
关键词:亚硝酸盐遗传算法

摘 要:针对香肠中硝酸盐含量,提出基于高光谱的无损快速检测。采集400~1 000 nm范围内45 组香肠样品高光谱数据,进行主成分分析(principal component analysis,PCA),择优选取主成分图像3(principal component 3,PC3)作为研究对象,并得到4 个特征波长,分别为402.47、483.04、642.27、961.82 nm。通过特征波长与波谱对比,最终采用800~950 nm范围内的波长进行亚硝酸盐定量分析建模。结合样品感兴趣区域平均光谱和理化检验结果,采用偏最小二乘回归和遗传算法优化的人工神经网络进行定量分析建模。结果显示:偏最小二乘回归模型的决定系数R2为0.899,交互验证均方根误差(root mean square error of cross-validation,RMSECV)为0.291,遗传算法优化的神经网络模型的决定系数R2为0.918,RMSECV为0.365,随着样品数增多,神经网络的建模效果会越来越优于偏最小二乘回归建模。

关键词:亚硝酸盐;高光谱技术;偏最小二乘法;遗传算法;人工神经网络算法

Abstract: This paper proposes a rapid and nondestructive method based on hyperspectral imaging system to detect the nitrite content in sausages. Firstly, the hyperspectral data in the wavelength range of 400–1 000 nm of 45 sausage samples were obtained and analyzed by principal component analysis. The third principal component (PC3) was selected for investigation, and four characteristic wavelengths were obtained, i.e. 402.47, 483.04, 642.27 and 961.82 nm. Furthermore, by combing the characteristic wavelengths and spectra, the data in the wavelength range of 800–950 nm were definitively chosen to build the models for quantitative analysis of nitrite in sausages based on the average spectra obtained from the region of interest (ROI) and chemical measurements using partial least squares regression (PLSR) and genetic algorithm (GA)-optimized back propagation neural network (BPNN). Results showed that the determination coefficient (R2) and root mean square error of cross-validation (RMSECV) of the PLSR model were 0.899 and 0.291, respectively, whereas those of the BPNN model were 0.918 and 0.365, respectively. As the number of samples increased, the BPNN model was increasingly superior to the PLSR model.

Key words: nitrite; hyperspectal imaging system; partial least squares (PLS); genetic algorithm (GA); neural network

DOI:10.15922/j.cnki.rlyj.2016.12.005

中图分类号:TS201.6 文献标志码:A 文章编号:1001-8123(2016)12-0022-06

引文格式:

陈晓东, 郭培源. 基于主成分分析法提取高光谱图像特征检测香肠亚硝酸盐含量[J]. 肉类研究, 2016, 30(12): 22-27. DOI:10.15922/j.cnki.rlyj.2016.12.005. http://rlyj.cbpt.cnki.net

CHEN Xiaodong, GUO Peiyuan. Detection of nitrite in sausages based on feature extraction of hyperspectral images using principal component analysis[J]. Meat Research, 2016, 30(12): 22-27. (in Chinese with English abstract) DOI:10.15922/j.cnki.rlyj.2016.12.005. http://rlyj.cbpt.cnki.net

香肠在我国有着悠久的历史,在生产以及贮存过程中,香肠难免会出现质量问题,人们食用此类香肠会引发健康问题。亚硝酸盐作为肉制品护色剂,适量使用可以增加肉的风味和起到防腐剂作用[1]。但是如果含量超标,成人食用0.3~0.5 g即可引起中毒,3 g可导致死亡,因此国家对肉类中的亚硝酸盐含量严格限制在

0.03 g/kg。目前检测方法主要是通过理化方法进行,这种检测方法虽然检测精确度高,但是检测周期长,检测流程繁琐,对检测环境要求高,不利于大众检测。

高光谱检测技术结合了图像技术和光谱技术,有快速、图谱合一、无损等特点[2-4]。高光谱检测可使用400~1 000 nm的波段。国内外研究者Haff[5]、Polder[6]、张雷蕾[7]、Barbin[8]、陈全胜[9]等分别已利用高光谱技术对芒果果蝇侵染程度、西红柿品质、水果品质、猪肉新鲜度、鲜肉颜色、猪肉嫩度等进行过研究,都达到了预期检测效果。基于以上研究,本实验提出基于高光谱及主成分特征与香肠亚硝酸盐含量的相关性研究,拟构建一种对香肠亚硝酸含量的快速检测方法。

1 材料与方法

1.1 材料与试剂

本次实验样品购于北京家乐福超市。样品为保质期6 个月的不同生产日期的广味香肠,共45 根,其中距离生产日期1 个月内的25 根,距离生产日期3 个月以内的10 根,接近过期的10 根。对样品进行拆封并置于保鲜袋中,之后放于冰箱中保存等待检测。

1.2 仪器与设备

高光谱成像系统主要由光谱仪、电荷耦合器件(charge coupled device,CCD)相机、传送装置、PC计算机、暗箱等几部分组成。为了保证光谱采集环境的稳定性,整个采集过程在暗箱中进行。高光谱图像是一个三维的数据矩阵(x,y,l),其中(x,y)代表两维的空间维度,l代表一维的光谱维度[10],检测原理是香肠所含不同品质对应不同化学组成和物理特性,体现在高光谱某一特征峰可以表示亚硝酸盐的物质属性及含量,从而可以通过分析光谱信息实现香肠中亚硝酸盐的定性或定量检测[11]。

1.3 方法

1.3.1 高光谱数据采集

将样品从保鲜袋中取出置于水平移动台上,依次对45 个样品进行高光谱数据采集,采集时要保持采集环境的稳定,光谱采集范围是400~1 000 nm,采样分辨率为5 nm,传送速率为100 mm/s,总共得到128 个波段。

采集过程中考虑到外界环境影响及光源因素,需要对光谱进行黑白校正[12]。即扫描标准白板得到全白图像W,关闭相机快门得到全黑图像B,利用R=(I-B)/(W-B)

进行黑白校正,其中I为原始图像,R为校正后的图像。考虑底板对整个光谱分析的影响,采用感兴趣区域(region of interest,ROI)工具对原始光谱图像进行剪切。

1.3.2 主成分分析

主成分分析可以达到去除波段冗余信息、数据降维目的[13]。每个主成分图像都是由原波段线性组合,根据各波段权系数即可得到相应的主成分图像(principal component image,PCI)的特征波长,按式(1)计算。

1.3.5 偏最小二乘法建模

偏最小二乘回归(partial least squares regression,PLS)是对一般最小二乘回归(ordinary least squares regression,OLS)的扩展,它集主成分分析与多因变量多自变量回归建模于一体,一次计算后可实现预测建模和简化多变量系统[16]。PLS建立自变量的潜变量关于因变量的潜变量的线性回归建模,间接反映自变量与因变量的关系,自变量与因变量分别按式(3)、(4)计算。

PLS分别应用X和Y的潜变量,采取迭代方法,每一次迭代调整ta、ua使之到最后残差矩阵中的元素绝对值近似为0。

1.3.6 遗传算法(genetic algorithm,GA)优化的人工神经网络建模

BP(back propagation)神经网络是一种按误差反向传播的多层前馈网络。通过梯度下降法学习规则,通过反向传播不断调整网络的权值和阈值使网络达到最优[17-22]。本次实验中神经网络建模使用35 组样品作为训练集,10 组样品作为验证集。

GA通过模拟进化论自然选择和生物遗传机理,运用交叉、变异等方法来寻找种群中的最优解。本实验中使用遗传算法来优化神经网络中的权值和阈值,寻找最优解并输送到神经网络中进行样本预测。

2 结果与分析

2.1 光谱图谱信息

对45 个香肠样品图像进行主成分分析,根据方差累计贡献率排列,取前4 幅图像进行研究,如图4所示。

根据主成分分析特点,选择各波段权重系数最大的几个波段作为特征波长进行香肠亚硝酸盐含量研究。通过主成分分析得到以下4 个特征波长,分别为band7、band23、band54、band114,对应的波长分别为402.47、483.04、642.27、961.82 nm。

2.3 样品感兴趣区域光谱的提取

ROI工具可以从原图像中提取所要研究亚硝酸盐对象的区域[23],分别对45 组样品提取如下感兴趣区域,其中

1组样品选取的感兴趣区域如图5所示。

2.4 理化实验结果

检测样品分为3 类,即距离生产日期1个月内的25 组,距离生产日期3 个月以内的10 组,接近过期的10 组。经过理化实验,测得45 组样品亚硝酸盐含量信息如表1所示。

由表1可知,理化实验测得样本亚硝酸盐含量最小为1.40 mg/kg,为距离生产日期最近的一组样品,最大是3.93 mg/kg,为接近过期的一组样品;理化实验标准偏差为91.87%。实验结果表明,随着放置时间的增长,香肠中亚硝酸盐含量也随着增加。

2.5 图谱对比

由图7可知,含有亚硝酸盐样品在900 nm附近有明显的吸收峰(实线谱线Y),而未检出亚硝酸盐的样品(<1 mg/kg)则没有(虚线谱线N)。实验表明,900 nm附近的吸收峰可能是由香肠中亚硝酸盐引起的。由光谱曲线可以看出低波段(400~450 nm)和高波段(950~1 000 nm)附近的噪音特别大,不利于样品定量分析,600~800 nm的光谱曲线无明显吸收,对定量分析的结果也不够精确,因此,结合特征波长和波谱对比结果,选用800~950 nm这一波段作为特征波段,以此来对香肠中亚硝酸盐含量进行定量分析[24]。

2.6 光谱预处理

图8和图9分别为预处理前的光谱以及经过一阶导数+矢量归一化预处理后的光谱。

2.7 偏最小二乘建模分析

偏最小二乘建模过程中使用35 组样品作为校正集进行建模,10 组样本作为验证集进行检验模型的准确性,最终得到亚硝酸盐预测模型交叉检验如图10所示。

2.8 人工神经网络建模分析

通过主成分分析以及波谱图比较得到150 nm长度的定量分析波长范围,系统采样分辨率为5 nm,因此可以得到30 个长波的反射率数据,由此设计BP神经网络,输入节点为30 个,隐藏节点5 个,输出节点1 个。30 个输入节点分别对应30 个波长的反射率,输出为亚硝酸盐含量值。网络结构如图11所示。

权值根据选择概率进行交叉、变异,阈值优化方法与权值方法相同,最后得到的阈值权值送入网络中使用。得到回归分析图如图12所示。训练数据、验证数据、检验数据以及所有数据的回归性能和复相关系数r,其中总体数据的复相关系数r为0.958,决定系数

R2为0.918。

根据式(5)可算得RMSECV为0.365。

2.9 样本预测

使用2 种模型分别对验证集的10 组样本进行预测分析结果如表2所示。

由表2可知,虽然在输入样本为35 组的时候,在预测结果上PLS所建模型要略优于GA-BP网络所建立模型,但是在输入样本为45 组时,GA-BA所建模型预测效果显著提升,且明显优于PLS所建模型。2 种模型所预测的结果皆在可以接受的范围内,证明高光谱可以满足检测香肠中亚硝酸盐含量的需求。

3 结 论

本实验通过对香肠的高光谱图像及光谱数据采集,对45 组样品图像进行了主成分分析,根据方差累计贡献率排列,按照波段权重系数提取特征波长,分别采用偏最小二乘回归建模及遗传算法优化的神经网络建模,实验结果表明,在多样本的情况下,神经网络的建模效果明显优于偏最小二乘回归建模。随着训练样本数的增多,其效果更加明显,基于高光谱及主成分特征提取的香肠亚硝酸盐含量检测方法是可行的。

参考文献:

[1] 赵静, 王娜, 冯叙桥, 等. 蔬菜中硝酸盐和亚硝酸盐检测方法的研究进展[J]. 食品科学, 2014, 35(8): 42-49. DOI:10.7506/spkx1002-6630-201408008.

[2] 彭彦昆, 张雷蕾. 农畜产品品质安全高光谱无损检测技术进展和趋势[J]. 农业机械学报, 2013, 44(4): 137-145. DOI:10.6041/j.issn.1000-1298.2013.04.025.

[3] 张令标, 何建国, 王松磊, 等. 高光谱成像技术在肉品无损检测中的应用及进展[J]. 河南工业大学学报(自然科学), 2014, 35(1): 100-105.

[4] 李江波, 饶秀勤, 应义斌. 农产品外部品质无损检测中高光谱成像技术的应用研究进展[J]. 光谱学与光谱分析, 2011, 31(8): 2021-2026. DOI:10.3969/j.issn.1673-1328.2014.27.031.

[5] HAFF R P, SARANWONG S, THANPASE W, et al. Automatic image analysis and spot classification for detection of fruit fly infestation in hyperspectral images of mangoes[J]. Postharvest Biology and Technology, 2013, 86(8): 23-28.

[6] POLDER G, van der HEIJDEN G W A M, YOUNG I T. Spectral image analysis for measuring ripeness of tomatoes[J]. Transactions of the Asae Online, 2002, 45(4): 1155-1161.

[7] 张雷蕾, 李永玉, 彭彦昆, 等. 基于高光谱成像技术的猪肉新鲜度评价[J]. 农业工程学报, 2012, 28(7): 254-259. DOI:10.3969/j.issn.1002-6819.2012.07.042.

[8] BARBIN D F, SUN D W, SU C. NIR hyperspectral imaging as non-destructive evaluation tool for the recognition of fresh and frozen-thawed porcine longissimus dorsi muscles[J]. Innovative Food Science and Emerging Technologies, 2013, 18(18): 226-236.

[9] 陈全胜, 张燕华, 万新民, 等. 基于高光谱成像技术的猪肉嫩度检测研究[J]. 光学学报, 2010(9): 2602-2607

[10] 马骥, 曲佳欢, 孙大文, 等. 高光谱成像在食品质量评估方面的研究进展与应用(二)[J]. 肉类研究, 2012, 26(4): 42-48.

[11] 洪添胜, 乔军, WANG Ning, 等. 基于高光谱图像技术的雪花梨品质无损检测[J]. 农业工程学报, 2007, 23(2): 151-155. DOI:10.3321/j.issn:1002-6819.2007.02.030.

[12] SHETTY N, GISLUM R. Quantification of fructan concentration in grasses using NIR spectroscopy and PLSR[J]. Field Crops Research, 2011, 120(120): 31-37.

[13] 张凯华, 臧明伍, 王守伟, 等. 基于光谱技术的畜禽肉新鲜度评价方法研究进展[J]. 肉类研究, 2016, 30(1): 30-35. DOI:10.15922/j.cnki.rlyj.2016.01.007.

[14] 中华人民共和国卫生部. GB 5009.33—2010 食品安全国家标准食品中亚硝酸盐和硝酸盐的测定[S]. 北京: 中国标准出版社, 2010: 149-153.

[15] 叶莺, 陈崇帼, 林熙. 偏最小二乘回归的原理及应用[J]. 海峡预防医学杂志, 2005, 11(3): 3-6. DOI:10.3969/j.issn.1007-2705.2005.03.002.

[16] 刘硕, 郭培源, 杨昆程, 等. 基于高光谱图像技术的腊肠酸价含量检测[J]. 食品工业科技, 2016, 37(5): 287-291; 297.

[17] 刘欢, 姜峰, 于国强, 等. 遗传-神经网络方法在炸药撞击感度预测中的应用研究[J]. 火工品, 2010(6): 42-45. DOI:10.3969/j.issn.1003-1480.2010.06.012.

[18] 王立国, 魏芳洁. 结合遗传算法和蚁群算法的高光谱图像波段选择[J]. 中国图象图形学报, 2013, 18(2): 235-242. DOI:10.11834/jig.20130216.

[19] WANG W, LI C, TOLLNER E W, et al. Shortwave infrared hyperspectral imaging for detecting sour skin (Burkholderia cepacia): infected onions[J]. International Journal of Food Engineering, 2012, 109(1): 38-48.

[20] 陈学杰, 吕柏权, 武冬冬. 基于神经网络模型参考自适应的智能控制优化算法[J]. 工业控制计算机, 2015(1): 49-50. DOI:10.3969/j.issn.1001-182X.2015.01.022.

[21] 马永杰, 云文霞. 遗传算法研究进展[J]. 计算机应用研究, 2012, 29(4): 1201-1206. DOI:10.3969/j.issn.1001-3695.2012.04.001.

[22] 汤素丽, 罗宇锋. 人工神经网络技术的发展与应用[J]. 电脑开发与应用, 2009, 22(10): 59-61. DOI:10.3969/j.issn.1003-5850.2009.10.025.

[23] 田有文, 王晓娟. 基于高光谱图像技术的农产品品质无损检

测[J]. 农机化研究, 2009, 31(10): 220-222. DOI:10.3969/j.issn.1003-188X.2009.10.063.

[24] 黄文倩, 陈立平, 李江波, 等. 基于高光谱成像的苹果轻微损伤检测有效波长选取[J]. 农业工程学报, 2013, 29(1): 272-277.

[25] 孙俊, 金夏明, 毛罕平, 等. 基于高光谱图像光谱与纹理信息的生菜氮素含量检测[J]. 农业工程学报, 2014, 30(10): 167-173. DOI:10.3969/j.issn.1002-6819.2014.10.021.

猜你喜欢
亚硝酸盐遗传算法
羊亚硝酸盐中毒的病因、临床表现、诊断与防治措施
高位池亚硝酸盐防控
遗传算法对CMAC与PID并行励磁控制的优化
冬棚养殖需警惕亚硝酸盐超标!一文为你讲解亚硝酸盐过高的危害及处理方法
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
协同进化在遗传算法中的应用研究
家畜硝酸盐和亚硝酸盐中毒的诊断、鉴别和防治
基于改进的遗传算法的模糊聚类算法