高光谱成像的牛肉丸掺假检测

2020-07-08 14:31孙宗保王天真李君奎邹小波梁黎明刘小裕
光谱学与光谱分析 2020年7期
关键词:牛肉丸鸡肉波长

孙宗保, 王天真, 李君奎, 邹小波, 梁黎明, 刘小裕

江苏大学食品与生物工程学院, 江苏 镇江 212013

引 言

肉丸是一种有着独特口感的肉类深加工产品, 深受人们喜爱。 相比于猪肉、 鸡肉、 鱼肉等其他原料肉, 牛肉的蛋白质含量较高、 肌纤维较粗, 因而加工特性更好, 牛肉丸也比其他肉丸更有弹性和嚼劲。 在我国, 以广东潮汕地区制作的牛肉丸最为著名。 然而, 有不法商贩受利益驱使, 在牛肉中掺入猪肉、 鸡肉等廉价肉制作肉丸冒充纯牛肉丸售卖。 这种行为不仅扰乱市场秩序, 还会引发一些宗教问题。 广东省发布地方标准中明确规定汕头牛肉丸中牛肉占原料肉的比例须大于90%[1]。 因而有必要研究快速检测牛肉丸掺假的方法。

目前, 常用的肉类产品掺假鉴别方法有蛋白质组学分析法[2]、 DNA分析法[3]、 传感器法[4]和光谱法[5-8]等。 这些检测方法各有其优缺点。 蛋白质组学分析法检测结果准确, 但所用设备价格昂贵, 重复性较差。 DNA分析法检测限低、 灵敏度高, 但操作复杂, 且同样存在重复性差的问题。 传感器法有着快速无损的优点, 然而其结果不够准确。 光谱法不仅快速无损, 且准确度高, 近年来在肉品掺假检测方面得到越来越广泛的应用。

高光谱成像技术作为光谱法的一种, 不仅具有光谱技术的常规优点, 而且较其他光谱技术有着更加全面的信息。 高光谱成像能够以数百个波长同时对样本连续成像, 同步获取样本的光谱和图像信息[9], 有着数据量丰富、 分辨率高的特点。 但同时高光谱成像也存在光谱信息重叠、 冗余的问题, 需要通过特征波长的筛选来提升模型效率和精度。 高光谱成像在无损检测肉品掺假方面已有较多的应用。 Ropodi等[6]利用高光谱成像结合PLS-DA和LDA判别模型鉴别掺有猪肉的牛肉样本, 结果表明, 两种建模方法均可以较好地区分掺假样本, 识别率分别为98.48%和96.97%。 Kamruzzaman等[7]利用高光谱成像预测牛肉中掺马肉含量, 采用不同的方法处理光谱数据并建立偏最小二乘模型(PLS), 模型预测集相关系数达到0.98。 Wu等[8]研究了高光谱预测虾中掺假物明胶含量的可行性, 使用无信息变量消除(uninformative variable elimination, UVE)和连续投影法(successive projections algorithm, SPA)的组合筛选了最佳波长, 建立的LS-SVM模型预测集相关系数达0.965, 并实现了虾中明胶含量的分布可视化。 上述研究证实了高光谱检测肉品掺假的可行性, 然而目前未见高光谱应用到牛肉丸掺假检测的报道。

根据唐穗平等[10]的调查, 猪肉和鸡肉是市场上最主要的牛肉丸掺假物。 因此, 利用高光谱成像系统采集掺有不同比例猪肉和鸡肉的牛肉丸的信息, 对光谱信息进行预处理后建立全波段偏最小二乘(partial least squares, PLS)掺假含量量预测模型, 而后采用SPA、 竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)、 联合区间偏最小二乘法(synergy interval partial least squares, siPLS)和联合区间偏最小二乘-竞争性自适应重加权(synergy interval partial least squares-competitive adaptive reweighted sampling, siPLS-CARS)筛选特征波长, 建立PLS掺假含量预测模型, 以期为牛肉丸掺假快速检测提供参考。

1 实验部分

1.1 样本制备

实验所用牛腿肉、 猪肉、 鸡腿肉、 淀粉、 调味料(食盐、 白糖、 味精、 黑胡椒粉、 料酒)均购于镇江麦德龙超市; 肉弹素、 谷氨酰胺转氨酶(TG酶)均购于河南千志商贸有限公司。

牛肉丸制作方法参照文献[11]。 肉丸制作配方: 每1 kg原料肉中加入淀粉100 g、 食盐25 g、 白糖20 g、 肉弹素5 g、 味精4 g、 黑胡椒粉5 g、 TG酶5 g、 料酒20 mL、 水200 mL。 工艺流程: 选料→清洗→沥干→绞肉→斩拌→混料→煮制→冷却→包装。 首先制作原料肉全部为牛肉的牛肉丸, 再分别制作以牛肉糜混合不同比例猪肉糜和鸡肉糜的牛肉丸, 掺假肉占原料肉质量比分别为5%, 10%, 15%, 20%和25%。 总共得到11类样本, 每类样本30个平行, 共计330个样本。

1.2 高光谱图像采集

1.2.1 高光谱成像系统

采用的高光谱成像系统如图1所示, 由江苏大学食品无损检测实验室自主研制。 系统硬件部分主要包括CCD摄像机(ImSpector V10E, Spectral Imaging Ltd, Finland)、 150 W光纤卤素灯(Fiber-Lite DC950 Illuminator, Dolan-Jenner Industries Inc, America)、 精密电控平移台(SC30021A, Zolix Instruments Ltd, China)、 电子控制箱(SC300-1A, Zolix Instruments Ltd, China)和计算机等。 软件部分主要是SpectralCube (Spectral Imaging Ltd, Finland)。

图1 高光谱成像系统

1.2.2 高光谱成像数据采集与标定

在高光谱数据采集之前先打开系统预热30 min, 以减少基线漂移带来的的影响。 设置采集参数: CCD摄像机曝光时间为45 ms, 图像分辨率618×1 628; 光谱范围为431~962 nm, 光谱波长间隔为0.858 nm; 电控平移台移动速度为1.25 m·s-1。 采集时将牛肉丸样本置于电控平移台上, 打开平移台的同时点击保存按钮采集高光谱数据, 最终得到样本的三维数据模块。

高光谱数据采集过程易受光强不均匀和暗电流等影响, 需要对获取的原始图像进行黑白板校正。 校正公式如式(1)所示。

(1)

式中,R为校正后高光谱图像;I为原始高光谱图像;B为黑板标定图像;W为白板标定图像。

1.3 数据处理方法

1.3.1 高光谱成像的光谱数据提取

利用ENVI软件打开校正后牛肉丸样本高光谱图像, 采用矩形工具选取每个样本中心附近200像素×200像素的区域作为感兴趣区域(region of interest, ROI), 计算ROI内所有像素点的光谱反射率的平均值作为此样本的光谱数据。 330个样本共得到330条平均光谱, 最终得到330×618的光谱数据集。

受环境条件和仪器运行等因素的影响, 采得的信息中包含无用信息和噪声。 为了减少散射光和噪声等影响, 需要对光谱数据进行预处理[12]。 采用的预处理方法包括一阶导数(first derivative, 1stDer)、 二阶导数(second derivative, 2ndDer)、 均值中心化(mean centering, MC)、 多元散射校正(multiplicative scatter correction, MSC)、 卷积平滑(savitzky-golay, SG)、 标准正态变量变换(standard normal variate transformation, SNVT)。 通过对比不同预处理方法所建立模型的效果, 选取最佳预处理方法进行后续数据处理。

1.3.2 光谱特征波长筛选

光谱信息数据量巨大, 且存在冗余信息。 为了提高模型的效率和精度, 对预处理后的光谱进行特征波长的筛选。 采用连续投影法(SPA)、 竞争性自适应重加权算法(CARS)、 联合区间偏最小二乘法(siPLS)和联合区间偏最小二乘-竞争性自适应重加权(siPLS-CARS)四种筛选特征波长方法。 SPA通过比较不同波长之间投影向量的大小, 以投影向量最大的波长为待选波长, 并用校正模型选择最终特征波长[13]。 SPA可以使变量之间共线性最小化, 很大程度上减少变量的个数。 CARS通过蒙特卡罗采样随机抽取校正集的一部分样本建立 PLS 模型, 计算此次采样中波长回归系数的绝对值权重, 再利用指数衰减函数(exponentially decreasing function, EDF)去除绝对值较小的波长变量点, 剩余的变量以其回归系数的绝对值作为权重采用自适应重加权采样(adaptive reweighted sampling, ARS)建立PLS模型并计算RMSECV, 当RMSECV最小时对应变量即为选择的特征波长。 siPLS先将全波段分为若干个子区间, 然后通过计算从所有可能的区间组合模型中选择出相关系数最大且RMSECV值最小的区间组合, 是一种高效的筛选特征区间方法[14]。 本研究提出的siPLS-CARS是联用siPLS和CARS进行波长筛选的一种方法, 先利用siPLS选择最佳波长区间, 再利用CARS从最佳区间中筛选特征波长。 最后对不同波长筛选方法下建立的预测模型效果进行比较。

1.3.3 掺假含量预测模型

通过建立PLS模型预测牛肉丸掺假含量。 PLS能够充分提取数据的有效信息, 解决变量共线性的问题, 在光谱数据建模中应用广泛。 PLS模型预测效果的评估指标为校正集相关系数(correlation coefficient of calibration,RC)、 预测集相关系数(correlation coefficient of prediction,RP)、 交叉验证均方根误差(root mean square error of cross validation, RMSECV)和预测均方根误差(root mean square error of prediction, RMSEP)。RC和RP越接近1, RMSECV和RMSEP越接近0时, 模型的预测效果越好。

2 结果与讨论

2.1 光谱预处理

图2(a)和图3(a)分别为掺有猪肉和鸡肉的牛肉丸样本的原始光谱图, 图2(b)和图3(b)为对应平均光谱图(均含有纯牛肉丸光谱)。 从平均光谱图中可以看出, 不同掺假含量的样本光谱曲线趋势相近, 但反射率存在差别, 掺假量越大, 反射率越大。 纯牛肉丸和掺有猪肉的样本平均光谱在710 nm处有反射峰, 这主要与O—H键的三级倍频吸收有关[15]。 掺有鸡肉样本光谱在710 nm处反射峰不如掺有猪肉样本明显, 这是由于相比于猪肉, 鸡肉与牛肉的差别更大。 从原始光谱图中可以看出, 当样本数量较大时, 光谱曲线重叠严重, 无法通过肉眼从光谱曲线上进行区分, 此时需要进行数据处理以实现掺假量预测。

图2 掺有猪肉的牛肉丸样本原始光谱(a)与平均光谱(b)

图3 掺有鸡肉的牛肉丸样本原始光谱(a)与平均光谱(b)

2.2 牛肉丸中掺假猪肉含量预测模型建立

2.2.1 全波段PLS模型

将不同预处理方法处理后的光谱以随机分组的方式把180条猪肉掺假光谱的2/3划分为校正集, 1/3划分为预测集。 用PCA优选前15个主成分, 作为模型的输入建立PLS掺假含量预测模型。 模型的预测结果如表1所示, 可以看出, 光谱经MSC预处理后建立的模型预测效果最好, 当主成分数为15时, 模型的RC和RP分别为0.951 5和0.948 1, RMSECV和RMSEP分别为0.026 9和0.026 1。

表1 基于不同预处理方法的牛肉丸中掺猪肉含量PLS模型预测结果

Table 1 Predictive results of PLS model of pork content adulterated in beef meatballs based on different pre-processing methods

预处理方法PCsRCRMSECVRPRMSEP1st Der100.946 30.028 70.930 10.029 32nd Der150.881 80.041 90.877 40.038 8MC110.936 50.031 60.928 70.028 8MSC150.951 50.026 90.948 10.026 1SG120.941 10.029 20.924 90.031 8SNVT140.948 70.026 20.944 60.030 5

2.2.2 特征波长筛选

全波段光谱数据量大且有冗余信息, 需要进行特征提取以简化模型、 提升模型效率。 分别采用SPA, CARS, si-PLS和siPLS-CARS四种方法筛选特征波长。 2.2.1已指出掺有猪肉的最佳预测模型预处理方法是MSC, 故对光谱数据进行MSC处理后进行特征波长筛选。

(1) SPA筛选特征波长

设置选择特征波长数量范围1~25, 根据均方根误差(RMSEC)选择波长, 选择结果如图4所示。 图4(a)和(b)分别表示RESE变化趋势和最终筛选的特征波长具体位置。 从图4(a)中看出, 当波长数量从1增加到13时, 均方根误差(root mean square error, RMSE)的值程阶梯状下降, 随后趋于稳定。 最终选择了13个特征波长(431.05, 442.63, 476.73, 502.69, 522.89, 555.88, 742.60, 786.19, 864.10, 878.14, 903.59, 927.31和948.39 nm), 占全波段的2.10%, 特征波长具体位置如图4(b)所示。

(2) CARS筛选特征波长

CARS筛选波长的过程如图5所示。 采样次数设置为100次, 图5(a)为变量个数随采样次数的变化趋势, 随着采样次数增加, 选择的波长数量逐渐减少, 先快减后缓慢。 图5(b)为RMSECV随采样次数变化趋势, 一开始RMSECV缓慢减小, 说明一些无关变量在采样过程中被去除。 而后RMSECV阶梯上升, 一些关键变量被去除。 图5(c)显示采样次数为44时, RMSECV最小, 此时共筛选了51个特征波长, 占全波段的8.25%。

图4 SPA筛选波长结果

图5 CARS筛选波长过程

(3) siPLS筛选波长

将预处理后的全光谱划分为10~25个子区间, 分别联合2, 3和4个子区间, 以RMSECV最小原则优选特征子区间组合。 图6显示了最优联合子区间的位置。 从图中可以看出, 当把全光谱分为14个子区间, 联合第1, 3, 7, 13子区间时, RMSECV最小。 每个子区间包含45个波长, 因此共筛选180个特征波长, 占全波段的29.13%。

(4) siPLS-CARS筛选特征波长

siPLS-CARS通过联用siPLS和CARS实现特征波长的选择。 将siPLS筛选所得波长区间作为新数据, 进行CARS波长筛选, 结果如图7所示。 从图中可以看出, 当采样次数为9时, 筛选出32个特征波长, 占全波段的5.18%。

图6 siPLS选择最佳子区间

图7 siPLS后CARS筛选波长过程

2.2.3 特征波长下PLS模型结果

不同特征波长筛选方法的PLS模型结果如表2所示。 可以看出, CARS筛选波长后建立的模型预测效果最佳, 模型的RC和RP分别为0.981 4和0.972 1, RMSECV和RMSEP分别为0.016 3和0.020 3。 SPA虽然极大地减少了特征波长数量, 但模型的预测效果不如全波段下预测效果。 siPLS筛选特征区间后模型精度没有得到提升, 这是因为所提取的变量是连续的, 相邻或者相互之间可能会存在高度相关性。 siPLS-CARS相比于siPLS不仅有效地缩减了特征波长数量, 而且提高了模型预测的精度; 相比于CARS筛选波长更少, 但精度略低。 CARS波长筛选后模型最佳, 可以说明CARS可以有效去除无关变量。 siPLS-CARS作为一种新的特征波长筛选方法需要在更多实际应用中测验其实用性。

表2 基于不同特征波长筛选方法的牛肉丸中猪肉含量的PLS模型预测结果

Table 2 Predictive results of PLS model of pork content adulterated in beef meatballs based on different characteristic wavelengths screening methods

模型特征波长筛选方法筛选波长数量RCRMSECVRPRMSEPPLSSPA130.914 50.033 60.906 20.038 6CARS510.981 40.016 30.972 10.020 3siPLS1800.943 20.027 70.906 90.037 2siPLS-CARS320.963 10.023 30.941 80.029 6

2.3 牛肉丸中掺鸡肉含量预测模型建立

2.3.1 全波段下PLS模型结果

牛肉丸中掺鸡肉全波段PLS建模方法同2.2.1, 结果如表3所示。 掺鸡肉含量预测结果总体优于掺猪肉结果, 这是因为鸡肉与牛肉差异更大。 经1stDer预处理后建立的模型预测效果最好, 当主成分数为14时, 模型的RC和RP分别为0.9861和0.9807, RMSECV和RMSEP分别为0.014 3和0.016 5。

表3 基于不同预处理方法的牛肉丸中掺假鸡肉含量PLS模型预测结果

Table 3 Predictive results of PLS model of chicken content adulterated in beef meatballs based on different pre-processing methods

预处理方法PCsRCRMSECVRPRMSEP1st Der140.986 10.014 30.980 70.016 52nd Der110.974 30.019 40.982 80.015 7MC150.982 80.015 50.976 20.019 4MSC140.976 50.019 00.986 20.013 3SG120.972 60.020 10.964 10.022 0SNVT150.984 00.014 90.975 30.020 6

2.3.2 特征波长的筛选

利用SPA筛选了15个特征波长(439.32, 448.43, 461.72, 467.55, 473.39, 493.46, 504.37, 591.63, 622.44, 695.72, 704.38, 726.08, 768.74, 922.04和952.78 nm), 占全波段的2.43%。 CARS筛选了61个特征波长, 占全波段的9.87%。 siPLS选择的最佳区间组合为: 将全光谱分为14个子区间, 联合第7, 8, 11, 12四个子区间, 共180个特征波长, 占全波段的29.13%。 siPLS-CARS筛选了28个特征波长, 占全波段的4.53%。

2.3.3 特征波长下PLS模型结果

不同特征波长筛选方法的PLS模型结果如表4所示。 与掺猪肉预测结果类似, CARS筛选波长后建立的模型预测效果最佳。 此时, 模型的RC和RP分别为0.990 2和0.987 8, RMSECV和RMSEP分别为0.012 3和0.012 6。 这表明CARS在牛肉丸高光谱掺假检测中能够较好地去除无关变量、 提升模型效率和精确度, 可结合PLS模型用于实际检测。 不同波长筛选方法对牛肉丸中掺鸡肉含量预测趋势上与掺含量猪肉基本相同。

表4 不同特征波长筛选方法的牛肉丸中鸡肉含量的PLS模型预测结果

Table 4 Predictive results of PLS model of chicken content adulterated in beef meatballs based on different characteristic wavelengths screening methods

模型特征波长筛选方法筛选波长数量RCRMSECVRPRMSEPPLSSPA150.945 60.027 80.937 30.030 0CARS610.990 20.012 30.987 80.012 6siPLS1800.980 90.015 20.969 60.021 8siPLS-CARS280.982 30.016 00.972 30.020 3

3 结 论

利用高光谱成像进行牛肉丸掺猪肉和鸡肉检测研究。 首先采用不同预处理方法建立全波段下PLS模型并比较得出最佳预处理方法, 然后用不同方法筛选特征波长建立PLS模型。 结果表明: (1)在1stDer, 2ndDer, MC, MSC, SG和SNVT预处理方法中, 牛肉丸掺猪肉和鸡肉PLS预测模型最佳预处理方法分别为MSC和1stDer。 (2)在SPA, CARS, siPLS和siPLS-CARS四种特征波长筛选方法中, 牛肉丸掺猪肉和鸡肉PLS预测模型最佳方法均为CARS, 分别筛选了51和61个特征波长。 此时, 掺猪肉PLS预测模型RC和RP分别为0.981 4和0.972 1, RMSECV和RMSEP分别为0.016 3和0.020 3。 掺鸡肉PLS预测模型RC和RP分别为0.990 2和0.987 8, RMSECV和RMSEP分别为0.012 3和0.012 6。 掺鸡肉预测模型效果整体好于掺猪肉。 研究表明采用高光谱成像技术可以实现牛肉丸掺猪肉和鸡肉含量预测, 可为快速无损检测牛肉丸掺假提供理论基础。

猜你喜欢
牛肉丸鸡肉波长
汕头牛肉丸
厨房料理小妙招
潮汕美食牛肉丸
下半年鸡肉市场看好
天热了,吃点鸡肉吧
不吃鸡肉
基于频域分析方法的轨道高低不平顺敏感波长的研究
日本研发出可完全覆盖可见光波长的LED光源
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
我爱牛肉丸