孙宗保,王天真,邹小波,*,刘 源,梁黎明,李君奎,刘小裕
(1.江苏大学食品与生物工程学院,江苏 镇江 212013;2.镇江市食品药品监督检验中心,江苏 镇江 212000)
调理牛排是以牛排为原材料,加入适量调味料和食品添加剂,经过切分、滚揉腌制和包装等加工过程,食用前只需简单热处理的一种非即食肉制品。因其滋味鲜美、营养丰富、食用方便等特点深受消费者喜爱[1]。根据原料的完整性,调理牛排可以分为原切调理牛排和合成调理牛排。合成调理牛排是以碎牛肉为原料,额外添加酪蛋白酸钠、谷氨酰胺转氨酶(transglutaminase,TG)或卡拉胶等黏合剂,拼接而成的整块牛排。在添加黏合剂适量和正确标识的情况下,合成调理牛排是合法的,且可以提高碎肉的利用率。而原切调理牛排口感滋味更好、营养成分更多、更受消费者欢迎,价格也相对较高[2]。一些不法商贩为了谋取利益,将合成调理牛排充当原切售卖,这不仅损害了消费者利益,还可能带来食品安全问题。原切牛排内部菌落总数不高,食用前不必加热至全熟,而合成牛排内部容易滋生细菌,需要烹饪至全熟杀灭细菌才可以安全食用。错误的标识会导致消费者在食用合成牛排时未加热全熟,引发健康问题。所以有必要采用快速无损的方法对原切与合成调理牛排进行鉴别。目前对调理牛排的研究主要为工艺优化[3]和常规品质检测[4],鲜见原切与合成调理牛排的鉴别研究。
当超声波传经声阻抗不同的相邻介质的界面时,会发生反射和折射。超声成像技术通过收集并处理反射回波,将回波强度转化为该位置像素点的灰度值,在计算机上形成图像,通过超声图像可以对物质内部结构做出评价。超声成像技术因其快速无损、灵敏度高等优点已广泛运用于工业检测[5-6]和医疗诊断[7-8]等领域,而近期有研究将超声成像技术应用于食品品质检测。邹小波等[9]采集不同等级火腿肠的超声图像,提取图像特征值后建立判别模型,实现火腿肠等级的快速判别。孙宗保等[10]利用超声成像技术对冷鲜与解冻牛肉进行鉴别,并通过质构、微观结构和理化指标等信息对冷鲜与解冻牛肉的超声图像差异进行解释。研究利用图像纹理特征值建立的鉴别模型取得较好的分类效果。这些研究结果表明,超声成像技术在肉品品质检测方面有着良好的应用前景。
高光谱成像技术能够以数百个波长同时对样本连续成像,同步获取样本的光谱信息和图像信息,最终得到由不同波长下的二维图像构成的三维数据块[11]。三维数据块包含了图像上每个像素点对应的光谱数据,从另一个角度看,也包含了每个波长下的样本图像信息。高光谱成像技术在肉品品质检测方面已得到了广泛应用[12-14]。Kamruzzaman等[15]利用高光谱成像技术检测红肉中的持水量,通过回归系数筛选特征波长后建立最小二乘支持向量机模型,模型的预测精度达到93%。谢安国等[16]利用高光谱成像技术构建了调理牛肉在煎制过程中的品质可视化模型,预测调理牛肉的水分和剪切力相关系数分别为0.908和0.763,研究表明高光谱成像技术具备检测混有调料的复杂肉品的能力。
原切与合成调理牛排主要的区别特征是质构,超声成像技术对质构差异具有敏感性[9],因此可以通过超声图像对其进行区分。对于高光谱成像技术,因为原切与合成调理牛排的表面纹理存在差异,而化学成分上相似,且纹理特征变量数量远少于光谱变量,因此采用高光谱数据中的图像信息对原切与合成调理牛排进行鉴别。研究最后将2 种技术所采集的图像纹理信息进行融合建模,并采用不同变量选择方法优化鉴别模型,以期为高光谱和超声成像技术在调理牛排品质鉴别中的应用提供参考。
牛排原料和辅料均购于镇江麦德龙超市。
碳酸氢钠、复合磷酸盐(三聚磷酸钠和六偏磷酸钠)、TG、酪蛋白酸钠和卡拉胶(均为食品级)河南千志商贸有限公司。
图1 超声成像系统Fig. 1 Schematic illustration of the ultrasonic imaging system
如图1所示,超声成像系统由食品无损检测实验室自主研发。系统硬件部分主要包括UTEX 320型超声信号发射/接收器(加拿大UTEX公司),直径10 mm、焦距25.4 mm的20 MHz点聚焦型超声波换能器(日本奥林巴斯公司),高速A/D数据采集卡(美国Agilent公司),三轴精密直线电机扫描机构(广东创锋精工机械有限公司),计算机,样品槽等。
图2 高光谱成像系统Fig. 2 Schematic illustration of the hyperspectral imaging system
如图2所示,系统硬件主要包括CCD摄像机(ImSpector V10E,芬兰SPECIM公司)、Fiber-Lite DC950 Illuminator 150 W光纤卤素灯(美国Dolan-Jenner公司)、SC30021A三轴精密电控平移台(北京卓立汉光仪器有限公司)和计算机等部件构成。软件部分主要是Spectral Cube(芬兰SPECIM公司)。
1.3.1 样本制备
原切调理牛排制作工艺流程:原料肉修整→切片→配制腌制液→滚揉腌制→密封包装。操作要点:原料肉修整时,先剔除肉眼可见的筋膜和血块,然后将肉切成12 mm左右的块状。每1 kg原料肉对应称取15 g食盐、5 g白砂糖、20 g香辛料、3 g碳酸氢钠、3 g复合磷酸盐和150 mL水,混合搅拌溶解后作为腌制液。将切块后的原料肉和腌制液放入真空滚揉机中滚揉1 h。最后将牛排放入托盘中进行密封包装。
合成调理牛排制作工艺流程:原料肉修整后绞碎→配制腌制液和复配黏合剂→滚揉腌制→冷冻后切片→密封包装。其中复配黏合剂为0.3% TG、0.85%酪蛋白酸钠和0.3%卡拉胶,添加量参照马娅俊[17]的方法。操作要点:原料肉修整后绞碎处理,加入腌制液滚揉1 h,然后灌装至肠衣模具中并排净空气,在冰箱冷藏2 h黏合后,冷冻10 h。取出后用锯骨机切片,厚度为12 mm,最后进行托盘包装冷藏解冻。原切和合成调理牛排各制作60 个样本,编号后依次进行高光谱和超声图像采集。
1.3.2 超声成像数据采集
超声图像采集参数:脉冲电压250 V;脉冲宽度25 ns;脉冲重复频率800 Hz;增益40 dB;分辨率0.1 mm;扫描速率5 mm/s。
1.3.3 高光谱成像数据采集
在采集前先打开系统预热30 min,减少基线漂移的影响。通过光谱采集软件Spectral Cube设置采集参数:CCD摄像机曝光时间为45 ms,图像分辨率1 628×1 235;光谱范围为431~962 nm,采样间隔为0.858 nm。设置步进电机运动参数:电控平移台移动速率为0.9 mm/s,快进位移量为180 mm。采集时将样本置于电控平移台上,打开平移台装置的同时点击保存按钮采集高光谱图像数据,扫描得到样本的三维数据模块。高光谱数据采集过程易受光强不均匀和暗电流等影响,导致数据中含有噪声,因此对获取的原始图像进行黑白板校正。
1.4.1 纹理特征值提取
纹理一般是指图像灰度在分布上的重复或变化。灰度共生矩阵(gray-level co-occurrence matrix,GLCM)法[18]是一种最为经典且广泛应用的基于统计规律的纹理特征提取方法。从0°、45°、90°、135°四个方向上计算GLCM,提取各方向下的角二阶矩、对比度、相关性和逆差矩,并计算图像的熵、各向异性、平均灰度值和方差,得到共计20 个纹理特征变量。
1.4.2 模式识别方法
鉴别模型可以分为线性和非线性分类算法,本实验采用线性分类方法中的线性判别分析(linear discriminant analysis,LDA)和K最邻近(K-nearest neighbor,KNN),非线性分类算法中的反向传播人工神经网络(back propagation artificial neural network,BP-ANN)和极限学习机(extreme learning machine,ELM)4 种鉴别模型。
LDA是利用投影映射将数据变换至最佳矢量空间,并保证在新的空间内类间的距离尽量大、类内的距离尽量小[19]。KNN是数据挖掘技术中的一种有监督的学习模式识别方法,其根据距离公式计算出最接近测试样本的K个已知样本,然后将测试样本判定为这K个样本中出现次数最多的类别[20]。BP-ANN是应用较多的一种按误差逆传播算法训练的多层前馈神经网络,其模拟人脑构建多个交叉联系的数据单元形成神经元结构,不断迭代正向和反向传播过程,直至误差小于设定阈值或者到达迭代次数。ELM是一种新型的单隐层前馈神经网络,训练时仅需设置网络隐含节点的个数,克服了传统神经网络训练参数繁多、迭代过程复杂、容易陷入局部最小的问题,具有泛化性能好、学习速率快等优点[21-22]。
1.4.3 变量选择方法
采用连续投影法(successive projections algorithm,SPA)、竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、变量组合集群分析(variables combination population analysis,VCPA)法3 种变量选择方法。
SPA是一种前向式的变量选择方法,可以使变量之间共线性最小化,很大程度上减少变量的个数[23]。SPA任意选中一个变量作为起点,计算其在剩余变量上的投影值,将投影值最大的变量加入这个组合中。迭代这一步骤,最终获得最低限度冗余信息的变量组合[24-25]。
CARS通过蒙特卡罗采样随机抽取校正集的一部分样本建立偏最小二乘回归(partial least square,PLS)模型,计算此次采样中变量回归系数的绝对值权重,再利用指数衰减函数(exponentially decreasing function,EDF)去除绝对值较小的变量点,剩余的变量以其回归系数的绝对值作为权重采用自适应重加权采样(adaptive reweighted sampling,ARS)建立PLS模型并计算交叉验证均方根误差(root mean square error of cross validation,RMSECV),当RMSECV最小时对应变量即为选择的光谱数据特征变量[26-27]。
VCPA首先利用二进制矩阵采样(binary matrix sampling,BMS)法从样本变量空间中采样K组变量子集,对获得的K组变量子集建立PLS模型计算RMSECV,保留RMSECV最低的σ×K组变量子集。再统计这些变量子集中每个变量出现的概率,利用EDF删除频率较小的变量。将剩余变量进行上述过程的迭代,最后计算出剩余变量间所有可能组合的RMSECV,选择RMSECV最小的变量组合作为最终建模数据[28-29]。
图3 原切与合成调理牛排超声图像Fig. 3 Ultrasound images of raw and restructured beef steak
从图3可以看出,原切调理牛排图像整体反射回波强度较大,图像内部的均一性较差,部分区域的回波强度与相邻区域差异明显;而合成调理牛排图像整体反射回波强度较小,部分区域超声信号微弱,图像整体均一性较好。根据超声成像的原理,当超声波传经声阻抗不同的相邻介质的界面时发生反射,计算机根据该像素点的反射回波大小赋予对应灰度值,从而形成图像。所以反射回波的强度反映了试样内部质构变化的程度,回波强度越大则表明介质内部质构变化程度越大。合成调理牛排中添加了复配黏合剂:TG、酪蛋白酸钠和卡拉胶。TG通过催化转酰胺基反应,使蛋白质分子之间共价交联形成凝胶,形成的稳定共价键在一般食品加工过程中不会断裂[30-31]。酪蛋白酸钠和卡拉胶可以提升肉制品的凝胶特性、黏稠度和持水能力等[32]。这些黏合剂通过提取蛋白质基质黏合,改变了碎肉原先的纹理结构,使肉块组织趋于均匀、合理的分布,因此内部质构差异较小,反射回波强度也较小。而原切调理牛排样本中存在未剔净的血管和筋膜,且生物组织有多样性的特点,所以反射回波强度较大、超声图像均一性较差。
利用GLCM提取原切与合成调理牛排超声图像的20 个纹理特征值,通过主成分分析(principal component analysis,PCA)对纹理特征值进行处理后作为输入变量,分别建立LDA、KNN、BP-ANN和ELM鉴别模型,结果如表1所示。ELM模型鉴别准确率最高,校正集识别率为95.00%,预测集识别率为90.00%;非线性模型鉴别效果优于线性模型,这是因为原切合成判定与其纹理特征值并非简单的线性相关,非线性模型在处理繁琐问题上更具优势。
表1 基于超声图像的不同鉴别模型的识别率Table 1 Recognition rates for calibration and prediction sets of different models based on ultrasound images
采集的高光谱数据中包含618 个波长下的灰度图像,为了简化运算、减少建模变量,利用PCA对高光谱原始图像进行降维处理,前3 个PC图像累计贡献率超过98%,可以有效代表样本的原始信息(图4)。
图4 前3 个PC图像Fig. 4 First three principal component images
利用GLCM提取每个图像的纹理特征值,前3 个PC图像共得到60 个纹理变量。对所有样本高光谱图像进行处理后,得到120×60的变量矩阵,经PCA处理后建立鉴别模型,结果如表2所示。各模型识别率整体高于基于超声图像的识别率,其中KNN和ELM模型的鉴别效果较好,校正集识别率都为97.50%,只有2 个样本误判,而KNN的预测集识别率更高,为95.00%。
表2 基于高光谱图像的不同鉴别模型的识别率Table 2 Recognition rates for calibration and prediction sets of different models based on hyperspectral images %
2.3.1 基于超声和高光谱图像融合的不同鉴别模型的识别结果
表3 基于超声和高光谱图像融合的不同鉴别模型的识别率Table 3 Recognition rates for calibration and prediction sets of different models based on data fusion between ultrasound and hyperspectral images %
上述结果表明,超声成像和高光谱成像技术都能够快速无损地鉴别原切和合成调理牛排,取得了较好的效果,但它们的鉴别原理不同,为了获取更加准确的模型,将超声图像和高光谱图像技术进行融合建模。将超声图像和高光谱图像的20 个和60 个纹理变量融合,获得80 个纹理变量建模,模型结果如表3所示。可以看出,数据融合后各个模型的识别率均有不同程度的上升,其中,最佳模型ELM的校正集识别率达到100.00%,预测集识别率为97.50%,只有一个样本识别错误。超声成像技术主要是对样本内部质构情况的考量,而高光谱图像主要是获取样本的表面纹理信息,将它们的数据融合,可以实现优势互补,获取样本的内外全面信息,结合模式识别方法可以作出更加准确的判定。各个模型识别率的上升表明数据融合取得较好的效果。
2.3.2 基于SPA的特征变量选择
考虑到融合后的模型纹理变量较多,采用变量选择方法对特征变量进行筛选。利用SPA选择特征变量时,设置选择特征变量数量范围1~25,根据均方根误差(root mean square error,RMSE)选择变量,选择过程如图5所示。从图5可以看出,随着变量数量的增加,RMSE值先快速下降,而后缓慢下降,最终选择了7 个特征变量。
图5 SPA选择特征变量过程Fig. 5 Selection of feature variables by SPA
2.3.3 基于CARS的特征变量选择
图6 CARS选择特征变量过程Fig. 6 Selection of feature variables by CARS
如图6所示,采样次数设置为100 次,随着采样次数增加,选择的变量个数逐渐减少,减少速度先快后慢(图6a)。开始RMSECV缓慢减小,说明一些无关变量在采样过程中被去除。而后RMSECV阶梯上升,一些关键变量被去除(图6b)。如图6c所示,星号标记的位置RMSECV最小,此时采样次数为14,对应选择15 个特征变量。
2.3.4 基于VCPA的特征变量选择
VCPA运行参数设置如下:K个变量子集中最佳子集占比0.1,BMS运行的次数设为1 000,EDF运行的次数设为50,剩余变量数目设为14。如图7所示,随着EDF的重复运行,特征空间缩小,RMSECV整体呈下降趋势,相关性较小的变量特征被删除,剩下的变量被添加到最佳子集中。EDF运行结束后,计算选择的14 个变量所有可能组合的RMSECV,并选取RMSECV最小的组合,最终选择了12 个特征变量。
图7 RMSECV随EDF运行次数变化趋势Fig. 7 Changes in RMSECV with the number of EDF runs
2.3.5 不同变量选择方法下ELM模型的识别结果
表4 不同变量选择方法下ELM模型的识别率Table 4 Recognition rates for calibration and prediction sets of ELM models based on different variables selection methods
利用表现最好的ELM模型对筛选后的变量进行鉴别,结果如表4所示。SPA选择的变量数量最少,但鉴别准确率下降较大。CARS和VCPA分别选择了15 个和12 个纹理变量,校正集和预测集识别率均达到100.00%,减少建模变量的同时,提高了预测集的识别率,也说明80 个纹理变量中存在冗余信息。技术融合结合变量选择方法取得了很好的鉴别效果。
本实验分别利用超声成像和高光谱成像技术对原切和合成调理牛排鉴别,建立LDA、KNN、BP-ANN、ELM四种鉴别模型,并将它们的数据融合,结合变量选择方法,以获得变量少、精度高的鉴别模型。结果表明:合成牛排的肉块组织均匀,超声图像信号弱、均一性好,与原切调理牛排图像存在差异。提取超声图像纹理特征值建模,最佳模型为ELM,校正集和预测集识别率分别为95.00%和90.00%。利用PCA对高光谱图像进行降维,提取前3 个PC图像纹理特征值建模,最佳模型为KNN,校正集和预测集识别率分别为97.50%和95.00%。将超声成像和高光谱成像数据进行融合建模,获得ELM模型的校正集和预测集识别率分别为100.00%和97.50%,采用SPA、CARS、VCPA选择特征纹理变量后建立ELM模型,CARS和VCPA选择的纹理变量建立的模型校正集和预测集识别率均达到100.00%。研究表明超声成像和高光谱成像数据融合结合变量选择方法可以快速准确地鉴别原切和合成调理牛排。