利用高光谱成像技术预测牛肉pH值及其空间分布

2020-09-10 05:19乔芦贺晓光王松磊王彩霞李娜陈前禹文杰
河南农业大学学报 2020年4期
关键词:波长预处理牛肉

乔芦, 贺晓光, 王松磊, 王彩霞, 李娜, 陈前, 禹文杰

(宁夏大学农学院,宁夏 银川 750021)

牛肉是人类主要肉食品之一,具有高蛋白、低脂肪和低胆固醇的特点,并含有全部种类的氨基酸,深受消费者喜爱[1-2]。泾源黄牛作为宁夏优势畜种,具有肉质鲜嫩、富有弹性、瘦肉多、脂肪少和蛋白质含量丰富等特点,市场前景广阔。新鲜牛肉pH值对肉品的色泽、嫩度、烹调风味、货架期和保水性等都有非常重要的影响,是评定牛肉品质的重要指标[3]。然而在牛肉屠宰过程中,牛肉正常的生理机能会遭到破坏,同时受肌体内酶和各种微生物的影响,在储藏、运输过程中会发生无氧酵解,使其pH值发生变化,出现尸僵、成熟、自溶以及腐败等现象[4-5]。屠宰后24 h内肉品pH值变化幅度过大会对牛肉的品质产生影响,因此在牛肉胴体后处理以及生肉加工过程中如何快速并准确获得牛肉pH值,对牛肉品质的检测具有重要意义[6]。传统测量牛肉pH值的方法有比色法和电位法等,测量效率低、耗时且繁琐,不能实现快速和无损检测[7]。高光谱无损检测技术具有操作方便、原理简单和不破坏样品等优点,在食品质量和安全性评估中受到了广泛关注[8-11]。杨建松等[12]取排酸48 h后的不同部位牛肉样本,经不同预处理后建立牛肉pH值偏最小二乘回归模型,决定系数为0.620。王文秀等[13]在基于双波段光谱下建立原料肉的pH值在线预测模型,相关系数为0.950 4。BARBIN等[14]利用近红外高光谱图像技术预测猪肉的pH值并建立预测模型,相关系数为0.87。LI等[15]利用高光谱成像技术经过洛伦兹函数拟合后建立猪肉新鲜度的预测模型,其中pH值的预测相关系数为0.72。虽然建立回归模型预测肉类pH值的研究并不少见,但是该类研究中目前存在建模过程中使用方法较单一、对比性不明显以及缺乏直观可视效果等缺陷,不利于实际操作与工业应用和推广。本研究以宁夏泾源黄牛肉为对象,对其屠宰后牛肉pH值进行快速检测,利用可见/近红外高光谱成像系统(400~1 000 nm)采集样本图像信息,通过不同的预处理以及特征波长提取方法分别建立基于全波段和特征波段的偏最小二乘回归(partial least squares regression, PLSR)、多元线性回归(multiple linear regression, MLR)和主成分回归(principal component regression, PCR)模型,对牛肉pH值进行预测并比较,选择最优模型。在此基础上计算牛肉样本中像素点的pH值,并利用伪色彩图像直观表示牛肉样本的pH值的空间分布情况,从而实现对牛肉pH值无损检测及分布可视化表达,为牛肉品质的在线光谱快速检测提供理论依据。

1 材料与方法

1.1 材料与仪器

研究材料为宁夏泾源黄牛肉,养殖于宁夏泾源县,由宁夏尚农生物科技发展有限公司提供。研究采用高光谱成像系统(Hyper Spec VNIR)进行样本高光谱图像采集(波长范围400~1 000 nm,光谱分辨率为2.8 nm,125个波段),系统主要包括高光谱成像光谱仪(V10E-QE,芬兰Specim公司)、电荷耦合器件相机(C8484-05G型,日本滨松公司)、光纤卤素灯(DCR III型,150 W,美国肖特公司)和电控位移平台(SC300-1A型,北京卓立汉光公司)。肉品酸度检测仪(Testo 205型pH计)购自深圳卓越仪器有限公司。

1.2 试验方法

1.2.1 牛肉样本采集 36月龄的泾源黄牛经屠宰后,将其胴体放置在0 ℃下排酸48 h,取牛胴体4个部位的肉(脖肉、眼肉、瓜条肉和里脊肉)进行分割,剔除可见脂肪和结缔组织,于4 ℃储藏。光谱扫描前将肉样整形切块(40 mm×30 mm×20 mm),最终得到牛肉样本229个,用滤纸吸干表面水分进行高光谱图像采集,随后测定其pH值。

1.2.2 数据采集与处理 为消除光照不均匀和暗电流噪声的影响,对原始光谱图像进行黑、白图像标定[16],标定公式如下:

(1)

式中:IC为校正后的图像反射率;RO是原始图像的反射率;B表示是用不透明的黑色盖板完全盖透镜所得到的标准黑色参考图像;W为标准白板图像。

依次将5个牛肉样本按顺序摆放,进行光谱扫描。最佳样本采集参数为曝光时间15 ms、物距385 mm、电控位移载物台的速度1.5 mm·s-1以及扫描线长度75 mm。

1.2.3 牛肉样本pH值测定 pH计测头插入样本约8 mm处,取样本上、中、下3个点(间距10 mm)进行测量,取3次平均值作为该样本最终pH值参考值。

1.2.4 牛肉样本划分 采用Kennard-Stone(KS)算法对样本进行划分,从多个样本池中选择1个具有代表性的子集。首先选择欧式距离或马氏距离最大的2个样本在校正集,然后计算其他样本到已选2个样本的距离,选择最大和最小距离的样本加入校正集,重复上述步骤,直到达到校正集所需的样本数为止[17]。

1.2.5 光谱数据预处理 由于仪器噪声、暗电流等外部干扰[18-19],采集的光谱数据会存在无用信息从而影响建模效果。对原始光谱进行预处理来消除上述干扰[20]。本试验通过Savitzky-Golay卷积平滑法(SG)、面积归一化法、最大归一化法、基线校准、标准正态变量变换(standard normal variables, SNV)、去趋势法、多元散射校正(multiplicative scatter correction, MSC)、正交信号校正(orthogonal signal correction, OSC)对原始光谱进行预处理。采用SNV方法可以除去表面散射和路径长短变化对光谱数据的影响,采用MSC方法可以消除由于物理效应引起的不理想的散射[21-22]。通过对原始光谱图像和预处理后的光谱图像的波峰波谷处波长处进行分析,直观表示预处理对原始光谱的影响。

1.2.6 特征波长提取 有效的最佳波长选择能够删除与样本成分无关的信息,并提取最能代表肉类样本基本信息的特征波长,通过提取具有重要信息的特征波长来简化模型,提高运算效率[23]。本试验应用竞争性自适应加权算法(competitive adaptive reweighed sampling, CARS)、无信息消除变量法(uninformative variable elimination, UVE)、β权重系数以及变量组合集群分析法(variable combination population analysis, VCPA)共4种方法来提取特征波长。

1.2.8 牛肉pH值空间分布可视化 利用CARS法提取的特征波长所建立的PLSR模型进行。通过ENVI软件选取742 nm处的图像,然后利用MATLAB软件对图像进行掩膜处理得到样本二值化图像,结合PLSR模型获取与化学值相关的权重系数,其回归系数与特征图像每个像素点相乘,再根据矩阵赋值情况对像素点进行显色处理,利用Jet色度带进行显色。

1.3 数据处理软件

高光谱图像数据分析软件ENVI 4.8(Research System Inc, USA),样本集划分、原始光谱预处理以及PLSR、MLR、PCR模型构建使用软件The Unscrambler X10.4 ,特征波长提取使用Matlab R2016a软件。

2 结果与分析

2.1 牛肉样本划分

对于稳定的定量模型,选择合适的定标集方法划分样本至关重要。具有良好代表性的样本可以提高模型的预测能力。利用KS算法将229个牛肉样本划分为校正集(n=170)和预测集(n=59),表1为pH值统计描述信息。其中校正集与预测集中,pH值最大分别为5.59和5.55,最小值分别为5.01和5.03,标准差分别为0.155和0.137,数值相差较小,适用于建立模型。

表1 牛肉样本校正集与验证集 pH 值统计结果Table 1 Statistics of pH value in calibration and validation set of beef samples

2.2 牛肉样本全波段光谱预处理及PLSR模型分析

表2 不同预处理方法下牛肉pH值PLSR模型Table 2 PLSR model of beef pH value by different pretreatment methods

2.3 牛肉样本原始光谱分析

牛肉在储藏运输过程中,受肌体内酶和微生物的影响,肉品肌红蛋白中的血红素结构发生降解,从而促进氧合肌红蛋白氧化为高铁肌红蛋白。图1为牛肉样本的原始光谱曲线图,包含引起牛肉样本pH值变化的脱氧肌红蛋白、水分和氨所对应的光谱信息。560 nm处为脱氧肌红蛋白的吸收峰,610 nm处是氨基团的3级倍频吸收峰,700 nm处是牛肉样本本身所带的水分吸收峰。由于外界噪声干扰以及仪器自身的暗电流等影响,图1-A中原始光谱分离程度较高,出现基线漂移等现象,无法满足建立稳定数学模型的要求。根据2.2的研究结果,对原始光谱进行最大归一化预处理。由图1-B可知,经预处理后的光谱有效减少了背景噪音,杂波的干扰减少,且分离程度大幅度降低,使光谱曲线变得更光滑,提高了模型的稳健性。

注: A原始光谱图;B最大归一化法预处理光谱图Note : A is the original spectrogram;B is the maximum normalization method to preprocess the spectrogram

2.4 特征波长选取

2.4.1 竞争性自适应加权算法(CARS) CARS是新的变量选择方法,能有效减少共线变量对模型的影响,同时移除无用变量[24]。图2所示为CARS筛选过程。图2-A中所选变量个数呈递减趋势,抽样变量数随着抽样次数的增加而减少;图2-B中,当抽样次数在0~126次时RMSECV值降低,此时无用信息被剔除,126~400次之间趋于稳定,400次之后上升,此时有用信息被剔除,选取RMSECV值最小时,提取特征波长;图2-C中最左边的蓝色竖线代表当RMSECV值最小时的抽样运行次数。在多次试验中,选取RMSECV值最小为0.065 9时提取的19个特征波长,分别为468、487、511、521、559、569、579、708、713、761、771、775、804、814、833、847、905、939和943 nm,占总波长变量的15.2%。

图2 CARS法特征波长的筛选Fig.2 Selection of characteristic wavelength through CARS method

2.4.2 无信息消除变量法(UVE) UVE用于消除对检测模型贡献率少的光谱波段,即消除无信息变量,实现光谱波段的降维,从而提高模型检测精度[25]。图3所示为UVE模型的稳定性分布曲线。当主成分数为11时,RMSECV最小,2条水平虚线外为有用信息,在此基础上提取出16个特征波长,分别为415、492、497、502、511、516、521、583、612、617、622、627、646、651、905和977 nm,占总波长变量的12.8%。

2.4.3 β权重系数法 加权β权重系数是根据建立的PLSR模型得到回归系数曲线图,基于局部绝对值最大的原则挑选特征波长的方法[26]。该方法通过给予不同指标不同比例系数来表示指标在总量中重要程度。系数越大,该指标对总目标影响越大。如图4所示,提取其吸收峰和反射峰中的波段(A~N)作为特征波段进行PLSR模型建立。由于在PLSR模型中前5个主成分累计贡献率为96%,故提取前5个主成分的14个特征波长,分别为415.7、420.6、463.7、507.0、540.6、545.4、574.2、579.0、718.2、732.7、747.1、751.9、756.7和963.1 nm,占总波长变量的11.2%;对应的β权重系数分别为0.101、0.208、-0.085、0.016、0.138、-0.163、0.178、-0.230、0.285、0.086、0.233、-0.415、-0.034和-0.258。

图3 考虑11个主成分的UVE法稳定性分布曲线Fig.3 Stability distribution curve of UVE method considering 11 principal components

2.4.4 变量组合集群分析法(VCPA) 变量组合集群分析法(VCPA)[27]作为较新的特征变量筛选方法。该方法通过二进制矩阵采样法进行模型种群分析,并利用指数衰减函数迭代进行变量筛选,基于达尔文进化论中“适者生存”的原理,不断减小变量空间,使用RMSECV值作为选择最佳变量的标准,将频率较大的剩余变量进行组合作为最终选择出的特征波长变量。如图5所示,本研究中输入数据为光谱变量,VCPA法采用5折交叉验证,将VCPA法中指数衰减函数运行数设置为50,将二进制矩阵采样运行数设置为1 000,选取前11个变量(选取频率最大)作为最优变量。利用VCPA法提取出11个特征波长,分别为415、430、454、458、487、612、627、655、660、665和679 nm,占总波长变量的8.7%。

注:A~N为特征波长对应位置

注:曲线为光谱曲线,柱状图为提取的特征波长

2.5 建模方法及建模结果的比较分析

2.6 牛肉pH值空间分布可视化

牛肉样本可视化处理结果及过程如图6所示。根据利用CARS法提取的特征波长所建立的PLSR模型,经二值化图像后最后进行显色处理。样本通过伪色彩图像的不同区域颜色差异及深浅来表示该像素对应的pH值分布情况,颜色栏从蓝色到红色,表示pH值由低到高的变化,样本边缘位置偏蓝色,中间位置整体偏橘色,且有深红色。通过可视化可以直观看出样本pH值的空间分布情况。

表3 不同特征波长的牛肉pH值预测模型Table 3 Beef pH value prediction models with different characteristic wavelengths

图6 基于PLSR模型的牛肉pH值空间分布可视化图Fig.6 Visualization of spatial distribution of beef pH value based on the PLSR model

3 结论与讨论

可视化技术因其直观、快速以及无损等特点在食品检测领域广受欢迎[35]。本研究中,根据利用CARS法提取的19个特征波长所建立的PLSR模型生成牛肉pH值空间分布可视化分布图。可视化分布图可以直观表示牛肉pH值的空间分布特征。本研究中pH值在样本之间显示出不同像素的差异,样本边缘为蓝色,中间大部分为橘色,偶有深红,推测是储藏和运输过程中牛肉内微生物在生长和繁殖中产生了碱性物质[5]。JIA等[36]利用可见/近红外高光谱预测鸡胸肉的pH值,并对pH值进行空间分布,得到了与本研究相似的结果。本研究表明,高光谱成像技术在快速无损检测泾源黄牛肉性质方面具有潜在的应用价值。

猜你喜欢
波长预处理牛肉
一种波长间隔可调谐的四波长光纤激光器
求解奇异线性系统的右预处理MINRES 方法
杯中“日出”
酸汤牛肉里的爱
污泥预处理及其在硅酸盐制品中的运用
寻味牛肉
牛肉怎么做,好吃又嫩?
基于针孔阵列型的单次曝光双波长叠层成像*
基于预处理MUSIC算法的分布式阵列DOA估计
吃不上牛肉了