禹文杰,王彩霞,乔 芦,王松磊,贺晓光
(宁夏大学 农学院,宁夏 银川 750021)
肉色是评价肉质的重要指标之一[1-2],直接影响消费者的购买意愿[3-5]。常用的客观评价肉色的仪器有色度计和色差计,两种测定方法都是将肉的表面直接放置于仪器的镜头上,虽然测定较快,但是测定过程中极易污染样品,结果也不能代表整体性[6-7]。
高光谱成像技术是一种绿色、快速的分析检测技术[8],具有响应范围广、波段多而窄、连续分辨率高、操作简便、无污染等特点,适用于食品内、外部的品质检测。国内外学者利用高光谱技术对肉及肉制品的风味物质、嫩度、菌落总数、大理石花纹、蛋白质含量、pH等进行了研究[9-12]。Feng等[13]利用高光谱成像技术研究牛肉中掺加鸭肉的问题;赵娟等[14]采用牛胴体背最长肌56个有效样本的高光谱立体图像,建立了基于主成分纹理特征的线性判别模型,预测精度达到94.44%。
泾源黄牛是宁夏优势畜牧品种,具有体躯丰满、增重快、饲料利用率高、产肉性能好等特点,其肉质鲜嫩,瘦肉多、脂肪少,适口性好。2014年,泾源黄牛肉获得国家农产品地理标志登记保护。本研究以泾源黄牛肉作为研究对象,利用高光谱技术检测肉色,进而建立泾源黄牛肉色度的PLSR预测模型,旨在为牛肉快速在线检测提供参考。
5头2岁左右泾源黄牛,购自宁夏泾源县清苑牧业有限公司。
HyperSpec VNIR N型高光谱成像系统(谱区为400~1 000 nm),购自美国HeadWall公司;DC-P3色差仪,购自北京市兴光测色仪器有限公司。
1.3.1 样本采集
根据NY/T 676—2003《牛肉质量分级》,将5头泾源黄牛屠宰后4 ℃下冷藏48 h,每头牛采集脖肉、眼肉、黄瓜条、里脊肉样品各0.5 kg,并分割成长条(5 cm×3 cm×2 cm)待测,待测样本共计150个。
1.3.2 光谱信息和图像采集
使用高光谱成像系统,采用“推扫式”方式进行牛肉样品的图像采集,采集的光谱区间为400~1 000 nm,光谱分辨率为2.8 nm,狭缝宽度为25 μm,狭缝长度18 mm。
在采集图像前,对高光谱成像系统进行预热和参数设定[15],开机0.5 h后按照以下公式对仪器进行黑白校准[16]:
(1)
式中,R为经黑白校正后的图像,Is为原始数据,Ib为黑板标定值,Iw为白板标定值。待样本中心温度达到室温后,擦去表面水分,放置于高光谱电控位移平台进行光谱图像扫描。
1.3.3 牛肉肉色的检测
采用色差仪测定牛肉肉色。测定前,先对色差仪进行黑白校正,然后在牛肉表面的肌肉部分进行颜色的测定,每个样品选择3个点,即测定3个数据,取平均值作为试验参数。颜色参数用亮度(L*)、红度(a*)、黄度(b*)表示。
1.3.4 光谱数据的处理
采用ENVI 4.8软件对采集到的光谱数据进行处理,采集区域应尽可能覆盖整块样本(图1),通过波段运算和掩膜法提取纯肌肉部分的感兴趣区域(ROI)的平均反射光谱数据。为了提高模型精度,将得到的光谱数据进行偏最小二乘回归(PLSR)建模,利用Matlab 2014a软件中的蒙特卡罗法[16]剔除异常值,利用经典K-S算法进行校正集与预测集的划分。受仪器暗电流、噪音等因素的影响,样本光谱曲线产生重复、基线漂移、分散等现象,故采用卷积平滑、归一化、标准正态变量变换(standard normal variable transformation,SNV)、正交信号校正(orthogonal signal correction,OSC)、基线校准、去趋势、多元散射校正(multiplicative scatter correction,MSC)和Deresolve这8种预处理方法对原始光谱数据进行预处理,然后对比分析,确定最优预处理方法。
图1 400~1 000 nm波段下牛肉样品图像采集区域Fig.1 Region of interest extraction from beef samples at 400-1 000 nm
1.3.5 特征波长提取
通过提取特征波长可以有效降低模型运算次数,提高运算效率,提升校正集模型相关性和预测集预测能力。采用竞争性自适应重加权法(competitive adaptive reweighting,CARS)、连续投影算法(successive projections algorithm,SPA)和无信息变量消除算法(uninformative variable elimination,UVE)进行特征波长提取。SPA算法是一种使矢量空间共线性最小化的前向变量选择算法;CARS算法是通过自适应重加权采样技术选择出PLSR模型中回归系数绝对值大的波长点,去掉权重小的波长点,有效寻出最优变量组合的算法;UVE是一种通过去除无用信息并提取特征波长的方法,利用偏最小二乘回归系数法对变量进行稳定性分析的算法。
1.3.6 模型构建
利用蒙特卡洛法进行异常值剔除,L*、a*、b*分别剔除2、7、4个异常样品。然后利用经典K-S算法进行样本集划分,按照校正集∶预测集=3∶1进行划分,获得各个参数的校正集和预测集。其中,L*的校正集样品111个,预测集样品37个;a*值的校正集样品108个,预测集样品35个;b*值的校正集样品111个,预测集样品35个。
为了避免上文各因素对模型构建效果的影响,采用不同预处理方法处理光谱数据,提高所建PLSR模型的预测性能。
表1 不同预处理方法下L*所构建的PLSR模型效果
Table1Effect of PLSR model constructed byL*under different pretreatment methods
预处理方法Pretreatment method主成分Mainingredient校正集Calibration setR2cRMSEC交互验证Interactive verificationR2cvRMSECV预测集Validation setR2pRMSEP原始频谱 Original spectrum20.97320.52980.97070.55440.97510.5851卷积平滑 Smoothing-SG20.97220.53990.96960.56460.97360.6018归一化 Normlization40.95120.71510.92370.89640.91161.2310基线校准 Baseline correction20.95900.65610.95570.68170.96620.6748标准正态变量变换 SNV50.94010.79260.91030.97130.87361.3213去趋势 De-trending20.95620.67760.95150.71310.93590.9189多元散射校正 MSC50.94010.79230.91210.96130.90611.1635Deresolve30.97900.46920.97690.49250.97660.2341
表2 不同预处理方法下a*所构建的PLSR模型效果
Table2Effect of PLSR model constructed bya*under different pretreatment methods
预处理方法Pretreatment method主成分Mainingredient校正集Calibration setR2cRMSEC交互验证Interactive verificationR2cvRMSECV预测集Validation setR2pRMSEP原始频谱 Original spectrum50.80670.69140.77880.73990.91960.7251卷积平滑 Smoothing-SG40.80700.69100.78010.73770.91550.8047归一化 Normlization50.69270.87190.44541.20570.58591.4933基线校准 Baseline correction50.59371.00250.46391.15930.79361.1382标准正态变量变换 SNV60.48741.12600.36211.26470.32091.9310去趋势 De-trending50.57721.02260.46311.15950.81621.0783正交信号校正 OSC40.74240.79830.70810.85030.71781.1087Deresolve50.80700.69090.78040.73720.90960.8242
L*、a*和b*的原始光谱曲线和经预处理后光谱曲线见图2。综合以上结论,L*经Deresolve法预处理的效果较好,a*经卷积平滑法预处理的效果较好,b*经卷积平滑法预处理的效果较好。在后续特征波长提取过程中,分别采用Deresolve、卷积平滑、卷积平滑处理L*、a*、b*参数后,构建PLSR模型。
利用竞争性自适应重加权法(competitive adaptive reweighting,CARS)、连续投影算法(successive projections algorithm,SPA)和无信息变量消除算法(uninformative variable elimination,UVE)对特征波长进行提取,结果如表4所示。
表3 不同预处理方法下b*所构建的PLSR模型效果
Table3Effect of PLSR model constructed byb*under different pretreatment methods
预处理方法Pretreatment method主成分Mainingredient校正集Calibration setR2cRMSEC交互验证Interactive verificationR2cvRMSECV预测集Validation setR2pRMSEP原始频谱 Original spectrum30.92210.25880.91210.25710.95040.2614卷积平滑 Smoothing-SG60.93110.24350.91670.26790.95060.2785归一化 Normlization60.83320.37900.80360.41200.71660.6122基线校准 Baseline correction30.95900.65610.95570.27390.93600.2592标准正态变量变换 SNV60.94010.79260.91030.97130.87361.3213去趋势 De-trending50.95620.67760.95150.71310.93590.9189多元散射校正 MSC60.94010.79230.91210.96130.90611.1635Deresolve30.92900.45320.90630.42350.91660.6234
A、C、E分别为L*、a*、b*原始光谱,B、D、F分别为预处理后的L*、a*、b*光谱。A, C and E showed the original spectrum of L*, a* and b*; while B, D and F showed the spectrum of L*, a* and b* after pretreatment.
通过SPA算法在卷积平滑预处理后的光谱数据上进行降维处理,优选过程中RMSECV逐渐减小,在第6个变量值时RMSECV趋于稳定,共挑选出6个最有特征波长。通过CARS算法提取特征波长,设定运行次数为3 000,根据RMSECV最小挑选最优特征波长,共挑选出30个特征波长。通过UVE算法在卷积平滑预处理后的光谱数据上提取特征波长,共挑选出18个特征波长。
表4L*、a*、b*特征波长提取
Table4Feature wavelength extraction ofL*,a*andb*values under three different methods
肉色参数Parameter特征波长提取方法Extraction method波长点数Wave number波长Wave length/nmL∗SPA7434;511;612;627;651;665;689CARS12410;415;420;425;434;627;631;641;646;718;723;727UVE62401;406;410;415;420;425;430;434;439;444;449;454;458;612;617;622;627;631;636;641;646;651;679;684;689;694;699;703;708;713;718;723;727;732;737;742;747;751;771;775;780;785;790;795;799;804;876;881;886;891;895;900;905;910;915;919;924;929;934;939;991;996a∗SPA6439;493;636;699;972 CARS30430;434;439;579;583;603;607;612;751;756;761;766;919;977;987;991UVE18430;434;439;444;449;454;593;607;612;617;622;737;742;747;751;756;761;766;771;775;943;948;953;958b∗SPA6468;631;684;795;886;948 CARS30473;478;483;488;493;497;502;507;583;588;593;598;603;607;612;617;622;627;631;636;641;651;655;660;665;670;675;679;982;987UVE18511;516;521;526;603;607;612;617;622;627;631;636;972;977;982;987;991;996
表5 基于不同特征波长提取方法下L*、a*、b*建模效果对比
Table5Comparison ofL*,a*andb*value modeling effects based on different feature wavelength extraction method
肉色参数Parameter特征波长提取方法Extractionmethod波长点数Wavenumber校正集Calibration setR2cRMSEC交互验证Interactive verificationR2cvRMSECV预测集Validation setR2pRMSEPL∗SPA60.97780.48040.97510.51150.97050.6272CARS300.97570.50530.97390.52330.98170.4954UVE180.97350.52710.97090.55200.97020.6286a∗SPA70.76960.75500.73870.84050.92570.7192 CARS120.81140.68290.77230.75130.92110.6908UVE620.80750.69010.92100.73440.91570.7188b∗SPA50.92350.25660.91570.26940.95220.2506 CARS160.93160.24270.91900.26410.95320.2405UVE250.92820.24680.92100.26080.95200.2504