基于机器视觉的鹅肥肝色泽自动分级模型

2021-12-01 06:10:14逄滨

食品安全导刊 2021年31期

逄滨

（青岛农业大学食品科学与工程学院，山东青岛 266109）

目前，我国鹅肥肝质量分级主要包括感官指标分级、重量分级、理化指标分级等。其中感官指标分级主要根据鹅肥肝的色泽等级并辅之以弹性、损征和气味等进行人工评级。这种人工分级方法依赖评级员的感官和经验，具有很强的主观性和不一致性，而且评级效率低，不能满足现代鹅肥肝产业的发展要求。

采用机器视觉技术实现农产品品质检测与自动分级应用已成为近年来农产品加工与检测领域的研究热点，主要涉及了农产品颜色[1-7]、面积大小及形状[8-13]、表面损伤及缺陷检测[14-16]等。目前应用机器视觉技术进行鹅肥肝色泽自动分级的研究较少，但在其他肉类（牛肉、猪肉等）颜色分级领域的研究已经较为成熟。在牛肉颜色分级研究方面，陈坤杰等[1]采用计算机图像处理技术，计算得到了牛肉肌肉区域的R、G、B、H、S、I颜色特征分量，并分析了这些颜色特征分量在牛肉储藏期间的变化规律；陈坤杰等[2]以这些颜色特征分量的参数值作为输入，构建了基于BP神经网络的牛肉肌肉颜色等级预测模型，模型的预测准确率可达95%；CHEN等[3]提取了牛肉眼肌切面的皮下脂肪区域的12个脂肪颜色特征，并以12个颜色特征参数为输入、脂肪颜色等级为输出，建立了一个最优支持向量机（SVM）分级模型，模型的预测准确率为97.4%；SUN等[4]分析并提取了21个牛肉精肉图像的颜色特征，并分别利用多元线性回归法（MLR）和支持向量机法（SVM）建立了牛肉肌肉颜色分级模型，其模型的预测准确率分别为86.8%和94.7%。在猪肉颜色分级研究方面，贾渊等[5]将猪肉的R、G、B颜色分量以及亮度和饱和度构建了一个新的颜色维度，并建立了SVM颜色分级模型，模型的分级正确率为96.5%。

本研究提出一种基于机器视觉技术的鹅肥肝色泽自动分级模型，用以弥补传统人工色泽评级的不足，通过机器视觉技术提取反映鹅肥肝色泽等级的色泽特征参数，分别建立多元线性回归分级模型和典型判别函数分级模型，实现鹅肥肝色泽等级的自动判定。

1 材料与方法

1.1 试验材料

鹅肥肝样本取自于青岛农业大学优质水禽研究所育种基地，根据文献[17]方法对75只青农灰鹅进行统一填饲、杀鹅取肝，得到75个新鲜鹅肥肝样本，将所有鹅肥肝样本在育种基地加工现场用真空薄膜袋封装打包，并使用医疗冷藏箱将样本从加工现场运至实验室。封装打包前，参照国家行业标准（NY 67—1988）对鹅肥肝样本的色泽进行人工评级，将肝表面光泽良好、色度均匀且为淡黄、米黄或浅粉色的样本划分为特级，用数值1（级）标记；将呈现淡黄、米黄或浅粉色的样本划分为一级，用数值2（级）标记；将呈现淡黄、米黄、黄色或浅粉色的样本划分为二级，用数值3（级）标记；将呈现淡黄、米黄、黄色、浅粉或浅红色的样本划分为三级，用数值4（级）标记。

1.2 鹅肥肝样本图像采集与分割

鹅肥肝样本图像的采集采用机器视觉系统，主要由工业相机、光源、计算机组成，如图1所示。

图1 鹅肥肝样本图像采集系统

将不同色泽等级的鹅肥肝样本置于工业相机下方，依次采集鹅肥肝样本图像数据，根据文献[3]方法应用MATLAB R2014a软件对图像进行背景分割，不同色泽等级的典型鹅肥肝样本图像如图2所示。

图2 不同色泽等级的典型鹅肥肝样本

1.3 鹅肥肝色泽特征参数提取

对于经图像分割处理后的鹅肥肝样本图像，根据文献[2]的颜色特征提取方法提取鹅肥肝的色泽特征参数，修改如下。将HIS颜色模型中H、S、I颜色分量的平均值和标准偏差改为Lab颜色模型中的L、a、b颜色分量的平均值和标准偏差。因此，对于图像的鹅肥肝目标区域，通过提取相应的R、G、B、L、a、b 颜色分量的平均值（μR、μG、μB、μL、μa、μb）和标准偏差（σR、σG、σB、σL、σa、σb）共 12 个色泽特征参数来定量描述鹅肥肝样本的色泽特征。应用MATLAB 2014b软件完成色泽特征参数的提取工作。

1.4 色泽分级模型建立与数据分析

针对12个鹅肥肝色泽特征参数与色泽等级间的关系，本研究采用主成分分析法对这12个色泽特征参数进行重新筛选，按主成分贡方差献率选取对色泽具有综合解释能力的色泽主成分，并用色泽主成分进行多元线性回归建模和典型判别函数建模，分别得到两种鹅肥肝色泽自动分级模型。应用SPSS 19.0软件完成数据的统计、分析和建模工作。

2 结果与分析

2.1 鹅肥肝色泽特征的统计分析

经感官评定，鹅肥肝色泽等级为1级、2级、3级、4级的样本数分别为14、15、30、16。对75幅鹅肥肝图像进行图像处理，提取12个色泽特征μR、μG、μB、μL、μa、μb、σR、σG、σB、σL、σa和 σb，并分别用X1～X12表示，计算出不同色泽等级下12个色泽特征的均值和标准差，如表1所示。

由表1可知，对于不同色泽等级的鹅肥肝，其色泽特征差异较显著。随着鹅肥肝色泽等级的降低（从1级降到4级），特征X2、X3、X4、X9的均值随等级逐步降低，特征X1、X7、X8、X10的均值随等级呈下降趋势，其余色泽特征无明显的变化规律。

2.2 鹅肥肝色泽特征的主成分分析

对75个鹅肥肝图像的12个色泽特征进行主成分分析，得到12个主成分PC1～PC12，主成分方差贡献率如表2所示，主成分系数矩阵如表3所示，表3中的Z1～Z12是输入变量X1～X12标准化后的数据。标准化计算公式如式（1）：

表2 主成分方差贡献率

表3 主成分系数矩阵

式中：Xi为提取的第i个鹅肥肝色泽特征，Zi为Xi标准化后的数据为所有鹅肥肝样本第i个色泽特征的均值，Si为所有鹅肥肝样本第i个色泽特征的标准差与Si的具体取值详见表1的总计部分。

由表2可知，前3个主成分（PC1、PC2、PC3）的特征值均大于1，且累计方差贡献率高达86.24%，基本能够涵盖样本的色泽信息，因此可以选取前3个主成分来代表原有12个鹅肥肝色泽特征，反映鹅肥肝色泽等级。75个鹅肝样本色泽特征前3个主成分的数据点分布如图3所示。由图3可知，不同色泽等级对应的主成分数据点区域无明显重叠现象，能够大致分布在4个区域，但3级样本标准化数据点之间分布较为分散，在实际应用中可能会其他等级样本发生混淆，其他3个等级的样本标准化数据点分布较为集中，区分效果良好。

图3 不同色泽等级鹅肥肝样本的主成分分布

2.3 鹅肥肝色泽多元线性回归分级模型

在保证各等级样本内部抽取比例为2∶1的前提下，随机从75个鹅肥肝样本中抽取50个样本作为训练集，抽取25个样本作为测试集。对训练集50个样本的前3个主成分进行多元线性回归分析，得到回归方程：

式（2）即为鹅肥肝色泽多元线性回归分级模型，其中，Y为该模型预测的鹅肥肝色泽等级，PC1、PC2、PC3分别为主成分分析提取的前3个主成分。

根据式（2）所建立的主成分回归方程预测训练集的色泽等级，模型的预测结果如图4所示，其中训练集的相关系数R2=0.912，训练标准差为0.307。

图4 回归分级模型训练集预测结果

测试集的模型预测结果如图5所示，其测试集的相关系数R2=0.935，测试标准差为0.271，与训练集的预测结果接近，说明所建立的色泽回归分级模型具有一定的稳定性。

图5 回归分级模型测试集预测结果

利用所建立的鹅肥肝色泽MLR分级模型对训练集和测试集的色泽等级进行计算，将计算结果四舍五入保留整数，且小于0.5的结果判定为1，大于4.5的结果判定为4，即可得到该模型的实际色泽判定等级。模型对训练集和测试集的分级结果分别如表4、表5所示。

表4 训练集中鹅肥肝色泽等级分级结果

表5 测试集中鹅肥肝色泽等级判定结果

由表4可知，模型在训练集中，将2个2级样本误判为3级，将1个3级样本误判为4级，将2个4级样本误判为3级，模型在训练集中的分级正确率为90%。由表5可知，模型在测试集中，将1个2级样本误判为3级，模型在测试集中的分级正确率为96%。综上所述，通过鹅肥肝色泽MLR分级模型判定75个样本色泽等级，共有6个样本发生了误判，模型的总体分级正确率为92%。结果表明，模型的识别率和稳定性都达到了较好的水平。而发生误判的样本全部发生在相邻色泽等级之间，这是由于相邻色泽等级的样本之间提取的特征相似所导致的，所以使得模型的判定结果存在了一定的误差。

2.4 鹅肥肝色泽典型判别函数分级模型

对训练集50个样本的前3个主成分进行典型判别分析，得到3个典型判别函数，其特征值及方差贡献率如表6所示，其中前2个典型判别函数的累积方差贡献率为97.18%，能够描述鹅肥肝色泽特征前3个主成分的主要信息。经计算可知，前2个典型判别函数与前3个主成分的转换关系如式（3）：

表6 典型判别函数方差贡献率

式（3）即为鹅肥肝色泽典型判别函数分级模型，其中，F1、F2分别为前2个典型判别函数值，PC1、PC2、PC3分别为主成分分析提取的前3个主成分。

根据鹅肥肝典型判别函数分级模型，绘制训练集50个样本的F1、F2数据点分布如图6所示。由图6可知，不同色泽等级对应的F1、F2数据点均围绕组质心分布，其中1级组质心为（-11.29,0.38），2级组质心为（-1.86,-1.16），3级组质心为（3.78,3.16），4级组质心为（4.04,-5.00），4个不同等级的组质心能够较好分开，且不同等级间数据点没有明显重叠显现，说明模型分级效果较好。

图6 训练集中不同色泽等级鹅肥肝样本的F1、F2分布

为验证模型效果，计算分别训练集50个样本的（F1,F2）数据点与各级别组中心的欧式距离，依据距离值最小原则判定样本色泽等级。训练集样本的回判结果如表7所示。由表7可知，4个等级的样本判定正确率均为100.00%，总判别正确率为100%。考虑到模型是根据训练集样本特征的前3个主成分信息得到的，故可能夸大模型判定效果，为了验证模型的有效性，以未参加建模的测试集25个样本对模型进一步检验，绘制训练集F1、F2数据点分布如图7所示。由图7可知，测试集的F1、F2分布与训练集的F1、F2分布（图6）大致相同。测试集的模型判定结果如表8所示。由表8可知，模型对测试集中4个等级样本的判定正确率同样为100%，说明利用训练集构建的模型分级效果良好。

表7 训练集中鹅肥肝色泽等级分级结果

表8 测试集中鹅肥肝色泽等级判定结果

图7 测试集中不同色泽等级鹅肥肝样本的F1、F2分布

3 结论

本研究利用机器视觉技术和统计模式识别方法对不同色泽等级的鹅肥肝样本进行了色泽等级自动判定，得到结论如下：①鹅肥肝线性回归分级模型的识别率和稳定性均达到了较高水平，模型的总体分级正确率为92%，模型中训练集与测试集的相关系数接近、标准差相近；②鹅肥肝典型判别函数分级模型的识别率高于线性回归分级模型，其模型的总体分级正确率为100%，模型中训练集与测试集的典型判别函数数据点分布规律大致相同。因此，本研究可用于鹅肥肝色泽的自动分级，而且有望在此研究基础上开发鹅肥肝色泽在线分级系统，从而取代人工并且为鹅肥肝的生产加工提供技术支持。但本研究中训练集和测试集的样本均较少，使得模型预测结果不能较全面的包含各个色泽等级样本，今后应该扩大样本数量并分多批次做重复试验，以期得到更加准确和稳定的鹅肥肝色泽分级模型。