吴江春,王虎虎,徐幸莲
(南京农业大学食品科技学院,肉品质量控制与新资源创制全国重点实验室,江苏 南京 210095)
鸡肉营养价值丰富,含有多种易被人体吸收的蛋白质和氨基酸,同时具有低脂肪、低能量和低胆固醇的优势。我国是鸡肉生产和消费大国,在新冠肺炎疫情与禽流感的影响下,2021年全球肉鸡产量增速下调,我国肉鸡产量仍有小幅上升,据预测,2022年我国肉鸡供需仍将延续增长趋势[1]。日益增长的需求量要求肉鸡市场有足够的供应量。目前我国肉鸡产业向着集中屠宰、冰鲜上市的生产方式转型升级,大型屠宰线在屠宰过程中基本实现了机械化[2-3]。如图1所示,在肉鸡屠宰工艺流程中,残次品挑选是保证产品品质的重要环节,但该环节对劳动力的依赖度高。
图1 肉鸡屠宰工艺流程Fig.1 Flow chart of broiler slaughtering
据调研,某大型肉鸡屠宰厂一天屠宰的鸡胴体缺陷率为3%~6%。在所有缺陷鸡胴体中,原发性皮炎鸡胴体占比约为7.4%,原发性皮炎是鸡胴体质检的一个重要指标。鸡胴体原发性皮炎是指鸡胴体表面可见、分散不均匀的一种缺陷类型,在外观上表现为粗糙、红或黑的皮炎与结痂,由外伤、理化性、细菌和外寄生虫以及感光过敏性刺激等因素造成[4]。质检人员将鸡胴体表面发炎、结痂面积达3 cm2以上且无法修复的鸡胴体分为皮炎品。鸡胴体表面皮炎分布分散、面积占比小,且不同个体皮炎严重程度各不相同,因此人工识别存在速率慢、效率低、主观性强等不足。此外,长时间、高强度的用眼会导致视觉疲劳,降低识别准确率,给工厂带来损失。
机器视觉技术是近年兴起的一项技术,广泛用于工业、农业、食品等领域。在禽类养殖、屠宰和加工过程中,机器视觉技术可用于禽类饲养环境的监控[5]、形态与行为的诊断[6-7]、出栏体质量的控制[8-9],可用于冰鲜类产品的分割与品质控制过程,如鸡胴体的分割与掏膛[10-11]、质量预测[12-13]、淤血识别[14]、表面污染物检测[15-16]与鸡胸肉的木质化程度判定[17]。此外,在副食品加工中,机器视觉技术可用于熏鸡腿颜色的识别[18]。但冰鲜鸡质检所研究的产品缺陷类型以淤血、木质化、新鲜度为主,并未涉及鸡胴体表面的原发性皮炎检测。因此,为利用机器视觉技术实现对肉鸡屠宰后道质检端皮炎鸡胴体的快速检测,本研究利用机器视觉装置采集及鸡胴体表面图像,根据皮炎的颜色、纹理特征和面积大小,提取相关特征值构建皮炎检测模型,以期为肉鸡胴体的皮炎检测提供技术参考。
本研究的实验对象为肉鸡胴体,所有鸡胴体图像均采集于某大型肉鸡屠宰线。选取生产线上经人工质检的皮炎与正常鸡胴体,用机器视觉装置采集其3 个方位的视图,共采集316 只鸡胴体(皮炎、正常各158 只),获得948 张样本图片。经质检员判定,158 只皮炎鸡胴体样本皮肤发炎、结痂面积均大于3 cm2,且无法修复。皮炎和正常鸡胴体的代表性样本如图2所示。
图2 代表性皮炎样本(A)和正常样本(B)Fig.2 Representative dermatitis samples (A) and qualified samples (B)
光源、相机、工控机等设备是机器视觉系统的重要组成部分[19-20]。鸡胴体原发性皮炎主要分布在背部和两侧区域,本研究用含3 个相机的机器视觉装置采集鸡胴体后侧、左侧和右侧3 个方位的视图,各组成的选型均基于屠宰线的实际需求,安装连接方法参考赵正东等[21]的研究,光源、相机和工控机的参数如表1所示。
表1 机器视觉装置各组成的参数Table 1 Parameters of each component of machine vision system
相机支架与胴体支架的安装方位如图3所示,鸡胴体以背部朝向相机1,倒挂在胴体支架上,各个相机的中轴线夹角为120°,相机镜头光心与鸡胴体表面的距离固定为50 cm,3 个相机覆盖的视野可完整获取鸡胴体表面信息。
如图4所示,该装置运用于肉鸡屠宰厂后道质检端。相机的最小曝光时间为26 μs,快于肉鸡495 mm/s的平均运动速率。该装置可以成功捕获清晰、无拖影的鸡胴体图像,并通过模型识别后在输出端进行分开运输的操作,实现鸡胴体原发性皮炎的静态检测。
图4 机器视觉装置的安装效果Fig.4 Installation diagram of machine vision device
1.3.1 图像的预处理
在授精前需要做好相关的饲养管理,输精后的饲养管理也尤为重要。如在输精后5~8 min时,可为母牛注射一定剂量的催产素,可使受胎率提高25%。在输精后当天也可以注射50万U的维生素A,这对提高母牛的受胎率也有很大帮助。有些母牛自身体质较差,受胎率不高,这时也可以人工注射一些激素完善母牛的各项机能,较为常见的是注射新斯的明注射液,可有效提升母牛的卵巢机能,提高母牛配种后受孕率[3]。
从工厂采集的原始图像存在干扰信息,因此需对图像预处理,以减少噪声,改善图像的质量,增加特征识别的准确性[22]。本研究采用加权平均值法将原始RGB图转换成灰度图,经二维中值滤波处理后采用迭代阈值法分割出鸡胴体区域,将鸡胴体二值图与原始RGB图点乘,获得去除背景的鸡胴体图。
不同皮炎鸡胴体的皮炎面积各不相同,且分布不集中,整体识别存在难度。因此采用提取鸡胴体局部皮炎信息的方式,如图5所示,将皮炎鸡胴体的去背景图用网格(单个网格边长为128 像素)划分成若干区域,从中筛选出颜色斑驳、纹理粗糙且黑色背景面积占比小的皮炎皮肤图片;同理,划分正常鸡胴体去背景图像,从中筛选出颜色均匀、表面光滑且黑色背景面积占比小的正常皮肤图片。对所有鸡胴体样本进行分割和筛选后共获得1537 张样本图片(皮炎皮肤762 张,正常皮肤775 张),在此基础上提取特征值和建模。
图5 皮炎皮肤(A)与正常皮肤(B)图片筛选流程Fig.5 Dermatitic skin (A) and normal skin (B) image screening process
1.3.2 特征值的提取
如图6所示,皮炎和正常皮肤在颜色和纹理上均有差异。皮炎样本的皮肤为红橙色或黑棕色;与正常皮肤相比,皮炎皮肤表面更粗糙、斑驳。故提取图像的颜色特征、纹理特征以及皮炎面积作为皮炎检测的特征值。
图6 代表性皮炎(A)和正常(B)皮肤样本Fig.6 Representative dermatitic skin sample (A) and normal skin sample (B)
1.3.21 颜色特征值的提取
颜色矩可用来表示图像不同通道的颜色分布特征,由于颜色分布的信息主要存在颜色矩的低阶矩中,本研究选取一、二、三阶矩表示RGB图像各分量图的颜色分布[23-24]。其中一阶矩为图像颜色均值(μi),表示明暗程度;二阶矩是图像颜色的方差(σi),表示颜色分布的均匀性;三阶矩是图像颜色的斜度(si),表示颜色分布的对称性,计算公式如下所示。分别提取上述皮炎与正常皮肤图像R、G、B通道的三阶颜色矩,共9 个颜色特征,记为μ1、σ1、s1;μ2、σ2、s2;μ3、σ3、s3。
式中:N为图像的像素个数;i为通道数;pi,j为第i个通道的第j个像素。
1.3.22 纹理特征值的提取
表2 灰度共生矩阵特征值的英文缩写对照Table 2 Abbreviations of gray-level co-occurrence matrix eigenvalues
1.3.23 皮炎面积的提取
图像分割是根据图像中目标对象的特点,分割出感兴趣区域的图像处理方法[29]。如图7所示,采用Otsu阈值分割法提取皮炎区域面积,将样本图片从RGB颜色空间转换到HIS空间,提取S分量图,用Matlab中的graythresh()函数计算分割阈值,记为T。如图8所示,随机选取皮炎和正常皮肤样本各30 个,计算其阈值。发现皮炎与正常皮肤样本图片的分割阈值大致以0.20为分界线,当S分量图的分割阈值大于0.20时,则将其处理成二值图,并计算皮炎面积,记为A1。A1为图像中皮炎的像素个数,不是实际坐标的皮炎面积,因此在采集鸡胴体时还需对图像进行标定[30-31]。本研究采用10 cm×10 cm的标准正方形标定图像,如图9所示,经计算得标定系数为1594.29 像素/cm2。记实际皮炎面积为A,计算公式如下:
图7 皮炎面积提取示意图Fig.7 Schematic diagram of dermatitis area extraction
图8 皮炎与正常样本图的分割阈值分布Fig.8 Segmentation threshold distribution of dermatitis versus normal sample maps
图9 标准正方形标定图像[21]Fig.9 Standard square diagram for calibration
式中:A1为图像中皮炎的像素个数。
1.3.3 模型的建立与验证
用主成分分析(principal component analysis,PCA)法对特征值降维,选取方差累计贡献率在95%以上的PC,分别将特征值与PC导入线性判别分析(linear discriminant analysis,LDA)模型、二次判别分析(quadratic discriminant analysis,QDA)模型、随机森林(random forest,RF)、支持向量机(support vector machines,SVM)、反向传播(back propagation,BP)神经网络模型。GoogLeNet模型则以皮炎与正常皮肤图片为输入数据。所有模型均在MATLAB R 2020b中建立和运行,模型的训练集为1000 张皮肤图片(皮炎与正常各500 张),测试集为537 张皮肤图片(皮炎262 张、正常275 张),模型的分类效果采用召回率、精确度、F1分数、总准确率和平均检测速率表示。
上述模型均基于128 像素×128 像素的图像建立,为检测最终模型对整只鸡胴体的分类效果,随机选取40 只鸡胴体进行验证(皮炎与正常各20 只)。以鸡胴体后视图为例,单侧视图检测流程如图10、11所示。仅当后视图与两侧视图全判定为正常时,所检测的鸡胴体为正常,否则为皮炎。
图10 鸡胴体后视图检测过程Fig.10 Chicken carcass rear view inspection process
图11 鸡胴体单侧视图检测流程图Fig.11 Flow chart of chicken carcass single-side view inspection
特征值的PCA结果如图12和表3所示,在PCA碎石图中可以观察到从第6个PC开始,特征值的下降趋势趋于平缓,但前6 个PC的方差累计贡献率仅为87.92%,经过综合考虑选取方差累计贡献率为96.29%的前10 个PC作为模型的输入参数。
表3 PC方差贡献率Table 3 Variance contribution of principal components
图12 PCA碎石图Fig.12 Principal component analysis scree plot
以特征值和PC为输入参数的模型分类效果如表4、5所示。在以特征值为输入参数的模型中,QDA模型召回率最高,为90.08%;精确度、F1分数和总准确率最高的模型均为SVM,分别为90.38%、90.03%、90.32%。在以PC为输入参数的模型中,RF模型的分类效果优于其他模型,皮炎样本的召回率为88.93%,识别精度为89.30%,F1分数为89.11%识别总准确率为87.71%;通过比较不同输入参数的模型可发现,经PCA降维后,LDA、QDA、SVM模型总准确率均有不同程度的下降。其原因是降维后数据是原始数据的近似表达,减少了原始数据特征,这与章振原[23]、刘广昊[32]和王敏[33]等的研究一致。
表4 以特征值作为输入参数的不同模型分类效果Table 4 Classification performance of different models with eigenvalues as input parameters
表5 以PC作为输入参数的不同模型分类效果Table 5 Classification performance of different models with principal components as input parameters
如图13所示,在GoogLeNet模型中,皮炎样本的召回率为89.5%,识别精确度为90.6%,F1分数为90.0%,模型识别总准确率可达90.5%。
图13 GoogLeNet混淆矩阵Fig.13 GoogLeNet Confusion matrix
模型的预测速率如图14所示,其中以特征值为输入参数的SVM模型预测速率最快,高达405895.69 张/s。GoogLeNet模型的预测速率为122.65 张/s,远低于其他模型,但其预测速率仍高于人工质检速率。
综合比较模型分类效果可发现,GoogLeNet模型对皮炎皮肤图片的识别整体效果最好,因此利用该模型对40 只鸡胴体样本进行验证。如表6所示,该模型对皮炎鸡胴体的识别准确率为100%,对正常鸡胴体的识别准确率为90%。部分样本的检测结果如表7所示,被误分类的正常鸡胴体皮炎面积分别为3.3981、3.9270 cm2。
表6 GoogLeNet模型对整鸡的分类效果Table 6 Classification performance of GoogLeNet model for whole chicken carcasses
表7 部分鸡胴体样本检测结果Table 7 Test results of selected chicken carcass samples
如图15所示,在误检样本中,样本A与B侧视图翅膀上方均可观察到如图16所示的黄色小绒毛,这些绒毛被识别成皮炎,从而造成误差。正确分类的18 个正常鸡胴体样本中均有皮炎检出,其中12 个样本皮炎面积小于1 cm2,4 个样本皮炎面积在1~2 cm2内,2 个样本皮炎面积在2~3 cm2内。
图15 正常鸡胴体的误检样本A(A)与样本B(B)Fig.15 False examination samples A (A) and B (B) of normal chicken carcasses
本研究利用机器视觉装置采集肉鸡屠宰线上316 只鸡胴体的正视图与两侧视图,经图像预处理去除背景和干扰后,用边长为128 像素的网格划分,并从皮炎鸡胴体中筛选出皮炎皮肤图片762 张,从正常鸡胴体中筛选出正常皮肤图片775 张。提取皮肤图片的颜色矩、不同方向灰度共生矩阵特征的均值与方差、Tamura纹理特征以及皮炎分割阈值和面积共计24 个特征值,经PCA降维后,用特征值与PC分别建立LDA、QDA、RF、SVM与BP神经网络模型。GoogLeNet卷积神经网络模型则用筛选出的皮肤图片建立。模型的分类效果采用召回率、精确度、F1分数、总准确率和平均检测速率判断,经过综合分析发现所有模型中以GoogLeNet模型的分类效果最好,皮炎样本的召回率为89.5%,识别精确度为90.6%,F1分数为90.0%,总准确率可达90.5%,预测时间为122.65 张/s。在对整鸡胴体图像识别的验证实验中,GoogLeNet模型对皮炎鸡胴体的识别准确率为100%,正常鸡胴体的识别准确率为90%。该模型对鸡胴体原发性皮炎有较好的识别能力,可为鸡胴体原发性皮炎的快速识别与分类提供技术参考。