吴林峰 余怀鑫 祝志慧
(华中农业大学,湖北 武汉 430070)
鸡蛋孵化过程大约需要21 d,对环境温湿度条件要求较高,是个耗时、耗能的过程[1]。据统计[2],种蛋的成活率在85%~95%。目前市场上检测种蛋最常见的方法主要是人工照蛋法,速度慢、效率低、准确性差,且受到工人主观判断的影响,并不能满足当前自动化生产的需要。有许多学者利用机器视觉技术[3]、近红外光谱[4]、高光谱图像[5-6]实现了对鸡种蛋内部特性的无损检测,这些方法具有检测速度快、精度高、所需时间短、劳动强度低等优点[7]。但光谱设备对于低成本的农业生产来说过于昂贵,对检测环境也有较高的要求,限制了这些方法的推广;机器视觉技术目前对种蛋孵化信息的无损检测仅处于静态单个蛋的模型检测研究。
本试验拟利用机器视觉技术,直接以工业蛋托为基础,将整托蛋直接从孵化箱放进检测装置采集群体种蛋的图像,从群蛋图像中分割出单个蛋图像,提取图像信息,利用不同方法建立无损检测模型,为高通量在线检测提供有力的理论依据。
种蛋:京粉2号褐壳蛋,峪口禽业有限公司,共计164枚,其中受精蛋96枚,无精蛋68枚,孵化温度37.8 ℃,湿度63.5%,翻蛋时间间隔2 h,每天对鸡蛋进行称重,从第3天开始采集整托种蛋图像,蛋托为6枚×6枚规格,共计5托,第5托数量不足部分用其他托中的蛋补齐,防止漏光现象。
搭建如图1所示机器视觉系统,由工业相机、镜头、光源、暗箱和计算机组成。相机选用DLC500型工业相机,镜头选用精工XW0612型,其焦距为6~12 mm,光圈为f1.6。光源选用35 W的卤素灯置于种蛋下方,用橡胶环托住鸡蛋减少漏光现象;暗箱用于隔绝环境光,减少外界干扰。工业相机通过USB接口与计算机连接,计算机保存图像数据并进行处理。
1.光源 2.工业蛋托 3.种蛋 4.暗箱 5.摄像头 6.USB线 7.计算机
图1 图像采集系统
Figure 1 Schematic diagram of image collection system
受精蛋和无精蛋的蛋重存在一定的差异,种蛋蛋重的大小对受精率和孵化率有显著的影响[8]。使用XYSCALE的JAP型电子天平,精度为0.001 g,在每天固定时间测量蛋重信息,如图2所示,在孵化0~8 d受精蛋与无精蛋的平均蛋重均缓慢下降,其中受精蛋共失重2.736 g,平均日失重率为0.55%;无精蛋共失重2.395 g,平均日失重率为0.53%。
将受精蛋和无精蛋每天的蛋重进行对照试验T检验,所有P值<0.05,即证明在孵化0~8 d的受精蛋和无精蛋蛋重都符合正态分布,再进行独立样本T检验,所有P值<0.05,即认为2个总体之间的均值不相等,受精蛋平均蛋重大于无精蛋。虽然受精蛋与无精蛋的平均蛋重存在显著差异,可以将蛋重用作特征参数,但是每个鸡蛋的大小、蛋壳厚度都不一,无法单一用蛋重来区分受精和未受精的鸡蛋,需加上其他的特征来区分。
1.4.1 群蛋图像的分割 采集整托蛋的图像上共有36枚鸡蛋,首先需要对图像进行分割。由于蛋壳厚度、孵化程度等因素,种蛋之间的亮度差异较大,局部阈值分割只能将少数亮度均匀的鸡蛋分割出来。为了提高处理的速度和准确性,将所有种蛋看作圆形,通过建立坐标系确定每枚鸡蛋中心的坐标,图3(a)为第7天群蛋图像,分别拾取左上、左下和右下3个鸡蛋的中心,再通过蛋托的距离计算拿出每个鸡蛋中心的坐标。鸡蛋的半径主要分布在区间[135,180]的像素长度上,为了防止拾取到非鸡蛋像素,以125像素为半径画圆,如图3(b)所示,保留圆形内部像素,再按照顺序分割为单个种蛋图像。
1.4.2 特征值提取 采集后的图像包含一些干扰信息,运用平滑处理对图像去噪[9],如图4所示,通过平滑处理后直方图的两端更加突出,特征更加显著。
图2 孵化早期受精蛋与无精蛋蛋重变化Figure 2 The change of average weight in early days of hatching
图3 分割得到的单个鸡蛋图像Figure 3 Single egg obtained by division
在此基础上,再提取出图像的RGB值,通过数学关系转换为HIS值。分别挑选40个无精蛋和受精蛋统计各分量均值的散点图,如图5、6所示,第3天无精蛋与受精蛋的特征参数区分不明显,到第7天多数无精蛋的G、B、I分量均值以及灰度均值都高于受精蛋,S分量均值低于受精蛋,无精蛋的R分量均值分布区间比受精蛋大。
种蛋数量按约为5∶3的比例分为训练集和测试集,从164枚中随机挑选104个作为训练集,其中受精蛋61枚,无精蛋43枚,剩余的60个作为预测集,其中受精蛋35枚,无精蛋25枚,用Matlab对图像中提取的R、G、B、H、S、I、灰度均值以及蛋重这8个特征参数分别建立多元线性回归、SVM和BP神经网络模型。
图4 预处理对于图像质量的影响Figure 4 Effects of image preprocessing
图5 第3天蛋重特征参数Figure 5 Egg weight parameters on third day after hatching
图6 第7天蛋重特征参数Figure 6 Egg weight parameters on seventh day after hatching
因变量y表示种蛋类别,设定受精蛋的y值为1,无精蛋为0,最后的拟合结果中将0.5及以上的值看做1,即受精蛋,小于0.5的值看做0,即无精蛋。RGB和HSI之间具有一定的数学关系,因此在建模前需去除其中的冗余信息。通过计算变量的方差膨胀因子(VIF)对变量的多重共线性进行检测,当VIF<5时可以认为不存在共线性,当5≤VIF<10时认为存在中等程度的共线性;当VIF>10时,认为共线性严重。每次剔除一个最大VIF值的变量,直到所有剩余变量VIF值都<5,如表1所示。建立线性回归模型,结果如表1、2所示,在孵化3~6 d时,蛋重是一个显著性的影响因素,随着孵化天数的增加,受精蛋图像的颜色会逐渐变深,蛋重变量逐渐变得不显著,故逐步判别时被剔除。从表2中可以看出,随着孵化天数的延长,检测精度逐渐提高。
SVM模型在高维数据、小样本数据和非线性数据模式识别方面都有出色的表现[10],建立一个分类准确的支持向量机模型需要选择合适的核函数[11]。常用核函数有线性核函数、多项式核函数、高斯径向基核函数(RBF)和Sigmoid核函数,在其他参数相同的情况下进行比较,结果如表3所示,Sigmoid核函数的结果非常低,RBF核函数准确率略高,仅在第5天略低于Linear核函数建立的模型,且RBF核函数的收敛域相对较宽,不受训练样本数量的制约,因此选用RBF作为核函数。
表1 多元线性回归模型Table 1 Model of linear regression
表2 多元线性回归方程结果Table 2 Results of linear regression
运用SVM对种蛋进行分类,首先通过网格搜索寻找最优参数,结果如图7所示,根据等高线图和3D图得出惩罚因子c和核参数g的值分别为0.25和0.062 5。
运用SVM模型对60个预测集进行分类,结果如表4所示,随着孵化天数,准确率逐步提升,在5 d之后准确率达到了90%以上。
表3采用不同核函数时早期种蛋鉴别准确率的对比
Table 3 Results of egg identification in early hatching period with different kernel functions
核函数第3 d第4 d第5 d第6 d第7 d第8 dLinear80.080.093.391.796.796.7Polynomial80.081.791.793.396.796.7RBF81.783.391.795.096.796.7Sigmoid58.358.358.358.358.358.3
表4 SVM模型鉴别结果Table 4 Results of SVM model
综上表2、4、5可知,对孵化3~8 d的褐壳种蛋运用多元线性回归模型、SVM模型和BP神经网络模型进行鉴别,种蛋鉴别的准确率随着孵化时间的延长而逐渐升高,在第6天均能达到90%以上,都可以用来对群体褐壳种蛋的受精信息进行判别,其中SVM鉴别模型最稳定、准确率最高,在第3天和第7天的准确率分别达到81.7% 和96.7%。对比已有研究,利用机器视觉对整托白壳蛋的受精信息进行判别在第7天达到了97%[13],利用机器视觉对单枚褐壳蛋横向放置采集图像,在孵化第6天达到90%以上[14],目前,褐壳蛋受精信息的研究仅处于对单枚蛋,并无对整托褐壳蛋受精信息的研究,因此本研究提出的利用机器视觉技术和提取的特征参数来建模鉴别群体褐壳受精蛋和无精蛋是可行的,后续将进一步提高鉴别精度。
c=0.25,g=0.062 5,CVAccuracy=98.076 9%
表5 BP神经网络鉴别结果Table 5 Results of BP neural network
本试验对整托褐壳蛋受精信息进行检测,通过对蛋重数据的分析表明了蛋重可以作为判别受精蛋和无精蛋的特征参数;利用机器视觉技术采集群体种蛋孵化信息,将群蛋图像分割并从图像中提取RGB值,用RGB、HIS、灰度均值和蛋重作为特征值建立了多元线性模型、SVM模型和BP神经网络模型。对比了SVM3种核函数,其中RBF核函数的准确率较高。利用相同的测试集对3个模型进行验证,综合考虑,在检测群体种蛋孵化情况时,SVM模型准确率较高,在第3天和第7天分别达到了81.7% 和96.7%,具有最好的稳定性和判别准确率,说明利用机器视觉技术对整托褐壳蛋进行孵化受精信息检测是可行的。但在孵化前3 d检测精度有待提高,可以尝试寻找其他特征值和改进模型。