目前,中国奶牛养殖从整体上来看,有着规模小、养殖观念传统、缺乏养殖和管理经验等缺陷,这导致牧场的管理水平低下,影响了奶牛养殖的产量与质量[1]。普遍的人力监管方式难以避免人为因素导致的牛奶质量问题,且其获取养殖场的综合信息能力较低。因此为保证奶牛得到高效率的监管,增加养殖收益,使用机器视觉技术监管成为一种趋势。
机器视觉作为一种智慧农场实现的热点技术,具有非接触、不易干扰奶牛正常生活、长时间连续监控、算法更新迅速的优点。对于奶牛的个体准确识别是机器视觉对获取到的奶牛图像进行各类体况分析的前提,也是将奶牛体况信息精准记录到每一只奶牛的基础技术。该文将从以下三方面基础技术对奶牛个体的精准识别研究进展进行综述,即从图像中识别到奶牛具体位置的算法,对奶牛身份进行识别对应的算法,获取更多奶牛信息量的算法。
所有对于奶牛图像的各类人工智能分析方法,都建立在一个最基础的问题上——奶牛图像的获取。摄像机等硬件设备能够拍摄获得奶牛所处场景的整体图像,但无法单独获取奶牛个体的图像。因此,为了进行后续对奶牛个体动作和状态的分析,首先需要解决奶牛个体图像的准确提取。顾静秋等[2]提出了使用聚类算法和熵结合的方式获取奶牛对象。通过阈值区分天空、地面和目标对象的图像灰度,再对图像欧氏空间内的特征向量进行聚类,抽取分离奶牛对象。实验中奶牛对象提取效果较好,但由于其方法基于灰度值的计算,在目标对象与背景灰度近似时可能会造成准确度的影响。赵凯旋[3]同样提出了一种对图像灰度进行分析的方法。通过按照灰度值划分不重叠的子区,使用动态RGB通道合成参数调整的方法对目标及背景图像进行适时调整,然后使用背景去除和最后进行子区域拼接的方法完成目标的检测。检测率为88.34%,误检率、误检帧和拒检帧较低,且对光照变化适应性较强。但文章只对单头奶牛和单一背景进行了实验,对于这一方法的适用性还需要更多应用和测试来进行评估。同样是背景去除的方法,宋怀波等[4]将图像转换为HSV图像,对亮度分量进行二值化得到奶牛目标提取的掩模,使用高斯去噪后,使用掩模在灰度图上去除无关背景后,得到奶牛目标。其算法一定程度上补充了背景去除算法的思路。
不同于利用灰度值的思想,宋怀波等还提出了使用光流法对于奶牛个体或其所需要检测的部位图像进行提取。光流是一种图像亮度模式的表观运动,其表达了目标的运动信息,其引申出的光流场概念描述了图像中所有像素点构成的瞬时速度场,因此光流法提取目标主要应用于运动较剧烈的目标的提取。宋怀波等[5]使用每帧图像的光流场,通过识别光流场的变化,检测奶牛较大运动部位,作为目标区域的候选。对图像用合适阈值分割,使用有较大变化的光流值的帧,叠加分割后帧的二值图像,利用牛反刍时嘴部运动最为剧烈的特点,通过最终叠加后的二值图像识别牛的嘴部区域。
除光流法外,也有其他对于图像中的运动区域进行识别的方法被应用于奶牛个体的识别。Tsai D等[6]使用IP摄像机从牛棚顶部拍摄奶牛,通过对视频的时空表示识别高水平的运动区域,得到运动强度图,然后通过区域生长分割的方法,保留面积最大的区域进行进一步处理。使用基于模式的前景分割从当前图像中提取奶牛的形状。分割后的运动区域用来限制目标物体的前景,消除附近不相关的牛的部分。该方法能够得到对奶牛个体的最小包围框,而非沿奶牛个体边界的精确提取。
为解决对牛个体间的区分问题,研究人员常利用机器学习和卷积神经网络的方法对牛只身份进行识别。赵凯旋等[7]提出通过帧间差值法计算直线行走侧视奶牛视频中的粗略轮廓,再由分段跨度分析对应二值图像,从而定位器躯干区域,使用二值图像对躯干进行比对跟踪。将上述方法得到的躯干图像进行灰度化,并进行插值运算和归一化转换为矩阵,作为神经网络的输入数据。通过第一卷积层,第二下采样层,第三卷积层和第四下采样层的卷积神经网络结构,建立与奶牛头数相当的感知器,使每一种奶牛个体作为一个模式进行输出。该方法对视频中奶牛个体的识别准确率达到了93.33%,同时,方法中减少了卷积层中特征图的数量,提高了网络对图像信息的利用率。然而再对相似图像进行处理时,会由于先前对图像进行的变化导致细节信息的损失,从而降低了方法的准确性。Kumar等[8]提出利用牛的鼻口处纹路判断牛的身份。该团队先提出利用Fisher线性保留映射 FLPP(Fisher Linear Preserving Projection) 的方法来提取牛口鼻特征,通过 SVM 训练预测达到 96.87% 的准确率。在这一研究基础上,Kumar等[9]又对算法进行了更改。提出利用加速鲁棒性特征和局部二值模式的特征提取方法,对口鼻处不同程度的高斯金字塔平滑图像纹路特点进行描述。通过融合加权求和的方法,得到最终的特征描述。其团队建立了500头牛的5000张图像数据集,通过对比多种算法的性能,最终选择使用LDA算法,通过Fisher识别标准最大化组间和组内的主要特征比例;使用ICA算法得到对口鼻图像高阶统计量更敏感的识别方式;采用基于SURF和LBP特征描述的技术对鼻口图像进行评估,将融合后的相似度评分作为最终判定的依据。该方法交叉验证得到身份识别准确率为93.87%,且方法为未来的持续性改进留有余地。方法中对于纹路的识别分析算法,以及对身份识别的算法,都可以根据算法的性能进行具体的更改。这使得算法在未来有更广的使用方式和应用场景。
牛只个体识别这一基础技术的准确度主要受制于图像质量。如同人眼视物,如果人眼本身接收到的图像不清楚,则在人脑中反映出的信息也是不准确的。
增强图像本身的清晰程度和信息表现能力,是最基础直接地提高获取信息量的方法。刘忠超[10]借助双域滤波去噪,通过低频和高频图像分解、贝叶斯估计高频图像的小波阈值、Garrote函数小波去噪、伽马变换矫正、暗通道先验算法去雾、自适应直方图均衡的算法处理,增强图像清晰程度,扩充其涵盖信息量。且在各时间段,各类天气环境下都能够有效地去噪、增强信息和改善图像视觉效果,能够为牛棚环境中的奶牛识别提供良好的样本。
另一方面,由于设备硬件的条件本身决定了图片质量的上限,训练能够有效进行模糊识别的算法也是一种高信息量获取的重要途径。刘杰鑫等[11]为了解决传统机器学习方法提取特征不充足和采用 CNN 的研究中深度学习网络识别率不高的问题,提出了通过建立高斯混合模型,确定像素点与分布的匹配关系决定其归属,通过多个分布对背景进行建模。完成背景建模后,可以二值化提取到奶牛的模糊轮廓,使用最大连通域对奶牛进行定位,通过定位框的坐标和尺寸信息获取奶牛个体图像,随机作为训练集和测试集。然后使用Alex net网络softmax和svm分类器对牛个体进行迁移学习。该方法采用规定像素占比的方式较好地避免了光线突变和镜头抖动带来的噪声干扰,且相较于先前的研究有着较好的准确性提高。
从近年研究情况来看,由于各类算法的更新以及设备的迭代,对于奶牛个体的精确识别在各个研究的测试环境下都能够得到较准确的识别效果,且能够依据不同的需求,对奶牛轮廓、奶牛花纹、奶牛嘴部等实验所需识别部位进行较为精准的识别。对于牛只的身份确认,也能有较良好的表现。研究者也从图像本身入手,着眼于提高图像的信息量,以达到提供更好的算法训练数据。整体而言,对于个体的精确识别一方面在对环境的适应和迁移上有所欠缺,另一方面各类奶牛个体的识别技术在可视化和与人交互方面的不足,可能会造成技术在推广应用方面的阻力。为了能够进一步提升机器视觉技术在实际应用中的可行性,未来能从以下几个方面继续发展:(1)建立奶牛图像信息的互联网数据库。通过数据库能够交流不同地区环境采集到的奶牛图像,丰富研究者在实验中可获取的奶牛图像信息量。(2)研究综合性算法。应用单一的算法检测奶牛个体时,总会受到某个算法的弊端影响。可以通过将多种算法进行综合,或可能够减少单一算法带来的误差。(3)应用更新的人工智能算法。现在人脸识别算法的准确度和普及度都十分可观,人工智能的应用也在社会中十分广泛。其中应用的各类新型算法思路,也可以被修改和应用到奶牛养殖业,乃至其他畜牧养殖业管理中。
总而言之,中国的奶牛养殖业还处于一种较为粗放的管理方式之中,对于奶牛的精细管理和信息化数据记录以及分析都尚处于初级阶段。各类自动化的监控方式也都处于研究阶段,进行落地转化的技术较少。期望相关的研究单位能结合具体国情,研发更多可以投入生产生活中的技术,提升中国奶牛养殖业的自动化、精细化和智能化水平,促进其繁荣发展。