马佳佳, 陈友鹏, 王克强, 刘展眉, 温艳兰, 林钦永, 蔡 肯
(仲恺农业工程学院1,广州 510225) (广州南洋理工职业学院2,广州 510925)
农作物病虫害是主要农业灾害之一,具有种类多、影响大、并时常暴发成灾的特点,其发生范围和严重程度对农业生产常造成重大损失[1-3]。虫害的预测预报和实时监测是虫害管理的重要组成部分,也是有效防治和控制虫害蔓延的依据。只有对虫害发生进行及时、准确的识别监测,正确的拟定综合防治对策,才能经济有效地降低虫害威胁,确保农业粮食的安全,进而推动农业可持续发展。而传统的虫害识别仍然依赖于人力,存在检测不及时、标准不规范、效率低等弊端。机器视觉技术作为人工智能领域中的重要分支之一,同时也是图像识别领域的重要技术手段之一,研究热度逐年攀升,在农业相关领域的主要应用方向包括农产品品质无损检测、农作物生长情况监控及农作物产量预测等[4,5]。与此同时,国内外研究学者也在虫害识别的应用上,分别基于传统机器学习和深度学习两个方向,做了不少尝试。传统机器学习方法依赖于作为先验知识的特征提取算法,可以通过多源信息融合或算法优化进一步改进模型识别性能。邹永杰等[6]提取番茄样本图像的HOG和LBP特征作为SVM分类器的特征向量,提出了一种番茄病虫害检测方法,对公开番茄病害数据集的识别率达99.49%。吴一全等[7]选用Shearlet变换和Krwtchouk矩分别提取储粮害虫图像中的纹理、形状特征向量,同时提出一种全局混沌蜂群算法优化SVM分类模型,由于提取到的特征信息较为完整,该模型对三种储粮害虫取得较好的识别效果。Kasinathan等[8]结合HOG和GIST特征描述子对田间虫害图像进行特征提取,采用多数投票的集成分类器实现较优的虫害分类效果。基于深度学习的虫害识别方法在近年来随着计算机性能的不断提升也得到广泛关注。苗海委等[9]提出一种基于改进SSD的黏虫板储粮虫害图像检测算法,实现了对粘虫板诱捕到六类害虫的识别与定位,识别率达81.36%。Shen等[10]采用Faster R-CNN模型建立了储粮虫害识别系统,通过优化的初始网络对图片样本进行特征提取,系统对储粮虫害的识别精度达88%。因此,机器学习技术在虫害识别应用上具有一定的必要性与可行性。
本研究以迁飞性害虫草地贪夜蛾为识别对象,提出了基于粒子群优化SVM的虫害图像快速识别方法。目前基于粒子群优化SVM的算法模型已被尝试应用于工业检测中,如电路故障诊断[11]、环境数据的异常检测[12]及工业控制中的异常检测[13]等,其数据来源相对标准且规范,但在农业领域的识别应用中,采集到的大多数数据都是不标准且背景复杂的,这对模型的识别性能提出了更高要求。本研究首先构建草地贪夜蛾成虫图像数据集,并对图像提取方向梯度直方图特征,通过结合粒子群优化算法对SVM分类模型进行参数寻优,将优化SVM模型应用于虫害图像检测中,重点解决实际应用中小训练样本的识别精度问题,该方法的简单性和高效率使其适用于复杂背景下的虫害识别。
为准确识别出目标类别,研究学者提出了许多特征提取方法,本研究选用HOG特征描述符来获取图像特征向量。方向梯度直方图(Histogram of Oriented Gradient,HOG)特征是一种通过计算和统计图像局部区域的梯度方向直方图来构建特征信息的一种特征描述子。HOG特征的本质可以理解为梯度的统计信息,图像中局部目标的表象和形状能够充分通过梯度方向密度分布来描述[14,15]。另外,因为该特征方法的操作对象是图像的局部方格单位,所以提取到的HOG特征对图像的形变,包括几何上的和光学上的都能保持良好的不变性[16]。
HOG特征提取算法的实现过程如下:首先采用Gamma校正法对灰度图像进行颜色空间的归一化操作,目的是调节图像对比度[17],降低图像局部由光照变化引起的光学影响,同时增强鲁棒性。然后,计算每个局部方格单位内各像素点的梯度,从而得到图片中对象的轮廓信息与梯度方向。图像中像素点(x,y)的梯度计算公式如式(1)~式(4)所示。
Gx(x,y)=H(x+1,y)-H(x-1,y)
(1)
Gy(x,y)=H(x,y+1)-H(x,y-1)
(2)
式中:Gx(x,y),Gy(x,y),H(x,y)分别为输入图像像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值。
(3)
(4)
式中:G(x,y),a(x,y)分别为像素点处的梯度幅值和梯度方向。
将检测窗口大小设置为与图像分辨率一致为(150,150),把每个窗口分成10×10个方格区域,把梯度方向平均划分为9个区间,分别计算各区域内的梯度直方图,再把相邻的区域组合成一个区域块,在区域块内对梯度强度做归一化。最后再将各方格内提取到的特征向量串联组合,形成图像整体的HOG特征信息。本实验在特征提取步骤中从每幅图像中提取得到2 916个特征值。
针对本研究面向的小样本数分类问题,选用传统机器学习算法中的支持向量机(Support Vector Machine,SVM)分类模型。因该模型具有泛化能力强,对小样本数据友好,算法灵活等诸多优点,目前已被广泛应用于目标识别中[18]。SVM是一种基于统计学习理论的分类方法,通过监督学习的方式对数据进行二元分类,其决策边界是对学习样本求解的最大边距超平面,该超平面的求解公式可以表述为:
y(ω·x+b)≥1-ξi(ξi≥0;i=1,2,…,n)
(5)
式中:ω为权重向量;b为分类阈值;ξi为松弛因子;C为惩罚因子。
引入核函数映射后,得到决策函数如式(6)所示:
(6)
式中:f(x)取值为1或-1;K(xi,x)为核函数,选用高斯核函数。
由式(6)可知,SVM对其内部参数有着极高的依赖性,惩罚因子c与核参数gamma的选择将直接影响模型识别准确率[19]。同时,对于不同的数据集,使得识别效果最好的参数值也是不同的,因此模型内部参数的选取优化是SVM模型训练中格外重要的一步。
粒子群优化算法(Particle Swarm Optimization,PSO)是一种基于迭代的智能群算法,是通过模拟鸟群捕食行为设计的。该算法的基本思想是通过群体中个体之间的协作和信息共享来寻找最优解[20]。从随机解出发,通过迭代寻求最优解,并通过适应度来评价解的质量,粒子速度和位置的更新公式如式(7)和式(8)所示。
(7)
(8)
为了进一步提高SVM模型的识别性能与泛化能力,本研究提出采用粒子群优化SVM算法,解决模型中核函数与参数的寻优问题,进而建立效果更优的虫害图像识别模型。PSO-SVM算法模型的建立步骤如下:
初始化参数,随机生成初始粒子群;
通过计算各粒子的个体最优解和全局最优解,更新粒子的速度和位置;
判断是否满足迭代终止条件,若满足则跳出迭代,否则重复步骤2;
得到SVM模型内部参数c与gamma的最优值;
按正常步骤训练SVM模型,使用测试集对模型识别效果进行评价。
本研究应用自行采集的草地贪夜蛾成虫图像进行识别实验。准备好图像样本后,首先对图像进行简单的预处理,得到质量相对增强的图像;然后从图像中提取得到HOG特征信息,将图像信息转换为表征数据以便进行后续分类;接着将特征信息输入PSO-SVM算法模型进行识别,最终得到虫害识别结果。算法训练与识别流程如图1所示。
图1 算法流程
选择草地贪夜蛾成虫作为实验对象。草地贪夜蛾成虫翅展宽度一般为32~40 mm。前翅灰色至深棕色,后翅灰白色,翅脉呈棕色并透明[21]。在暗箱内固定环形光源,选用德国IDS工业相机(型号:UI-3070CP-C-HQ Rev.2)作为图像采集设备,标准化图像采集环境如图2所示。采集成虫在简单背景下和复杂背景下的正样本(即有成虫对象)图像1 000张及负样本(即无成虫对象)图像800张,共1 800副彩色图像作为本实验的数据集。
图2 图像采集环境示意图
为提高检测效率,对图像进行预处理操作。首先将图片分辨率降低为150×150(单位:像素),同时进行灰度化处理。接着对灰度图像进行滤波操作,分别选用5×5的中值滤波模板和高斯滤波模板消除图像中的随机噪声。经过预处理后的部分正样本图像如图3所示。
图3 预处理后的正样本图像示例
实验中训练模型的基础环境为64位Windows10系统,并配置有Intel Core i5-6300HQ CPU和NVIDIA GeForce GTX 960M GPU。实验在图形处理单元(GPU)模式下进行,选用的脚本语言为Python,并安装OpenCV图像处理库及Scikit-learn机器学习库。
对PSO算法的初始参数做如下设置:惯性因子为1,学习因子为2,种群规模为20,迭代次数为100。通过迭代,PSO计算得到使得SVM分类效果最优的最佳惩罚因子c为0.025,最佳核参数gamma为1.964。PSO优化前后模型的识别实验结果如表1、表2所示,识别正确样本平均数指多次实验后通过记录每次实验识别正确样本数进而计算得到的平均值,平均准确率指识别正确样本平均数除以待识别样本数得到得到的百分比数,平均识别时间包含模型训练所需的时间与识别测试所需的时间。
表2 模型对复杂背景下样本的识别实验结果
由表1、表2可知,传统SVM模型与PSO-SVM模型在对简单背景下虫害图像的识别中都能达到100%的准确率,但在对复杂背景下虫害图像的识别中,PSO-SVM模型的识别准确率相比于SVM模型提升了7.22%,且在识别时间上也缩短了30%。因此,经PSO算法优化后的SVM模型,既显著降低了SVM模型性能对其内部参数惩罚因子c和核参数gamma的依赖程度,同时有效提高了其识别的精度与效率。
为进一步验证PSO-SVM模型的识别性能,随机选取300张图片,分别选用装袋最近邻(Bagging-kNN)、自适应提升(AdaBoost)、随机森林(Random Forest)、卷积神经网络(Convolutional Neural Network,CNN)中的典型模型GoogLeNet inceptionV3与本文提出的PSO-SVM共5种机器学习分类模型对草地贪夜蛾虫害图像进行识别测试,实验结果如表3所示。
表3 不同模型识别实验结果
本研究提出的PSO-SVM模型在对虫害图像的识别实验上,准确率均明显优于另外几种算法。其中,与Bagging-kNN、AdaBoost、Random Forest相比,同样是选用HOG特征描述符从图片样本中提取特征向量作为模型的输入,但从分类器效果来看,PSO-SVM模型的识别效果明显更优,准确率差距基本保持6%以上,同时识别速度更快,能够做到虫害的实时检测。对于CNN模型,在实验中选用典型模型GoogLeNet inceptionV3进行对比实验,该模型不依赖于先验知识的特征提取算法,具有自主特征学习、自我完善模型等优点[22],可以自动学习并得到数据隐含在图像内部的关系,提取出更高维、更具表达力的特征信息。但由于数据样本数量的限制以及图像采集背景的复杂性,在此实验中CNN模型没有取得很好的识别效果;且从识别时间上看,GoogLeNet inceptionV3模型在数据充足的条件下,提前训练好学习模型后将会有不错的识别效率,但在小样本的应用条件下,其训练时间成本相对较高。因此,出于识别精度与效率的综合考虑,PSO-SVM模型在虫害图像识别实验中取得了相对较好的识别效果。
机器学习技术的快速发展,大大提升了目标识别的速度与精度,为其在农业领域上的应用发展带来了新的契机。本研究结合HOG特征描述符,提出一种基于PSO-SVM的虫害图像快速识别方法,对不同背景下的草地贪夜蛾虫害图像进行识别研究。实验结果表明,该模型对简单背景下样本的识别率达100%,对复杂背景下样本的识别率达93.89%,保证了虫害识别的精度与效率,能够为农作物虫害识别与预防工作提供有益的参考。在今后的研究中,会考虑加入其他优化模型,加速优化迭代过程,达到更高效准确的效果。