沈美,于翔
摘 要:鉴于无线传输技术的推广和应用,文章以无人机为载体,以水稻纹枯病为例,通过支持向量机、AdaBoost等机器学习算法,重点研究并实现了基于机器学习的农田无人机农作物病害图像自动寻的系统,并对该系统进行深层次探索和功能分析。
关键词:机器学习;支持向量机;AdaBoost;无人机;农作物病害;水稻纹枯病
1 農作物病虫害现状
我国农业正在从传统型农业向精细型农业发展。精细农业的中心思想是在农事劳动和农业生产生活中,依靠先进的科学技术手段,快速、准确地采集尽可能多的农田信息,以达到减少投入的同时增加产出、提高投入物利用率、降低环境污染程度的目标[1]。
作为影响农作物最终产量的重要关键因素之一—农作物病虫害的田间调查、检测、识别及病虫害危害状况进行分级、监测,却长期依赖专业的植保人才,导致作物病虫害识别诊断的主观性强、工作量大、成本高、误差大、时效差、对专业知识要求较高,已经远不能满足我国现阶段对现代农业快速发展的需求[2]。因此,采用无损测试技术,即在不破坏植物组织结构的基础上,利用各种手段对作物的生长、病害危害状况进行监测,以便及时采取措施治理或合理安排计划[3]。从而实现对病害进行早期预警,对控制病虫害大范围蔓延、保护作物产量有深远研究作用及社会意义[4]。
本文利用无人机(Unmanned Aerial Vehicle,UAV)便利、高效的特点,通过其携带的摄像头对水稻田间进行高速飞掠采样,利用机器视觉、机器学习等先进技术对水稻纹枯病病害图像进行识别、寻的,从而完成基于机器视觉的水稻纹枯病的早期预警、诊断及病虫害分级判断,为在相关条件成熟的情况下实现精准喷洒、施药打下坚实的技术基础,从而实现基于机器学习的水稻纹枯病无人机平台自动寻的。该研究结果能对其他类似农作物病虫害的无人机自动寻的以及精准施药技术起到借鉴作用。
2 机器学习在农作物无人机图像寻的中的应用
机器学习是一门多领域交叉学科,主要研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是目前人工智能中最具智能特征、最前沿的研究领域之一[5]。历经多年的发展,源于人工神经网络的研究,包含多个隐藏层的、多层感知器的、机器学习中的一种—深度学习,通过组合低层特征形成更加抽象的高层表示属性类别或特征,模仿人脑的机制来解释数据,例如图像、声音和文本等,在很多方面收获了突破性进展,本文主要通过支持向量机(Support Vector Machine,SVM)与Adaboost两种机器学习算法,应用于无人机,对水稻纹枯病病害图像的寻的有极大帮助。
2.1 支持向量机
支持向量机是Cortes和Vapnik于1995年首创的,在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[7]。
SVM理论来自于数据二值分类问题的处理:假定在可分数据中由多个可以区分正负样本的超平面(Hyperplane)组成超平面集,在可分数据中寻找一个满足分类要求的最优分割超平面(Optimal Separating Hyperplane,OSH),使得在保证分类精度的同时最大化OSH两侧的间隔[8]。
假定空间中存在包含正负两类的自变量xi∈R,i=1,…l及因变量y,满足y∈{1,﹣1}。假定存在一个分类超平面可以区分这两类正负样本,超平面上的点xi满足ω·xi+b=0,其中ω为超平面的法向量,|b|/||ω||为超平面到原点的垂线距离,||ω||为ω的范数。
给出一组数据{(xi,yi)},i=1,…l满足
满足上式且在超平面H1和超平面H2上的样本点xi可分别表示为x+和x-。将上述两式整合可得到
超平面H1和超平面H2可分别表示为
在超平面H1和H2上的点到原点的最短垂线距离分别是|1-b|/||ω||和|﹣1-b|/||ω||。因此,超平面间的间隔Margin为:
2.2 Adaboost算法
Schapire和Freund于1997年第一次提出Adaboost算法,将多个弱分类器有机地结合在一起,通过多次迭代,对训练样本的权重不断更新定义,随后通过投票机制进行分类。随着迭代次数的增加,Adaboost算法会将分类的重点逐渐放在一些难区分的样本上,通过这种机制,最后实现整体识别准确率的提高。
Adaboost算法过程如下[9]:首先,将把数据分成训练集和测试集两部分,随后输入训练集,对训练样本权重进行初始化,D1代表数据集的权重集合,N代表样本的个数,ω代表每个样本的权重(一般初始的权重都设为1/N),其公式如下:
将清洗后的数据集输入算法中,并建立一对多(One Against All,OAA)一对一(One Against One,OAO)分类器,分别用于训练和测试;
在每一次迭代过程后,根据如下公式计算弱分类器的错误率em:
在迭代m次之后,根据弱分类器的错误率确定每一个弱分类器在最终分类集合中的比例系数am:
每次迭代后,根据下面两个公式来更新OAA分类器所有的权重:
输入测试集,调用OAO分类器下式:
最后得到分类器:
3 利用SVM与Adaboost分类器实现无人机水稻纹枯病寻的
3.1 利用SVM与Adaboost分类器实现无人机水稻纹枯病寻的技术路线
在无人机施工过程中,如果利用无人机实现基于机器视觉的精准寻的,就必须将正常叶片、病害叶片及土地等噪声分开,这也是无人机植保中的关键问题之一。因此,构造一个具有较高精度的分类器,从而实现病害叶片的检出及对正常叶片、泥土、杂草图像等噪声的分类,为基于机器视觉的无人机寻的提供精准目标就成为实现无人机精准寻的一种解决思路。本文提出利用Adaboost及SVM建立两级级联分类器,从而实现新型的、高效的、具有计算复杂度小、分类精度高等优点的二级级联分类器来解决该问题。
本文通过研究不同局部特征对纹枯病和非纹枯病检测的影响,创造性地提出在水稻基部纹枯病识别研究中利用两层分类器来对纹枯病进行检测与识别,其技术路线如图1所示。
图1 利用SVM与Adaboost分类器实现无人机
水稻纹枯病寻的技术路线
首先,在第一层利用水稻基部图像的颜色特征,通过图像预处理等手段对具有水稻纹枯病变的叶片图像进行处理,随后利用Adaboost分类器进行初步分类、建立正负样本,初步实现水稻纹枯病的检测。然后,通过颜色特征、方向梯度直方图(Histogram of Oriented Gridients,HOG)特征及局部二值模式(Local Binary Patterns,LBP)特征组合成新的特征组,并利用SVM对第一层检测结果进行非目标的精细排除,进一步去除泥点、枯叶、杂草、水滴、反光等噪声,减少误差,并实现对水稻植株纹枯病的自动检出。
3.2 基于Adaboost分类器的无人机寻的
针对同样的训练集病害图像特征值,通过Adaboost算法训练出多个不同的弱分类器,然后对分类器输出的结果设定一个阈值,通过大量的实验,设定该阈值为1,通过该阈值来区分正、负样本。如下式所示:
其中x为样本的数据,hj(x)为对应于第j张病害图像的病害特征值,βj为判定阈值,在本文中确定为1。
基于颜色分量的级联分类器构成设计思路如图2所示。
图2 基于颜色分量的级联分类器构成
本实验过程中存在着数量极为庞大的颜色特征描述值,若通过计算所有的特征來完成识别的过程,其计算量是十分庞大的。本文设计了基于颜色分量的级联分类器,针对彩色图像的3个颜色通道,首先赋予所有样本每个颜色通道相同的权重。然后,分别进行计算,得到样本每个颜色通道分类的错误率。最后,调整并重新分配样本的权重,从而提高错误样本颜色分量分类的权重,实现对错误样本在下一轮训练中的重视程度。多次对样本进行迭代训练后,实现利用Adaboost算法来对每个颜色通道进行弱分类,并通过阈值组合成强分类器,最终解决该问题,
4 结语
通过Adaboost算法的不断迭代运算,首先将彩色图像的3个通道颜色特征值单独拿出来进行分别计算,然后,利用大量的实验确定阈值为1,实现弱分类器的第一次分类,进行过程中,当错误率达到了预想值时,迭代的过程就可以结束了。随后,将Adaboost算法分类出的结果输送给SVM,构建出第二个分类器,通过对多个弱分类器的级联实现无人机对水稻纹枯病病害图片的强分类,最终实现水稻纹枯病病害的精准检出,从而实现无人机对水稻纹枯病病害图片的自动寻的。
本研究使用5个级别测试150个样本,对区分不同危害程度的水稻纹枯病测试了准确率。根据结果可以看出,2级病株中有一株误判,偏大,正确率80%;3级病株有一株误判,偏大,正确率89%;4级中全部都检测无误,正确率100%;5级中有一株误判,偏小,正确率80%。总体来讲,其正确率在可接受范围内。分析发生误判的原因,有以下几点:
(1)在发病初期,如2级病株的植株基部病状太轻,不易检出,且有多个暗绿色斑点,无法分辨是否为噪声,从而产生误判,并导致样本的计算百分比不准确。
(2)在水稻发病的过程中,样本有时并不能很好地反映发病情况,在很大程度上会影响判别效果。
(3)在实时检测中,摄像头需要平行地面且尽可能靠近作物采集病斑,并且从侧面以固定的角度、倾斜方向采集整株高度,采样时因采样角度不对而产生误差。
作者简介:沈美(1978— ),女,青海乐都人,副教授,硕士;研究方向:人工智能,神经网络。
[参考文献]
[1]张心雨.低密度下评估稻飞虱智能识别系统的有效性[D].南京:南京农业大学,2016.
[2]柴阿丽.基于计算机视觉和光谱分析技术的蔬菜叶部病害诊断研究[D].北京:中国农业科学院,2011.
[3]唐晏.基于无人机采集图像的植被识别方法研究[D].成都:成都理工大学,2014.
[4]黄向阳.低密度下评估稻飞虱智能识别系统的有效性[D].南京:南京农业大学,2016.
[5]王晓丽.无人机精准作业决策方法研究[D].北京:中国民航大学,2017.
[6]张松.基于SVM和AdaBoost的多分类算法研究[D].济南:山东师范大学,2019.
[7]任浩,叶亮,李月,等.基于多级SVM分类的语音情感识别算法[J].计算机应用研究,2017(6):1682-1684.
[8]金纯,陈光勇.基于优化的LSTSVM的多模态生理信号情感识别[J].电子技术应用,2018(3):112-116.
[9]刘岩,李幼军,陈萌.基于EMD和SVM的抑郁症静息态脑电信号分类研究[J].山东大学学报(工学版),2017(47):26.
Research and implementation of unmanned aerial vehicle search for crop diseases based on machine vision: taking rice sheath blight as an example
Shen Mei, Yu Xiang
(Information and Intelligent Engineering School, Nantong College of Science and Technology, Nantong 226007, China)
Abstract:In view of the popularization and application of wireless transmission technology, this paper takes unmanned aerial vehicle as the carrier, takes rice sheath blight as an example, through the support vector machine, AdaBoost and other machine learning algorithms, focuses on the research and implementation of the system of agricultural unmanned aerial vehicle. Based on machine learning to automatically find the crop disease image, and makes a deep exploration and functional analysis of the system.
Key words:machine learning; support vector machine; AdaBoost; unmanned aerial vehicle; crop disease; rice sheath blight