李 素, 郭兆春, 王 聪, 陈天恩, 袁志高
(1.北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室,北京 100048;2.国家农业信息化工程技术研究中心,北京 100097)
农作物重大病虫害的实时监测和早期预测是及时、有效地控制其暴发成灾的先决条件之一。传统的病虫害采用肉眼观察或者直接田间定点捕捉的方法,依靠个人经验来预测,有时间滞后性、主观性和极大的不准确性等一系列缺点,不能满足宏观病虫害预测。例如,2008年草地螟2代幼虫在我国的华北、东北再次大规模暴发,发生面积广,危害程度重,持续时间长[1]。
病虫害预测有很长的时间跨度,一般来说要经历经验预测、试验预测、统计预测3个阶段。传统的病虫害预测不仅在信息采集上依赖主观观察,在进行病虫害的预测时往往也是通过经验,导致病虫害预测精确度低下,信息十分滞后,严重阻碍了对病虫害的准确预测,限制了我国农业的发展。
我国作为21世纪的农业大国,对世界农业有着举足轻重的影响。病虫害的治理和预防是我国提高粮食产量的重要途径,因此病虫害的早期预测,采取及时有效的防治措施,减少农业损失,成为目前关注的重要问题。从信息的采集到信息的传递再到信息的处理进行预测,现代技术正在病虫害预测中起着至关重要的作用。
针对传统病虫害预测不准确和时间滞后的缺点,现代病虫害预测技术依赖计算机技术,正在对这些缺点进行改进,使其朝着智能化、精准化的方向发展。现代信息技术从信息的采集到信息的传递,然后到信息的分析,病虫害的预警越来越走向规范化、数据化和标准化。如利用高光谱和低高空遥感技术对病虫害危害程度进行监测[2];利用空气中气流场研究高空气流对迁飞昆虫和病菌孢子的传播作用以及利用物联网等网络信息技术开展数字化预测报告和信息收集与发布[3];利用人工神经网络、粗集理论和数据挖掘技术对病虫害进行预警等。
人工神经(back propagation,简称BP)网络采用误差反向传播算法,适用于非线性模式识别和类型预测的问题。典型的人工神经网络包括输入层、隐含层和输出层3个部分,模仿生物神经网络构造,如图1所示。
人工神经网络层与层之间相互连接,各层之间神经元节点互不联系,相邻层之间通过权连接,进行分布式信息处理。
影响病虫害的因子包括物理因子和环境因子,各个因子之间相互作用,对害虫的影响不是线性关系,因此传统的数理统计方法对模型的训练十分困难。而人工神经网络模拟人脑思维结构,具有很强的自学习、自组织、自适应和容错性等特点,适合非线性问题的处理。例如靳然等以运城市苪城县1980—2006年麦蚜最大虫株率和气象因子为基础,建立BP神经网络来预测2007—2011年麦蚜最大虫株率,平均预测精度为96.09%[4];Klem等以气象参数和土壤温度建造了基于神经网络的白菜茎象鼻虫的病虫害发生预测,准确率达到97%[5];李波等通过使用主成分分析法获得的主分量光谱,结合概率神经网络实现了稻干尖线虫和稻纵卷叶螟的识别,准确率达到95.65%[6]。
虽然人工神经网络在农业病虫害方面起到了一定的作用,但人工神经网络也有一些缺点。例如,在学习过程中该算法收敛速度慢;人工神经网络中隐含层节点数没有明确的方法来确定;采用梯度下降法,人工神经网络易陷入局部最小值,不能找到真正最优解,因此神经网络往往都须要优化,结合其他一些算法来进行。例如,张芳群等以陕西地区1988—2013年玉米螟虫危害为例,利用基于偏最小二乘法回归(PLS)-遗传算法(GA)-神经网络(elman)的组合神经网络算法对病虫害进行预测,5年的预测结果相对误差在 0.066 1%~0.122 2%之间,证明该神经网络精度较高,具有较好的泛化能力[7];曹志勇等建立了基于粒子群算法对神经网络参数优化的混合智能算法的病虫害预警模型,以1980—2007年的稻瘟病为数据建立模型,最大允许误差小于0.001[8]。
神经网络还可以结合一些数学模型来进行应用。例如杨淑香等通过SPSS逐步回归法,建立内蒙古东部地区落叶松毛虫的分布面积、密度与环境的人工BP神经网络模型[9];温芝元等将模糊逻辑与神经网络相结合,建立补偿模糊神经网络脐橙病虫害识别模型[10];谭文学等通过深度学习神经网络并以弹性动量对神经网络进行参数优化,建立了实时预警果树病害和辅助诊断果蔬系统[11];Kouakou等通过光学指纹结合多通道人工神经网络来检测黄瓜花叶病毒[12]。
SVM是建立在统计学习VC维理论和结构风险理论的基础上,适用于小样本、非线性和高维模式,通过一定数量的样本信息在样本模型的精确度和学习能力(识别任意样本)之间取得一个最佳平衡,来取得较好的泛化能力。SVM的基本原理为应用核函数展开定理,把样本空间映射到高维的特征空间,在高维空间中求得一个最优分类面,使得在原来样本空间中的非线性可分问题转化为特征空间的线性可分问题,具体见图2。
SVM问题描述:
假设给定特征空间的数据集Q={(x1,y1),(x2,y2),…,(xn,yn)};其中xi∈Rn,yi∈(+1,-1),i=1,2,…,N;xi为第i个实例(若n>1,则x是多维度,具有多个属性特征,此时xi为向量);yi为xi的类标记,当yi为+1时,xi为正例,当yi为-1时,xi为负例。寻找最优超平面即使得正例反例的隔离边缘最大化,即求函数:
(1)进一步规范体育基金会内部管理,完成体育基金会评估工作,获得评估等级,优先购买政府服务。政府对基金会的资金支持一方面是政府职能转变的需要,另一方面也能有效补充社会对公共服务的需求。目前,政府对基金会的支持已经从直接拨款变为购买项目或公共服务外包,最终形成全社会共同参与、共建共享的发展局面。因此,体育基金会要积极完成评估并获得3A以上评估等级,同等条件下可优先购买政府服务。
式中:yi(w·xi+b)≥1,i=1,2,3,…,n;w为超平面法向量;b为常数;xi为训练集;yi为类别。
当SVM面对线性不可分时,通过使用核函数将非线性样本从低维线性不可分转化成高维特征空间的线性可分,然后在高维特征空间使用线性分析,这样就可以对线性不可分数据样本进行分析。
通常用到的核函数包括以下几种:线性核函数、多项式核函数、高斯核函数、sigmoid核函数。
不同的核函数导致计算量不同,甚至导致计算复杂度大到无法计算。SVM基于结构风险理论,在高特征空间中建立最优分割超平面,使得SVM是基于全局优化的,不会存在陷入局部最小值的问题,并且使得全部样本风险存在一个阈值。
例如杨昊谕等通过基于SVM并结合荧光光谱方法建立的黄瓜病虫害诊断模型,实现了病虫害的迅速检测功能,通过使用平滑法(savitzky-golay,简称SG)+一阶导数变换(FDT)和主成分分析(PCA)法进行数据处理后,使用SVM进行黄瓜病虫害的检测和预警时准确率达到 98.3%[13];Mokhtar等通过SVM不同核函数来识别健康番茄叶片的纹理特征,精度达到99.83%[14];石晶晶等进行了SVM的稻纵卷叶螟危害水稻高光谱遥感识别研究[15]。
SVM也存在一些缺点,例如小训练样本集收敛速度比较慢等,因此一般须要结合其他算法来进行优化。例如马涛等在基于粒子群优化支持向量机(CPSO-SVM)的小麦条锈病预测模型中,运用一种结合混沌系统的粒子群算法来改进SVM模型,克服了收敛速度慢的问题,在小麦条锈病预测中通过25次迭代找到全局最优解,准确预测了5年来条锈病的流行等级,预测精度为83.333%[16];蒋龙泉等研究了基于高清视频图像融合特征的SVM检测方法[17];Rajan等设计了基于SVM的图像处理技术——自动害虫识别技术进行早期病虫害识别和疾病监测[18]。
3S技术是遥感技术(remote sensing,简称RS)、全球定位系统(global position system,简称GPS)和地理信息系统(geographic information system,简称GIS)3种技术的结合。3S技术包括空间技术、信息通信技术、计算机技术和卫星定位等技术,是一门多学科交叉的、对地理空间信息进行采集、处理、通信等操作的技术。
1.3.1 基于GIS的病虫害预测应用 GIS是一种十分重要的空间信息系统,GIS是在计算机硬件、软件系统的支持下,对地球表面有关的地理信息进行数据采集、存储、管理运算等操作,并帮助提供空间问题决策和进行空间数据处理的一个技术系统。GIS是一门综合性的学科,包含地理学、地图学以及遥感和计算机技术,对于地理空间信息的处理能力很强,在区域性病虫害研究中十分广泛。例如,图3通过GIS技术揭示了飞虱种群变化规律。
例如刘小红设计了采用PostgreSQL(对象-关系型)数据库管理系统,以WebGIS(基于互联网的地理信息系统)技术为基础的烟草病虫害诊断预测系统,基本预测了赤星病发生的重灾区主要分布在云南省偏北,中度区分布在东三省偏北及广东地区,轻度分布在山东省区域[20]。赵庆展等基于移动GIS,运用移动GPS定位、离线地图加载、图形绘制等技术,实现了花病虫害信息的快速提取,实现了空间数据与属性数据的聚合存储,提供了病虫害监测、预测服务[21];Garnas等依据GIS在地中海气候区总结了22~43种病虫害对该地区的损害程度并进行了生物防治[22]。
一般来说GIS根据病虫害和收集信息的种类会结合一些算法来实现最后病虫害的预测,如白嫄等根据反距离权重插值法(inverse distance weighted,简称IDW)设计实现了基于GIS的山茱萸病虫害分布预测系统[23];靳光才等设计了以GIS为架构,基于马尔科夫链的棉田朱砂叶螨预警系统,使用克里格插值方法实现大范围的预测,短期预测精确度达到80%[24];潘洁等设计了以B/S(浏览器/服务器模式)为结构的基于高光谱数据与网络GIS应用的森林病虫害检测系统[25];Steere等基于GIS通过非线性克里格方法预测了黄萎病的感染情况[26]。
1.3.2 基于遥感技术的病虫害预测 遥感技术出现在20世纪60年代,结合计算机技术迅速发展起来。它是以电磁波理论为基础,通过各种传感器对目标物体辐射和反射的电磁波进行收集处理最后成像,然后对目标物体进行探测和识别的一种技术。在农业方面的应用有通过遥感影像获取遥感的红外波段和近红外波段的反射率及其组合与作物的叶面积指数,通过卫星传感器记录地球表面信息,识别农作物类型,观测农作物生长情况,避免了手工收集方法费时费力,还会造成破坏等缺点。图4为卫星遥感结合气象数据对小麦白粉病的预测结果。
目前,遥感一般有卫星遥感、高光谱遥感和航空遥感。遥感技术将观测到的数据通过图像处理和识别等技术,成为人们进行植物生长程度、环境因子和病虫害防治的根本依据。遥感一般作为信息的采集而出现,通过信息传递传到后台再进行数据分析。如马慧琴等通过遥感提取到的植被指数、地表温度和影像中各波段的反射率特征,结合Relief算法和泊松相关系数进行筛选,使用相关向量机(relevance vector machine,简称RVM)筛选出的遥感气象特征,进行小麦灌浆期白粉病发生预测模型构建,模型预测总体精度达到84.2%[27];马菁等通过遥感近地高光谱技术对果树枸杞病虫害进行光谱测定[28];李卫正等通过小型无人机遥感技术,实现了病死木位置信息采集[29];Yuan等利用遥感和地理信息系统分析当前模式下的高度复杂的信息环境[30];Liu等用高光谱遥感技术发现了谷物成熟飞虱的最佳密度[31]。
遥感技术也会与其他技术结合来进行数据的采集和分析,如袁琳等基于连续小波分析(continuous wavelet analysis,简称CWA)提出一种全光谱域优化搜索的病虫害区分小波特征选择方法,通过该方法将收集来的数据采用费氏判别线性分析(fluorescence linear discriminant analysis,简称FLAD)和SVM构建模型,建立的病虫害区分模型总体精度达到70%以上[32]。
1.3.3 基于3S技术的病虫害预测 由于RS和GIS都不太成熟,所以RS、GIS通常分开使用。随着这2项技术的逐渐成熟,3S集成技术能更加方便和广泛地应用于环境监测、气候变化和灾害预测等各个方面。3S预测病虫害技术,根据对植物反射光谱的RS影像不同,可以判断植物健康情况和病虫害的动态。GIS对RS收集到的图像进行图像处理,数据分析和专家系统对病虫害发生的程度、发生面积进行预测分析,再通过GPS进行地理位置的精确定位,找出病虫害发生地点。
3S技术的集成应用不仅可以对病虫害进行精确范围的预测,还可以实时对植物健康情况进行监测。例如汪浩然等以3S技术为核心,使用C#、ARC等语言构建病虫害预警系统,应用GIS中的缓冲和叠加分析预测了病虫害的发生范围,并在空间上标示了扩散区域、危害程度和防治技术[33];余笑等基于3S实现了农产品的溯源,对农产品进行了病虫害评估[34];王永生等指出3S在评价农业资源、减少物资投入、防治病虫害方面有显著作用[35];马莉娜指出3S技术在我国精细农业方面将是一个巨大的改革性技术[36]。
物联网是指处于各种环境下的终端和设备,例如智能传感器、移动终端、视频音频监控设备、数控系统和贴有射频技术(radio frequency identification,简称RFID)的各种商品等,通过无线(或有线)短距离(或长距离)通信网络实现互联互通,在互联网环境下,提供在线监测、定位追溯、指挥调度、安全防范和决策支持等一系列的服务。物联网的体系架构见图5。
在病虫害预测方面,通过传感器对植物的生长环境,例如温度、湿度、光照度等不间断地进行检测,实现对农作物的检测和病虫害的有效控制。物联网技术通过传感器、互联网等实现了信息从人与人到物与物的传输转变,大大加强了我国智能化的农业发展。同时物联网技术使得采集的信息不仅从数量上而且在维度上实现了质的飞跃,对于后期预测的准度和精度有十分巨大的作用。
苏一峰等基于物联网的远程小麦病虫害诊断系统总体框架见图6。此外,钟志宏等创建的江西省农作物物联网平台,在培养温室大棚蔬菜时通过摄像头和传感器实现了蔬菜的有效检测、监控和调节,有效减少了病虫害对蔬菜的影响,提高了温室病虫害环境感知和病虫害的预警综合诊断能力[38];张恩迪等基于物联网技术开发的农业虫害智能监控系统,可以自动采集农田环境信息、害虫数量,通过k-means聚类提取害虫数量,用椭圆率区分虫体和杂质,实现了虫害信息的提取和自动防治[39];罗世亮等设计了基于物联网的脐橙园病虫害专家防治系统,实现了脐橙病虫害防治的智能化识别[40];房亚群等基于物联网和智能监控技术,完成了果园自动对靶喷药项目[41];邓晓璐等基于物联网技术实现了寒地玉米大斑病预警系统[42];Fu创建了感知、运输和数据处理的3层结构农业物联网,实现了病虫害预警和快速诊断[43]。
图像处理就是将图像信号转化为数字信号,再通过计算机技术对其进行加工处理的过程。随着技术的发展,在农业方面图像处理技术正在逐渐替代人工识别技术。通过图像处理在机器视觉和计算机视觉中的不断应用,病虫害地智能化识别已经达到很高的准确率,为病虫害预测前期的病虫害识别奠定了坚实的基础,为及时采取措施防治病虫害传播提供了极大的帮助。图像处理技术一般包括3个步骤:
(1)病虫害图像分割。图像分割是图像处理的第1步,是通过将图像分割将图像细分为特征(即图像的结构、颜色、文理等)子区域的过程。在图像分割的过程中实现了特征值提取、构建分类器等。图像分割的经典方法有阈值分割法、边缘检测法、数学形态学法和模糊聚类法等。
(2)病虫害图像特征提取。图像特征提取包括图像的特征描述和提取2个过程,决定了分类的效率和分类的精度。特征描述是指给进行图像分割后的图像某种图像属性,以量性地描述或表示,提取是指计算特征的子集,筛选有用信息给目标空间进行降维,利于目标识别。按照特定属性来提取,主要方法有形态特征提取、颜色特征提取和纹理特征提取。
(3)病虫害图像的分类与识别。以提取的图像特征为基础,建立分类器,通过一系列的算法来进行图像的处理分类,力求达到高精度、稳定、快速的图像分类识别。基于分类规则的不同,有基于形状的分类、基于颜色的分类等多种分类器;根据分类结果的数量,有2类分类器与多类分类器,多类分类器是多种算法或决策的组合,例如BP网络、SVM和模糊聚类法等。
随着图像识别技术的逐步发展,图像处理技术也逐渐被应用在一些其他领域,例如计算机视觉、机器视觉等技术领域,并取得了很好的应用效果。赵瑶池等采用混合高斯模型得到纹理差异图像,使用灰度图像的自动阈值分割法进行分割得到DRLSE演化初始区域,利用改变纹理差异度的边缘停止函数,精准地获取病变区的轮廓,为病虫害预测提供了依据[44];高新浩等基于机器视觉采用最大熵函数对纹理图像进行分析,对玉米病虫害进行区分,进行玉米病虫害的早期预测,分类效率达到99%[45];高雄等提出了基于机器视觉的欧式距离病虫害自动识别检测方法,以颜色特征为基础,准确识别害虫区域和目标农作物,判断病虫害的危害程度[46];Paul等基于机器视觉提出认知系统来自动检测和计数粉虱各个阶段的数量和进行玫瑰早期的疾病检测和防治[47]。
1.6.1 基于粗集理论的病虫害预测 粗集理论是处理模糊和不精确性信息的一种算法。主要思想是利用已知的知识库,将知识理解为对数据的划分,每一个被划分的集合称为概念,将不确定或不精确的知识用已知知识库中的知识来刻画。该理论是建立在分类机制基础上的,它将分类理解为空间上的等价关系,而等价关系构成了对该空间的划分。
粗集理论是根据大量的已有知识,划定信息中的等价关系,再根据各等价关系中的依赖关系将相容信息去除,简化和挖掘隐含关系的理论。粗集理论对信息的整合有很高速度的融合能力和预测能力,对于早期的预测预警技术来说是至关重要的。涂运华等使用粗集消除冗余样本,结合神经网络、不定性原理建立了蔬菜病虫害诊断专家系统,实现了番茄病虫害的有效控制[48]。
1.6.2 基于Android系统的病虫害预测系统 随着无线通信技术的进一步发展,大量针对病虫害预测的专家系统被研发出来,推进了农业信息化的发展。而智能手机的进一步普及和电子商务的快速发展,使移动互联网用户飞速增长。目前移动终端的主流操作系统为Android平台,优点是设备廉价且开放性高,因此基于Android平台的病虫害预测系统大大推进了病虫害预测的发展进程。
基于Android的病虫害预测系统包括人机交互模块和数据处理模块、客户输入农作物和害虫的种类模块、后台数据服务器返回信息模块。田磊等设计了基于Android的机器视觉诊断系统[49];宁宁等设计了基于Android系统的植物病虫害查询系统[50];于辉辉等基于Android手机终端设计了棉花害虫智能诊断系统,实现了实时有效的诊断[51]。
本文主要介绍了现代信息技术在病虫害预测方面的原理与应用。从信息的采集(例如遥感技术)到信息的传递集成(3S等)再到信息的处理(BP、SVM),信息技术正在逐渐渗透进病虫害预测分析的每一个环节,并将它们连接起来,形成一张网络,逐步实现病虫害预测的规范化、标准化。不同的信息技术有不同的领域,针对不同的农作物病虫害和不同的预测环节,采用不同的信息技术。虽然信息技术在病虫害预测方面有很大前景,但是这些技术依旧存在一些问题。主要包括:(1)遥感传感器的种类单一,对于种类繁多、气候条件不同的农作物病虫害信息提取不到位;(2)信息传递速度较慢,对病虫害反应不够灵敏,不能实现精确的病虫害实时预测;(3)整个病虫害预测网络自动化程度不够高,人为参与较多,易产生误差。
随着信息技术的不断发展,病虫害各个环节的衔接必定更加紧密,智能化、自动化水平大大提高,成为病虫害预测的主要力量。