南亚平,徐运红
(河北工程大学,河北 邯郸 056000)
随着世界人口的增加,提高农作物的质量和产量变得十分迫切。随着以信息技术为基础的现代工具被广泛运用,加快了实现这一目标的进程。然而,相关成绩的取得是以增加作物病虫害的数量和类型为代价。在早期发现植物叶片病变可使农民采用适当的处理方法,精确地调整和把控农作物质量和数量,对农业的智能管理具有重要意义[1]。
现阶段,世界上大部分地区叶片病变需要通过人工实地调查来检测,既耗时费力又容易出错。此外,人工实地勘察要求在第一时间指出受感染的病变类型,专业性极高。随着人工智能技术的迅速发展,可以在病变早期进行诊断,使农民能较早发现和识别出病虫害类型和阶段,从而及时采取预防措施,降低调查人员农业勘察的工作难度,提高农业勘察的效率和准确率[2]。
随着现代农业的发展,迫切需要一个详细的调查技术用于鉴别在各种植物中发现的病虫害,从而更早、更快、更准地对农作物病虫害进行科学预判和干预,从而判断病虫害灾情,采取科学、智能的管理方式,降低植物病虫害的发生概率和导致的风险。
在自动化技术中,基于植物叶片图像的智能处理方法是解决植物疾病诊断的最佳方法。在各种图像处理的基础上,使用基于端到端深度学习的模型成功地解决了常规的图像分类问题,取得了巨大的成功[3]。近年来,深度学习技术在农业中得到了广泛应用,包括识别杂草、分类土地覆被、识别植物类型、计数果实以及检测植物叶片病变等诸多问题[4]。
随着GPU 的广泛使用,各种图像处理应用中使用深度学习技术的比例也极大增加,使得利用深度学习技术智能诊断植物叶片的病虫害类型成为了可能,对智慧农业中的智能农业管理具有重要意义。但是,其重点是使用不同的网络架构,很少关注不同植物的病变。因此基于深度学习的叶片植物病变分类技术的详细综述存在研究空白。
在近期提出的针对各种植物病变的研究中,深入调研基于深度学习技术的可用性及其对农业管理的启示是文章的研究动机。早期的一些工作主要利用图像处理技术来识别植物叶片病变。国外对植物果实和叶片病变进行了另一项调查,主要包括利用传统的特征提取和分类模型。
文章重点介绍了不同的卷积神经网络(CNN)模型,对基于深度学习的方法进行了全面回顾。文章阐述了针对各种蔬菜、水果和杂类植物叶片病变的深度学习技术,概括了近年来提出的用于检测田间感染叶片病虫害程度的深度学习方法,分别从植物类型、数据采集及预处理、方法设计(训练与测试)、评估指标和性能等方面,对不同类型的卷积神经网络方法及其对农业管理的启示进行了分析。
Plant Village 是使用计算机视觉识别植物叶片病变领域中使用最广泛的数据集[5]。该数据集由美国宾夕法尼亚州立大学采集,其收集病虫害和健康作物中收集成千上万的图像,包含来自24 种不同植物的叶图像,分为55 类。大多数研究者使用Plant Village 数据集作为图像源训练、测试和验证数据。然而,这些图像是在不同的光照和背景条件下拍摄的,给研究人员带来了更大的挑战。
使用深度学习技术意味着需要大量数据来训练模型。通常而言,拥有成千上万的训练图像很容易达到高精度。与植物病变识别相关的其他问题相比,收集大量的真实野外数据是一个很大的困难。因此,要使用一些适当的预处理方法丰富图像数据。调研国内外主要农作物病虫害公开数据集,包括数据集规模、来源、用途以及农作物的类型和主要病虫害的种类等,例如农作物种类有大豆、咖啡、大米、豆类、小麦、玉米和其他水果品种等,病虫害类型有赤霉病、白粉病等。此外,调研农作物数据集图像预处理方法。该操作对原始数据集进行了大量的平移、缩放、倒置等扩充方法,从而扩充训练数据集[6]。
通过观察主要的经济作物,确定其病虫害症状下存在的图像特征。构建农作物病虫害的智能诊断模型,从而达到智能诊断农作物的目的,判断农作物是否生病以及生病的类型。
文章采用了一种由预先训练和从零开始训练的CNN 模型组成的方法,识别苹果叶片病变的4 种严重程度。为了节省计算量,通过大规模常规图像数据集Image Net 进行预训练,然后将模型迁移到苹果叶病虫害识别中,具体而言,将VGG16、VGG19、inception -v3和ResNet50 进行微调。将不同的病虫害类型直接当成不同的图像类别,采用分类任务中常用的交叉熵损失函数来进行训练。初始学习率为0.01,优化算法采用随机梯度下降法[7],其识别准确率如表1 所示。
今年,青海油田计划生产66亿立方米天然气,比上年预计增产1.99亿立方米。东坪、尖北气田属于基岩气藏,埋藏深、钻井周期长、产建速度慢、开发难度大。为了弥补今冬明春天然气资源保供区的缺口,青海油田追加了采气三厂产气量,产能建设计划由1.85亿立方米增加至2.35亿立方米,并一改以往产能建设冬休的机制,采取不停工连续生产模式,推进天然气产能建设提速提效,厚实天然气资源根基。
表1 不同网络准确率 单位:%
结果表明,传统机器学习的分类方法仅能取得70%左右的准确率,而试验所验证的深度学习方法普遍可以取得80%以上的病虫害识别准确率,大幅领先于传统的机器学习分类方法。此外,对比深度学习的不同神经网络,VGG16 的准确率略高于90%,是所有模型中准确率最高的,为将来农作物病虫害智能识别模型的设计提供了思路,更加准确地识别病虫害性能意味着更加有利于农业管理人员制订相应的防治措施,从而减少损失。然而,在相同的训练和测试机制下,从头训练的8 层CNN 准确率只有80%。
深度学习技术是图像处理领域的热门话题。通过利用人工智能技术建立智能诊断模型,检测农作物病虫害为农业智能管理提供辅助决策,从而探索病虫害提前干预的措施和方法。利用智能化的管理手段,减少病虫害的发生概率。
近年来,由于深度学习技术在基于图像处理的应用领域具有许多优势,在农业上的应用大大增加。尽管最近有几十种基于深度学习方法识别植物叶片病变,但仍存在一些挑战,比如使用真实世界数据、自动背景消除以及使用手持设备来训练和测试包含数百万个参数的复杂卷积神经网络。大量已发表的研究对Google Net、VGG Net 或Alex Net 等预先训练过的网络的训练数据进行了微调。
研究发现,与从头训练网络的情况相比,基于迁移学习的方法产生了更好的识别精度。这些技术的一些明显优势如下。
1)该方法允许设计基于端到端特性学习的解决方案,从而简化所提出的方法架构。最近在这一领域提出的深度网络对几乎所有类型的植物都有很高的识别精度(一般在90%以上),大幅优于传统的机器学习分类方法。
2)一些研究人员已经将高光谱、热成像和多光谱成像用于识别植物叶片病虫害。目前,高光谱成像在检测应激类型、健康状况、虫害、螨虫和杂草等方面显示出了很有前景的结果,但需要借助传统的机器学习模型。卷积神经网络为所有基于图像处理的应用提供了一个新方向,这些网络可以用于未来的高光谱作物图像,特别是检测早期的病虫害。
3)合理利用新型计算机新型图片数据处理技术,充分运用病虫害数据集。Plant Village 是目前使用计算机视觉识别植物叶片病变领域中使用最广泛的数据集,除此之外还有其他许多公开的数据集,涉及的植物种类包括大豆、咖啡、大米、豆类、小麦、玉米和其他水果,病虫害类型有赤霉病、白粉病等。随着工作的推进,数据集的内容也会逐渐扩大,包含的植物种类和病虫害类型也会更加全面。
可以从以下几个方向监测干预和管理病虫害。
1)利用新型计算机技术,充分运用数据集。运用先进的计算机图片处理技术,提高病虫害甄辨的速度。基于CNN 模型的可用性使开发工作快速和容易,只需修改、再训练最后几层,就可以根据目标应用对给定的网络进行优化,从而节省训练整个神经网络模型的时间,在实际应用中可大幅缩减训练学习时间,为提高农业管理效率提供了技术支撑。
2)提高监测图片的样本容量,国际公开的病虫害数据库是很好的内容借鉴,但可能会存在地域差异,造成病虫害阶段性诊断和分析的差异。当样本实践的内容和样本本身的容量对比越大时,差异度就更加明显,监测更加准确。但是扩大样本数据需要根据自身的需求运用符合国情的病虫害数据库,因此有必要构建和完善我国病虫害的数据库。只有不断完善数据库内容,病虫害数据分析才会更加准确,监管措施才会更加地完善。
3)需要完善调研农作物数据集图像预处理方法。有了大量的数据库后,需要对数据具体分析、提取特征。只有采用合理的方法,才能更快、更准确地提取植物病虫害的特征。可能涉及对原始数据集进行大量的平移、缩放、倒置等扩充方法,因此扩充训练数据集十分必要。
4)运用多种图片检测方法,提高病虫害的诊断准确率。同一植物、不同病虫害类型的生命周期不同,如何将智能识别的病虫害结果用于优化智能化的农业管理,是亟待解决的问题。因此需要能检测和分类病虫害的所有阶段、严重程度的深度学习模型,以便能在早期发现和治愈病变。利用实操图片分析数据,对病虫害的确切时期进行诊断分类,提出针对早、中、晚期不同的诊治方法。充分考虑植物病虫害的特征和影响、当地的经济水平和环境特征,再结合生物防治、化学防治、机械防治等防治措施对病虫害进行干预,从而选择最优防治方案。
通过大量的文献调研和试验验证发现,应用深度学习技术进行植物病虫害识别所面临的一些挑战如下。
1)缺乏大型数据集一直是深度学习方法在植物叶片胁迫识别领域应用的一大障碍。虽然已经公开了包含数千张图片的大型数据集Plant Village 供研究者使用,但是包含真实应用场景、面向不同农作物品种不同病虫害类型的数据集仍然较为缺乏。
2)大多数作者使用了来自公开数据集剪切之后的图像,而来自真实场景的原始图像数据则不可避免地会存在很多噪声。一些研究者使用了来自杂乱背景的图像集,但收集的小数据集也需要经过必要的预处理。因此提出了基于深度学习方法,利用实验室的图像模拟不同光照环境的植物叶片图像,评估不同角度和距离的变化,识别病虫害精度的影响。使用该方法必须对自采集的野外图像进行预处理,以提高图像的编码精度。
3)如何将农作物病虫害智能识别的准确率与农业管理的技术政策相结合是亟待研究的关键问题。同时,在领域专家的帮助下标注收集的数据是具有计算机科学背景的深度学习研究人员面临的另一个问题。
4)植物病害的早期发现是该领域研究的重要方面。在早期阶段发现被感染的植物,使农民能以较低的成本采取纠正措施。相比较而言,采用超广谱的影像识别已被用于这一场景,但使用热传感器和光反射器传感器在地面捕获的区域非常大,使得疾病或感染区域的精确检测也成为一个难题。
根据本调查所查阅的研究论文以及试验分析,列出该领域新研究者的一些未来发展方向,也是未来利用深度学习技术在农业病虫害管理上的可能研究热点。
1)一片叶子在同一时间可以受到多种病虫害的影响。如果寄主已经缺乏营养或已经存在其他非生物病变,寄主会变得更加脆弱。这种多重病虫害的共存现象在现实中很常见,但现在的研究还没有给予过多关注,现有的文献很少讨论这个问题。因此,可以作为未来的研究方向。
2)深度学习网络的性能因作物的不同而具有差异,也会因为病虫害类型的改变而产生变化。如果能搜索一组作物分析其性能,并提供大识别精度的统一深度网络是未来的研究方向。
3)随着深度学习模型的不断改进,研究人员需寻找最优参数。不同的传统优化算法在高维数据上表现不佳。已经训练好的网络和使用集成学习技术来获得最优参数相关问题也是未来的研究方向。
4)充分结合具体的防治措施,对病虫害诊断进行干预。利用图片对病虫害进行分析诊断后,结合复杂的社会环境、当地的经济消费水平以及生物多样性等问题,再充分利用化学防治、生物防治和物理防治的各自特点进行病虫害诊断工作。