张建华,陈申宽,张晓振,韩应欣,姜娇阳
(扎兰屯职业学院,内蒙古 呼伦贝尔 162650)
随着农业生产方式的不断发展和进步,对于农作物种植过程中的病虫害防治也提出了更高要求。目前,我国已经建立了较为完善的植物病理诊断系统以及相关检测方法体系,但是由于受到传统人工操作方式影响,导致部分植物病害难以精准识别,而通过运用智能机器学习算法识别植物叶片病害可以有效提升其应用效率。
目前常用于植物病害识别的方法主要有人工神经网络(ANN)和支持向量机(SVM)等。
人工神经网络(ANN)是将大量的样本输入到一个神经网络系统中,通过不断优化训练样本集使模型能更好地适应环境变化。
支持向量机(SVM)是利用大数据挖掘出与目标相关的信息并从中提取出有用特征,然后根据这些特征建立相应的预测模型,从而实现对病害发生规律的分析。由于不同种类的病原菌具有一定差异性,导致其在疾病诊断方面存在较大的差别,因此针对这种情况,相关学者开始尝试使用多种不同的检测方式来提高检测结果的精确度,卷积神经网络便是其中之一。
该算法需要构建一个全新的图像识别框架,用以处理多个类别的样本数据。而且每一次迭代都会将原始数据作为基础进行重新编码,以保证分类器可以获得较好的性能,此外还有其他几种常见的分类方法,如支持向量机和决策树等也被广泛运用于植物病害的诊断工作当中[1]。
目前常用于图像处理领域的深度学习模型主要有卷积神经网络(CNN)和循环神经网络(RNN)等,其中卷积神经网是最为常见的方法。该方法通过对大量数据进行训练来获得一个高维特征图[2],然后利用这个特征图去预测未知样本,从而实现对图像的分类。由于CNN 可以将输入层和隐含层之间建立起联系,所以其能够更好地处理非线性问题,而RNN 具有很好的泛化能力且不需要预先知道每一层的输出值,因此被广泛应用于各种复杂场景下的机器学习任务。近年来,随着计算机技术以及互联网络的发展,人们开始尝试使用其他类型的网络结构去代替传统的卷积神经网络结构,例如LSTM、SVM 等[3]。然而这些网络结构并没有得到普遍认可,因为目前还没有任何一种网络结构能够达到完全替代现有的LSTM-ANN-GRU(Long Shortest Memory)网络结构的程度。为了解决这一问题,一些专家提出了许多新的方法来提取图像的深层次信息,其中最常用的是深度学习方法,主要通过构建多层前馈网络从而使得模型具备更强的泛化性能,但是该方法存在着训练速度慢、计算效率低等缺点[4],具体见图1。
图1 基于卷积神经网络的故障预警过程
随着计算机技术和大数据分析技术的不断发展,越来越多的学者开始将机器学习与其他领域相结合。其中最典型也是应用较广泛的就是深度学习算法,通过对海量的原始数据集进行训练来实现对大样本数据的高效处理,从而提高预测精度并且减少人工干预所带来的误差,使得该类方法能够更好地适应于复杂环境下多类别、多尺度的特征分析问题[5]。
有些学者提出了基于迁移学习的分类模型,即根据输入图像的空间结构信息构建一个包含大量神经元的多层感知器网络,然后利用这个网络提取出每一层神经元之间的连接关系,再用这些连接关系建立一个分类模型用于后续的分类工作,最后利用该分类模型得到最终的分类结果[6]。
目前常用于病害检测的算法主要有2 种。第1 种是传统的机器学习方法(ANN 和RNN 等),通过对输入图像进行预处理后得到一个二维或三维空间上的特征图;第2 种则是神经网络模型,可以根据训练数据来预测出样本之间相似性的强弱及其分布情况。其中,第1 种算法利用了大量的原始图像作为基础特征集对其进行处理;而第2 种算法则将所有的图像都看成一系列由许多卷积核组成的线性组合。这2 种方法均能够有效地提取出图像中的信息并且具有较高的泛化性能。但无论哪种分类器都存在着一定的局限性,即不能准确地描述复杂的问题,因此文章针对上述2 类网络结构分别设计了相应的改进策略以提高其应用效果。目前有以下几种机器学习算法:一是支持向量回归,二是随机森林,三是决策树,四是支持向量机。其中,支持向量回归和随机森林主要是对原始数据集进行预处理;决策树和支持向量机则利用分类器来完成分类任务。通过构建一个包含多棵树和若干个节点构成的分类模型,然后根据每棵树的不同属性以及这些树之间相互作用、关系等建立一棵完整的分类树来实现对样本数据的预测与分类。
目前,常用的机器视觉系统有卷积神经网络和长短期记忆网络等。卷积神经网络是一种多层感知器结构,具有较好的非线性映射能力,该方法能够通过对输入图像进行预处理来获取目标区域的局部特征。例如,将输入图像进行灰度化处理后,再利用高斯滤波器去除噪声。但是这种预处理过程会使得输出图像出现过拟合现象,从而影响到后续的预测精度与准确性。为了提高模型的泛化性能,通常需要多次重复迭代训练,并采用多个不同类别的样本来构建模型[7]。
目前,针对上述方法的缺陷,有学者提出了一种基于卷积神经网络(CNN)和支持向量机(SVM)的植物病害识别系统。该方法通过对输入图像进行预处理,提取出特征向量,并将其与疾病诊断相关联,再使用训练好的模型来预测出最终的结果。同时,还可以利用这个网络来对不同类型的病斑进行分类。但是文章认为由于数据集大小以及所需样本数量等因素的限制,该系统只能适用于小规模的病害检测,而且也只有少数几种常见病害能够被正确地检测到。此外,该系统对光照条件要求比较严格,因此不能很大程度上提高检测器的准确性。另外,该系统需要大量的样本作为训练样本,所以很难实现大规模的物体检测[8]。
人工神经网络是一种模拟生物大脑结构和功能的计算机模型,通过对输入数据的非线性映射,将大量神经元连接起来形成复杂的非线性系统并实现信息传递与处理。目前,人工神经网络已经被广泛应用于图像处理、模式识别等领域。相关学者提出了一种新的卷积神经网络用以提取图像的纹理特征,该算法先利用深度学习方法从原始图片中获取每个像素点的灰度值,然后根据灰度值构建一个3 层的多层前馈网络结构来预测目标区域的颜色分布情况,最后使用多尺度融合的方式将3 层网络连接成更加精细的三维结构,以便对其进行分类或回归分析。相关学者采用CNN 作为分类器对不同类型的植物病害进行检测,先用CNN 对不同种类的植物病原菌进行训练,之后再用RNN-SVM 算法对其进行分类。结果表明,所提的模型能够很好地处理高维和低维数据集上的问题,并且具有较高的准确性和置信度(均方误差),而且可以有效降低过拟合现象。此外,由于LSTM 是一种无监督的循环神经网络,所以相较于其他传统的机器学习模型拥有更大的泛化能力以及更好的鲁棒性。
卷积神经网络是一种多层前馈型非线性映射模型,通过将输入图像与输出图像之间的关系用二维数组表示,然后对每个像素点进行卷积运算来提取其特征向量,最后再利用反向传播算法,从而实现目标函数最大化。卷积神经网络可以分为2 类:全连接层和部分连接层。其中全连接层又可进一步细分为3 类:第1 类是无监督学习方法,第2 类是有监督学习方法,第3 类是半监督学习方法。由于不同类型的分类器所需的训练样本不一样,因此需要选择合适的训练集来获得最佳的分类结果。目前常用的卷积神经网络主要包括SVM、KNN 等。其中最为经典也被广泛使用的是Resnet 50,该网络能够有效地处理大样本数据,并且具有较好的泛化性能以及鲁棒性。
卷积神经网络是将输入数据映射到一个二维矩阵上并对其做归一化处理后再进行运算得到输出结果。该方法具有结构简单且计算速度快等特点。相关学者引用了一种新的图像分割算法来实现对不同种类害虫的检测和分类。需要使用卷积神经网络提取出图像中的每个像素点所对应的颜色信息,然后通过特征提取模块(FPNs)对这些特征向量进行降维操作以获得更加准确的类别标签。相关学者利用卷积神经网络建立了一个包含3×3 层的卷积神经网络模型,用于区分玉米螟与棉铃虫两种昆虫的差异。相关学者用CNN 作为框架结构来构建卷形编码器。还有其他学者采用深度学习模型来提高模型的泛化能力。
迁移学习是一种通过对原始数据集中的特征向量进行降维处理来提高分类精度的方法。该类方法需要将原始数据集转换为低维空间并构建相应的模型,然后利用这类模型预测未知样本的分布情况,从而实现高精度的分类任务。
迁移学习是一种将多个不同来源和处理方式的原始数据集通过某种机制结合到同一个目标上的新一代机器学习方法。该方法主要有以下几点:一是对输入样本进行预处理,二是利用训练好的模型对其分类,三是用测试结果验证模型的有效性。其中,前2 点为基础,最后1 点则需要根据实际情况选择合适的参数来实现。由于不同种类的病菌具有差异化特征,因此文章采用了多种不同的网络结构来构建模型。
随着科技的进步和社会经济水平的提高,人们越来越重视信息技术在农业生产过程中的作用。目前,对于人工智能在植物叶片病虫害识别方面还存在一些不足之处。一方面,主要是受到传统人工经验和知识的影响,导致其无法准确地判断病害类型。另一方面,由于缺少相应的理论基础,使得其不能有效预测未来可能出现的问题,从而造成了一定程度上的误判。为了解决这些问题,需要进一步完善相关的理论体系,并加强对人工智能技术应用于植物叶片病虫害识别领域的研究与实践,以便更好地推动我国农业现代化建设进程。