赵振中 杨帆 徐彪 葛增瑞 郁亚楠
摘 要:南疆自然条件恶劣,棉花常受枯萎病的侵害。为尽早发现并快速预防棉花枯萎病大面积扩散,基于手机拍照利用深度学习,设计一款识别南疆棉花枯萎病的系统,专门针对南疆棉花枯萎病进行识别。该系统首先通过智能手机对棉花进行图像采集并上传至服务器;然后服务器对图像进行处理,通过构建棉花叶片病害分割模型和棉花叶片病害识别模型对棉花枯萎病进行识别;最后将识别结果显示至用户手机,从而实现棉花枯萎病识别的目的。
关键词:深度学习;南疆;棉花;枯萎病
0引言
南疆位于天山以南、昆仑山以北,多旱少雨,自然条件恶劣[1]。南疆还是有名的棉花产地,每年出产棉花百万吨,棉花生产已成为人们主要的经济来源之一。但是棉花枯萎病的发生会对棉花的生产造成了巨大的损失。为尽早发现并快速预防棉花枯萎病大面积扩散,该系统基于手机拍照利用深度学习识别棉花枯萎病,该技术基于深度学习技术实现棉花枯萎病分类识别。首先,通过手机拍照获取棉花叶部病害图像数据构建数据集,并使用图像旋转与镜像、图像亮度调整和基于生成式对抗网络的方法扩充数据集;其次,结合图像分割算法对棉花叶片进行提取,选用Mask R-CNN模型对正常棉花叶片和病害棉花叶片分别进行叶片提取;最后,实现深度迁移学习算法在棉花叶部病害图像数据集上的分类,并对学习结果进行分析评价。通过构建棉花叶片病害分割模型和棉花叶片病害识别模型,解决棉花叶片病害识别问题,专门针对南疆棉花枯萎病进行监测,以长期达到对南疆棉花枯萎病起到一定的防控作用。
1图像预处理技术
为深入研究棉花叶片病害识别模型,以棉花叶片枯萎病为研究对象,对于棉花叶片提取和棉花叶片识别两个关键问题,从图像预处理、棉花叶片分割和棉花叶片病害识别三部分进行研究。
图像预处理部分首先对棉花叶片病害图采用图像旋转镜像、图像亮度调整和条件式对抗生成网络进行数据增强,使用双线性插值算法进行图像大小的缩放[2];棉花叶片分割部分首先基于迁移学习,在 ImageNet 数据集上对 Mask R-CNN 进行训练,然后在棉花叶片病害数据集上进行微调,标注棉花叶片区域之后,再对叶片区域进行分割,对分割后的结果进行掩码填充操作,从而建立病害区域分割模型;棉花叶片病害识别部分通过对标准的残差网络添加多卷积组合和 SENet 网络[3],构建 Multi-Scale ResNet 网络对棉花叶片病害进行识别,最后以微信小程序作为可视化平台,实现棉花叶片病害识别。
2卷积神经网络的使用
在传统的卷积神经网络中,随着网络深度的不断增加,有两个问题是不可避免的,梯度消失和梯度爆炸。在这种情况下,由于识别率逐渐达到饱和,继续增加网络的深度反而会造成识别率下降,这是由于训练过程中产生的梯度退化问题造成的。AlexNet网络结构虽然解决了梯度消失问题但在小于0的地方会出现神经单元死亡,并且不能复活的情况。VGG网络结构虽然其简单、同构的拓扑结构和增加的深度而广受赞誉,但使用了1.38亿个参数,使得在低资源系统上部署VGG变得非常昂贵和困难。而ResNet利用捷径连接,实现了输入与输出之间的数据叠加。在捷径连接下,网络的参数量和计算复杂度并没有增加,因此ResNet的层数在很深的情况下也可以保持较快的计算速度。ResNet通过增加跨层的连接来解决梯度退化问题,ResNet相对于其他的DCNN所做的优化还有在卷积和激活函数之间使用BN的方法,BN可以加快网络训练,防止网络的梯度爆炸。本项目采用基于的深度迁移学习方法,该方法在进行模型迁移学习时,通过增加网络层数提取图像的高阶统计特征进行分类,以ImageNet数据集作为源域,利用深度残差网络进行基于同构数据下的模型迁移。
3识别方案
由于棉花枯萎病有多种类型症状,对于识别系统的识别方案也应对应识别。通过对棉花枯萎病症状类型的分类研究,得出不同类型症状的颜色特点以及其他特征。棉花枯萎病类型颜色及其特征见下表6-1:
4系統设计
在对系统进行设计时,需要对硬件装置的提供方面和软件技术的支持方面进行设计。其中硬件装置的设计是通过手机完成,手机获得的图像信息可以通过网络直接传输给云服务器,让服务器进行处理。软件设计是通过将手机拍摄的图像传输给服务器后,经过存储、预处理、特征提取和特征分析技术获得有效特征值;再使用数据库的相关技术,将提取后特征值与数据库样本的特征值比对、匹配,如若匹配成功,就将最终结果通过微信小程序输出显示到用户手机,达到棉花枯萎病识别的目的。
8.1硬件设计
用户需配备一台手机,终端通过拍摄棉花数据上传至云服务,接收服务器发来的最终识别结果,最后获得棉花是否患枯萎病的识别信息。硬件设计框架图如下图3-2所示。
8.2软件设计
云服务器通过需求设计出服务器可对手机端传输过来的图像信息进行图像预处理、特征提取以及特征分析的程序,再通过使用数据库,将最后服务器分析出来的样本特征值发送到数据库,对样本特征值进行存储、对比以及匹配,实现对该区域棉花枯萎病的有效识别。
5总结
随着图像识别技术的不断发展和完善,其越来越多的被利用于在农业、医疗、教育、制造等各个方面,图像识别技术在南疆棉花枯萎病应用的特点在于,首先,种植户可以很便捷的对问题植株进行检测,及时发现病情,其次是可以大大缩短病情由发现到扩散的时间,避免因为病情控制不及时造成重大损失,同时该随着智慧农业的发展,该技术未来可以自动的去监测棉花的生长发育过程,及时检测到棉花枯萎病的产生和避免其扩散。
参考文献:
[1] 盖有军,朱明俊.【放眼南疆四地州】南疆之“特”[EB/OL].http://www.xinjiangnet.com.cn/2017/0528/1863935.shtml,2017-05-28.
[2] 郑世茶. 基于机器视觉技术的棉花病害识别[D].江苏大学,2007.
[3] 张建华,孔繁涛,吴建寨,翟治芬,韩书庆,曹姗姗.基于改进VGG卷积神经网络的棉花病害识别模型[J].中国农业大学学报,2018,23(11):161-171.
基金项目:塔里木大学大学生创新创业训练项目(2021120)。
作者简介:赵振中(2000-),男,本科,研究方向为计算机科学与技术。