唐伟萍 黄欣 陈泳锨
摘 要:蔗糖作为重要的食用糖和再生能源,在世界糖产业链中占有举足轻重的地位。文章旨在通过设计一个准确、高效的模型来监测甘蔗生长状况,进而有效指导科学培育,这是提高甘蔗产量的重要途径。利用深度学习方法构建甘蔗生长监测模型,以解决传统监测方式存在的问题。通过调研了解蔗糖的重要性及传统的甘蔗生长监测方法,详细分析深度学习在计算机视觉等领域的应用,提出基于卷积神经网络(CNN)的甘蔗生长监测模型架构;设计基于CNN的图像分类模型监测甘蔗生长,并通过试验对比验证模型的有效性。最后总结基于CNN的深度学习模型监测甘蔗生长的有效性,并探讨如何进一步提高甘蔗生长监测的准确性。
关键词:蔗糖;甘蔗生长监测;深度学习;计算机视觉;卷积神经网络
中图分类号:S566.1;S126 文献标志码:A 文章编号:2095-820X(2023)03-0014-06
0 引言
甘蔗是重要的糖料作物和能源作物[1],作为世界上主要的糖源,对于全球食品产业具有重要意义。我国是世界第一蔗糖生产国和消费国,甘蔗糖业在保障我国食糖安全中的地位举足轻重[2],蔗糖产业对促进国民经济发展和保障农村经济稳定具有重要作用,对广西的农业经济和社会发展而言同样意义重大。据统计,2022年广西年甘蔗种植面积超过666666.7 hm2(1000万亩),位居全国第一;蔗糖产量600万t,占全国蔗糖产量一半以上,年产值达到数百亿元。甘蔗的种植、加工和销售形成了完整的产业链,涉及到农业生产、食品加工、糖业、酒业和生物燃料等多个领域,为广西经济发展带来了巨大的贡献。
甘蔗生产受气候变化、病虫害等多种因素的影响,因此甘蔗生长监测尤为重要。我国作为甘蔗生产大国,近年来甘蔗糖量已得到明显提升[3]。甘蔗种植的全程机械化和自动化是产业发展的趋势[4],提高甘蔗糖产量和糖分离不开强化甘蔗生长的监测、及时防治病虫害及科学合理的方式培育和管理甘蔗作物。传统的甘蔗生长监测方法主要依赖于人工观察和定期抽样,效率低、耗时长且容易受人为因素的影响。因此,开发一种高效、准确的甘蔗生长监测方法对于提高甘蔗产量和优化农业资源配置具有重要意义。
1 甘蔗生长监测模型设计的概述
1.1 甘蔗生长监测信息化概述
长期以来,传统的甘蔗生长监测方法主要依赖于人工观察和定期抽样,该方法优点在于直观、易于操作,但存在诸多局限性,如效率低、耗时长、容易受到人为因素影响等,很难保证结果的准确可靠。同时,人工监测方式劳动强度大且成本高,难以实现对大规模甘蔗种植区域的实时监测,限制了其在现代农业生产中的应用。
近年来,遥感技术的发展为甘蔗生长监测提供了新的手段。通常使用光学和SAR卫星数据监测甘蔗生育状况、病虫害发生情况及应对措施效果。这些方法可定量化和客观化地获取作物生育参数信息,但也面临一定的问题,比如光学数据容易受天气影响,其中云层覆盖会极大降低监测精度;SAR数据分辨率有限,难以精确提取甘蔗生育参数;卫星数据存在时滞性,精度较高的监测,图像通常难以及时获取。
1.2 深度学习技术
深度学习是通过神经网络的学习方法对数据进行有效处理分析。深度学习模型通过大量的训练数据来学习数据的规律与特征,还可通过反向传播算法来调整网络参数,从而提升模型的准确性和泛化能力。近年来,深度学习在计算机视觉和自然语言处理等领域取得了重要的成果。在计算机视觉领域,深度学习模型可实现图像分类、物体检测、语义分割等任务,已经成为了许多实际应用的核心技术。在自然语言处理领域,深度学习模型可实现文本分类、情感分析和机器翻译等任务,为人工智能技术的发展提供了重要支持。
随着计算能力的提高和大数据的汇集,深度学习模型已经超过人类在图像分類比赛中的识别准确率,著名的深度学习模型如LeNet[5]、AlexNet[6]、VGG[7]、ResNet8]、Inception[9]等相继提出,有效推动了机器视觉的发展。卷积神经网络(Convolutional neural networks,CNN)是一种深度学习模型,能有效地进行图像分类和物体检测等任务。2012年Alex Krizhevsky等提出了AlexNet模型,利用CNN进行图像分类和物体检测,在ImageNet数据集上测试取得了显著的结果[10],标志着深度学习在计算机视觉领域的崛起。除CNN之外,目标检测和语义分割也是深度学习在计算机视觉领域的重要应用。目标检测是计算机视觉中的一个重要任务,可识别图像中物体并确定其位置。深度学习在目标检测领域的应用主要有2个重要的发展方向:一是Faster R-CNN,一种基于区域提取的目标检测框架,能在准确率和速度之间取得良好的平衡[11];二是YOLO(You only look once),一种端到端的目标检测模型,可在较短时间内实现高精度的目标检测[12]。语义分割任务旨在将图像中的每个像素进行分类,从而实现对图像的完全理解。深度学习在语义分割领域的应用主要有2种方法:一是基于CNN的全卷积网络(Fully convolutional networks,FCNs),可对整个图像进行像素级的分类[13];二是基于编码器—解码器(Encoder-Decoder)[14]结构的模型,可对图像进行分层解码,从而实现更加准确的语义分割。
深度学习模型采用CNN能自动学习数据的特征并进行分类或识别,但也存在一定的局限性。采用传感器技术的方法受到传感器的精度和数量限制,同时需要进行复杂的数据处理和分析。采用图像处理技术的方法需要高质量的甘蔗图像,且对于甘蔗生长过程中的其他因素(气候、土壤等)的影响不够敏感。
1.3 基于深度学习的农作物生长监测研究
深度学习在农业上的应用前景非常广阔,近年来在农业方面取得了不少的成就[15],其中计算机视觉技术在农业应用中最广泛[16],涵盖农业生产的各方面。如帮助农民进行农业生产管理,通过识别农田中的作物种植情况,预测作物的生长趋势等,此外,深度学习还可帮助农民优化农业生产的各环节,从而提高整个农业生产系统的效率和质量,为基于深度学习的甘蔗生长监测模型提供了有力的技术基础。
随着深度学习技术的发展,越来越多的研究者开始关注基于深度学习的农作物生长监测。通过利用卫星遥感图像、无人机航拍图像等数据,设计多种基于深度学习的农作物生长监测模型,运用于预测农作物生长、检测病虫害等方面。深度学习对甘蔗生长检测模型发展的影响主要包含2个方面:(1)深度学习模型可利用其强大的特征提取和分类能力,对甘蔗生长过程中的图像进行准确的分类和检测,从而提高甘蔗生长检测模型的准确率;(2)深度学习模型可实现对甘蔗生长过程中的图像进行自动化检测,从而极大减少人工操作的时间和成本,并实现实时监测,及时发现甘蔗生长过程中的问题。
但现阶段针对甘蔗的深度学习监测模型研究仍相对较少,因此文章提出建立一种使用深度学习方法自动监测和分类甘蔗生长图像的方法,以实现更加准确、高效的生育监测。构建基于CNN的深度学习模型,采用甘蔗生长期的高光谱图像作为模型的训练和测试数据,建立甘蔗生长阶段分类模型,从而达到监测甘蔗生长动态的目的,以提高甘蔗生产效率并为农业生产提供科学依据。
2 甘蔗生长监测模型设计方法
本研究提出的甘蔗生长监测模型,能及时发现并解决可能影响生长效率的问题,指导农民在合适的时间和地点进行灌溉和施肥,分析生长环境和甘蔗生长状态的变化,及早发现病虫害的存在并预测其发展趋势,提前采取相应的防治措施,帮助农民做出科学合理的决策,从而提高甘蔗的產量、质量和农业可持续发展水平。
2.1 总体思路
采集甘蔗从萌发期到成熟期不同生育阶段的高光谱图像作为模型的训练集。采用基于CNN的模型对这些图像进行分类训练,建立甘蔗生育分类模型。将新采集的待测图像输入模型,模型可判断图像属于哪个生育阶段,从而实现对甘蔗生长的监测。
2.2 数据获取与预处理
为了训练和验证甘蔗生长监测模型,首先需要获取大量的甘蔗生长图像数据。本研究将利用无人机航拍图像作为数据来源,并对数据进行预处理,包括图像裁剪、缩放和旋转等操作,以增强模型的泛化能力。同时采集甘蔗的生长数据,包括温度、湿度和光照等环境因素及甘蔗的生长状态。最后将这些数据划分为训练集和测试集,其中训练集占总数据量的80%,测试集占20%。在数据预处理阶段,对数据进行归一化处理,将所有数据缩放到0~1,以便于模型的训练和预测。
2.3 模型架构
采用CNN作为基础架构,设计甘蔗生长监测模型。CNN是一类用于图像识别和分类的深层神经网络,其包括输入层、卷积层、池化层、全连接层和输出层。卷积层采用卷积核对输入数据进行特征抽取;池化层用于进一步提取图像的空间信息;全连接层对抽取的特征进行分类或回归。CNN具有强大的图像特征提取能力,能有效地捕捉甘蔗生长过程的关键信息。具体而言,模型将包括多个卷积层、池化层和全连接层等组件,以实现对甘蔗生长状态的自动识别和预测。
如图1所示,甘蔗生长监测模型包括以下7层:(1)输入层。输入甘蔗生长的图片数据和时间序列数据。(2)卷积层。用于提取图像特征,包括多个卷积核和激活函数。(3)池化层。用于降低特征图的维度和大小,减少参数数量。(4)LSTM层。用于处理时间序列数据,捕捉序列中的时序信息。(5)GRU层。用于处理时间序列数据,与LSTM相似,但计算复杂度更小。(6)全连接层。用于将卷积和时序的特征进行融合和分类。(7)输出层。输出甘蔗生长状态的预测结果。
2.4 训练与优化
在获取并预处理数据后,将使用随机梯度下降(Stochastic gradient descent,SGD)等优化算法对模型进行训练。SGD算法的迭代更新过程如下:
Step 1:随机初始化模型参数;
Step 2:对每个训练样本作如下工作:(1)计算损失函数关于参数的梯度,(2)根据学习率和梯度方向更新模型参数。
Step 3:是否达到最大迭代次数或损失函数收敛。是则停止,否则重复执行Step 2。
在训练过程中,模型将根据损失函数的梯度信息不断调整参数,以提高对甘蔗生长状态的预测准确性。
此外,为防止过拟合现象,还采用正则化(Regularization)和dropout等技术对模型进行优化,帮助提高模型的泛化能力,并在处理复杂数据集时减少过拟合问题的发生。
3 甘蔗生长检测试验与评估
3.1 试验设置
为评估甘蔗生长监测模型的性能而进行多组试验。试验数据将分为训练集、验证集和测试集,用于模型的训练、参数调整和评估。模型包括4个模块:输入模块、特征提取模块、深度学习模块和输出模块(图2)。试验步骤如下:
Step 1:将采集到的萌发期到成熟期不同生育阶段的高光谱图像作为模型的训练集,结合时间序列数据作为模型的训练数据。
Step 2:对高光谱图像使用主成分分析(PCA)降维,将降维后的数据作为特征提取模块的输入。
Step 3:将特征提取后的数据和甘蔗生长周期数据作为模型训练数据集,进行模型的训练。
Step 4:使用训练后的模型对测试集数据进行预测,从而得到甘蔗生长周期预测结果。
通过将样本分为5个子集,进行5折交叉验证,每次选择其中一折作为验证集,其余的折作为训练集。重复5次,每次使用不同的验证集,最后将5次评估结果进行平均,得到模型的性能评估。
將训练的Epoch设为200轮,随着训练次数的增加,该模型的边界损失、目标损失、分类精度和召回率如图3所示,通过该图可见,在训练150轮后,模型开始逐渐收敛,精度在95%以上。训练出来的模型可对甘蔗的生长周期做出判断,分别为萌芽期、幼苗期、分蘖期、伸长期和成熟期。农场主更具甘蔗不同的生长周期做出合理的决策,从而提高甘蔗作物产量。
3.2 试验结果
为了验证所提出的深度学习模型相较于其他方法的优势,将本研究提出的模型与1D-CNN、2D-CNN和ResNet进行对比。所提出方法与其他3种方法的算法准确率,试验对比如图4所示。通过试验发现,文章所构建的深度学习模型通过结合ResNet和2D-CNN,在提升分类精度的同时,减少了模型的复杂度,实现较高精度地分类甘蔗生育阶段。相对于2D-CNN和ResNet,该模型在测试集上精度提升幅度分别为5.1%和2.4%。同时将训练好的甘蔗生长监测模型应用于实际场景中,对甘蔗的生长状态进行了预测,结果表明,该模型具有较高的准确率,能有效监测和判断甘蔗的生长阶段,为科学培育甘蔗提供了重要依据。
4 结语
本研究基于分析蔗糖的重要性及传统监测方法的不足,提出利用深度学习自动监测和分类甘蔗生长图像的方法,构建了基于CNN的深度学习模型,并进行验证其监测甘蔗生长的有效性。就进一步提升深度学习模型的能力,提出以下几点建议:(1)采用更大规模和多样化的数据集训练深度学习模型,提高模型的泛化能力。可结合更长时间跨度的甘蔗生育数据,同时加入不同品种、不同区域等数据进行训练。(2)采用更深和复杂的网络架构,如DenseNet等[17],提高模型的特征学习能力,也可在原模型基础上加入注意力机制或记忆机制,进一步优化模型。(3)将深度学习模型与时间序列模型或推荐系统相结合,实现对甘蔗全生育周期的精准监测和预警。如利用广西某地区甘蔗历史生育数据预测生育趋势,一旦发现异常情况及时发出预警。(4)将深度学习模型部署至终端设备,实现实时监测。通过边缘计算的方式,将模型运行在现场的终端设备上,可减少数据传输和提高监测响应速度。(5)探索将深度学习与遥感监测相结合,发挥两者优势。深度学习模型可高精度提取生育参数,而遥感可定期监测较大范围内甘蔗生长状况,结合使用能实现对更加广泛区域内甘蔗高效和精准监测。
综上所述,本研究构建的深度学习模型为高效和精准监测甘蔗生长提供了可能。模型具有较高的准确率和精确度,能有效地监测甘蔗的生长状态,为甘蔗生长管理和决策提供了参考依据。今后不断改进模型的性能,将其应用于更广泛的农业领域中,以提高作物生产的效率和质量。
参考文献
[1] 杨婷, 沈石妍, 王智能,等. 100份甘蔗种质资源营养品质分析及评价[J]. 热带作物学报,2023,44(3):484-493.
[2] 张华, 罗俊, 袁照年,等. 甘蔗机械化种植的农艺技术分析[J]. 中国农机化学报,2013,34(1):78-81.
[3] 冯丽钢. 农艺技术在甘蔗机械化种植中的应用[J]. 广西农业机械化,2023(1):5-7.
[4] 凡云雷, 周德强, 邓干然, 等. 基于机器视觉的甘蔗切种装备设计与试验[J]. 农机化研究,2021,43(5):55-60.
[5] LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Procee-dings of the IEEE,1998,86(11):2278-2324.
[6] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[J]. Communications of the ACM,2017,60(6):84-90.
[7] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[C]//Computational and Biological Learning Society. International Conference on Learning Representations,2015. doi:10.48550/arXiv.1409.1556.
[8] He K M, Zhang X Y, Ren S Q, et al. Deep residual learning for image recognition[C]//IEEE. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016. doi:10.1109/CVPR.2016.90.
[9] Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the inception architecture for computer vision[C]//IEEE. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016. doi:10.1109/CVPR. 2016.308.
[10] Ballester P, Araú R M. On the performance of GoogLeNet and AlexNet applied to ketches[C]//AAAI. AAAI'16: Proceedings of the Thirtieth AAAI Confe-rence on Artificial Intelligence,2016:1124-1128.
[11] Ren S Q, He K M, Girshick R, et al. Faster R-CNN: Towards real-time object detection with region propo-sal networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2017,39(6):1137-1149.
[12] Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, real-time object detection[C]//IEEE. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016. doi:10.1109/CVPR. 2016.91.
[13] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//IEEE. IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2015),2015. doi:10.1109/TPAMI.2016. 2572683.
[14] Badrinarayanan V, Kendall A, Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(12):2481-2495.
[15] 徐衍向,张敬智,兰玉彬,等. 基于红外热成像和机器学习的作物早期病害识别研究进展[J]. 中国农机化学报,2023,44(5):188-197.
[16] 边柯橙,杨海军,路永华. 深度学习在农业病虫害检测识别中的应用综述[J]. 软件导刊,2021,20(3):26-33.
[17] Huang G, Liu Z, van der Maaten L, et al. Densely connected convolutional networks[C]//IEEE. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2017:751-759.
(責任编辑 邓慧灵)