梁鑫婕,李卫东,孟凡谦,张海啸,李志伟,秦丹阳
(1.河南工业大学信息科学与工程学院,河南 郑州 450001;2.中国海洋大学海洋技术学院,山东 青岛 266000)
土壤水分的测量对于维持作物的正常生长以及提高作物的经济效益具有重大意义,以往传统的对于土壤水分进行预测的方法是根据经验公式进行计算,其参数是固定的,不具备实时性的特点,无法满足对土壤水分含量的动态预测,随着科技快速发展和我国对农业的结构化调整,对土壤水分预测的动态实时性要求体现出来。因此,通过实现对土壤水分的动态预测进一步实现对作物的科学供水,对实现精准农业具有重要意义[1-10]。
本研究使用爬虫程序从中国天气网获取2018年10月1日—2019年7月10日的历史气象数据,通过土壤墒情检测仪获取2018年10月1日—2019年7月10日期间的相关土壤数据,将土壤数据及气象数据合并作为本研究所使用的实验数据。由于以往研究者对于相关实验的研究表明,受气象因素影响的主要为土壤的地表表面含水量,因此,课题组不再研究地表以下的土壤含水量,仅研究地表含水量,将两部分数据结合整理后总数据量为6 796条,部分数据如表1所示。
对原始数据进行预处理,为本研究中用到的神经网络预测模型构建训练数据集,对于数据中存在的部分缺失值进行补零替换,使用MinMaxScaler函数对补零后的数据进行归一化处理,特性范围为0~1。从总数据中分离出300条作为本实验的测试集,对于获得的全体数据进行归一化处理,有效保留了数据的周期和范围信息。数据预处理后的部分数据如表2所示。
表2 预处理结果数据示例表
BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,基本BP算法包含前向传播和误差的反向传播这两个过程。计算误差按输入到输出的方向进行前向传播,调整权值和阈值则是反向传播。BP神经网络结构图如图1所示。
图1 BP神经网络结构图
将收集的处理后的训练数据动态地传入BP神经网络模型中,不断优化权重文件参数,根据上一时段的传感器实测土壤含水量数据输入预测程序,就可实现基于BP网络模型的土壤含水量动态预测。
循环神经网络(recurrent neural network)的基本架构包含输入层、输出层和隐含层。循环神经网络(RNN)是传统前馈神经网络的一个变种,引入了环状结构,在神经元和自身之间建立连接,使得前一时序的信息可存储并影响下一步网络输出。RNN挖掘数据中的时序信息以及语义信息的深度表达能力被充分利用,并在语音识别、语言模型、机器翻译以及时序分析等方面实现了突破。本研究将此模型用于在时间上动态地预测土壤含水量。循环神经网络会记忆之前的信息,并利用之前的信息影响后面结点的输出。RNN网络结构图如图2所示。
图2 RNN网络结构图
本研究中土壤含水量预测模型使用均方根误差(RMSE)、预测准确率以及可决系数R2评估模型优劣。均方根误差公式如下:
式中,n表示测量次数,di为一组测量值与真值的偏差。
传统的土壤含水量预测模型是根据以往的测量数据进行公式推导,主要使用经验预测公式计算,参数固定。如图3所示,是选取部分真实值和预测值进行对比所得到的传统土壤水分预测结果示例图。由图3可以看出传统的对于土壤水分的预测方法与实际值存在一定的偏差。
图3 传统土壤水分预测结果示例图
课题组使用BP神经网络构建不同小时尺度的土壤含水量预测模型,分别建立1 h和4 h预测模型用于检验不同模型之间的差异。对训练组数据进行训练得到权重文件,预测未来1 h和4 h土壤含水量,部分预测数据与实际值如表3所示。
表3 BP神经网络预测数据表
由上表可以看出随时间尺度的增加,BP神经网络预测模型的预测精度有所降低,图4为模型拟合过程。图4(a)为1 h模型的拟合过程,图4(b)为4 h模型的拟合过程。
图4 BP模型训练图
本研究使用RNN建立不同的小时尺度土壤含水量预测模型,分别建立1 h、2 h、3 h、4 h预测模型,对不同模型的结果进行详细分析,部分测试结果数据如表4所示。
表4 RNN预测结果示例表
各模型训练过程图如图5所示,图中(a)、(b)、(c)、(d)分别为1 h、2 h、3 h、4 h预测模型的训练过程。各模型预测评估结果如表5所示,由表5可以看出使用传统公式法对土壤含水量进行预测的准确率仅为54.3%,均方根误差为5.548,可决系数仅为0.023,表明数据离散程度较高。而且传统土壤水分含量预测公式为逐日递推公式,公式鲁棒性差,预测出来的数据结果不具备可靠性。
图5 RNN模型训练图
表5 预测结果评估表
相较传统预测公式方法,BP神经网络预测模型可根据学习过程中动态输入的影响因子预测土壤的含水量,对后1 h土壤含水量情况进行精确预测,结果离散程度大幅降低,模型带来的优化效果显著,可决系数由原来的0.023提升至0.926。但是此模型在增加预测的时间间隔后数据准确率有明显下降,由原来的96.5%下降至95.9%,均方根误差由原来的0.328升高至0.891,可决系数由0.926降至0.499,降低0.427。
相较于BP神经网络模型,RNN土壤含水量预测模型的离散程度更低,RMSE降低至0.306,真实数据与预测数据的误差较小,可决系数升高至0.941,易得RNN模型对于土壤含水量的动态预测具有更好的效果。且RNN对于不同时间尺度的预测都保持较高的准确率,均在96%以上。本研究可以得出随着预测时间尺度的增加,BP神经网络和RNN模型预测数据的离散程度及相似程度均有所下降,RNN动态预测模型对比BP神经网络算法有更大的优势,RMSE上升幅度仅为0.235,R2降低0.067,RNN模型预测得到的数据具有更高的可信度。
在当代中国科技日益创新和农业快速发展、国家大力推进供给侧结构改革的大形势下,精准农业成为我国发展的目标,把科学技术应用到农业发展上来,正是国家政策的要求。农业生产过程中对于水资源科学管理的要求日益增长,面对世界上淡水资源紧缺的问题,研究如何节约用水,把每一滴水用到该用的地方去对于保护水资源有重大意义。如今,随着深度学习神经网络的快速发展,课题组根据实际数据对提出的两种土壤水分动态预测模型进行研究,结果表明RNN动态预测模型具有较高的准确率。