基于1D CNN-GRU的日光温室温度预测模型研究

2023-08-22 06:56:36雷文晔卢有琦魏子朝刘行行高茂盛
农业机械学报 2023年8期
关键词:土壤温度日光温室温室

胡 瑾 雷文晔 卢有琦 魏子朝 刘行行 高茂盛

(1.西北农林科技大学机械与电子工程学院, 陕西杨凌 712100; 2.农业农村部农业物联网重点实验室, 陕西杨凌 712100;3.陕西省农业信息感知与智能服务重点实验室,陕西杨凌 712100; 4.杨凌高新农业气象技术联合研示中心, 陕西杨凌 712100)

0 引言

温度是影响日光温室内农作物产量和品质的重要参数之一,其过高或过低均会对农作物生长发育产生危害[1-2]。随着设施农业不断发展,日光温室已成为设施农业的重要组成部分,对我国经济发展发挥着显著作用。温度调控是日光温室环境调控的重要手段[3],但温室温度不仅是具有时变性、非线性、周期性[4]等特征的连续时间序列,还与温室内外多种环境因子存在复杂的耦合关系。目前,温室的生产调控大多依靠生产者相关经验或通过短时预测模型进行调控决策[5],这种方法会造成反馈控制存在滞后性,影响作物生长。研究证明,提前预测温度并进行提前的有效控制,对日光温室的增产增效具有重要意义[6]。因此,融合温室内外多环境因子构建温室温度长期预测模型,是日光温室温度精准高效控制的重要前提。

目前,国内外学者对温室温度建模的方法可分为基于能量和质量平衡的机理模型和基于数据驱动的非机理模型。机理模型具有可解释性强及外推性良好等优点,但其参数难以获取、边界条件变化程度高的问题导致其在长时精准预测中难以应用。随着现代信息数据的采集越来越容易,基于数据驱动的非机理模型因其具有精度较高、泛化能力强和参数易于获取的特点,被广泛应用于温室温度预测领域。现有数据驱动建模方式可分为统计回归法[7-8]和浅层神经网络法[9-10]。其中,统计回归法虽然可对时序数据进行预测,但其处理非线性问题能力有限且不考虑时间序列存在的规律,导致其拟合精度普遍较低。浅层神经网络法作为智能算法,虽然在一定程度上提高了模型的预测精度,但是难以实现对大数据量的精准化预测。而温度变化是一个累积过程,当前数据会影响后续数据变化规律,且这种变化规律受多种因子影响,上述温度预测模型对多维时序数据处理能力有限[11],仅能实现对于短期温室温度的精准预测,但随着预测时间的延长,其难以挖掘数据中蕴含的时序特征,导致模型预测精度快速下降,难以满足实际生产过程中对精度和时长的双重需求。

近年来,深度学习法成为研究热点,其因具有较强的非线性逼近及深层特征提取能力,为多维时序数据提供良好的理论支撑。然而目前基于深度学习的温室温度预测相关研究[11-12]多聚焦于单一时序网络,无法挖掘环境数据间深层次有效信息,且模型最大预测时长仅为1h,仍不能真正实现模型精度、效率和时长的需求。为此,本文引入双重叠加网络长时预测模型。其中,卷积神经网络是一种具有卷积计算能力的深度结构前馈神经网络,可提取时序数据中隐含的复杂动态变化高维特征[13]。一维卷积神经网络相比于二维卷积神经网络保留了原始时序数据各时刻点间的相关性及时域特征,同时网络参数的减少提升了模型运行效率,但一维卷积神经网络仅保留数据间有效信息,难以提取其长期数据的序列信息[14]。门控循环单元是循环神经网络的一种有效特殊形式,处理具有时间相关性且连续变化的数据效果较佳,既充分挖掘了数据间的时间相关性同时也提高了数据非线性逼近的能力,但其无法挖掘各维数据的内部规律[15]。因此,单独采用任何一种方法都无法实现对温室长时温度的精准高效预测,但由于二者优势互补,将二者叠加进行温室长时温度预测可能会提升模型精度[16]。

因此,本文提出一种基于一维卷积神经网络和门控循环单元(GRU)的混合模型温室温度预测方法。首先搭建温室内外监测平台,获取并分析内外环境因子对室内温度的影响程度,以斯皮尔曼相关系数选取相关性高的特征构造特征与时间步长的二维矩阵作为CNN层输入;其次完成模型网络设计并进行参数优化,通过CNN网络挖掘数据中蕴含反映温室环境数据相互联系的有效特征,将提取特征输入GRU网络,构建面向冬季的日光温室温度预测模型;最后为验证本文模型在不同天气下适用性,以清晰度指数KT对天气进行分类,分别验证在不同KT下模型的预测效果,为实现高效、精准的温度预测和日光温室的生产调控提供依据。

1 平台搭建和数据获取

试验于2019年12月2—31日在西北农林科技大学泾阳蔬菜试验示范站东五号日光温室内进行。试验地位于北纬34°53′、东经108°84′,海拔404 m,属于暖温带大陆性季风气候,年均温度13℃。温室为单栋单坡面式,骨架采用轻钢结构,后坡采用PC板和丝绵棉被覆盖,东侧、西侧与北侧是墙体部分,均采用黏土建造。东西走向,长50 m,宽10 m,后墙高3 m,脊高1.6 m,具有天窗、风机、卷帘机、遮阳网、湿帘以及喷淋器等设备,将传感器放置于其中部,距地面垂直高度1.2 m。由于温室空气温湿度空间分布不均[17],在任何位置放置传感器均不能准确表征温室内温度。为减少监测节点放置位置对空气温湿度监测结果的影响,本研究采用绕动风机加快温室内的空气流动[18-19],使温室内部温度趋于均匀,保证作物生产一致性。

试验期间,冬季共包括晴、晴转多云、多云、阴霾及霾转多云5种天气。为进一步分析不同天气条件下温度的预测效果,以清晰度指数KT对上述天气进行分类。KT表征太阳辐射经过大气层时衰减程度,与当时的天气状况密切相关[20]。如表1所示,根据清晰度指数对应的天气现象,将冬季天气分为4类。其中KT≥0.5共15 d、0.5>KT≥0.2共5 d、0.2>KT≥0.1共10 d、KT<0.1共0 d。温室室内栽培作物为番茄,以滴灌方式培育,试验期间每日于08:00—08:30揭盖保温被,当KT≥0.5及0.5>KT≥0.2时温室于10:00—10:30开窗换气通风;当0.2>KT≥0.1时根据实际情况适当延后温室开窗时间。

表1 清晰度指数对应的天气现象Tab.1 Weather phenomena corresponding to clarity index

温室内外监测平台由信息监测模块、信息传输模块及农业生产物联网监测平台组成,每日于00:00—24:00连续采集,采样间隔为20 min,共采集10种环境因子,包括室内光照强度(QY-150A型光照强度传感器,量程:0~200 klx,精度:±1 lx)、室内外空气温度(PT1000型温度传感器,量程:-200~200℃,精度:±0.1℃)、室内外空气相对湿度(DHT11型湿度传感器,量程:20%~90%,精度:±5%)、室内外土壤温度(PT1000型温度传感器,量程:-200~200℃,精度:±0.1℃)、室内外土壤含水率(EC-5型土壤含水率传感器,量程:0~100%,精度:±3%)及室外CO2浓度(体积比)(T6615型CO2传感器,量程:0~10 000 μL/L,精度:75 μL/L),各采集30 d,共获取2 160组样本数据。其中,信息传输模块是将感知信息通过ZigBee网络发送至网关节点对其进行数据处理,随后通过GPRS 网络传输至移动基站,将获取的数据上传至农业生产物联网监测平台,具体过程如图1所示。

图1 温室内外监测平台Fig.1 Monitoring platform inside and outside greenhouse

2 相关性分析

2.1 斯皮尔曼相关系数

温室内部温度不仅受室内空气相对湿度、室内土壤温度、室内土壤含水率及室内光照强度等室内环境因子的影响,还与室外空气温度、室外空气相对湿度、室外CO2浓度、室外土壤温度及室外土壤含水率等室外环境因子有关[21]。同时温室温度具有时序性和自相关性,即前一时刻的数据影响当前时刻的数据变化[22]。因此,模型不仅应考虑室内外环境因子对温度的影响,还应考虑历史温度数据对当前时刻温度的影响。为提高模型输入信息的有效性及减少无用信息的噪声干扰,本文采用斯皮尔曼相关系数p,分析各因子对温室温度的影响程度,选取相关性高的因子作为模型输入。斯皮尔曼相关系数p是一种基于单调方程评价两变量间相关关系的方法,范围为(-1, 1),其绝对值越趋近于1,相关性越强,其值与相关程度的关系如表2所示。

表2 相关系数绝对值与相关程度的关系Tab.2 Relationship between absolute value of correlation coefficient and degree of correlation

2.2 温度与各类影响因子分析

利用斯皮尔曼相关系数分别计算室内温度、室内空气相对湿度、室内土壤温度、室内土壤含水率、室内光照强度、室外空气温度、室外空气相对湿度、室外CO2浓度、室外土壤温度及室外土壤含水率10个因子与1 h后温室温度的相关系数绝对值,其结果如表3所示。

表3 各因子与温室温度的相关系数绝对值Tab.3 Absolute value of correlation coefficient between each factor and greenhouse temperature

由表3可知,室内空气温度、相对湿度、土壤温度、光照强度,以及室外空气温度与1 h后温度属于强相关;室外空气相对湿度、土壤温度与1 h后温度属于中相关;其余因子属于弱相关或极弱相关。其中,室内土壤含水率相关性最低,较室外土壤含水率影响程度更小,这是由于温室内栽培作物采用膜下滴灌方式,室内土壤由于覆膜处理导致土壤水分蒸发减弱,减少了其对室内空气相对湿度等因素的影响,而室内空气相对湿度又是影响温度的关键因素;而室外土壤由于未覆膜处理导致其影响室外湿度,进而影响温室内温度,所以在本试验条件下,室外土壤含水率相较于室内更能影响温室温度。

为降低模型复杂度,本文仅考虑与温室温度具有极强相关、强相关及中相关3种相关程度的因子。因此,日光温室温度模型选择室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度7种因子作为输入。

3 模型构建

3.1 1D CNN-GRU网络结构

基于1D CNN-GRU深度神经网络具体结构如图2所示,整体结构采用逐个堆叠方式连接,共分为4部分。其中,输入层Xt+j,i为二维矩阵,i为特征个数,j为时间步长;Xt,i~Xt+j,i表示第t时刻到第t+j时刻输入样本的第i个特征数据;Xt,1~Xt,i表示t时刻样本数据共有1~i个特征。卷积层采用一维卷积滤波器提取数据特征,因样本数据维度较少,未添加池化层。循环层选择2层GRU,第1层网络返回每个时间步输出的完整序列,第2层网络返回每个输入序列的最终输出。最后全连接层作为输出层输出目标时刻的预测值。

图2 1D CNN-GRU网络结构Fig.2 1D CNN-GRU network structure

其中,1D CNN是深度学习中的一种有效学习框架,通过卷积运算模拟人脑从局部中提取特征,在计算机视觉方面取得了较好的效果。同时在序列问题中,1D CNN可通过卷积层的滤波器捕捉输入数据间的相互关系,并将其组合成更短的特征序列输入至下一层网络中进行预测。例如,当卷积滑动窗口尺寸为5时,1D CNN通过窗口滑动依次从序列中提取局部一维序列段与权重作点积,如图3所示。

图3 1D CNN工作原理图Fig.3 1D CNN working principle

门控循环单元(GRU)是一种基于循环神经网络的优化网络,通过引入“门”的概念,优化了神经元内部结构,有选择性地传递信息,解决了循环神经网络难以学习序列中长距离依赖关系问题。在隐层中,各神经元相互连接,输入不仅与当前时刻输入层输入有关,还与上一时刻隐层输出有关。如图4a所示,x为总输入,h为隐层输出,o为总输出。在图4b中,GRU “门”包括重置门r和更新门z,重置门r融合输入xt与前一时刻的历史数据ht-1, 并丢弃与时间无关的历史数据,保留短序列数据间的依赖关系;更新门z通过存储上一时刻记忆ht-1,选择性地记忆信息,不断更新其值来捕捉长序列数据间的依赖关系。

图4 门控循环单元结构Fig.4 GRU structure

3.2 温室温度预测模型建立

基于上述网络结构,本文构建基于1D CNN-GRU的温度预测模型。模型以室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度为输入,时间步长为6,即输入矩阵尺寸为6×7;以1、2、3、4 h后温度为输出,其具体流程图如图5所示。

图5 温度预测模型建立流程图 Fig.5 Flow chart of establishing temperature prediction model

(1)由于不同样本数据间数值范围存在较大差异,量纲也有所不同,为加快神经网络拟合速度并提高模型预测精度,故对样本数据采用归一化处理缩放至[0,1]之间。

(2)在归一化后的2 160组数据中,选取1 512组数据(占样本总数据70%)作为训练集,其余648组数据(占样本总数据30%)作为测试集,最后以训练集数据训练模型,测试集数据验证模型的泛化能力及精度。

(3)卷积层将第t个输入样本数据st与一维卷积核执行卷积操作后,加以偏置bcnn通过激活函数进入循环层,即

yt=f(Wcnnst+bcnn)

(1)

式中f——激活函数

Wcnn——输入层到卷积层对应的权值矩阵

st——第t个输入样本数据

bcnn——输入层到卷积层对应的偏置矩阵

yt——第t个输出样本数据

在循环层中样本数据xt通过重置门r、更新门z及t时刻提供临时单元状态c点乘运算输出至全连接层,具体计算过程为

z=sigmoid(Wzht-1+Uzxt)

(2)

r=sigmoid(Wrht-1+Urxt)

(3)

c=tanh(Wc(ht-1⊗r)+Ucxt)

(4)

ht=(z⊗c)⊕((1-z)⊗ht-1)

(5)

式中ht——当下时间步终时记忆数据

Wz、Wr、Wc、Uz、Ur、Uc——更新门、重置门和临时输出的权值矩阵

(4)每层网络均采用线性整流函数(Rectified linear unit, ReLU)作为激活函数,均方误差函数(Mean square error,MSE)为损失函数。同时为实现神经网络权重的更新,利用自适应运动估计优化算法,使模型性能达到最佳。它是一种结合自适应梯度算法和前向均方根梯度下降算法二者优点的智能优化算法,优势在于解决稀疏梯度和非平稳问题上表现良好。在每次迭代中,以损失函数最小值为优化目标,通过计算梯度的一阶动量项和二阶动量项使学习率自适应地更新。

基于试参法寻优得到最优的学习率为0.001,训练轮数为500,当模型完成规定的训练轮数后,判断其输出结果是否满足模型精度,若不满足则重新调整参数值,继续训练直到达到模型精度;若满足则输出结果。

(5)以测试集温度为实际值,模型输出值为预测值,先对二者反归一化,恢复原有量纲级别,再以各类评价指标对模型精度及泛化能力进行评估。

4 算法对比与模型验证

4.1 不同算法和时长对比

为验证本文算法的预测性能,以决定系数R2、均方根误差 (Root mean square error, RMSE)、平均绝对误差(Mean absolute error, MAE)和绝对值的最大绝对误差(Maximum absolute error, MaAE)为评价指标,参数优化后的多元线性回归法(Multiple linear regression,MLR)、BP神经网络算法(Belief propagation neural networks,BPNN)、一维卷积神经网络(1D CNN)及门控循环单元(GRU)与一维卷积门控循环单元网络(1D CNN-GRU)建模效果进行对比,其预测结果如表4所示。

表4 不同算法和时间结果对比Tab.4 Comparison results of different algorithms and durations

由表4可知,在预测时间为1 h时,MLR模型和BP模型的预测精度虽均低于深度学习模型结果,但其总体相差不大。但随着时间的增加,前两者的预测精度快速下降。在2~4 h期间MLR模型较1D CNN-GRU模型RMSE、MAE和MaAE分别增加3.242~5.535℃、2.443~4.891℃和4.253~9.903℃;BP模型较1D CNN-GRU模型RMSE、MAE和MaAE分别增加1.564~3.167℃、0.739~2.407℃和1.568~3.891℃。上述结果说明,这2类方法对多维时序数据处理能力有限,无法实现对温室内长时温度的精准预测。在深度学习法中,1D CNN-GRU模型预测效果最好,GRU模型次之,1D CNN模型最差,且误差随时间逐渐变大, 2 h后这3类方法的预测差距逐步显现。当预测时间超过3 h后,1D CNN模型和GRU模型MaAE均超过了2℃,1D CNN模型较1D CNN-GRU模型RMSE、MAE和MaAE分别增加1.920~1.928℃、1.266~1.435℃和1.416~1.986℃;GRU模型较1D CNN-GRU模型RMSE、MAE和MaAE分别增加0.553~ 0.984℃、0.730~1.135℃和0.903~1.391℃。上述结果说明,1D CNN模型虽然相比于MLR模型和BP模型预测效果有所提升,但由于其无法提取序列信息,导致长时预测精度不高;GRU模型能够捕获长程依赖关系,较1D CNN模型更适应于时序数据,但由于局部特征提取能力不足,导致其较1D CNN模型预测精度虽提高,但其精度仍不满足生产需求。1D CNN-GRU模型结合1D CNN局部特征提取能力和GRU时间特征提取能力,在4 h内R2均不小于0.970、RMSE均不大于1.358℃、MAE均不大于0.854℃、MaAE均不大于1.959℃,长期预测方面明显优于上述4组对照模型,其可满足环境调控过程中对预测温度精度和时长方面的要求。

4.2 日光温室温度预测模型验证

为验证日光温室温度预测模型的泛化能力和预测性能,以测试集的648组样本数据对模型预测1、2、3、4 h后温度进行验证。验证结果表明,模型在测试集上预测1~4 h后的决定系数为0.970~0.994,均方根误差为0.612~1.358℃,平均绝对误差为0.428~0.854℃,绝对值的最大绝对误差为0.856~1.959℃,其拟合直线分别为y=0.183+1.004x、y=0.049+1.006x、y=0.198+0.977x、y=0.132+0.969x,它们的拟合系数均接近于1,截距均接近于零,说明该模型预测值和实际值几乎在直线y=x两侧,二者存在较强相关性,模型达到理想预测精度。

同时,为验证本文模型在不同KT下适用性,以RMSE、MAE和绝对值的平均相对误差(Average relative error,ARE)为评价指标,验证在2019年12月23—31日中的3类天气检验模型预测效果,其预测结果如表5所示。其中,12月26日(晴)、12月27日(晴转多云)、12月28日(晴)、12月30日(晴)及12月31日(晴)为KT≥0.5;12月25日(多云)为0.5>KT≥0.2;12月23日(阴霾)、12月24日(阴霾)及12月29日(霾转多云)为0.2>KT≥0.1。

表5 不同KT下模型验证结果Tab.5 Verification results of model under different KT

如表5所示,在不同天气条件下均方根误差为0.417~1.766℃,平均绝对误差为0.289~1.174℃,绝对值的平均相对误差为2.370%~7.858%。随着KT的下降ARE逐渐增大,这可能是由于云层及雾霾颗粒的影响[23-24],导致温室内光照产生波动,从而影响温度预测精度。进一步分析RMSE和MAE可以发现,虽然多云天会出现光照度波动,但晴天温室温度普遍高于其他天气,因而当KT≥0.5时其RMSE和MAE会略高于0.5>KT≥0.2条件,但并无显著差异。而0.2>KT≥0.1时,虽然其温度也相对较低,但其不仅存在温室内光照产生波动的影响,而且阴霾天较晴天和多云天存在湿度高且波动大的特点[25],由于室内湿度本就对温度影响程度较大,加之传感器在高湿环境下会出现误差偏移,因此其精度明显低于前两种环境状态。综合考虑,模型在KT≥0.5(晴)时预测效果最好,在各KT下模型均表现出较高准确性,说明此方法具有适用性,可应用于实际生产,在冬季室内太阳辐射较弱时,可通过该模型提前预知温度,利用加温设备为温室补充加温,为作物优质生产提供可靠性依据。

5 结论

(1)基于斯皮尔曼相关系数选取室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度7种因子作为输入,1、2、3、4 h后温度为输出,构建日光温室温度预测模型。结果表明,模型在测试集上预测1~4 h后的决定系数为0.970~0.994,均方根误差为0.612~1.358℃,平均绝对误差为0.428~0.854℃,绝对值的最大绝对误差为0.856~1.959℃。相比于统计学法和浅层神经网络法,该模型对温度预测的精度具有显著提升。

(2)以KT对天气分类的验证结果表明,该模型在KT≥0.5(晴)时温度预测效果最好,此外不同KT下模型均方根误差为0.417 ~ 1.766℃,平均绝对误差为0.289 ~ 1.174℃,绝对值的平均相对误差为2.370% ~ 7.858%。模型在不同天气条件下的预测精度均符合要求,验证了该模型对天气条件的普适性。

猜你喜欢
土壤温度日光温室温室
日光温室番茄高产高效栽培技术
农业知识(2022年9期)2022-10-13 08:25:50
现代温室羊肚菌栽培技术
苍松温室 苍松灌溉
云南农业(2021年9期)2021-09-24 11:57:06
苍松温室 苍松灌溉
云南农业(2021年8期)2021-09-06 11:36:44
可以避免一个温室化的地球吗?
英语文摘(2019年2期)2019-03-30 01:48:28
北方冬季日光温室番瓜高产栽培技术
现代园艺(2018年2期)2018-03-15 08:00:04
日光温室盆栽迷你玫瑰栽培技术
现代园艺(2017年22期)2018-01-19 05:06:54
辽东山区3种人工林土壤呼吸对土壤温度和土壤水分的响应
管群间歇散热的土壤温度响应与恢复特性
土壤湿度和土壤温度模拟中的参数敏感性分析和优化
大气科学(2015年5期)2015-12-04 03:04:44