基于WTD-LSTM 的对虾养殖水温组合预测模型

2021-03-12 09:15李祥铜李湘丽刘双印徐龙琴黄运茂
广东农业科学 2021年2期
关键词:对虾水温水体

李祥铜,曹 亮,李湘丽,刘双印,4,徐龙琴,呼 增,黄运茂,尹 航

(1.仲恺农业工程学院信息科学与技术学院,广东 广州 510225;2.广东省高校智慧农业工程技术研究中心/广州市农产品质量安全溯源信息技术重点实验室,广东 广州 510225;3.仲恺农业工程学院图书馆,广东 广州 510225;4.石河子大学机械电气工程学院,新疆 石河子 832000)

【研究意义】我国是对虾养殖大国,养殖面积和产量均位居世界第一[1]。养殖水体温度是影响对虾健康生长的关键因素之一,易受溶解氧、空气温度和湿度、风速、风向、降雨量、太阳辐射等主要因素影响,其非线性、非稳定和大时滞特点显著。水温突变会引起养殖水体其他物理化学反应,如果预防措施采取不及时很容易造成水质恶化与疾病暴发[2],因此研究对虾养殖水温预测方法,获得水体温度的变化规律,对预测预防水质灾害、提高水产品质量和促进渔业现代化具有重要意义[3]。

【前人研究进展】国内外对水质预测模型已进行了大量研究,并取得了一些研究成果[4-7]。施珮等[8]提出基于EMD-IGA-SELM 的池塘养殖水温预测模型用于水产养殖过程中的水温预测;柳海涛等[9]建立了人工神经网络预测模型对水电站下游鱼类产卵场水温进行预测分析;徐龙琴等[10]基于EMD 和ELM 组合模型对对虾工厂化育苗水温进行预测;刘双印等[11-12]通过改进粒子群算法优化LSSVM 的水产养殖溶解氧预测模型,并提出了基于粗糙集融合SVM 的水产养殖水质预警方法。上述模型对于小样本水温预测均取得了较好的预测精度,但由于长时间序列数据缺少鲁棒性和平稳性,影响了预测性能。

近年来,伴随计算机硬件的发展,深度学习性能不断提升[13],基于深度学习的预测方法在各个领域取得了不断的创造性发展[14]。其中循环神经网络(Recurrent neural network,RNN)在神经网络中引入了时序的概念,以序列数据为输入,对于时序数据的挖掘表现出强大的性能[15]。长短时记忆神经网络(Long short-term memory,LSTM)能解决长序列训练过程中的梯度消失和梯度爆炸等问题,能提高RNN 网络的准确性。彭文等[16]提出了基于Attention-LSTM 的电力市场中短期负荷预测方法,得到了很好的预测精度和算法鲁棒性;陈英义等[17]提出了基于主成分分析和LSTM 的水产养殖水体溶解氧预测模型,实现了对水体溶解氧的精准预测;Li 等[18]提出了一种基于稀疏自编码器和LSTM 的混合模型,提高了水产养殖中溶解氧的预测精度;王鑫等[19]利用LSTM神经网络对故障时间序列数据进行预测,模型具有良好的预测性能和泛化能力。目前,运用LSTM 研究对虾水体水温预测的有关文献并不多见。

【本研究切入点】长期以来,信号分析方法与人工智能算法组合预测模型一直是预测领域的重点,常用的有经验模态分解(Empirical mode decomposition,EMD)[8,10,20]、变分模态分解(Variational mode decomposition,VMD)[21]和小波变换(Wavelet transform,WT)[22]等。其中,小波理论由于其良好的时频特性备受专家学者们的青睐,在去噪领域也备受瞩目,且小波阈值降噪(Wavelet threshold denoising,WTD)从提出至今,对其优化和改进一直都有相关研究[23],但将其应用于水质领域预测的研究还较少。在前人研究基础上,利用WTD 和LSTM 的组合优势,提出基于WTD-LSTM 的对虾养殖水体温度组合预测模型。【拟解决的关键问题】首先通过WTD 对采集的对虾养殖水温关键影响因子进行降噪并做归一化处理,然后在Keras 框架下搭建LSTM 对虾养殖水温预测模型,通过Adam 算法找到最优模型参数,最后得到测试数据样本的预测结果。将该模型应用于广东省广州市海鸥岛对虾养殖综合试验基地的水温预测中,并展开试验及验证,一定程度上提高了对虾养殖水温预测精度,并取得了较理想的预测效果,可以为水产养殖水质精准调控提供技术支持。

1 数据与方法

1.1 研究区域概况

研究试验地点为广东省广州市海鸥岛(113°5′E、22°97′N),位于广州市番禺区东郊,属于东亚季风区气候,降水量充沛,年平均气温22.3℃。该岛水源为河道水,对虾养殖规模大,产量丰富。本研究选取的1.3 hm2对虾培育池塘,水深1.5 m,配备有抽水泵、增氧机、水温控制器、灯光调控设施、pH 检测仪等多种水质参数传感器以及对虾养殖物联网平台。

1.2 数据采集系统架构

采用中国农业大学研制的水产养殖物联网平台采集对虾养殖池塘水质参数数据,养殖基地系统拓扑结构如图1 所示。该系统主要由数据采集模块、网络传输模块、监控模块和智能控制模块4 个部分组成,依靠现代物联网技术开发的一套集水质环境参数在线采集、智能组网、决策支持等功能于一体的物联网平台。数据采集模块是整个系统的基础,该模块负责采集气象和水质参数等信息,其中所使用的设备为水下监控、溶解氧、pH 和温度传感器。网络传输模块是整个系统数据的传输通道,通关网关接收数据并传送到现场监控中心,最后通过GPRS 传入监控中心。监控模块用户可以通过各种终端实时了解养殖场的信息,包括服务器和应用平台及数据库。智能控制模块主要包括温度控制、增氧泵控制、给排水控制等智能处理手段和设备。试验数据为采集系统所采集的对虾养殖水温数据,每10 min 对对虾养殖水质参数和当地气象参数时序数据采集1 次。采样周期为2018 年7 月20 至8 月19 日,共采集了4464 个样本,分别将前30 d 共4320 条数据和最后1 天的144 个数据作为训练集和测试集。

图1 养殖基地系统拓扑结构Fig.1 Topology structure of breeding base system

1.3 研究方法

1.3.1 小波阈值降噪 小波理论日益完善,其以自身良好的时频特性在长时间序列去噪领域取得一定效果,并开辟了用非线性方法去噪的先河[24]。其中WTD 方法近年来得到了广泛应用,本研究应用小波变换阈值去噪对水温时间序列数据进行降噪处理,主要分为以下3 个过程:

(1)小波分解:根据不同的变量数据特征选用不同的小波函数进行噪声信号的分解,得到小波分解后的尺度系数和小波系数。

(2)阈值函数选择:阈值处理函数分为硬阈值和软阈值。当小波系数的绝对值小于给定阈值时令其为0,而大于阈值时则保持其不变,此时表示为硬阈值,该阈值采用应用最广泛的Sqtwolog 阈值[25];当小波系数的绝对值小于给定阈值时令其为0,大于阈值时令其减去阈值,这样的阈值即为软阈值。阈值的选择是离散小波去噪中最关键的一步,小波阈值λ 起决定性作用:如果阈值太小,则施加阈值后的小波系数将包含过多的噪声分量,达不到去噪效果;反之,阈值太大,则去除了有用的成分,造成失真。硬阈值函数在ω=λ 处是不连续的,容易造成去噪后数据在奇异点附近出现明显的伪吉布斯现象。因此本研究采用软阈值去噪。

(3)小波重构:通过软阈值处理后,根据前面层的高频系数和最后一层的低频系数进行小波重构,最终获得小波阈值降噪后信号。

1.3.2 长短时记忆神经网络 LSTM 是一种特殊的RNN,能够有效解决信息的长期依赖,避免梯度消失或爆炸,其出现就是专门解决信息长期依赖问题的。与传统RNN 相比,LSTM 巧妙地设计了循环体结构[26],其内部单元结构如图2 所示。

LSTM 使用两个门来控制单元状态Ct的内容,一个是遗忘门(forget gate),它决定了上一时刻单元状态Ct-1有多少数据保存在当前时刻Ct;另一个是输入门(input gate),它决定此时网络的输入xt有多少保存到单元状态Ct。LSTM 使用输出门(out put)来控制单元状态Ct有多少输出到LSTM 的当前输出值ht。相关计算公式如下:

图2 LSTM 模型结构Fig.2 Structure of LSTM model

式中,ft、it、C′t、Ct、ot分别代表遗忘门、输入门、更新细胞的输入状态、更新后的细胞状态和输出门;W和b分别为对应的权重系数矩阵和偏置项;σ和tanh 分别表示sigmoid激活函数和双曲正切激活函数

1.3.3 预测模型构建 基于WTD-LSTM 的对虾养殖水体温度组合预测模型构建过程如图3 所示。

(1)通过水质检测传感器系统和小型气象站获取水产养殖水环境数据和当地气象数据,并对数据进行修复和预处理;

(2)对修复和预处理后的数据进行特征相对重要性计算,最后筛选出相对重要的水体水温预测关键因子,利用WTD 对筛选后的对虾养殖水温关键影响因子进行处理,降低噪声数据对于模型预测的干扰,降低参数相互的关联性以及冗余成分,提取更有利于对虾养殖水温预测的时间序列数据,将数据分为对应训练集和测试集样本并进行归一化处理;

(3)对预测模型参数和权重进行初始化,并且将训练集作为输入对模型进行训练,使用Adam算法连续对模型权重和参数进行优化处理,以得到所需要的精度,并对基于和LSTM 的对虾养殖水温预测模型进行构建;

图3 基于WTD-LSTM 的对虾养殖水体温度预测流程Fig.3 Flowchart of water temperature prediction of prawn culture based on WTD-LSTM

(4)将已构建出的预测模型在测试集上进行性能测试,将预测向量输出进行反归一化得到水温预测结果,同时使用标准的传统预测模型进行比对,准确高效地实现对今后某一时间段的对虾养殖水体水温预测;

(5)选择平均绝对百分比误差MAPE、均方根误差RMSE和平均绝对误差MAE等评价指标对基于WTD-LSTM 的对虾养殖水温预测组合模型预测性能进行性能评价,相关计算公式如下:

式中,MAPE、RMSE、MAE分别为平均绝对百分比误差、均方根误差和平均绝对误差;yi、ŷi分别为实际值和预测值,N为测试样本集数量。

2 结果与分析

2.1 对虾养殖水温数据源和数据预处理

本研究以广州市海鸥岛对虾养殖基地水温为研究对象,采用水产养殖物联网平台和小型气象站采集了31 d 共4464 个水温样本。由图4 可以看出,对虾养殖水温时序数据周期性和非线性特征明显。

图4 水温原始数据变化曲线Fig.4 Variation curve of the original water temperature data

由于设备故障等因素气象站和水质传感器采集的数据存在部分异常值,利用拉依达法则进行处理,如果存在参数与其平均值之差的绝对值大于其标准差的3 倍,会被断定为异常值并用其两侧数据的平均值替换,计算公式如下:

式中,Pt为水质或气象参数采集值,为异常数据处理后的值,为水质或气象参数数据序列均值。

为了提高预测准确率减少误差,本研究将异常数据处理和WTD 后的数据进行归一化处理,计算公式如下:

式中,Nmax为最大值,Nmin为最小值,N"为归一化值。

2.2 基于WTD 的水温数据源

WTD 和LSTM 组合预测方法中的步骤,对对虾养殖水体原始水温时序数据进行小波分解降噪与重构,其过程如图5 所示。由图5 可知,原始养殖水温时序数据表现出不平稳性和大时滞性,经过WTD 后,水温数据被扩展到一定阈值范围,降低了噪声的干扰,不仅更能反映原始数据变化信息,数据整体趋势变得更加明显,并且在波峰波谷表现更为平滑。对对虾养殖水体原始水温及风速、风向、太阳辐射、空气温度、空气湿度、大气压力和溶解氧等水温影响因子原始数据进行WTD,降噪后的数据更能反映水质参数和气象参数按一定趋势有规律变化的特点。

2.3 预测结果分析

利用WTD 和LSTM 模型对未来一天对虾养殖水温进行预测,将WTD 后的6 个气象影响因子和水体溶解氧、水温共8 个参数作为输入,全部选取31 d 的采集数据,同时将水温时间序列数据作为输出对LSTM 模型进行训练,使用Adam算法对预测模型参数不断进行优化和调整,为进一步验证本研究提出的组合模型的预测性能,分别采用BP 神经网络[27]、标准ELM[10]、标准LSTM 和小波降噪的LSTM 等4 种模型对同样的对虾养殖水温时序数据进行预测。其中BP 神经网络结构采用7-15-1 结构,学习因子φ=0.75,最大误差=0.0001,激励函数采用sigmoid 函数;标准ELM 模型隐含层神经元节点数为10,激活函数采用sigmoid 函数;标准LSTM 隐含层节点数、批尺度和时间步分别为30、60、30。上述4 种模型预测曲线对比如图6 所示,相应预测精度结果统计如表1 所示。

从图6 可以看出,BP 神经网络、标准ELM预测模型的单项预测误差较大,两者在拐点附近偏离实测值最大;LSTM 则相比前两者有很大提升,虽然与真实值曲线形似,但是在波谷处存在较大偏差。本研究提出的基于WTD-LSTM 的组合模型预测曲线贴近真实值曲线,能较好地拟合养殖水温非线性时间序列变化曲线,取得很好的预测效果。

由表1 可知,本研究所采用的基于WTDLSTM 的组合模型预测结果及其性能相比其他方法有相当大的提升,很大程度上强于传统的标准ELM 和BP 神经网络;并且比没有经过WTD的LSTM 模型预测精度更高。针对同样的水质和气象参数,将WTD 的LSTM 预测模型和标准BP 神经网络两种模型进行对比分析,评价指标MAPE、RMSE、MAE分别降低了64.85%、59.62%、64.62%;WTD-LSTM 预测模型和标准ELM 相比,评价指标MAPE、RMSE、MAE分别降低了63.64%、61.18%、60.12%;WTD-LSTM 预测模型和标准LSTM 相比,评价指标MAPE、RMSE、MAE分别降低了47.48%、37.07%、46.27%。WTD 具备了多分辨率的特性,对时间序列信号分解后会有更多的小波基系数趋于0,时间序列数据信号主要集中于某些小波基,WTD 便可更好地保留原始信号;而且WTD拥有去相关性,可以对信号进行去相关,噪声在变换后有白化趋势,因此小波阈比时域更利于去噪。可见,WTD 对于对虾养殖中的水温影响因子时间序列去噪具有很好的性能。LSTM 模型对于历史时间序列数据信息能够高效利用,在时间序列预测中具有很理想的效果。基于WTDLSTM 的组合预测模型进一步提升了对虾养殖水温的预测精度。

图5 降噪后的养殖水体水温影响因子数据Fig.5 Impact factor data of aquaculture water temperature after noise reduction

图6 4 种模型的水温预测结果Fig.6 Water temperature prediction results of four models

表1 4 种模型的预测结果精度Table 1 Accuracy of prediction results of four models

3 结语

WTD 是一种基于时间和多尺度的分析方法,其本身具备多分辨率的优点,WTD 擅长处理如水温数据这种时序性和频域性强的数据,相比其他传统的降噪方法,具有去相关性,因此WTD 可以将非连续的高斯白噪声从连续的信号在时间阈上分离,同时由于WTD 有低熵性的特点,采取阈值去噪后的信号具有较高的信噪比[28],可以很好地保留原始信号。由于水温数据变化呈连续性,本研究选择使用软阈值降噪,可以保证降噪后的水质和气象参数的连续性和准确性。

长短时记忆神经网络能够处理数据长期依赖的问题,并且解决了RNN 存在梯度消失和爆炸的问题,针对传统预测模型对拥有时间间隔的长时序非线性和非平稳的多尺度特征对虾养殖水温预测,所产生的预测精度低、泛化性差等问题,提出了基于WTD-LSTM 的水温组合预测模型,并应用于对虾养殖水温预测中,最后总结得到该模型对于对虾养殖水体水温具有良好的预测效果,提高水温预测精度和鲁棒性,为对虾养殖水质自动化、数字化监测提供了一种新的思路和解决办法。

猜你喜欢
对虾水温水体
对虾养殖弱势群体的管理
某轻型卡车水温偏高的分析及验证
对虾吃料慢的原因分析和处理
应避免在低于10℃水温条件下给温水性鱼类接种疫苗
农村黑臭水体治理和污水处理浅探
农村黑臭水体治理与农村污水处理程度探讨
生态修复理念在河道水体治理中的应用
对虾常见环境性疾病的防治
基于PLC的水温控制系统设计
太平湾发电厂坝前水温自动化观测系统改造