基于多维数据的WTD-GA-BP海参养殖水温预测

2023-10-31 12:02李晓梅杨健浩李俐盖荣丽汪祖民
关键词:环境参数海参水温

李晓梅,杨健浩,李俐,盖荣丽,汪祖民

(大连大学 信息工程学院,辽宁 大连 116000)

我国是水产养殖大国,随着经济的快速增长,海水养殖业得到不断提升和快速发展[1].近十年来,我国海参养殖规模不断扩大,已经成为我国重要的水产养殖品种.但是海参对海水水温极其敏感[2],这给海参养殖工作带来了很多不便.因此研究海参养殖水温预测的方法,及时预测海参养殖水温变化,对提高海水养殖产品的产量和质量具有重要的实际意义.

真实可靠的数据是水温预测的首要和关键性因素,各种环境因素均会影响到采集数据的准确性,易造成采集的数据存在一定偏差和少量噪声[3],尤其是时间序列数据更易受到各种因素的影响.不少学者对此进行了探索,WANG等[4]提出了一种校正EMD方法的近似预测模型,并将其定义为一种新的信号降噪方法.但是该方法需要对每一个预测过程进行往返分解和重构,会花费大量时间.LI等[5]通过小波变换对载荷序列进行分解,以捕获其在不同频率下的复杂特征,但是小波分析方法虽然能够提取不同尺度上的细节信息,但无法进行自适应的多分辨率分析.因此,为进一步提高数据的可靠性,解决传统水温预测模型易引入含噪数据等问题.本文利用小波阈值降噪(Wavelet Threshold Denoising,WTD)方法对影响海参养殖水温变化的关键影响因子进行去噪,在保留有效信息的前提下,减少关键影响因子数据的噪声,增强其数据的平滑性,以进一步提高水温预测精度.

近年来,随着智能化、数字化水平不断提高,运用科技技术实现养殖智能化成为水产养殖发展的新方向,并获得了一些成效[6-9].施佩等[10]提出了Empirical Mode Decomposition-Improved Genetic Algorithm-Improved Extreme Learning Machine(EMD-IGA-SELM)算法,用于预测工厂水产养殖环境下的水温变化,并监测了气象环境因子和部分水体因子.YANG等[11]提出了一种基于注意机制的Convolutional Neural Network-Long-Short-Term Memory(CNN-LSTM)混合水质预测模型,对北仑河口水质进行预测.徐大明等[12]利用粒子群算法优化Back Propagation(BP)神经网络对水产养殖的水温及pH值进行预测.陈英义等[13]提出基于Genetic Algorithm-Back Propagation(GA-BP)的池塘养殖水温短期预测方法,但仅考虑了气象环境因素对水温变化的影响.同时当样本数超过30时,预测值和实际值存在一些波动.尽管上述方法均取得了较好的结果,但大多聚焦于淡水领域,且未综合考虑气象和水体环境因子对水温变化的影响,不能充分挖掘出海参养殖水温的变化特征,降低了预测精度.因此,本研究系统地获取影响海参养殖水温变化的气象与水体环境因子,充分考虑气象和水体环境因子对水温变化的综合影响,以多维数据作为模型的输入,进一步提高模型的预测性能.

综上所述,本文提出了一种基于多维数据的混合Wavelet Threshold Denoising-Genetic Algorithm-Back Propagation(WTD-GA-BP)海参养殖水温预测模型,利用WTD对影响海参养殖水温变化的关键影响因子进行降噪,在保留有效信息的前提下,减少数据噪声,增强数据的平滑性.同时,综合考虑气象和水体环境因子对水温变化的影响,以降噪后的多维数据作为预测模型的输入,充分挖掘水温的变化特征,实现海参养殖水温的精准预测.

1 相关工作

1.1 实验环境

实验于2021年3月至9月在辽宁省大连市金州区海参养殖海域进行,该区域海水平均温度12.1 ℃,盐度平均为30%~32%,分布较为均匀,且具有水质好、水温低、营养物质丰富等特点,海洋资源丰厚,有利于海参的生长繁育.

1.2 数据采集

海参养殖环境水质参数的采集采用自主研发的海参养殖环境监测物联网平台系统,该系统由数据感知层、数据传输层和应用云平台组成.数据感知层负责采集气象和水质参数等信息包含温度、盐度、溶解氧、pH值等多种智能传感器,并在海参养殖环境周边安装自动气象站获取气象数据.数据传输模块实现数据感知层与应用云平台的无线通信,将所采集数据传输给应用云平台.整体结构如图1所示.系统的采样周期为30 min.样本总数为565组.收集到的数据被分为两部分,前80%组数据用作学习样本,后20%组数据作为测试样本,检验水温预测模型的预测效果.

1.3 研究方法

1.3.1小波阈值降噪

小波变换能够通过不同分辨率对时间序列进行分解,将原始信号分解成不同频率子信号,使得原始信号的时序概况和细节部分尽可能多地被发现,因此成为当前分析时间序列的有效工具[14],其中WTD方法近年来得到了广泛应用.因此,本文利用小波阈值降噪(WTD)对关键环境参数进行降噪,在保留有效信息的同时减少噪声并增强数据的平滑性,其主要包括3个步骤:

(1)首先根据不同变量的数据特征选用最佳小波函数对含噪信号进行分解.

(2)选择阈值函数去除原始数据信号的噪声分量,因为硬阈值函数在ω=λ处存在不连续点,降噪后的数据信号易在奇异点附近出现较为显著的假吉布斯效应,所以在本文中选择软阈值函数对数据信号进行去噪.

(3)根据前面1-N层的高频系数和最后第N层的低频系数进行小波重构,最终生成去噪数据信号.

1.3.2遗传算法

遗传算法(Genetic Algorithm,GA)是一种模拟自然界遗传机制和生物进化论而形成的并行随机搜索最优化方法,于1962年由Holland教授首次提出[15-17].GA将生物染色体编码的机制运用到对优化目标参数组的编码中,根据参数组表现的适应度进行模拟遗传操作,筛选出新的种群,不断迭代保留优质个体并保留至下一代,直至满足终止条件.

1.3.3BP神经网络

神经网络(Back Propagation,BP)是一种具有信号正向传播和误差反向传播的多层前馈性神经网络,其经过多年研究和发展,已具备较为成熟的理论基础,具有良好的非线性映射和自组织学习能力[18].一个BP神经网络一般包含一个输入层、一个输出层以及一个或者多个隐含层.每层存在多个神经元,每个神经元的输出值由输入值、权重、阈值和激活函数决定.其学习过程由信号的正向传播和反向传播两个过程构成:在正向过程中,输入信号经过输入层、隐含层,经过网络的权值、阈值的作用后通过输出层输出,若输出值大于期望误差,则进行反向传播,如此反复.在反复的过程中,网络的权值和阈值都在进行自适应调整,直到所有的输出值都达到预定误差.BP神经网络的输入和输出关系如式(1)、(2)所示.

(1)

yi=f(Ni),

(2)

式中,Ni为净激活;wij为上层神经元j到下层神经元i的权值;xj为上层神经元的输入信号;aj为阈值;yi为神经元i的输出;fx为激活函数.

2 基于多维数据WTD-GA-BP的海参养殖水温预测模型

2.1 海参养殖环境因子与水温相关性分析

2.1.1数据预处理

由于海水养殖环境大多为露天养殖,海水环境复杂,污染和腐蚀性较强,传感器放置于海水环境中,受腐蚀及其他环境因素作用,传感器在数据采集过程中易发生偏差,网络的传输也会产生数据的延迟及丢失,导致物联网数据收集系统收集的数据出现缺失值和异常值.因此,选择线性内插法来内插缺失的数据,并对异常值进行剔除.同时为了消除不同类别分子描述符在数量上的差距对建模的影响,本文利用数据归一化处理方法将不同的分子描述符数据统一表示为[0,1]之间的数字.将不同维度的表达式转换成同一维度表达式,解决数据间的可比性问题.

2.1.2影响水温变化的相关因子分析

由于水体环境因子和气象环境因子对水温的变化均具有一定的影响.本文从海参养殖环境监测物联网平台监测获取空气温度、空气湿度、相对气压、风速、风向、阵风、降雨量、盐分、溶解氧、pH值、水温等11项数据指标,并将其进行关联分析.在实验的565组数据中,利用Pearson相关性分析得出各环境因素与海参养殖水温间的相关关系.结果如表1所示,在各环境因素中与水温呈显著相关的有气温、相对空气湿度、相对气压、风速、阵风、降雨量、溶解氧、盐分、pH值等.

2.2 数据降噪

2.2.1指标选取

根据相关性分析结果可知,其中气温、空气湿度、相对气压、风速、阵风、降雨量、溶解氧、盐分、pH值等均与水温呈显著相关性,而风向与水温间无显著相关性.故选取气温、空气湿度、相对气压、风速、阵风、降雨量、溶解氧、盐分、pH值、水温10项环境指标构建水温预测模型.

2.2.2小波阈值降噪

利用WTD方法对与水温显著相关的关键影响因子数据进行降噪,增强数据的平滑性.其部分降噪前后的数据效果对比如图2所示.

由图2可知,WTD具有良好的降噪性能,有效去除了数据噪声,极大增强了数据的平滑性.

2.3 海参养殖水温预测模型

传统的BP神经网络存在易陷入局部极值、收敛速度慢等缺点,而遗传算法可以较好地克服陷入局部极值陷阱问题,且易于与其他算法结合[19-20].因此本研究提出基于多维数据的WTD-GA-BP海参养殖水温预测模型.模型构建过程如图3所示.

在整个模型当中,主要利用遗传算法不断优化BP神经网络的权值和阈值.通过模拟遗传的选择、交叉和变异等操作获得最佳权重和阈值;将获取的参数传送给BP神经网络;最后由BP神经网络进行训练并输出预测值.该预测模型具体步骤如下:

(1)根据海参养殖环境参数确定BP神经网络的拓扑结构,并初始化BP神经网络的权值和阈值.

(2)通过遗传算法对BP神经网络的权值和阈值进行编码,得到初始种群,进行模拟遗传操作,以获取新的个体.

(3)将获取的最佳参数赋予新建的BP神经网络,根据经验公式确定BP神经网络的隐含层节点数[21]并对权值和阈值进行更新,其公式为:

(3)

式(3)中隐含层节点数由p表示,输出层节点数为m,输入层节点数由n表示,a为0到10之间的常数.

(4)不断更新水温预测模型的权值和阈值并计算预测值和真实值的误差,判断误差是否超出规定范围或达到计算次数.若误差未超出规定范围或达到了计算次数,则输出水温预测结果.

(5)利用平均绝对百分比误差MAPE、均方误差MSE和平均绝对误差MAE对基于多维数据的WTD-GA-BP海参养殖水温预测组合模型进行性能评价.各指标表达式为:

(4)

(5)

(6)

模型参数设置.经过不断实验比较,将WTD-GA-BP水温预测模型初始种群规模设定为50,迭代次数设定为20.依据多次运行均方误差最小的原则,确定遗传算法的交叉概率0.3,变异概率为0.1[22].

3 实验结果与分析

为综合验证基于多维数据的WTD-GA-BP水温预测模型的预测性能,本研究采用两步进行.首先,以多维数据作为输入,分别比较WTD-GA-BP模型、GA-BP模型、BP神经网络和最小二乘支持向量回归(Least Square Support Vector Regression,LSSVR)模型的预测性能,以验证WTD-GA-BP预测模型具有更强的稳定性和更高的预测精度.进一步,分别以不同维度数据作为WTD-GA-BP模型的输入,验证在相同的WTD-GA-BP模型中,以多维数据作为模型输入比单维数据作为模型输入具有更好的预测性能.

3.1 不同模型的预测结果对比分析

为全面分析和比较WTD-GA-BP海参养殖水温预测模型的性能,均以多维数据作为输入,分别采用WTD-GA-BP水温预测模型、GA-BP模型、BP神经网络和LSSVR模型对海参养殖水温进行预测.其中设置WTD-GA-BP与GA-BP模型的隐含层节点数均为13,BP隐含层节点数为11.上述4种模型的预测结果对比如图4所示.

由图4可知,同时以多维数据作为模型输入,LSSVR和BP神经网络模型的预测误差较大,GA-BP相较于LSSVR和BP神经网络预测误差较小,但是在低拐点处偏离较大,存在一定的波动.而本研究提出的WTD-GA-BP组合模型的预测最为精准,在低拐点处无较大偏离值,预测效果最好.

同时,为综合评价这4个模型的预测性能,依据式(4)、(5)、(6)中的MAE、MAPE和MSE值,分别比较4个模型的性能.对比结果如表2所示.

表2 基于多维数据的各模型性能对比

根据表2的结果可知,本文提出的WTD-GA-BP组合模型相比于GA-BP、BP神经网络、LSSVR具有更好的预测性能,其预测精确度更高.将本文所提出的WTD-GA-BP模型与GA-BP相比,其评价指标MAE、MAPE、MSE分别降低了53.34%、53.49%和71.11%.同时,WTD-GA-BP相较于标准BP,其评价指标MAE、MAPE、MSE分别降低了64.84%、65.12%、80.49%.WTD-GA-BP相比于LSSVR的预测性能,其评价指标MAE、MAPE、MSE分别降低了64.50%、64.49%、84.66%.

上述分析表明,本研究提出的WTD-GA-BP水温预测模型能够准确预测海参养殖水温的变化趋势,WTD方法有效去除了数据信号噪声,增强了数据平滑性,进一步提高了模型的预测精度.

3.2 基于不同维度数据的WTD-GA-BP预测结果分析

为比较以不同维度数据作为输入时对WTD-GA-BP预测性能的影响,分别以不同维度数据作为WTD-GA-BP模型的输入,比较其预测效果.其中设置基于多维数据的WTD-GA-BP预测模型的隐含节点数为13,基于气象环境参数的WTD-GA-BP预测模型的隐藏节点数为11,基于水体环境参数的WTD-GA-BP预测模型的隐藏节点数为6.各模型预测结果对比如图5所示.

由图5可知,相较于以单维气象或水体环境参数作为模型输入,基于多维数据的WTD-GA-BP水温预测模型预测结果更加精准,预测精确度更高且异常值较少.

分别比较基于不同维度数据的WTD-GA-BP水温预测模型的MAE、MAPE和MSE,对比结果见表3.

表3 基于不同维度数据WTD-GA-BP预测性能对比

由表3可知,基于多维数据的WTD-GA-BP预测模型相较于基于气象参数的WTD-GA-BP预测模型、基于水体参数的WTD-GA-BP预测模型,预测精度得到了较大提升.基于多维数据的WTD-GA-BP预测精度达到了99.4%,而基于气象参数的WTD-GA-BP预测精度为98.8%,基于水体参数的WTD-GA-BP预测精度为98.68%.基于多维数据的WTD-GA-BP水温预测模型的MAE、MAPE、MSE分别为0.146 8、0.006 0、0.050 3,相比于气象参数的WTD-GA-BP水温预测模型,MAE、MAPE、MSE分别降低了49.41%、50.00%和69.33%.相比于基于水体参数的WTD-GA-BP的预测模型,MAE、MAPE、MSE分别降低了54.76%、54.55%和71.16%.结果表明,基于多维数据的WTD-GA-BP水温预测模型预测精度优于单独以气象环境参数为输入或单独以水体环境参数为输入的预测精度.

由3.1节、3.2节的实验结果可得,本研究提出的基于多维数据的WTD-GA-BP水温预测模型能够有效去除噪声影响,充分挖掘出水温数据的变化特性,极大增强了模型的泛化能力,进一步提升了海参养殖水温预测模型的预测性能.

4 结 论

针对海参养殖的水温预测难度大,精确度较低等问题,本文提出了基于多维数据的WTD-GA-BP海参养殖水温预测模型,对海参养殖环境水温进行预测,通过研究得到如下结论:

(1)WTD算法具有较好的降噪能力,增强了数据的平滑性,有效提升了模型的预测性能.

(2)以多维数据作为WTD-GA-BP模型的输入,解决了以往水温预测模型仅以单维气象环境参数或水体环境参数作为模型输入,无法充分挖掘出水温数据的变化特性,导致模型的泛化能力不足等问题,有效提高了模型的预测精度.

上述研究系统分析了影响海参养殖水温变化的气象及水体环境因子,构建基于多维数据的WTD-GA-BP海参养殖水温预测模型,具有良好的预测结果,且实时性强,可以为海参养殖水温预测提供科学指导.

本文基于多维数据构建了WTD-GA-BP模型,对海参养殖短时间内的水温变化进行预测,取得了较好的预测效果.但由于样本数较少,并未涉及长时间间隔的预测,因此在后续的研究工作中需要更加关注长时间间隔的水温预测,以促进海参养殖信息化发展.

猜你喜欢
环境参数海参水温
感谢海参
基于云平台的智能家居环境参数协同监控系统设计
列车动力学模型时变环境参数自适应辨识
基于PLC的水温控制系统设计
一种食用菌大棚环境参数测控系统设计
古今八珍之葱烧海参
基于DS18B20水温控制系统设计
海参易变弯,掺了糖
基于小型固定翼移动平台的区域大气环境参数采集系统设计
海参