基于SSA-PSO-LSTM模型的羊舍相对湿度预测技术

2022-11-08 02:20郭建军韩钤钰董佳琦徐龙琴刘双印
农业机械学报 2022年9期
关键词:羊舍湿度噪声

郭建军 韩钤钰 董佳琦 周 冰 徐龙琴 刘双印

(1.仲恺农业工程学院广州市农产品质量安全溯源信息技术重点实验室, 广州 510225; 2.仲恺农业工程学院信息科学与技术学院, 广州 510225; 3.深圳信息职业技术学院数字媒体学院, 深圳 518172; 4.仲恺农业工程学院智慧农业创新研究院, 广州 510225)

0 引言

规模化肉羊养殖场是肉羊栖息地重要场所,羊舍湿度过高或过低直接威胁肉羊健康生长,导致肉羊疾病暴发甚至大批量死亡,造成巨大经济损失[1-2]。而羊舍湿度具有大时滞、非线性和空间分布差异性的特点,且与多种环境参数相互作用,机理复杂、耦合性强,传统的预测方法构建的湿度预测模型难以满足规模化肉羊精准养殖的需要[3-4]。因此,采用新型人工智能算法对羊舍湿度精准预测,及时掌握湿度变化规律并提前调控是确保规模化肉羊在无应激环境下健康的关键[5-6]。

国内外专家学者已对相对湿度预测进行了多年研究,并在温室、果园、土壤温湿度、配电网环境等领域得到成功应用[7-13]。上述模型虽然取得一定的预测效果,但是仍存在训练时间长、收敛速度慢、欠学习和过学习、易陷入局部最优等不足,难以满足规模化肉羊养殖场湿度精准调控需要。

在线采集的规模化肉羊养殖场湿度数据具有时序性、非线性等特点。而作为深度学习典型方法之一的长短时记忆网络(Long short-term memory,LSTM)具有通过提取历史时序数据特征来挖掘未来数据变化趋势的能力,使其在许多领域的时序数据预测中得到广泛应用[14-16]。鉴于LSTM在复杂预测任务上的潜力,本文采用LSTM算法进行预测,以期提高精度。

LSTM其性能受参数的影响很大,如何选择最佳参数组合以获得更好的预测结果,是LSTM预测模型必须要解决的主要问题之一。粒子群优化(Particle swarm optimization,PSO)算法具有搜索速度快、效率高、鲁棒性好、算法简单、更容易收敛的优点,在现有的湿度预测模型中,被一些学者研究使用[17-19],且研究成果均证明粒子群优化算法在湿度预测模型中具有很好的优化效果,因此本文采用PSO进行组合参数的优化。

传感器采集数据时,传感器老化、电磁干扰等问题会造成数据存在噪声,直接对数据进行预测则会影响预测精度。目前,很多学者利用奇异谱分析(Singular spectrum analysis,SSA)法进行预处理,达到了很好的降噪效果[20-22],证实奇异谱分析具有一定的研究价值。

因此,基于前人的研究成果,为解决单一LSTM模型训练耗时长、泛化能力不足、难以处理大量级数据的问题,本文将奇异谱分析法、粒子群优化算法和长短期记忆网络相结合,提出一种基于SSA-PSO-LSTM的新疆羊舍环境湿度组合预测模型,首先利用SSA分离出正常序列和噪声序列,将原始序列转化为平滑序列;其次通过PSO不断迭代优化确定LSTM的最优参数,降低LSTM的训练成本;最终依据优化参数建立组合预测模型分别对两序列进行预测,模型结果之和为最终预测结果。采用从新疆玛纳斯新澳畜牧有限公司5号育种群母羊舍采集的系统数据,对不同时间间隔的湿度进行预测,以验证该试验模型的有效性。

1 材料与方法

1.1 试验区域

本研究试验数据区域为新疆维吾尔自治区昌吉回族自治州玛纳斯县玛纳斯新澳畜牧有限责任公司基地(北纬44°27′18″,东经86°10′47″),总面积约1 367 m2、试验(主体区域)面积约422 m2。该基地是一个集萨福克羊育种、种苗繁育、集约化养殖等多功能一体化的萨福克羊综合养殖基地。本试验选取的半封闭式萨福克羊养殖场按《畜禽养殖小区建设管理规范》进行设计,四面墙体均采用砖混结构,顶面采用钢板结构,地面是泥土结构建造半封闭羊舍(长约33.75 m,宽约12.5 m)。羊舍结构分为主体区域(中间,日常休息区域)、遮阳区域(北侧)、活动区域(南侧,饮食区),主体区域与遮阳区域以及活动区域都有可关闭门通道。羊舍夏季采用自然通风以及北侧的遮阳棚进行避暑,冬季在主体区域进行封闭式养殖,在主体区域安装了温度传感器、湿度传感器、噪声传感器、光照传感器、PM2.5传感器、PM10传感器、TSP(总悬浮颗粒物体积比)传感器、CO2传感器、NH3传感器以及H2S传感器,传感器分布在主体区域中心下檐,其中CO2传感器和TSP传感器距地面2.4 m,其余传感器距地面3 m左右,其平面示意图如图1所示。

图1 新疆羊舍监测平面示意图Fig.1 Schematic of Xinjiang sheep house monitoring

1.2 试验数据采集

以新疆玛纳斯新澳畜牧有限公司5号育种群母

羊舍相对湿度为研究对象,利用基于物联网的禽舍养殖环境监测系统,每10 min采集一次数据,将采集的2021年3月17—27日的1 584条羊舍参数数据作为试验数据,根据文献[23-25]可知,噪声过高易导致饲料利用率降低;氨气浓度过高易导致绵羊质量降低;湿热易导致羊的免疫功能下降;硫化氢浓度过高易阻碍动物呼吸中枢,甚至窒息死亡;二氧化碳浓度过高易导致动物缺氧,引发二氧化碳中毒;PM2.5指数、PM10指数、TSP过高易导致传染病及呼吸道疾病的发生;光照强度过高时间过长易抑制动物体内褪黑素的分泌;温度过高易对动物的繁殖能力以及饮水量和采食量产生不利影响。经过以上结果分析及畜牧业养殖专家指导建议,筛选影响因子包括空气温度、空气湿度、二氧化碳浓度、PM2.5指数、PM10指数、光照强度、噪声、TSP、氨气浓度、硫化氢浓度等参数,来实现对未来10 min的羊舍湿度预测。采集的羊舍养殖环境部分原始数据如表1所示。

表1 2021年3月17—27日采集的部分原始数据Tab.1 Some original data collected from March 16 to March 26, 2021

1.3 试验数据预处理

由于羊舍环境中各参数量纲和数值量级相差过大,为了提高预测精度,应对各数据项进行归一化处理,计算式为

(1)

式中Ymax——最大值Ymin——最小值

Yi——真实值Y′i——归一化值

1.4 性能评价

为评价本文提出的羊舍湿度预测模型性能,采用均方误差(MSE)、平均绝对误差(MAE)和决定系数R2作为预测结果的评价指标。

2 相关理论与技术

2.1 奇异谱分析(SSA)

奇异谱分析[26]适用于分析具有潜在结构的时间序列,其主要思想是通过对时间序列的轨迹矩阵进行分解和重构,从中提取出长期趋势信号、周期信号和噪声信号[27]。该方法将原始序列转化为平滑序列,通过消除噪声进行精准预测,主要用于识别和提取数据的主成分。具体步骤如下:

(1)嵌入

将长度为N的一维时间序列F=(f1,f2,…,fN)转化为d×K维的轨迹矩阵F。其中d=N-K+1,d为整数且1

(2)

式中K——窗口长度

N——样本数量

(2)奇异值分解

对F进行奇异值分解,先对FFT进行特征分解,得到d个降序排列的非负特征值λ1≥λ2≥…≥λd≥0,U1,U2,…,Ud为对应的正交特征向量,p为非零特征值的个数,则

(3)

(4)

F=E1+E2+…+Ep

(5)

Vi——主成分

Ei——基本矩阵

(3)分组

将F=E1+E2+…+Ep分割成q个不同的组I1,I2,…,Iq,记作Ii={i1,i2,…,ip},将q个不相交矩阵相加得到F,则

FIi=Fi1+Fi2+…+Fip

(6)

F≈FI1+FI2+…+FIq

(7)

(8)

式中αi——每组贡献率

(4)重构

(9)

2.2 粒子群优化算法(PSO)

粒子群优化算法[28]是一种全局随机搜索算法,通过追随当前搜索到的最优值来寻找全局最优,其基础是信息的社会共享。PSO具有算法简洁、易于实现、参数调整较少、不需要梯度信息的优点,可综合3条简单准则来构建这个行为:远离最近的邻居;向目标靠近;向群体的中心靠近。文献[29]试验结果显示,采用 PSO 优化算法代替传统 BPTT(基于时间的反向传播)算法对 LSTM 网络内部权值更新,进行轨迹预测,所需时间更短,能够满足在线预测的时间要求,精度也有所提高。具体步骤如下:

(1)初始化参数

(2)个体极值与全局最优解

(3)更新速度和位置

令k=0,k←k+1,根据公式

(10)

式中r1、r2——[0,1]之间的随机数

c1、c2——学习因子

w——惯性权重因子

(11)

2.3 长短时记忆网络(LSTM)

长短时记忆网络[30]是为了解决长期依赖而提出的一种特殊的RNN(循环神经网络)变体,其在RNN的基础上在隐藏层增加了记忆模块,通过在网络拓扑结构中引入门控单元,来控制记忆细胞删减或添加信息,能够有效解决反向传播过程中存在的梯度消失和梯度爆炸的问题。

LSTM神经网络由输入层、输出层和隐含层3部分组成,并由多个循环单元相互递归连接,每个神经元看作一个记忆细胞,每个记忆模块由输入门、输出门和遗忘门构成,其基本结构[31]如图2所示。

图2 LSTM 结构图Fig.2 LSTM structure diagram

(1)输入门

输入门用于控制网络当前输入数据xt流入记忆单元的数量,也就是有多少可以保存在ct中,输入门公式为

it=σ(Wi[ht-1,xt]+bi)

(12)

式中σ——sigmoid函数

it——输入门Wi——输入门权重

bi——输入门偏置

ht-1——上一时刻隐藏层单元的输出

(2)遗忘门

遗忘门可以控制信息的选择或遗忘,决定历史信息中的哪些信息被丢弃,也就是判断上一时刻记忆单元ct-1中的信息对当前记忆单元ct的影响程度,遗忘门公式为

ft=σ(Wf[ht-1,xt]+bf)

(13)

(14)

(15)

式中Wc——候选向量权重

Wf——遗忘门权重

bf——遗忘门偏置

ft——遗忘门

bc——候选向量偏置

(3)输出门

输出门控制记忆单元ct对当前输出值ht的影响,也就是记忆单元中的哪一部分会在t时刻输出,输出门公式为

ot=σ(Wo[ht-1,xt]+bo)

(16)

ht=ot⊙tanh(ct)

(17)

式中ot——输出门

Wo——输出门权重

bo——输出门偏置项

3 试验与结果分析

3.1 试验数据

本文选取的样本数据为新疆玛纳斯新澳畜牧有限公司5号育种群母羊舍2021年3月17—27日的养殖环境数据,每10 min记录一次,共计1 584条。将空气温度、空气湿度、二氧化碳含量、PM2.5指数、PM10指数、光照强度、噪声、总悬浮颗粒物体积比、氨气浓度、硫化氢体积比共10种环境参数作为输入参数,用以预测10 min后湿度数据,采用前90%的数据作为训练集,后10%数据作为验证集,其羊舍原始湿度数据如图3所示,据图3可知,羊舍湿度数据呈现周期性、非线性的特点。

图3 原始湿度变化曲线Fig.3 Raw humidity data chart

3.2 试验环境

本试验环境为:处理器Intel I5-5200U,CPU频率2.2 GHz,内存8 GB,操作系统Windows 10,程序设计语言Python 3.7,集成开发环境Anaconda 3,编程语言为Python 3.6,试验采用Keras和Sklearn来实现基于SSA-PSO-LSTM组合模型的羊舍空气湿度预测。

3.3 试验过程

为了提高湿度预测模型性能,将SSA、PSO和LSTM模型有机结合,构建基于SSA-PSO-LSTM的羊舍养殖环境湿度非线性组合预测模型,其基本思想:对羊舍养殖环境数据进行归一化处理,将SSA作为长短时记忆神经网络的前置预处理系统,根据公式设置嵌入维度分离出正常序列和噪声序列,然后分别对正常序列和噪声序列进行长短时记忆神经网络预测。使用PSO优化算法对两个模型中神经元个数进行调优,使其精度进一步提高,最后将两个模型结果做和得出预测结果。具体步骤如图4所示。

图4 预测流程图Fig.4 Forecast flow chart

(1)将新疆羊舍湿度数据标准化处理,并划分样本训练集和测试集。其中前90%用于训练,后10%用于测试。

(2)采用奇异谱分析法(SSA)将训练集数据分为i组,经SSA分解后全部分量组如图5、6所示。对序列进行重构,将分量值超出[-0.5,0.5]的序列做和得到趋势序列使其趋势序列的贡献度大于99%。剩余的序列做和得到噪声序列。

图5 SSA分量组1Fig.5 SSA component group 1

图6 SSA分量组2Fig.6 SSA component group 2

(3)使用粒子群优化算法(PSO)对LSTM算法的迭代数及神经元个数进行调优,并分别对趋势序列和噪声序列进行预测,得到基于趋势序列的PSO-LSTM模型和基于噪声序列的PSO-LSTM模型。其中预设迭代数范围为[0,10],神经元个数为[0,20],共寻优20轮,每轮5个粒子,以R2作为适应度,基于趋势序列的PSO-LSTM模型寻优结果显示,PSO在第2轮之后每代的最优适应度均大于0.985,在第15轮之后每代的最优适应度均大于0.99,已基本上满足LSTM模型的精度要求。

(4)将基于趋势序列的PSO-LSTM模型和基于噪声序列的PSO-LSTM模型预测结果相加,得到最终结果。预测结果如图7所示。

图7 SSA-PSO-LSTM预测结果Fig.7 SSA-PSO-LSTM prediction results

3.4 结果分析

为了验证提出模型的预测性能,将本文所提出的SSA-PSO-LSTM预测模型同其他7个模型进行对比,包括支持向量回归[32](Support vector regression,SVR)、极限学习机[33](Extreme learning machine, ELM)、SSA-PSO-ELM、LSTM、GA(遗传算法)-LSTM、PSO-LSTM、EMD(经验模态分解)-PSO-LSTM,试验以相同数据源为基础,采用训练集对上述模型进行训练,测试集对模型预测性能进行验证,并采用均方误差、平均绝对误差和决定系数R2作为预测模型的评价指标,预测模型结果对比如图8所示。

图8 预测结果对比Fig.8 Comparison of prediction results

由图8可知,不同预测模型预测结果的拟合曲线趋势相同,但波动较大,易出现极值点,而本文所提出的SSA-PSO-LSTM的预测曲线与真实值曲线最为接近,能够很好地拟合羊舍湿度非线性变化曲线,取得较好的预测效果。

本文所提出的SSA-PSO-LSTM预测模型以及7个对比模型的性能评价指标如表2所示。可以看出,本文提出的SSA-PSO-LSTM预测模型的均方误差、平均绝对误差和R2分别为1.127%2、0.803%和0.988,各项评价指标均优于其它预测模型,与传统的SVR、ELM和LSTM相比,该算法的均方误差分别降低了86.30%、78.41%和74.35%,表明仅靠单一模型自身训练,不能达到最优效果,其预测效果不能满足实际需求。与经过优化处理后的GA-LSTM、PSO-LSTM相比,本文提出的算法的均方误差分别降低了53.14%和49.57%,表明采用优化算法能够提高模型的预测精度,且粒子群优化算法的寻优效果优于遗传算法,但原始数据由于存在噪声干扰,仅通过优化后的模型预测效果不理想,而本文所提出的经过SSA降噪处理后的模型效果更优。同时将EMD-PSO-LSTM模型与本文所提模型对比,其MSE更是降低了87.35%,试验结果表明SSA对羊舍非线性湿度序列中的非平稳特征提取具有优异效果。为了更好地说明该模型的优越性,避免模型的偶然性,将SSA-PSO模型算法应用于ELM算法上,同样相比原模型拥有更好的预测准确率。结果表明,本文提出的SSA-PSO-LSTM预测模型具有更高的准确性与更好的拟合性,更有利于单一时间序列预测,实时性较好,具有较强记忆功能的LSTM网络,能够对历史数据进行记忆,准确预测10 min后羊舍空气湿度,为羊舍空气湿度预测预警提供了强有力的决策依据。

表2 不同预测模型试验结果对比Tab.2 Comparison of test results of different prediction models

4 结论

(1)SSA能够提取时间序列中的不同成分序列,直接分离原始信号的趋势、震荡和噪声信息,减少计算量,降低数据的复杂度,有效压缩研究对象的时空信息,适用于非线性数据进行时频分析。

(2)采用PSO算法对LSTM进行全局搜索,解决了依据经验选取参数的弊端,对比GA算法具有更快的收敛速度,可以获得更优参数来优化模型,使LSTM的R2从0.954升至0.976。

(3)试验证明,本文提出的SSA-PSO-LSTM模型能够有效地预测短时间羊舍空气湿度变化趋势,预测精度高于SVR、ELM等典型的预测模型,具有良好的泛化性、稳定性和收敛性,预测结果可对羊群生长环境改善提供重要支持,有利于羊群健康成长,为羊舍空气湿度预警提供有力支撑。

猜你喜欢
羊舍湿度噪声
羊热应激 这里有办法快速解决
“白噪声”助眠,是科学还是忽悠?
湿度变送器测量结果不确定度评定
基于声类比的仿生圆柱壳流噪声特性研究
加湿器用不对 警惕肺炎缠身
舍饲绒山羊的养殖技术要点
务川县高床漏缝式羊舍的推广应用
要减少暴露在噪声中吗?
带有双检测结构的电缆接头保护装置
跟踪导练(二)(2)