基于ZigBee和循环神经网络的城市空气质量预测

2021-07-03 04:55唐新宇唐超尘
沈阳大学学报(自然科学版) 2021年3期
关键词:空气质量神经网络样本

唐新宇, 唐超尘, 刘 鑫

(. 广东工商职业技术大学 计算机学院, 广东 肇庆 526040;2. 西安电子科技大学 通信工程学院, 陕西 西安 710071;3. 桂林理工大学 信息科学与工程学院, 广西 桂林 541004)

城市空气质量监测与预测是城市环境管理的重要部分,通过物联网方式实现城市空气质量的实时监测,可以有效获取城市各采集点的多样化空气质量数据,然后对采集获得的海量空气质量数据进行挖掘分析,以便根据历史空气质量数据对未来空气质量数据进行预测,根据预测结果采取相应的管控措施,以便能够优化城市产业结构和对城市污染排放进行有的放矢的管控.

在对城市空气质量预测时,需要对城市空气质量监测的海量数据进行分析[1],在对大数据进行数据挖掘时,采用深度学习算法通过大量数据样本训练获得需要的结果.近年来,采用深度学习算法对城市空气质量分析的研究较多,卢彬等[2]采用主成分分析算法与贝叶斯网络相结合的方法来实现空气质量预测,可以获得稳定的空气质量分级结果,但对空气质量指数(air quality index,AQI)具体值预测未作说明.林开春等[3]采用随机森林的方法实现城市空气质量预测,通过一系列的决策树能够实现空气质量等级情况准确预测,但其预测效率并不高,且AQI值预测精度不高.考虑到空气质量预测是根据历史时间段的空气监测数据经过算法训练后获得的结果,有较强的时间跟踪性,为了获得准确的空气质量预测结果,需要对当前时间前的若干时间段进行分析处理,因此本文选择了擅长处理时间序列训练的循环神经网络(recurrent neural network,RNN)算法来完成城市空气质量的预测.

1 基于ZigBee的城市空气质量监测

城市空气质量预测的前提是需要获得该城市空气质量历史数据,获得城市实时准确的空气质量数据是研究的起点.在空气质量数据获取时对空气质量监测传感器采用ZigBee的组网模式,可以有效降低硬件投入,并且完成多点采集的数据自行组网传输.

ZigBee网络在工作时能够完成自组网,且实现网络内的数据流畅传输,其主要网络结构如图1所示[4].

图1 ZigBee结构Fig.1 ZigBee structure

终端节点主要集成了空气质量传感器和RF模块的节点,终端节点的数据需要经过路由节点传输至网关节点,然后通过网关节点统一打包后传送至服务器.在组网时,终端节点既可以和路由节点相连,也可以和网关节点直接相连,在实际组网中,根据终端节点与路由和网关节点的位置分布来选择路由[5],为了防止因路由节点故障而导致与之所连的终端节点数据上传不了的问题,将路由节点相连,保证终端节点的数据有多条路由可达[6],确保数据均能上传至服务器.

在完成了城市空气质量监测的ZigBee布网之后,采用物联网方法对空气质量数据进行监测.通过ZigBee网获得空气质量数据,将数据传送至后台,进行大数据分析,可以统计城市空气质量阶段详细数据,完成各种污染物在不同时间的定量分析,同时也可以根据历史数据预测分析未来空气质量,根据分析结果采取应对策略,提高城市空气质量管理水平.

采用ZigBee的城市空气质量监测分析主要结构图如图2所示.

图2 ZigBee组网空气质量监测结构[7]Fig.2 Air quality monitoring structure based on ZigBee network

2 基于循环神经网络算法的空气质量预测

在图2所示ZigBee组网空气质量监测结构中,后台分析中的预测分析功能模块是整个系统的关键和难点.为了提高该模块的预测准确率,提出采用循环神经网络(RNN)算法来完成城市空气质量的预测.

2.1 循环神经网络算法

在神经元形成过程中会将各个触点获取的数据进行加权并赋予一定偏置,设有n个触点xi(i=1,2,…,n),神经元形成的主要表示方式为

(1)

其中,wi(i=1,2,…,n)为各个触点权重,b为常数.

当神经元经过激励后,其数学表达式为

(2)

在式(1)和式(2)的基础上,RNN网络隐藏层t时刻的输出不仅取决于t时刻的输入,还取决于t时刻前若干时刻的隐藏层输出,令x和o分别为RNN的输入与输出,s为隐藏层激励后的结果,其循环结构如图3所示.

图3 RNN结构Fig.3 RNN structure

图3中U、V和W表示各层神经元的连接权重矩阵,设样本xt经过隐藏层之后,结合前一时刻的隐藏层输出,经过激励后为[8]

st=f(|U|xt+|W|st-1+ht).

(3)

式中f(·)和ht分别为隐藏层激励和偏置.

s(t)经过输出层的g(·)激励后,得到

ot=g(|V|st+bo).

(4)

式中偏置bo为偏置常量.

RNN的核心操作就是隐藏层输出不断循环,通过这种循环,利用历史时间序列训练当前数据样本,ot的输出与t时刻前的多个输入有关[9].

设第k个节点的训练输出和实际标签分别为yk和dk,则误差项δk为[10]

δk=(dk-yk)yk(1-yk).

(5)

隐藏层节点j的误差为

(6)

式中:hj表示输出;Wjk为节点j到输出层节点k的权重;K为输出神经元个数.权重更新为

(7)

式中η为学习率.

偏置Δbk(n)的更新方式为

(8)

式中,α为偏置更新步长,一般α=1.调整后的权重为

wjk(n+1)=wjk(n)+Δwjk(n).

(9)

调整后的阈值为

bk(n+1)=bk(n)+Δbk(n).

(10)

通过式(11)~式(15)可以确定V和bo,按照此法继续反向求解U,W表示当前时间序列对当前时刻的权重影响,可灵活设置,本文设置为参与计算的时间序列的倒数.

所有节点的误差E为

(11)

当E满足设定的阈值,迭代停止,获得稳定的RNN模型.

2.2 空气质量数据构成

在建立RNN的城市空气质量预测模型之前,需要对空气质量预测指标及参数进行分析,空气质量监测对象主要为SO2、NO2、CO、O3、PM10和PM2.5,而空气质量标准一般用AQI表示,AQI的值与6种污染物的最大值有关,AQI的分级如表1所示.

表1 空气质量等级Table 1 Air quality grades

根据传感器获得的空气质量数据,输入至RNN网络模型进行训练,对获得的训练结果进行空气质量预测.

2.3 空气质量预测流程

从ZigBee网络中获取城市空气质量组成各要素,数据初始化后传送至RNN进行训练,训练过程中选取参与循环的时间序列个数为T,各时间序列的权重为1/T,设定AQI预测准确度阈值,当达到设定条件,获得预测结果见图4.

图4 空气质量预测流程Fig.4 Air quality prediction process

3 实例仿真

为了验证ZigBee和RNN深度学习在城市空气质量预测中的性能,选择某市2019年10个监测点ZigBee网络搜集的共计1 891条空气质量数据作为仿真数据源,RNN训练与测试样本分别为1 791和100个.首先采用RNN对城市空气质量AQI进行仿真,其次采用常用空气质量预测算法和本文算法分别对数据样本进行仿真,对比其预测性能.

3.1 RNN的预测性能

先对1 791个样本进行RNN训练,根据训练结束时获得的稳定RNN模型对100个测试样本进行空气质量AQI值预测,其预测结果如图5所示.

图5 测试样本实际AQI与预测对比Fig.5 Comparison of actual and predicted value of AQI of test samples

从图5可以看出,100个测试样本的实际AQI和预测AQI值大部分拟合效果好,只有个别样本出现了较大偏差,编号为20、21和72的样本AQI偏移较大,其他样本AQI值差异较小.为了更加直观地显示预测AQI和实际AQI的差别,统计所有测试样本的绝对误差,结果如图6所示.

图6 测试样本的预测绝对误差Fig.6 Prediction absolute error of test sample

从图6得,测试样本的AQI最大绝对误差为11;最小绝对误差为0.其中AQI偏差为1的样本数量最多,表明RNN算法对该城市大部分样本的空气质量预测准确率高.从图中可得AQI偏差达到10的样本仅有3个,AQI的预测性能较稳定.

3.2 不同算法的预测性能

应用BP神经网络[11]、深度置信网络(dynamic bayesian network,DBN)[12]、卷积神经网络(convolutional neural network,CNN)[13]等常用的空气质量预测算法和本文算法分别对该城市AQI预测准确率进行仿真,仿真结果如图7和表2所示.

图7 不同算法的AQI预测准确率Fig.7 AQI prediction accuracy of different algorithms

表2 不同算法的AQI预测误差性能

由图7可见,在AQI预测准确率方面,RNN性能最优,CNN算法次之,两者的AQI预测准确率均超过了90%,BP神经网络算法最差;从AQI的预测时间来看,BP神经网络性能最优,65 s完成了收敛,RNN和DBN次之,CNN最差,大约需要75 s.

从表2可以看出,在平均绝对误差(mean absolute error, MAE)和均方误差(root mean square error, RMSE)性能方面,RNN最优,其次是CNN,RNN和CNN算法在预测误差性能方面差异不大,BP神经网络算法表现最差.综合对比可知,本文算法在AQI的预测性能方面适应度更高,综合性能更优.

4 结 语

通过ZigBee组网采集的城市空气质量数据实现方式灵活简单,通过ZigBee网络获得的城市空气质量数据样本经过RNN网络训练,获得了较高的AQI预测准确率,预测误差性能优.因此,RNN深度学习算法对城市空气质量预测适用度高,有一定推广价值,后续研究将重点进行RNN网络调参,以便进一步提高空气质量预测的稳定性.

猜你喜欢
空气质量神经网络样本
基于神经网络的船舶电力系统故障诊断方法
乌海市雾对空气质量的影响
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
规划·样本
人大专题询问之“方城样本”
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
随机微分方程的样本Lyapunov二次型估计
“官员写作”的四个样本