基于遗传算法和BP神经网络的空气质量预测模型研究

2018-01-03 04:27牛玉霞
软件 2017年12期
关键词:适应度空气质量遗传算法

牛玉霞

(南通科技职业学院,江苏 南通 226007)

基于遗传算法和BP神经网络的空气质量预测模型研究

牛玉霞

(南通科技职业学院,江苏 南通 226007)

随着雾霾天气频发,大气污染和环境管理引起了人们越来越多的关注。能够精确监测化工园区厂企排放污染物,并能根据周边环境变化对空气质量做出相应预测,对广大民众健康甚至生命安全而言,具有重要的现实意义。本文利用遗传算法优化BP神经网络的权重和阙值,根据天气预报的相关变量,构建了空气质量预测模型,使预测模型的网络收敛速度、预测精度、拟合度以及泛化能力都有所w提高。

BP神经网络;遗传算法;VOCs;空气质量预测

0 引言

《中华人民共和国环境保护法》明确提出:“生态环境是人类生存和发展的基本条件,是经济、社会发展的基础。保护和建设好生态环境,实现可持续发展,是我国现代化建设中必须始终坚持的一项基本国策。”然而,我国正处于工业化发展前期,长期沿用高物耗、高能耗、高污染的粗放型经济模式,对环境造成了很大破坏。尽管环境管理部门可以通过信息化手段监测污染源排放情况,但是污染一旦发生,无法补救。通过分析历史数据、环境参数变化,预测污染源排放数据变化情况,在污染发生之前,给予相应预警,可以有效保护环境。

VOCs是挥发性有机化合物(volatile organic compounds)的英文缩写,有毒性,是造成雾霾的主要成因,分析并预测 VOCs的变化趋势,对空气质量的变化预测有重要意义。改进的神经网络运用改进的算法训练神经网络,继承了神经网络自学习和自适应的优点,同时避免了神经网络可能收敛到局部最优的缺点。本文选取江苏南通化工企业VOCs的现场监测小时数据,对BP神经网络模型的个体编码方式、适应度函数和种群交叉率、变异率进行优化,以实现对空气质量变化趋势的预测。

1 BP神经网络基本模型

1.1 BP神经网络原理

图1 BP神经网路模型Fig.1 BP neural network model

当学习模式供给网络后,神经元激活值从输出层传播,在输出层各神经元输出对应的值,然后按照减少与期望输出与实际输出的准则,从输出层回到隐含层,再回到输入层修正各个网络系数。由于BP网络有处于中间的隐含层,并有相应的学习规则可循,可以训练这种网络,使其具有对非线性模式的识别能力。因此,本文采用三层 BP神经网络对空气质量预测展开研究。

1.2 BP神经网络算法

BP神经网络通过修正输出层和隐含层的权值,

神经网络模仿脑细胞的结构和功能,模拟了人的思维模式和信息处理机制。由一些简单单元连接组成,每一个单元都有一个输出值,传递给下一连接单元,作为下个连接单元的输入值。具有非线性的特点,运用训练样本进行自学习、自适应,从而实现对全部数据的预测。

BP(back propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入——输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐含层(hide layer)和输出层(output layer)。每一层由一定数量的神经元构成,其拓扑结构如图1所示。反复训练学习,使误差不断减小,从而得到满意的结果。假定网络训练样本集合为其中第t层网络的神经元有个顶点,假设第k个神经元顶点的连接权值向量为,阙值为θk,那么第k个神经元对输入样本数据xt的实际输出为:

具体学习过程如下:

(1)初始化训练样本和阙值,确定J的终止值ε。

(2)计算各层神经元的实际输出如式(1)所示。

(3)对每个训练样本zp,按照式(2)计算误差。

(4)如果满足误差要求,即J<ε,则结束算法;如果不满足,则执行第(5)步。

(5)反向计算每个训练样本的网络连接权值和神经元阙值的修正量,调整隐含层的权值 Win和隐含层的权值Wim。

(6)继续执行第(2)步,直到满足J<ε为止。

BP神经网络的学习训练算法流程图如图2所示。

图2 BP神经网络学习训练算法流程图Fig.2 BP neural network learning and training algorithm flow chart

2 遗传算法基本模型

2.1 遗传算法原理

遗传算法(Genetic Algorithm)模拟生物进化过程和遗传学机理,自然选择,优胜劣汰,从而得到最优解。遗传算法的整体搜索策略和优化搜索方法在计算时不依赖于梯度信息或其它辅助知识,而只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法提供了一种求解复杂系统问题的通用框架,它不依赖于问题的具体领域,对问题的种类有很强的鲁棒性,被广泛应用于许多科学领域。遗传算法包括选择、交叉和变异三个算子。

(1)选择算子

从群体中选择优胜的个体,直接遗传到下一代,或者通过交叉产生新的个体再遗传到下一代。最常用的方法是轮盘赌选择法,假设种群中个体 i的适应度函数是fi,种群中的个体数量是n,那么是群里适应度的和,产生后代的能力如式(3)所示,其中k=1,2…。

(2)交叉算子

把两个不同的父代染色体基因进行交换,产生新的个体。由于父代是经过选择策略产生的优胜个体,所以遗传给后代的也是优良基因,如此进行多次循环迭代,最后出现的集多数优良基因于一体的个体便是最优解。常用的交叉有单点交叉、两点交叉、多点交叉、均匀交叉等。

(3)变异算子

以一定概率改变个体染色体中的部分基因,从而形成新个体。对由0和1编码的个体来说,就是将位值反转。遗传算法中的变异操作是为了保持种群的多样性,防止基因丢失。

2.2 遗传算法基本步骤

遗传算法的基本步骤如图3所示。

(1)给种群个体进行编码。

(2)初始化种群。染色体是组成种群的基本单元,一个个体即一个染色体,在编码的基础上,给每个个体一个初始解。

(3)设计适应度函数,确定个体的环境适应能力,适应度值越高,适应能力越强,存活的几率就越大。

(4)基于适应度函数,从父代种群中选择优胜个体。

(5)根据交叉率执行交叉操作。

(6)根据变异率执行变异操作。

(7)判断是否达到终止条件,如果达到了,转向(8),否则,转向(3)。

(8)完成进化,选出适应度函数值最大的个体作为问题的最优解。

图3 遗传算法基本步骤Fig.3 Basic steps of genetic algorithm

3 遗传算法优化的BP神经网络及其应用

由于 BP神经网络的学习函数比较复杂,在梯度下降中可能会陷入局部极值,使得训练结果不如人意或直接失败。而遗传算法有全局搜索的优势,可以弥补BP神经网络的不足,利用遗传算法对BP神经网络进行优化,大大提升了预测结果的稳定性和精确性。

3.1 优化的BP神经网络预测模型整体设计

优化的 BP神经网络空气质量预测模型的算法大致分为三部分。

(1)确定BP神经网络的结构

依据VOCs预测需求,以天气预报和空气质量数据为基础,构建 BP神经网络的结构,即设计输入层、输出层变量,确定隐含层的节点数和层数。

(2)优化BP神经网络

设计适应度函数,计算每个个体的适应度值,通过遗传算法中的选择、交叉、变异等相关操作,确定优胜个体,优化 BP神经网络中每一层的权重和阙值。

(3)形成预测模型

利用优化的 BP神经网络进行种群初始化,学习训练,输出预测结果。

空气质量预测模型的算法流程如图4所示。

图4 优化的BP神经空气质量预测模型流程图Fig.4 Optimized BP neural air quality prediction model flow chart

3.2 空气质量预测模型详细设计

3.2.1 设计BP神经网络结构

(1)设计输入、输出层

输入层神经元节点的数量对 BP神经网络而言非常重要,节点过多或过少都会影响预测结果。根据实际应用情况,本文选取对短期VOCs预测结果产生影响的主要因素:VOCs历史监测数据、天气情况、风向、风力、天气温度等作为空气质量预测模型的输入变量。因此,输入层的神经元节点确定为6,输出层的神经元节点数为1,即VOCs污染预测值。如表1所示。

表1 空气质量预测模型输入、输出层神经元节点Tab.1 Air quality prediction model input and output layer neuron node

(2)设计隐含层

采用试凑法确定隐含层的节点数,公式如式(4)所示。

n是输入层的神经元节点数量,q是输出层的神经元节点数,α是一个整数,取值范围为[1,10]。根据经验,结合公式(4),初步确定隐含层的神经元节点数为4-14,用同一组样本进行训练,对隐含层节点数的最佳取值进行实验,取相对误差最小,精确度最高的一组数据,最终确定隐含层的节点数为6。

(3)设计传递函数

本文的 BP神经网络模型输出层神经元使用purelin线性函数传递参数,隐含层使用tansig函数传递参数,其数学模型如图5所示。

图5 预测模型输出层和隐含层传递函数Fig.5 Prediction model output layer and hidden layer transfer function

(4)设计学习函数

采用L-M(Leveberg-Marquardt)算法为预测模型的学习函数,该算法与高斯牛顿法非常相似,具有同样的网络收敛和学习速度。L-M有效提升了迭代计算效率,总体性能也大大提高。具体实现步骤如下:

①设λ为衰变因子,初始值取 0.1,设θ为倍数常量,取值为10,λ最大取值为 h = e25。

②设W是当前的权值向量,利用反向传播算法,计算误差函数在连接权上的分梯度以及海森矩阵H。

③调整海森矩阵,求得H′= H + λ I。

⑤计算W′对应的误差J′。

⑥比较J′与终止值 ,若J′<ε,则跳转至⑧。

⑦λ=λ* θ,若λ>h,则λ=h,跳转至③,否则进入下一步。3.2.2 利用遗传算法优化预测模型的权重与阙值

BP神经网络的初始值和阙值都是随机生成的,会导致输出结果不稳定。利用遗传算法的优势,通过全局搜索,给 BP神经网络的初始值和阙值进行最优选择,二者结合,使得预测模型更加科学、高效。下面详细阐述遗传算法优化BP神经网络的过程。

(1)初始化种群

将 BP神经网络每层的权重和阙值进行编码,用随机法初始化种群。

(2)计算适应度值

利用式(5)计算适应度值。

其中,n为BP神经网络中输出节点数,k为相关系数,iy为第 i个节点输出的期望值,io第 i个节点输出的预测值。

(3)选择操作

采用轮盘赌法进行选择操作,利用本文中的公式(3)计算个体产生后代的能力。

(4)交叉操作

采用实数交叉的方法,第m个染色体αm和第n个染色体αi在j位的交叉操作如式(6)所示。

其中x为[0,1]的一个随机数。

(5)变异操作

对第m个个体第n个基因αmn进行变异操作,如式(7)所示。

其中,αmin和αmax分别为基因αmn的下界和上界,r是[0,1]之间的一个随机数。

4 结论

本文构建的 GA-BP空气质量预测模型,以MATLAB为编程环境,选取江苏省南通市化工企业实时监测的VOCs小时数据为样本,结合天气预报气象数据(天气、温度、风向、风力等),对模型进行了模拟实验,并与 BP模型进行了对比,得出以下结论。

(1)BP网络模型经过15次迭代误差值收敛到最小,GA优化的BP神经网络迭代次数是6,说明优化的BP神经网络收敛速度更快。

(2)利用 BP神经网络模型得到的污染物预测结果平均相对误差在 20%-60%之间,GA优化的预测模型得到的平均相对误差在20%-40%之间,说明优化的预测模型更接近污染物真实值变化趋势,拟合度更高。

(3)优化的 BP神经网络预测模型对空气质量指数的预测误差明显小于 BP网络预测模型,说明GA-BP预测模型预测精度更高。

(4)通过对两种模型的输出结果与期望输出进行分析,发现GA-BP模型的相关系数更高,说明优化的预测模型有更强的泛化能力。

本文构建了 BP神经网络空气质量预测模型,并利用遗传算法对模型进行了优化,使得网络收敛速度、预测精度、拟合度以及泛化能力都有所加强。具体实验过程、样本选择、样本数据处理、预测结果数据等将在其他文献中详细阐述。遗传算法虽然在一定程度改善了 BP神经网络在学习过程中容易陷入局部极小值的情况,但并没有全选消除。在模型泛化性和函数拟合度之间找到一个良好的平衡点,是本研究进一步要探索的地方。

在工业化进程日益加快的今天,我们更应该重视保护宝贵的空气资源,利用信息化手段,对污染物的排放进行实时监测和有效预测,可以使人们的日常活动有一定的前瞻性和针对性,从而有效保护环境,维护人类健康。

[1] 赵李明. 基于遗传算法和BP神经网络的广州市空气质量预测与时空分布研究[D]. 江西理工大学, 2016.

[2] 鲍慧. 基于BP-GA神经网络的六安市空气质量预测研究[D]. 安徽大学, 2015.

[3] 祝翠玲, 蒋志方, 王 强. 基于B-P神经网络的环境空气质量预测模型[J]. 计算机工程与应用, 2007, 43(22): 223-227.

[4] 张齐, 罗国亮, 李 佳, 赵坤荣. 优化进化神经网络的空气质量预测研究[J]. 计算机工程与应用, 2009, 45(28): 211-214.

[5] Jeong Gu-Young, Yu Kee - Ho. Morphological classification of ST segment using reference STs set[C]//29th Annual International Conference of the IEEE EMBS, 2007: 636-639.

[6] Paoli C, Notton G, Nivet M L, et al. A Neural Network Model Forecasting for Prediction of Hourly Ozone Concentration in Corsica: Environment and Electrical Engineering(EEEIC), 2011 10th International Conference on, 2011[C].

[7] 徐玲, 杨丹, 王时龙, 聂建林. 基于进化神经网络的刀具寿命预测[J]. 计算机集成制造系统, 2008, 14(1): 167-171.

[8] 杨家荣, 许伟, 谈宏志. 基于人工神经网络的车间产能预测[J]. 软件, 2014, 35(8): 22-25.

[9] 李政义. 基于GIS的城市空气污染预警及显示研究[D]. 西安科技大学, 2014.

[10] 陈晓梅, 杨成祥. 遗传进化算法在时间序列建模中的应用[J]. 计算机工程与应用, 2005, 41(5): 215-217.

Research on Air Quality Prediction Model Based on Genetic Algorithm and BP Neural Network

NIU Yu-xia
(Nantong science and technology Academy, Nantong, Jiangsu 226007)

With the frequent haze and haze, more and more attention has been paid to the air pollution and environmental management. It can accurately monitor pollutants emitted by factories and enterprises in chemical industrial parks, and predict air quality according to the changes of surrounding environment, which is of great practical significance for the health and even life safety of the masses. In this paper, we use genetic algorithm to optimize the weights and threshold values of BP neural network. According to the relevant variables of weather forecast, we build the prediction model of air quality, so that the prediction speed, prediction accuracy, fitting degree and generalization ability of the prediction model are all improved.

BP neural network; Genetic algorithm; VOCs; Air quality prediction

TP391.8

A

10.3969/j.issn.1003-6970.2017.12.009

本文著录格式:牛玉霞. 基于遗传算法和BP神经网络的空气质量预测模型研究[J]. 软件,2017,38(12):49-53

南通市科技局科技计划项目“基于物联网的化工园区VOCs在线监控系统研究”(MS12016028)

牛玉霞(1981-),女,讲师,主要研究方向:计算机软件技术、物联网技术。

猜你喜欢
适应度空气质量遗传算法
改进的自适应复制、交叉和突变遗传算法
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
“空气质量发布”APP上线
车内空气质量标准进展
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车
开展“大气污染执法年”行动 加快推动空气质量改善
基于空调导风板成型工艺的Kriging模型适应度研究
基于改进的遗传算法的模糊聚类算法