基于GA-BP神经网络模型的大气能见度预测

2020-10-09 10:23苏靖晰王圣堂陈红敏王永忠
电脑知识与技术 2020年18期
关键词:BP神经网络遗传算法

苏靖晰 王圣堂 陈红敏 王永忠

摘要:为探究成都地区大气能见度的区域特性,构建基于GA-BP神经网络的大气能见度预测模型,将空气中的相对湿度、PM2.5及PMio作为能见度主要影响因子输入到预测模型中,输出预测时间段每小时的大气能见度,再与实际值作比较。结果显示,经过遗传算法优化的BP神经网络预测模型能较好地预测该地区的大气能见度,预测值基本贴近于实际值,且预测结果优于BP神经网络。

关键词:大气能见度;BP神经网络;遗传算法

中图分类号:TP391 文献标识码:A

文章编号:1009-3044(2020)18-0019-03

开放科学(资源服务)标识码(OSID):

大气能见度是指人们在气溶胶粒子作用下所能看到物体大致轮廓的最大水平距离,同时也是表征空气质量的一项重要指标[1]。随着工业化生产的飞速发展,低能见度的发生频率也越来越高。低能见度不仅影响人们的生活质量,同时也严重危害到公路及航空运输的正常运行,造成了大量的人员伤亡及财产损失,因此低能见度的精准预测成为规避不安全事件的主要手段[2]。

国内外针对能见度的预测研究开始于20世纪50年代[3],Stuart Naegele和William Sellers[4]對美国的18个机场的能见度与其影响因子做线性回归分析,发现相对湿度与气溶胶粒子浓度能较为准确预测大气能见度的数值,但由于线性函数的局限性,导致预测精准度较为粗糙。Srivastava SK等[5]运用ARIMA模型对印度加兹阿巴德市的雾霾发生概率进行预测,结果显示预测较传统预测方法要好。而国内学者宋明等[6]研究能见度与相对湿度和PM2.5及PM10之间的相关性发现,多元非线性回归模型能较好地预测大气能见度的变化趋势。Marzban等[7]对预测方法进行改进,发现神经网络模型的预测性能较多元非线性回归预测要好。

本文所采用的数据来源于2014-2018年成都气象观测站及环境监测站的大气能见度、相对湿度、PM25及PM10质量浓度的小时数据,共28346组。

1 BP神经网络及遗传算法的原理及适用性

BP神经网络是人工神经网络中最常使用的一种网络模型,其基于误差反向传播来调整权重和阈值从而达到进一步减小误差的方法,经过多次迭代调整从而达到误差均方满足精度为止。BP神经网络一般具有3层或3层以上的层级结构,包含输入层、输出层以及隐含层,层级结构内部存在有限个节点,层与层之间进行信息的正向传播及误差的反向传播。信息通过输入层正向传播到隐含层再到输出层,输出结果与实际结果之间的误差均方不满足精度要求,则误差反向传播并逐层修改权值及阈值,再进行下一步的信息正向传输,如此经过多次迭代后得到满足输出精度的值为止。

BP神经网络是一种模仿人类大脑结构和信息处理方式的一种人工模型,它反映了人类大脑的一种智能化信息处理方式,其具有极强的并行处理、自学习和自适应等特性。但BP神经网络也存在着一定的缺陷,随着样本数据量的增大,BP神经网络存在着收敛慢、网络拓扑结构不稳定、易陷入局部最优解和平坦区域等问题,为了解决该类问题,在本文预测模型中引入遗传算法对BP神经网络进行优化,BP神经网络的层级结构如图1所示。

遗传算法是模拟大自然在进化过程所表现出“优胜劣汰”的自然选择和基于遗传学生物进化过程的一种计算模型,其运算的本质是在一个大的数据样本中随机选取一个特定数量的种群,种群中的每一个个体代表该问题的一个解决方案,再根据每一个个体的适应度大小,筛选出最优个体,被选择出的最优个体通过组合交叉和变异操作,得到一个具有新解集的种群,再对新的解集采取同样的筛选,对最后一代种群中的最优个体进行解码,得到的即为BP神经网络预测的初始权值及阈值。

2 GA-BP神经网络模型的构建

2.1 遗传算法模型的构建

遗传算法的主要步骤包括随机样本初始化、选择适应度函数、选择个体样本、交叉运算和变异运算。

(1)随机样本初始化:为了方便程序运算,样本编码均使用二进制编码,每个样本均为一个二进制字符串,输入层到隐含层再到输出层之间的每个连接权值及阈值均使用M位的二进制编码,将数据组的所有权值和阈值编码连接起来即为一个样本编码。

(2)选择适应度函数:为了使预测值与实际值之间的残差平方和尽可能的小,所以选择采用适应度分配函数:

FitnV= ranking (obj)

(1)

其中obj为目标函数的输出。

(3)选择个体样本种群:基于(2)中的适应度分配函数选择最优个体样本群。

(4)交叉运算:交叉操作采用单点交叉算子样本个体。

(5)变异运算:以一定概率产生变异的基因数,用随机的方法选出发生变异的基因。如果所选的基因编码为1,则变为0;如果所选的基因编码为0,则变为1.

2.2 BP神经网络模型的构建

构建BP神经网络预测模型是为对数据样本的未来每小时的能见度均做预测,选取3个主要影响因子相对湿度、PM2.5及PM10,设定输出结果为大气能见度VIS。

(1)网络输入层及输出层

根据前面确定的3个主要影响因子相对湿度、PM:5及PMio质量浓度可知,输入层神经元节点数为3,输出层神经元节点数根据需要唯一预测的能见度确定为1。

(2)网络隐含层

BP网络隐含层节点数的确定关乎于该预测模型误差值的大小及准确度,因此,正确的设置隐含层节点数至关重要。

l=√m+n+a

(2)

而根据以前学者针对这类问题的研究总结出如式(2)的隐含层节点选择公式,m为输入层节点数,n为输出层节点数,a为[1,10]区间的任意整数值,因为m=3,n=1.故l的取值范围为[3,121,根据试凑法对l在[3,12]范围内进行隐含层节点数的确定。随机选取2000组数据用作试凑数据,不同隐含层节点个数的试凑结果如表2所示。

由表(2)可知,当隐含层节点数为4时,试凑结果与实际值相关性较高且相对误差较小,所以选择隐含层节点数为4.

(3)激励函数

激励函数是位于层与层之间用来传递参数的工具,输入值根据激励函数得到输出值。而MATLAB中最常见的2种激励函数有线性激励函数purelin及双曲正切S型激励函数tan -sigmod.

1)线性激励函数purelin:对层与层之间采用线性关系连接输出权值及阈值,输入值的取值范围没有限制,输出值没有最大值与最小值的限制,c为正的常数;

y= pureLin(X)= cX

(3)

2)双曲正切S型激励函数tan - sigmod:输入值与输出值没有限制,输出值的取值范围为(-1,1),以0为中心,c为旋转度的S型函数,c为正的常数;

根据本文数据要求,选择双曲正切S型激励函数为输入层到隱含层之间的激励函数,选择线性激励函数为隐含层到输出层之间的激励函数。

(4)训练函数与学习函数

训练函数进行权值和阈值的求解以及误差分析得出结果,再通过学习函数进行修改权值与阈值的返回,训练函数根据返回值再次进行数值求解及误差分析,并多次循环迭代使得整体误差达到最小精度要求,从而得到最优值的方法。此处训练函数及学习函数均采用Levenberg-Marquardt算法。

3 GA-BP神经网络的参数设置

GA-BP神经网络预测模型的BP网络结构参数设置如表3所示,BP网络迭代算法参数设置如表4所示,遗传算法运行参数设置如表5所示。

4 实验结果的验证与分析

由图2可知,图2(a)与图2(b)为2个月中能见度实际值与预测值随时间变化的曲线,灰色阴影部分为能见度实际值,黑色折线为GA-BP神经网络模型的预测值,整体预测结果均贴近于实际值,其中拟合度最高的是1月份,最低的是9月份。

5 结论

经过遗传算法优化的BP神经网络模型能较好地预测成都地区的大气能见度,其预测数值基本贴近于实际值,且对于小于5km范围的低能见度预测较为精准,对于大于Skm范围的能见度预测相对较差,其原因主要受能见度观测仪器量程的限制以及短时间内能见度的大尺度突变影响。

参考文献:

[1]黄仪方.航空气象[M].成都:西南交通大学出版社,2011:55-55.

[2]于庚康,于达人,洪贞铨.专业气象预报服务系统[J].气象,1992(1):18-22.

[3] Holzworth G C,Maga J A. A method for analyzing the trendin visibility [J].

Journal of the Air Pollution Control Associa-tion, 1960,10(6):430-467.

[4] Naegele P S,Sellers W D.A Study of Visibdity in EighteenCities in the Western and Southwestern United States[Jl.Monthly Weather Review, 2009, 109(11).

[5] Srivastava S K,Sharma A R,Sachdeva K.An observation-based climatology and forecasts of winter fog in?Ghaziabad, In-dia[Jl. Weather, 2017, 72(1):16-22.

[6]宋明,韩素芹,张敏,姚青,等.天津大气能见度与相对湿度和PM_(10)及PMJ2.5)的关系[J].气象与环境学报,2013,29(2):34-41.

[7] Marzban C,Leyton S,Coleman B.Ceiling and VisibilityForecasts via Neural Networks[Jl. Weather& Forecasting,2006, 22(3):466-479.

【通联编辑:梁书】

基金项目:中国民用航空飞行学院研究生科研创新项目(X2018-39)

作者简介:苏靖晰(1992-),男,硕士研究生在读,主要从事空中交通运行环境一航空气象方向的研究。

猜你喜欢
BP神经网络遗传算法
遗传算法对CMAC与PID并行励磁控制的优化
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
协同进化在遗传算法中的应用研究
基于改进的遗传算法的模糊聚类算法