基于RBF神经网络的雾霾成因模型与预测

2020-12-05 06:23江善和
关键词:权值污染源成因

李 伟,江善和

(安庆师范大学1.经济与管理学院,2.电子工程与智能制造学院,安徽安庆246133)

随着经济发展和城市化进程的加速,我国空气污染态势日益严峻,雾霾污染席卷了全国众多地区。如何实现经济快速高质量发展且保障空气质量优良,已是各级政府不可回避的头等大事。李克强总理在2018年政府工作报告中指出:“重拳整治大气污染,重点地区细颗粒物(PM2.5)平均浓度下降30%以上”。为此,在分析雾霾形成的主要因素的基础上,建立一个雾霾模型,为管理部门进行科学管理提供参考。

雾霾的形成有两个因素:一是气象因素;二是污染排放因素,它包括自然污染排放和人为污染排放。由于气象条件和自然污染排放是不可控和难以调节的,而且人为污染排放是雾霾形成的主要危害因素,故本文就人为污染排放因素展开因素分析和模型评价。

近些年,相关学者也展开了雾霾成因问题的定性分析和定量模型研究。刘婉琪等针对长江经济带地区雾霾污染的空间特征及影响因素进行了剖析,并从能源结构、产业结构和协同策略等方面提出了治理对策[1]。丛林等研究了北京市PM2.5的相关影响因素,得出了PM2.5已成为空气污染的首要污染物,并通过多元回归分析方法得出PM10是造成空气中PM2.5的最主要因子[2]。彭希珑针对南昌市采用因子分析、多元线性回归、Back Propagation神经网络等方法对PM2.5和PM10污染源进行特征解析,得出了土壤尘、燃煤尘、建筑尘、机动车尾气尘是造成PM2.5和PM10超标的主要来源[3]。孟兆佳等基于灰色系统理论,运用混合多层效应模型分析了雾霾与主要成因的量化关系,得出了多层回归雾霾成因模型[4]。王坤龙分析了天津地区雾霾形成的主要原因,并应用灰色系统关联分析得出了PM10是形成雾霾的主要因素,基于GM(1,1)灰色预测模型进行了空气质量指数预测[5]。彭茜薇基于VAR模型研究了经济增长与雾霾污染各因素的相互关系,认为经济增长导致工业二氧化硫排放量的增加[6]。贺泓等以PM2.5 的生成、演化与控制为问题,针对京津冀、长三角、珠三角三个地区,研究了大气雾霾污染的形成机制、关键污染源识别以及监测预警技术,为控制我国雾霾污染提供了技术和政策方案[7]。但上述文献中所采用的定量分析模型多为线性模型,难以真实反映雾霾污染与其影响因素之间的非线性关系。

为此,本文针对雾霾PM2.5污染问题展开其成因的关联度分析,得出其主要影响变量。基于径向基函数(RBF)神经网络建立雾霾成因模型,并对污染源的来源进行解析,开展非线性RBF模型的验证和预测,提出一些针对性措施,运用所建模型开展治理措施的定量评价,为政府部门选择最优治理措施提供决策依据。

1 研究对象与方法

1.1 研究对象

为了更好地实施环境监测,国家已启用新的空气质量指数AQI 作为空气质量监测指标,有6 项指标:SO2、NO2、PM10、PM2.5、O3和CO。这些指标中,PM2.5 是导致能见度降低和雾霾形成的本质因素,且与AQI关联度极大,多数情况下PM2.5值直接反映AQI指数的值[2,6],建立PM2.5的成因模型及治理预测是当务之急。因此,本文将雾霾成因模型的建立转化为PM2.5成因模型的建立。

本文选取的各项指标样本数据来源于武汉市环境保护局官方网站公布的空气质量监测报告(2017年度和2018年度)、武汉市环境质量状况公报,部分数据来源于湖北省统计局公布的各市统计年鉴(2017年度和2018年度)和武汉市统计信息网公布的《国民经济和社会发展统计公报》等。

1.2 研究方法

RBF(Radial Basis Function)神经网络在逼近能力、学习速度和分类能力等方面都优于BP神经网络,具有很强的非线性拟合能力和容错能力,个别有误样本数据也不会对结果造成影响,且具有结构规模小、训练算法简洁、收敛速度快、泛化能力强、能够逼近任意非线性函数等优点。网络参数初始化具有一定的指导法则,如聚类或正交最小二乘法等[8],并非随机初始化方式。其基本思想是将输入数据变换到高维空间,使其在高维空间内线性可分。具体来说是指隐含层单元的“径向基函数”构成隐含层空间,通过RBF激活函数完成输入矢量直接到隐空间(不通过权值连接)的映射变换,而隐含层空间到输出空间的映射是通过线性加权和实现的。

RBF神经网络是一个由输入层、隐含层和输出层构成的三层前向神经网络。第一层为输入层,由信号源节点xi组成。第二层为隐含层,隐含层中单个神经元的激活函数即径向基函数,是满足中心点径向对称且衰减的非负线性函数。通常径向基函数采用高斯函数,其具体表达式为

其中,xp=(xp1,xp2,xp3,…,xpm)为第p个输入样本,p=1,2,3,…,P,P为样本总数;wij为隐含层到输出层的连接权值,i为隐含层的节点数,yj为与输入样本对应网络的第j个输出节点的实际响应。由式(2)可以看出,RBF神经网络优化参数分别为高斯函数的中心、方差和隐含层到输出层的连接权值wij。在学习过程中,通常采用训练数据对网络进行学习训练,不断优化调整RBF网络的参数,使得训练后的网络能够逼近所希望的非线性函数。在检验阶段,通过使用检验数据对网络的泛化能力和网络性能进行检验,使得学习后的网络具有良好的逼近性能。具体的RBF网络参数优化算法这里不再赘述,可以参考文献[9]。

利用所建立的RBF神经网络模型可以有效找出PM2.5与各影响变量指标的权重关系,通过网络权值计算出PM2.5污染源的贡献大小,确定出当前样本数据中哪个污染源对PM2.5造成的影响大,从而找出影响PM2.5的主要污染源。污染源贡献大小的计算公式为

其中,bk为第k个输入节点(污染源)的权重贡献率,wij为中间层节点i到输出节点j的连接权值,ci为中间层节点高斯函数的中心值。将输入节点(污染源)的权重贡献率进行归一化:

2 雾霾成因模型

2.1 雾霾成因变量关联度分析

为了观察形成雾霾各成因变量之间的耦合关系及关联程度,找出影响PM2.5的主要成因变量,利用SPSS软件对样本数据做出PM2.5与SO2、NO2、PM10、CO、O3等指标的关联度分析。选取武汉市2018年1月1日至3月31日共90个样本数据,建立PM2.5与雾霾各成因变量指标之间的关联度曲线,如图1所示。

图1 武汉市PM2.5与SO2、NO2、PM10、CO和O3的关联度曲线

从图1可以看出,PM2.5与PM10、SO2、NO2、CO的曲线趋势一致,表明它们之间具有强的相关性且是正相关的;而PM2.5与臭氧O3的曲线趋势不一致,表明它们的相关性弱,而且具有一定的负相关趋势。

为了进一步验证上述判断,采用相关性系数法[9]来进一步验证,结果如表1所示。

表1 PM2.5与SO2、NO2、PM10、CO和O3的相关参数计算结果

由表1可知,PM2.5与CO、PM10高度相关,这主要是因为燃煤、粉尘和各种有害气体含量增多,进而使得PM2.5含量升高。PM2.5与SO2、NO2显著相关,主要是因为工业污染、尾气排放等原因。PM2.5与O3的相关性较低。这与SPSS软件分析的结果是一致的。

2.2 雾霾成因模型

根据2.1 节的结论可知,PM2.5 与PM10、SO2、NO2、CO 和O3各成因变量之间存在着一定的数量关系,各成因变量的变化直接影响着PM2.5 的结果。为了找出这种数量关系,可采用多元线性回归模型[10],利用样本数据找出回归模型的参数,确定出PM2.5与各成因变量之间的关系式。但是,该模型存在很大的缺陷,即PM2.5与各成因变量之间是线性关系才能定量描述出来。实际上,PM2.5与各成因变量之间是一个非线性关系,为此,本文采用RBF神经网络找出它们的非线性关系,通过网络模型的训练获取输入与输出各变量之间的非线性规律,再利用另外一组样本数据进行模型的训练验证。

2.2.1 实验结果与分析

选取武汉市各变量的90个样本数据进行离线训练,首先确定神经网络的结构,即输入节点为5,代表着影响PM2.5输出的各成因变量,中间隐含层节点数取为20,输出节点数为1,即PM2.5输出值。RBF网络模型中的权值和中心初始值为任意值,然后利用RBF网络权值的学习算法获得优化后的网络权值和中心。采用Matlab编程得到RBF网络训练的均方差收敛曲线(如图2所示)和网络训练前后的拟合曲线(如图3所示)。

图3 归一化数据训练前后仿真结果

从图2可知,网络训练收敛速度非常快,仅需要27次训练即可达到收敛精度。从图3可知,训练后得到的RBF网络能够很好地拟合输入输出关系,从而说明RBF网络能够作为PM2.5的预测模型。通过仿真的权值结果根据式(4)可以计算出引起PM2.5 的主要污染源的贡献大小,分别为PM10(33.4%)、CO(25.6%)、SO2(19.9%)、NO2(17.5%)和O3(3.56%)。由此可知,引起PM2.5 雾霾成因中的主要因素为PM10、CO和NO2。由此可以提出针对性的治理措施,从而有效降低PM2.5的含量,减少和控制雾霾产生。

2.2.2 模型验证

为了验证基于RBF网络的雾霾成因模型的有效性,采用另外一组测试集样本数据(20组)进行模型的泛化性能和预测验证,并将实际输出和RBF网络输出结果进行比较,获得的输出曲线和误差曲线杆状图分别如图4(a)(b)所示。从图4(a)可知,上述训练获得的RBF网络雾霾成因模型能够很好地实现对新的测试样本数据输出的预测,从图4(b)可知,输出预测平均误差为2.56%。所以,RBF神经网络雾霾成因模型是合理可行的。

图4 RBF网络输出与实际输出的比较。(a)输出曲线;(b)误差杆状图

3 结 论

本文将雾霾污染形成的机理和主要因素转化为PM2.5成因模型的建立与分析,从而简化了雾霾污染成因分析。首先分析了PM2.5 形成的主要因素,得出其成因变量;然后基于RBF 神经网络建立了PM2.5的非线性模型;利用训练样本展开学习,获得PM2.5雾霾成因模型。利用模型对主要污染源进行了分析,利用测试样本数据进一步验证了所提模型的有效性和可行性。模型的分析结果可以为政府相关部门选择最优治理措施提供决策依据。

猜你喜欢
权值污染源成因
一种融合时间权值和用户行为序列的电影推荐模型
基于实证调查的学困生成因及转化
工程款超付的成因和应对措施
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
陆良县档案局认真做好第二次全国污染源普查档案验收指导工作
幼儿自信心的缺失成因及培养策略
一种基于互连测试的综合优化算法∗
试论污染源自动监测系统在环境保护工作中的应用
程序属性的检测与程序属性的分类
翻译实践问题及成因