黄成
华侨大学 机电及自动化学院 福建 厦门 361021
空气污染通常也被我们称为大气污染,随着城市的不断发展,我国私家车数量逐渐增加,而且越来越多的工厂被建立在城市周围或者城市内,这些工厂在工作的过程中便会不断排放出二氧化硫、二氧化氮、一氧化碳等有毒污染物。特别地,许多传统工业如煤炭、火力发电、造纸、印刷等产业由于设备升级困难,且对于国民经济与生活具有重要地位,在较长的时间内仍然会排放出大量空气污染物,这也极大地加剧了我国的空气污染。当这些空气污染物超过一定的浓度范围之后将会严重危害人类的健康,如产生眼部刺激症状、咳嗽、肺功能衰竭等急性危害和产生结膜炎、咽喉炎等慢性危害。特别对于孕妇、老人及儿童,空气污染物有更加严重的危害,比如处于妊娠期的孕妇若长期与空气污染物接触,会使得胎儿难以获得充足的氧气,使得孕妇早产、出生儿头小、体重大幅下降等非健康状况发生[1]。根据《环境空气质量标准》(GB3095-2012)的新要求,我国从2013年1月1日起开始对PM2.5、PM10、SO2、NO2、CO、O2等空气污染物进行实时监测数据,监测的城市也由最初的74个城市增加到337个城市,使得我国的空气污染监测工作变得越来越完善。
在前馈神经网络中,每一个神经元都排列成不同的层,并且每一个神经元均只能接收从前一层神经元传出的信号,并把接收到的信号变化处理后再传入下一层神经元中,且同层的神经元信号不能互相传递信号。前馈神经网络具有学习简单、收敛快等特点[2],它经过不断的发展,现在理论研究已经非常完善,且已经开始应用于越来越多的领域,比如神经网络预测胶结强度、神经网络预测焦炭质量、神经网络控制机械臂等等。本文运用MATLAB的Neural Net fitting,对中国生态环境部发布的2013年至2020年《中国生态环境公报》PM2.5、PM10、SO2等6项空气污染物年均浓度数据建立神经网络预测模型,并对2021年我国PM2.5、PM10、SO2等6项空气污染物年均浓度进行了预测。
前馈神经网络是具有递阶分层结构的网络,通常由输入层、一个或多个隐藏层、输出层构成。该神经网络的结构特点是:信号只能由本层的神经元流向下一层的神经元,而不能由本层的神经元流向本层其他的神经元,简单来说就是单向连接流通性,且各神经元之间不存在反馈。但是,前馈神经网络仍有误差信号的反向传播特性,当由输出层输出的实际信号与我们所期望的输出信号有偏差时,会把误差信号再反向传播回到神经网络中,神经网络再根据反馈的误差信号自学习调整权值以减小误差。下图为前馈神经网络的基本结构图。
图1 前馈神经网络基本结构
图2 反向误差流程图
BP误差反向传播算法利用了最小二乘法的思想,当输出层实际输出信号与期望输出信号产生偏差时,反向梯度传播误差信号,通过改变各层信号权值使得误差均方值最小。上图为反向传播算法流程图。
在MATLAB应用中首先在APP应用栏目下打开Neural Net fitting工具箱并建立一个两层前馈神经网络,其中该神经网络包括具有sigmoid神经元的一层隐含层和具有线性神经元的一层输出层。接着定义隐含层神经元的数量为10个,神经元的数量与神经网络的拟合精度有关联,在一定条件下适当增加神经元的数量可以提供我们预测模型的精度。接着,我们可以选择Levenberg-Marquardt算法、Bayesian Regularization算法或者Scaled Conjugate Gradient算法作为神经网络模型的训练算法。三种算法各有优缺点,其中Levenberg-Marquardt算法收敛速度增加,训练时间短,克服了传统BP算法收敛于局部极小点等缺陷,但会消耗过多的内存[3];Scaled Conjugate Gradient算法训练时间短,但是会有较大的误差;Bayesian Regularization算法会消耗较多的训练时间,但是训练结果更准确,所以最后我选择Bayesian Regularization算法作为我的训练算法。
我国城市空气污染物种类多,本文主要采用了PM2.5、PM10、SO2、NO2、CO、O2这6种主要空气污染物从2013年到2020年的年均浓度监测数据,其数据来源于中华人民共和国生态环境部发布的2013年至2020年《中国生态环境公报》。本文收集的数据PM2.5、PM10、SO2、NO2、CO、O2各有1组,每组数据各有8个独立数据,总共有48组数据。以下表格为各组具体的数据。以下表1为各组具体的数据。
表1 城市6项空气污染物年均浓度
将PM2.5、PM10、SO2等6组城市污染物年均浓度数据每分别导入预测模型中,共建立6组独立预测模型。其中每组模型输入数据都为2013至2020的年份,而目标输出值为每个年份对应的城市不同污染物年均浓度值。
建立好模型并且导入数据之后开始对每组数据进行训练,将PM2.5、PM10、SO2、NO2、CO、O2的年均浓度这6组不同的数据进行不同次数的训练后分别得到各组数据的训练结果。以CO的训练结果为例,训练结束后弹出训练结果操作界面,在训练界面中不仅可以查看到训练算法、训练次数、训练时间等数据,还能自由查看训练性能图、误差分布图、拟合图等图像。通过这些图我们能判断预测模型的好坏,并且能根据这些图中的数据对模型再进行适当调整以使预测精度达到我们的预测要求。
图3 CO误差分布
我们看到通过建立的神经网络预测模型拟合出的曲线与原数据点基本吻合,而且也能看出我们训练的点、目标输出点、检测输出点也基本吻合。除此之外,我们在误差一栏也可以看出拟合曲线与八组数据的误差在(±0.05)mg/m3之内,可以看出该模型拟合精度高,拟合效果好,通过此模型预测的结果具有一定的可靠性。把建立好的各组预测模型保存好后(“保持名称为‘net’”),在MATLAB命令行分别输入sim(net,2021)来预测我国城市2021年细粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、一氧化氮(CO)、臭氧(O2)6种城市污染物年均浓度并记录在表2-7中。具体预测数据及原数据表2-7。
表2 PM2.5预测数据
表3 PM10预测数据
表4 O3预测数据
表5 SO2预测数据
表6 NO2预测数据
从表2-表7的预测数据与原数据相比较可以看出经过该神经网络模型预测后得出的数据具有高的精度,其误差也较小,该神经网络模型对于预测城市细粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)等6项主要污染年均浓度具有一定可靠性。
表7 CO预测数据
通过MATLAB神经网络工具箱建模后训练图像及预测结果可以得出结论:前馈神经网络系统对于预测数据具有良好得性能,特别在处理大量数据、非线性系统时具有高效的并行处理能力与非线性映射能力。在本文中,利用前馈神经网络对我国城市6项主要空气污染物年均浓度进行有效预测,数据结果也表明了该预测模型的可靠性与准确性,其预测结果对于研究我国空气污染物浓度变化趋势也具有一定的作用。前馈神经网络系统具有结构简单、易操作系统稳定、处理数据快等特点,只需要在MATLAB中编写程序或者直接调用数据网络工具箱建立好神经网络结构,然后再输入数据训练模型,再调用神经网络模型就可对其他系统进行预测[4]。随着现代智能控制技术的大力发展,神经网络系统理论也会越来越完善,它也会在未来的社会中发挥越来越大的作用。