董丽沙,范金圆,吕金凤,孔 亮,张步英,杨晓静,李洋洋
(1 河北科技师范学院数学与信息科技学院,河北 秦皇岛,066004;2 中冶沈勘秦皇岛工程设计研究院总院有限公司)
2012年初发布的《环境空气质量指数AQI技术规定(试行)》(HJ 633—2012),依照数值范围的大小将空气质量指数(AQI)划分为0~50优、51~100良、101~150轻度污染、151~200中度污染、201~300重度污染、300以上严重污染等6个等级,依次用绿、黄、橙、红、紫、褐红等6种颜色来表示[1]。AQI的高低反映空气污染的程度,AQI数值越大,说明空气污染状况越严重,对人体的健康危害越大[2]。被列为评价大气环境质量标准的污染物包括PM2.5,PM10,SO2,NO2,CO,O3,各个城市都设立了多个监测站点,实时监测污染物浓度。
Boznar等[3]于1993年开始了将神经网络模型用于空气污染的预测。Kolehmainen等[4]在研究大气中NO2浓度时,通过多个预测模型的对比,找到MLP模型中使用原始时间序列进行空气中NO2的浓度预测结果最好。Giuseppe等[5]分析了BP神经网络存在的预测不足之处,并对其进行改进,得到了误差代价函数,通过对比得到利用其代价函数得到的预测结果较之前更优。虽然我国的环境监测与保护工作起步晚于工业发达国家,但是我国政府的环保意识提高迅速,环保措施发展迅速[6]。周兆媛等[7]利用主成分回归分析对北京、石家庄、天津地区的空气污染指数与气象要素的关系进行了论证,得到气温、气压、降雨量和相对湿度与空气质量密切相关。王娟等[8]分析了高密市空气污染物浓度的变化特征及成因,利用了适合于短期预测模型的GM(1,1)模型对高密市空气质量进行了预测。袁章帅等[9]建立了北京市空气质量预测ARMA(1,2)模型,通过实际数据进行预测,验证了模型的精确性,同时为有关部门提出大气污染治理的合理、科学的建议。文献[10~17]通过对各地空气质量变化趋势的评价分析,提出了一系列的原因分析与针对性的防治对策。
本次研究以AQI及PM2.5,PM10,SO2,NO2,CO,O3等6项污染物在空气中的质量浓度为因子,通过从网站获取的2015~2019年各指标数据,对秦皇岛市空气质量的时间分布特征和变化趋势进行分析,并根据分布特征特点试建立当地空气质量的预测模型。
从天气后报网站(http://www.tianqihoubao.com)获取了河北省秦皇岛市的AQI和空气中PM2.5,PM10,SO2,NO2,CO,O3等6项污染物的质量浓度在2015~2019年的日均值。将所得数据进行整理和统计,用于本次研究。
对获取到的秦皇岛市AQI数据,PM2.5,PM10,SO2,NO2,CO,O3在空气中的质量浓度日均值数据进行整理和计算,得到各个指标在2015~2019年每年的月均变化趋势。统计结果表明:秦皇岛市AQI及6项污染物质量浓度均呈现冬季较高,夏季较低的变化趋势,变化曲线整体呈U型(图1~图6)。这是由于在我国,包括河北省在内的北方地区居民住宅、学校及各种公共场所、企事业单位办公场所等冬季必需供暖,采暖形式以燃煤为主,因燃煤量暴增而产生的大量烟尘和SO2,NO2,CO等污染物排放到大气中,导致空气中的污染物浓度上升,再加上我国北方冬季的气象条件不利于污染物扩散,进一步造成污染物浓度居高不下的局面。不同的是,O3质量浓度变化曲线在每年中的月均值呈倒U型,即夏季较高、冬季较低的现象,这主要归因于夏季温度高、光照强的气候特点促使能生成O3的相关化学反应不断发生。
图1 2015~2019年秦皇岛市AQI的月均值变化特征
图2 2015年秦皇岛市空气中6项污染物的月均值 图3 2016年秦皇岛市空气中6项污染物的月均值
图4 2017年秦皇岛市空气中6项污染物的月均值 图5 2018年秦皇岛市空气中6项污染物的月均值
图6 2019年秦皇岛市空气中6项污染物的月均值
对秦皇岛市2015~2019年的AQI数据及PM2.5,PM10,SO2,NO2,CO,O3在空气中的质量浓度的日均值数据作整理和统计,计算各指标2015~2019年每年的年均值,分别得到AQI数据及6项污染物质量浓度的年均值分布特征和变化趋势。统计结果表明,2015~2019年秦皇岛市AQI及空气中PM2.5,PM10,SO2,CO的质量浓度均呈显著的下降趋势,O3质量浓度有明显上升趋势,而NO2质量浓度没有太大变化(图7,图8)。其原因在于近年来空气污染的不断加剧,引起了政府和城市居民的高度关注,通过采取有效措施,加大空气污染的治理力度,使大气环境得到了明显的改善。
图7 2015~2019年秦皇岛市AQI的年均值变化趋势 图8 2015~2019年秦皇岛市空气中6项污染物的年均值
本次研究分别采用基于AQI时间序列和气象因子的2种预测方案:在利用AQI序列历史数据规律预测未来发展趋势的方案中,选取乘积季节模型;基于7个气象因子(后知气象网获取的平均温度、湿度、风速、气压、能见度、总降雨量、平均总云量)的AQI预测方案中,选取的是适用范围较广的BP神经网络模型。利用上述方法分别对秦皇岛市2015~2018年空气质量进行拟合、建模,并预测2019年全年12个月份的AQI指数。通过对比不同模型的预测准确率,分析2种预测方案的优劣性,并选出秦皇岛市空气质量较优的预测模型。其中,准确率={1-|(预测值-实际值)/实际值|}×100%。
空气污染的复杂成因加大了对空气质量预测的难度。从前面关于秦皇岛市空气质量分布特征的分析中可以看出,秦皇岛市过去5年空气质量指数波动规律可大致划分为趋势、季节和其他3大类,且各类特征的作用是交错难分的。因此,本次研究采用多影响因素之间呈乘积关系的乘积季节模型对2015~2018年秦皇岛市的AQI的月均值序列进行建模,并预测2019年全年12个月份的AQI。在R软件中得到的结果如下:
首先,对AQI实测值序列作1阶差分提取序列中的趋势信息,周期12的步长差分提取序列的季节信息,得到AQI的1阶12步差分结果(图9),并对AQI的1阶12步差分后序列进行平稳性检验。结果显示,AQI的1阶12步差分后序列围绕均值在有界范围内作随机波动,基本可以视为平稳序列(图9)。AQI 的1阶12步差分后序列自相关图显示出典型的平稳序列自相关图特征(图10),自相关系数快速衰减至2倍标准差范围内,此后始终在零轴附近作小值波动。依据对时序图和自相关图的分析与检验可以判断,AQI的1阶12步差分后的序列为平稳序列。
图9 秦皇岛市AQI的1阶12步差分后序列时序情况
第2步,对AQI的1阶12步差分后的序列进行纯随机性检验,以考察该序列是否有研究价值。检验结果显示,延迟12期的P值为0.012 78,小于显著性水平0.05。因此,可以拒绝纯随机序列的原假设,认为序列各项之间有密切的相关关系,即过去的数据对未来发展有一定影响,后续对序列的建模和未来发展的预测有意义。
经上述分析可以得出,AQI的1阶12步差分后序列为平稳非白噪声序列。
第3步,依据上述AQI的1阶12步差分后序列的自相关结果和偏自相关结果对ARIMA季节乘积模型定阶。
AQI的1阶12步差分后序列自相关结果与偏自相关结果(图10,图11)反映出其自相关系数和偏自相关系数从显著非零到衰减至零值附近做小值波动的过程缓慢且连续,所以二者均呈现拖尾性。
图10 秦皇岛市AQI的1阶12步差分后序列自相关情况 图11 秦皇岛市AQI的1阶12步差分后序列偏自相关情况
综合上述差分和自相关分析结果,最终确定对秦皇岛市2015~2018年AQI的月均值序列拟合ARIMA(1,1,1)×(1,1,0)12乘积季节模型。
对上述拟合模型进行参数估计,得到拟合模型口径为:
模型显著性检验的结果显示,各阶延迟下LB统计量的P值都大于0.05,说明该拟合模型的残差序列为白噪声序列,拟合模型显著有效。利用此模型对秦皇岛市2019年全年12个月份的AQI进行预测,结果见图12。其中,黑色曲线表示2015 ~2018年秦皇岛市AQI实测值序列,阴影内曲线表示2019年全年12个月份的AQI预测值。
图12 乘积季节模型对秦皇岛市AQI的预测结果
由预测结果计算可得,乘积季节模型对秦皇岛市2019年全年12个月份AQI预测的准确率在75.72%~99.82%之间,均值为92.09%(表1)。
表1 乘积季节模型对秦皇岛市AQI的预测值和准确率
本次研究利用从天气后报网上获取并整理的AQI月均值数据,以及从后知气象网获取的平均温度、湿度、风速、气压、能见度、总降雨量、平均总云量等7个气象因子的月均值数据,采用BP神经网络模型对2015~2018年秦皇岛市的AQI与7个气象参数进行拟合建模(图13),并预测2019年全年12个月份的AQI。对比2019年AQI的预测值和已获取到的实测值,计算预测的准确率,对BP神经网络的预测效果进行评价。
图13 BP神经网络拟合秦皇岛市AQI的效果
建立空气质量的BP神经网络预测模型,选用3层的网络结构,输入层节点为7,包含平均温度、湿度、风速、气压、能见度、总降水量、平均总云量,隐含层层数为1,隐藏节点为4,输出层节点为1,即AQI。在MATLAB中用2015~2018年的空气质量和气象因子数据进行训练和检验,训练精度为0.000 001,最大训练次数为10 000。最后用经过训练和检验得到的BP神经网络模型,对秦皇岛市2019年全年12个月份的AQI进行预测,第1次运行结果见图14。
图14 BP神经网络预测秦皇岛市AQI的效果
在MATLAB中将这一程序运行多次会得到不同的预测结果,因为每次训练随机生成的初始权值和阈值不同。连续运行5次所得的5组AQI预测值和准确率计算结果分别见表2和表3。
表2 BP神经网络预测秦皇岛市AQI的前5次预测值
表3 BP神经网络预测秦皇岛市AQI的前5次预测准确率 %
在以上5次的运行结果中,只有第5次8月份的准确率为48.39%,这反映了BP神经网络算法收敛速度慢的缺点。其他预测准确率都在60%以上,其中预测准确率最高为99.91%,进一步计算得到前5次预测结果的总的平均准确率为89.81%。
综合以上分析可得,在本次研究所选用的2种模型中,基于AQI序列的乘积季节模型预测的准确率更高。