孙达云 王腾飞 郭伟震 葛于兵
(1.淮安市气象局,江苏 淮安 223001;2.淮安市淮安区气象局,江苏 淮安 223200)
臭氧主要分布在平流层。平流层的臭氧能够吸收太阳辐射中的紫外线,保护地球上的生物。对流层的臭氧约占总量的1/10,也称近地面臭氧。对流层的臭氧含量虽然少,但其对生物的生存产生一定程度的负面影响。近地面臭氧浓度较高时,植物的发育会受到影响,植物发病的概率增加,产量随之下降[1]。臭氧还会影响人类的呼吸系统,损害人类的呼吸道和肺器官[2]。对流层臭氧的来源主要是氮氧化物(NOX)和挥发性有机物(VOCs),通过一系列光化学反应生成。
Sohn 等[3]使用BP 网络来预报韩国首尔市的臭氧浓度,将气象要素和环境要素作为输入、未来6 个时次的臭氧浓度作为输出。苏筱倩等[4]利用支持向量机回归方法(SVR),利用高臭氧浓度期间的气象资料、臭氧前体物和臭氧浓度,完成南京工业区小时臭氧浓度的预报。
近地面臭氧浓度升高会带来光化学污染等一系列问题,而解决这些问题的一个前提是提高臭氧预报模型的精度。好的臭氧预报模型有助于提高臭氧预报的精度。当向公众发布臭氧超标预警时,预警的时效性和准确性越高,预警所产生的社会效益越高,尤其是对空气污染特别敏感的人群。同时,臭氧预报精度的提高,也有助于政府部门提前采取针对空气污染的管控策略。
本文通过深度学习算法,利用其对非线性关系的学习能力,结合各类气象要素和环境要素数据,实现对近地面臭氧的预报,能较好地预报淮安地区近地面臭氧浓度,可以作为空气质量预报的一种补充。
本文的环境数据采用2016—2020 年淮安地区的小时O3,NO2,CO,PM2.5,PM10浓度数据,数据来源于中国环境监测中心。气象数据采用2016—2020 年淮安国家基准气候站的小时数据,包括温度、相对湿度、风速、降水、气压、辐照度和曝辐量。
气象和环境数据按照同一时间进行组合。由于数据存在缺失值和异常值,为了保证模型训练的数据质量,对某一时刻存在缺失值或异常值的数据予以剔除。将保留下来的数据,根据深度学习模型要求,产生时间序列数据。
门控循环单元(GRU)是循环神经网络(RNN)的变体之一。GRU 由重置门(Reset Gate)和更新门(Update Gate)构成。相比于长短期记忆网络(LSTM),GRU 的构成更为简单,因此GRU 的训练时间更短、效率更高。Seq2seq 模型是一种深度学习算法,由谷歌公司于2014 年开发,主要用于语言翻译、自动摘要等。Seq2Seq 模型由编码器和解码器组成。编码器和解码器通常由RNN 组成,常见的是LSTM 和GRU[5]。Seq2Seq 模型的输入和输出均为序列,并且允许输入和输出的时间序列长度不同。编码器、解码器都有输入端、输出端和状态端。编码器接收输入序列,并将其产生的状态传递给解码器。解码器的输入端接收待解码序列,并结合状态在输出端输出解码序列。
利用“注意力机制”下的Seq2Seq 模型进行臭氧浓度预报时,考虑用过去24 h 的实况值来预报未来4 h 的小时臭氧浓度。小时臭氧浓度模型的编码器端输入的是预测时间之前24 h 的气象和环境要素数据,解码器端输入的是预报前一时刻的臭氧浓度值,输出的是预报时刻的臭氧浓度值。气象要素数据包括温度、相对湿度、风速、降水、气压、辐照度和曝辐量,环境要素数据包括O3,NO2,CO,PM2.5和PM10。
训练集的数据是2016—2019 年的数据,测试集的数据是2020 年的数据。预报结果评估主要是测试集的实况值与预报值之间的差异。评价指标包括皮尔逊相关系数(PCC)、平均绝对误差(MAE)和均方根误差(RMSE)。
一般来说,太阳辐射越强,气温越高,同时太阳辐射强度与臭氧的光化学反应速率是正相关,所以气温与近地面臭氧含量也具有相关性。通过2016—2020 年气温与臭氧数据的统计分析,得出两者之间的相关系数为0.58,达到0.001 显著性水平。
相对湿度与空气中的水汽含量有关,相对湿度越高,空气中的水汽含量越高。有研究表明,相对湿度较高时,水汽中的O,OH 等自由基能够将O3分解成氧分子,使得臭氧浓度下降[6]。同时,相对湿度较高时,降水的可能性增大,降水的湿清除功能造成臭氧浓度下降[7]。两者相关系数为-0.49,达到0.001 显著性水平。
地面气压与臭氧浓度的扩散相关。一般来说,地面是高压控制时,天气晴朗少云,城市的气流一般是从城市中心向城市外围运动,从而将城市中的污染物带走,使得臭氧浓度下降。而当地面是低压控制时,气流一般是从城市外围向城市中心运动,从而导致臭氧在城市中心集聚,臭氧浓度上升。两者相关系数是-0.41,达到0.001 显著性水平。
降水能够对前体物和臭氧起到净化作用,同时降水时太阳辐射弱,不利于光化学反应,导致臭氧浓度低[8]。两者相关系数为-0.015,达到0.01 显著性水平。
风速的大小影响着污染的水平和垂直方向的输送。有研究表明,风速较小时,向下的输送导致近地面臭氧浓度上升,而当风速增大时,水平扩散会导致近地面臭氧浓度降低。风速达到一定值时,向下输送和水平扩散使得二者的作用相互抵消。随着风速进一步增大,臭氧浓度呈下降趋势[9]。两者相关系数为0.24,达到0.001 显著性水平。
NO2是臭氧生成的前体物,主要来源包括化石燃料燃烧和生物排放。两者的相关系数为-0.47,达到0.001 显著性水平。
CO 主要来自汽车尾气排放及工业生产排放。CO 有助于臭氧的生成。两者的相关系数为-0.22,达到0.001 显著性水平。
臭氧的生消与颗粒物是相关的。首先,颗粒物影响大气光学厚度,从而影响太阳辐射,进而影响臭氧的光化学反应。颗粒物浓度较大时,大气光学厚度增加,NO2光解下降,OH 和HO2自由基减少,臭氧浓度下降[10]。同时,颗粒物为化学反应提供了场所[11]。PM2.5与臭氧浓度的相关系数为-0.25,达到0.001 显著性水平。PM10与臭氧浓度的相关系数为-0.14,达到0.001 显著性水平。
臭氧污染与人们的生产生活有着密切关系,因此臭氧浓度的及时准确预报有着重要意义。
为了验证预报模型的可行性,可以通过预报模型的输出结果与真实监测结果的接近程度来衡量,而接近程度可以通过各项指标来量化体现。下面将预报模型输出的近地面臭氧浓度与真实监测臭氧浓度的结果进行对比分析。
测试集的输出值与真实值的各项指标如下:RMSE 介于8.36~23.66 μg/m3之间,MAE 介于6.11~18.03 μg/m3之间,PCC 介于0.96~0.64 之间。对于1~4 h 的预测,1 h 的预测值效果最好,RMSE 和MAE最小,PCC 最大,表明预测值与观测值具有较强的线性相关性。随着预测时间的增加,RMSE 和MAE 逐渐增大,PCC 逐渐减小,预测值与观测值的差值越来越大,这是因为当前小时的预测值依赖于前一小时的预测值,前一小时的偏差会在当前小时被放大。对于4 h 的预测,尽管RMSE 和MAE 分别为23.66 μg/m3和18.03 μg/m3,但PCC 仍大于0.6。小时臭氧浓度实况值—预报值分布见图1,从图1 来看,臭氧浓度预报模型可以有效地预测近地面臭氧浓度。
图1 小时臭氧浓度实况值—预报值分布
根据2016—2020 年的气象和环境要素分析可以得出,臭氧浓度与气象要素和环境要素的关系是多样的,臭氧与气温、风速整体上呈正相关,与相对湿度、气压、降水量、NO2、CO、PM2.5、PM10整体上呈负相关。“注意力机制”下的Seq2Seq 模型在预报4 个小时的臭氧浓度上效果较好,相关系数大于0.6。整体而言,模型可以在小时臭氧浓度的预报上发挥一定的作用。未来还需要在模型结构、超参数等方面进一步的优化,以取得更好的预报效果。