王馨陆 黄冉,† 张雯娴 吕宝磊 杜云松 张巍 李波兰 胡泳涛
1. 杭州矮马科技有限公司, 杭州 311121; 2. 华云升达(北京)气象科技有限责任公司, 北京 102299; 3. 四川省生态环境监测总站,成都 610091; 4. School of Civil and Environmental Engineering, Georgia Institute of Technology, Atlanta, GA 30332;
环境空气质量的好坏对公众健康有着显著影响, 不论是极端重污染事件还是长期暴露于低浓度空气污染环境中, 均会直接增加人体心血管和呼吸系统等多种疾病的发病率[1–2]。近年来, 我国大多数城市的空气质量持续改善, 尤其是秋冬季细颗粒物(PM2.5, 空气动力学直径小于或等于 2.5 μm 的气溶胶粒子)污染程度下降明显[3–4], 但春夏季臭氧污染呈现上升趋势[5–6]。空气污染物源排放是影响空气质量的决定性因素, 天气形势及气象条件亦为关键因素。气象条件的变化直接或间接地影响大气中污染物的化学反应、传输、扩散稀释和沉降等过程[7–11], 对空气质量的影响呈现多时空尺度、影响大及变化快的特点[12]。对一定的区域而言, 如果短期内污染源排放相对稳定, 其空气质量则主要取决于气象条件[13–14]。当出现静稳天气等不利气象条件时, 污染物浓度容易在短时间内出现大幅增长,造成严重的空气污染事件[15–18]。因此, 研究天气形势及气象条件对污染物在大气中传输和转化的影响, 开展空气污染潜势预报预警, 对评估气象条件对空气污染的贡献以及辅助大气环境精细化管理和科学决策具有重要意义。
污染潜势预报是在假定污染源排放不变的情况下, 以可能影响污染物时空分布的天气形势及气象条件为主要依据, 对未来气象条件下的空气污染状况进行预测[19–21]。其特点在于忽略不确定的污染源排放速率的变化, 重点关注有利或不利于污染物扩散稀释等过程的气象因素[22], 将气象因素对空气质量的影响分离出来[23], 是评估气象条件对污染物浓度影响及贡献的重要方法之一。众多研究采用逐步多元线性回归的方法建立气象因子(如风速、相对湿度等)与污染物浓度(如 PM2.5和臭氧)之间的污染潜势模型[24–28], 量化气象条件变化对污染物浓度变化的贡献。Zhai 等[27]以中国地面气象观测日值数据及 MERRA2 再分析数据中的风速、降水、相对湿度、气温和 850 hPa 经向风等作为潜在预报变量, 采用逐步多元线性回归法建立 2013—2018 年中国主要地区的 PM2.5污染潜势预报模型, 定量分析气象条件对 PM2.5污染变化的贡献, 结果表明在中国 PM2.5浓度下降的趋势中, 气象贡献占 12%。张小曳等[29]利用国家自动气象站逐小时地面气象观测数据及欧洲中期天气预报中心的再分析数据, 对与气溶胶浓度密切相关的气象要素(如风速、风向和大气稳定度等)进行诊断和参数化分析, 得到可定量反映停滞–静稳型天气程度的“污染–气象条件”指数(PLAM 指数), 建立气溶胶浓度与气象要素之间的量化关系, 并分析评估了 2013 年《大气污染防治行动计划》实施以来气象条件变化对 PM2.5污染变化的影响。
数值预报计算量大, 计算成本高, 依赖于大量输入数据(如源排放清单和气象场)的驱动, 与之相比, 基于各种机器学习算法的空气污染潜势预报较为简单易行, 且无需源排放清单, 已广泛应用于各项研究中[30–31], 具有较好的预报效果。不同于数值预报模式中以大气污染物转化扩散的化学和物理机制为基础[32], 基于统计方法的污染潜势预报主要利用大量污染监测历史数据及同期气象观测资料, 分析污染物浓度与相关辅助因子之间的统计关系, 建立从简单相关到复杂多参数的模型, 从而进行未来空气质量的预测[19,22–23]。常见的潜势预报方法包括多元线性回归[33–35]、支持向量机[36–37]、决策树[30,38]、随机森林[39–40]和人工神经网络[41–43]等。Lightstone 等[44]利用 2016 年 NCEP/NARR 再分析资料及 NYSDEC 地面监测网的 PM2.5数据, 建立纽约市PM2.5神经网络预报模型, 并与 CMAQ 12 km 网格数值模式模拟结果进行对比, 结果表明神经网络模型准确性更好, 尤其是对传输引起的污染浓度快速变化时段的模拟。
本研究利用成都市 2016—2019 年WRF 模式回溯模拟气象场及同期空气质量观测数据, 以影响污染物转化、扩散和传输的主要气象因子及相关辅助因子为潜在预报因子, 通过筛选关键入模变量, 利用多元线性回归、随机森林及 BP (back-propagation)神经网络等机器学习算法, 建立成都市夏季(4—8 月) O3及冬季(11 月—来年 2 月) PM2.5浓度污染潜势预报模型, 对比分析各模型对成都市 O3及PM2.5污染的预测效果, 并检验建立的污染潜势模型的中长期预报能力。
1.1.1 空气质量数据
本研究使用的 2016—2019 年成都市逐日臭氧及 PM2.5环境浓度观测数据来自四川省空气质量监测网络管理平台(http://www.scnewair.cn:3389)。成都市 2016—2019 年 O3日最大 8 小时浓度在每年的4—8 月达到污染高峰期, O3超标事件(O3≥160 μg/m3)频发(图 1), 4—8 月的多年累月平均浓度分别为114.5, 128.2, 126.2, 131.2 和 143.7 μg/m3。PM2.5日均浓度的污染高峰期主要发生在每年的 11 月至来年 2 月(图 1), 11—2 月的多年累月平均浓度分别为65.2, 89.9, 93.5 和 69.7 μg/m3。
图1 成都市2016—2019 年O3 日最大8 小时浓度及PM2.5 日均浓度的月平均及每月超标日数(O3≥160 μg/m3, PM2.5 ≥75 μg/m3)统计Fig. 1 Monthly mean of daily maximum 8-hr average O3 and daily average PM2.5 concentrations,and monthly number of exceedance days (O3 ≥ 160 μg/m3, PM2.5 ≥ 75 μg/m3)
考虑到成都市 O3和 PM2.5污染以及各气象因子的显著季节波动, 为提高所建模型的可靠性、准确性和实用性, 本文针对成都市每年 4—8 月和 11—2月分别建立 O3和 PM2.5的污染潜势预报模型。
1.1.2 气象数据
本研究使用的成都市 2016—2019 年气象数据来自中尺度预报模式 WRF (Weather Research and Forecast Model, 版本 3.6)[45]的气象回溯模拟结果。该回溯模拟采用基于 Lambert 投影坐标的 36 km、12 km 和 4 km 水平分辨率的 3 重嵌套网格(见 http://xbna.pku.edu.cn (以下简称 xbna)附录 1), 最外层网格覆盖包括青藏高原在内的所有中国地区和东亚以及部分东南亚和印度次大陆, 次内层网格包括四川省全省及西南地区各省(市、区)的大部分区域, 最内层网格覆盖四川盆地的主要城市, 垂直方向采用从地面到 50 hPa 共 35 个σ层。模拟中以 NCEP GDAS/FNL 0.25°×0.25° 全球再分析资料作为初始条件和边界条件, 主要物理过程采用 Lin 微物理参数化方案[46]、Kain-Fritsch 积云方案[47]、YSU 边界层参数化方案[48]以及 NOAH+MOSAIC 陆面模式[49]。此外, 在模拟过程中启用 Grid Nudging 同化技术[50–51], 利用 NCEP ADP 全球地面及探空气象观测数据, 对逐6 小时猜测场进行“校正”, 并在 WRF 计算过程中通过同化技术优化模拟结果。利用中国地面气象观测站逐小时数据, 对 2016—2019 年 WRF 回溯模拟结果进行评估(xbna 附录 2), 各评估统计指标都处于合理的可接受范围[52], 表明气象回溯模拟数据可进一步用于成都市污染潜势预报模型的建立及后续的预报能力评估。
本研究以可能影响 O3及 PM2.5污染的气象及相关辅助因子为潜在预报变量, 建立污染潜势模型,重点在于识别影响空气质量的关键预报因子。瞬时多变的天气形势及气象条件对空气质量的影响极为复杂, 不同气象条件和相关辅助因子对不同污染物的作用各不相同, 又相互影响。为了尽可能准确地识别影响 O3和及 PM2.5污染的关键预报因子, 本研究拟定 39 个潜在的预报因子(xbna 附录 3), 主要包含污染持续性因子(如前一日的污染物浓度)、节假日和工作日信息[53–55]以及相关气象条件因子(如风速、气温、湿度和云量等)[12–13,22,24,56], 并利用WRF 回溯模拟结果建立潜在预报因子数据集, 以便后续关键预报因子的筛选。
以成都市 2016—2019 年 O3及 PM2.5的日值观测数据和 1.1.2 节建立的包含 39 个潜在预报因子的数据集为基础, 筛选关键预报因子, 并分别建立训练、测试和评估数据集。采用多元线性回归(Multiple Linear Regression, MLR)[57]、随机森林(Random Forest, RF)[58]以及 BP 神经网络(Back-Propagation Neural Network, NN)[43]3 种机器学习算法, 建立成都市夏季 O3及冬季 PM2.5污染潜势预报模型, 并进行验证和评估。图 2 为建立污染潜势预报模型的技术路线。
图2 建立污染潜势预报模型的技术路线Fig. 2 Flow chart of building the air pollution potential forecasting models
1.2.1 关键入模变量的筛选
首先进行预报因子的筛选, 确认影响成都市夏季 O3及冬季 PM2.5浓度的关键入模变量。采用基于随机森林算法的变量重要性分析工具进行潜在变量的初步筛选, 然后根据相关性及不同组间的差异性分析, 最终选定入模变量。
1) 以潜在预报因子数据集中的 39 个变量为自变量, 分别以成都市 2016—2019 年的 O3及 PM2.5浓度为因变量, 利用随机森林算法进行潜在预报因子的重要性分析, 降序排列选择其中前 25 个变量为初步选定的潜在入模因子。分别计算上述步骤初步选定的 O3及 PM2.5的 25 个入模变量间的相关系数矩阵(xbna 附录 4 和 5), 可见其中存在大量高度相关的相似变量, 进一步剔除相关系数高于 0.7 的相对不重要变量, 达到删除多余相似变量的目的, 避免高度相关变量进入模型中可能导致的严重的多重共线性问题[59–60]并减少模型训练过程中的计算量。
2) 分别分析 O3及 PM2.5浓度与上一步筛选出的对应潜在入模因子的相关性, 并根据国家一级及二级标准(GB/T 3095—2012 环境空气质量标准), 分别划分 O3和 PM2.5污染的清洁日(O3<100 μg/m3,PM2.5<35 μg/m3)和污染日(O3>160 μg/m3, PM2.5>75 μg/m3), 利用 t 检验对在清洁日与污染日潜在入模因子的差异性进行分析, 选择具有显著相关性及显著差异的因子分别作为 O3和 PM2.5潜势预报模型的最终关键入模因子。
通过上述步骤, 最终选定成都市臭氧污染的关键入模变量为 T_MAX (地面每日最高气温)、PBL_MAX (每日边界层高度最大值)、O3_YEST (前一日臭氧平均浓度)、HCC (每日平均高云量)、MCC (每日平均中云量)、WS850 (850 hPa 每日平均风速)、WS_AFTE (地面下午时段平均风速)、PR (每日降水总量)、PS_DELTA_YEST (前一日 24 小时变压)、WD (地面每日最多风向)及 WD700 (700 hPa 每日最多风向)。PM2.5的关键入模变量为 PM2.5_YEST(前一日 PM2.5平均浓度)、PBL (每日平均边界层高度)、WS (地面每日平均风速)、T700_MAX (700 hPa每日最高气温)、PS_DELTA (当日 24 小时变压)、WD_CHANGE (风向日变化因子)、PS_DELTA_YEST (前一日 24 小时变压)、PR (每日降水总量)、WS500 (500 hPa 每日平均风速)、GHT500 (500 hPa 每日平均位势高度)及 WD (地面每日最多风向)。
1.2.2 数据预处理
在正式建立预报模型之前, 需要对数据进行预处理, 包括归一化处理、污染物浓度对数化处理及风向相关变量特殊处理等。
1) O3及 PM2.5浓度数据为对数正态分布, 对相关变量(PM2.5, O3, PM2.5_YEST 和 O3_YEST)进行自然对数化处理, 处理完成后的数据主要用于 MLR及 NN 模型的建立。
2) 为消除量纲的影响, 对各变量数据做归一化处理, 处理完成后的数据用于 MLR, NN 及 RF 模型的建立。
3) 针对类别型变量(WD, WD700, IF_HOLIDAY和 IF_WEEK)进行特殊处理。在 RF 模型的建立中,对上述 4 个变量进行因子化处理; 在 MLR 及 NN 模型的建立中, 则分别构建新的虚拟变量, 如 WD 变量共包含 17 个因子水平(N, NNE, NE, ENE, E, ESE,SE, SSE, S, SSW, SW, WSW, W, WNW, NW, NNW和 C), 因此新建 16 个虚拟变量(WD.N, WD.NNE,WD.NE, WD.ENE, WD.E, WD.ESE, WD.SE, WD.SSE, WD.S, WD.SSW, WD.SW, WD.WSW, WD.W,WD.WNW, WD.NW 和 WD.NNW)。若所有虚拟变量为 0, 则代表 WD 为 C; 若 WD.N 为 1 且其他虚拟变量为 0, 则代表 WD 为 N; 依此类推。
此外, 随机抽取 2016—2018 年 75%的数据作为模型训练数据集, 剩余 25%的数据为测试数据集,保留 2019 年数据为回顾预报数据集, 用于模型建立完成后对预报效果进行独立评估。
1.2.3 模型训练及优化
本研究利用建立的训练数据集, 分别采用多元线性回归(MLR)、BP 神经网络(NN)和随机森林(RF) 3 种方法训练, 建立成都市夏季臭氧及冬季PM2.5污染潜势预报模型。
1) MLR 模型: 在数据预处理过程中, 针对类别型变量新建了大量的虚拟变量, 首先利用最优子集回归法进一步筛选变量, 基于马洛斯 Cp 准则、贝叶斯信息量准则和修正R2选择最佳的变量组合, 建立初步的 MLR 模型, MLR 模型建立完成后, 进行模型的诊断及显著性检验, 并利用方差膨胀因子进行共线性分析和模型优化, 确定相对最优的 MLR 模型。
2) NN 模型: 采用最优子集回归法确定最佳变量组合, 建立 NN 模型。设置隐含层层数为 1, 采用十折交叉检验确定隐含层神经元个数, 建立相对最优的 NN 模型。
3) RF 模型: 采用筛选的关键入模变量建立 RF模型, 通过诊断测试抽样的特征个数和森林决策树的个数等参数对 RF 模型的影响, 确定最优的参数组合, 建立相对最优的 RF 模型。
1.2.4 模拟和预报效果评估
对建立的“最优”MLR, NN 和 RF 模型在训练集和测试集中的表现进行评估, 并分析模型的泛化能力; 利用建立的模型对 2019 年的 O3及 PM2.5浓度进行回顾预报, 进一步验证 3 种模型的预报模拟能力。用于评估模拟效果的统计量包括相关系数(R)、平均偏差(Bias)、平均绝对误差(GE)、均方根误差(RMSE)以及分类误判率。
在成都市 2016—2018 年数据中随机选取 75%作为训练数据集, 剩余 25%的数据作为测试集, 利用多元线性回归、BP 神经网络及随机森林算法进行模型训练, 分别建立成都市臭氧污染潜势预报MLR, NN 及 RF 模型(各模型参数设置见 xbna 附录6), 并评估各模型在训练数据集和测试数据集中的模拟表现(表 1 和 xnba 附录 7)。MLR 及 NN 模型在训练集和测试集中的表现相对稳定, 性能接近。与训练集相比, 两个模型在测试集中的相关性有所降低, 误差值略有增大, 但仍处于合理的可接受范围内。RF 模型在训练集中的综合表现最优, 其相关系数高达0.98, BIAS, GE, RMSE 和分类误判率分别为−0.22, 9.09, 11.98 和 8.93, 均明显优于 MLR 及NN 模型在训练集中的模拟表现。在测试集中,RF 模型的相关系数显著降低 22.4%, GE, RMSE 和分类误判率等误差指标分别增加 148%, 150%和300%, 模拟能力显著降低, 但仍与 MLR 及 NN 模型在测试集中的评估结果接近。可见, 尽管 RF 模型存在明显的过拟合问题, 但依旧保持较好的模拟能力。综上所述, 利用多元线性回归、BP 神经网络、随机森林算法训练建立的 MLR, NN 以及 RF 模型的模拟表现较为接近, 都能够对成都市夏季臭氧污染进行良好的预测。
利用上述建立的 MLR, NN 及 RF 模型, 对成都市2019 年 4—8 月的臭氧污染进行回顾预报模拟,对模型的独立预报能力进行评估(表 1 和图 3)。该回顾预报可理解为提前一天(1-day lead)的污染潜势预报。MLR, NN 及 RF 模型在回顾预报集中的模拟值与观测值的相关系数位于 0.75~0.77 之间, 除BIAS 指标外, GE, RMSE 及分类误判率等误差结果较为一致(表 1)。对比在测试集中的表现, 3 个模型在回顾预报集中的评估指标结果并无明显差异, 可见 MLR, NN 及 RF 模型的表现均较为稳定。此外,虽然 MLR, NN 及 RF 模型的模拟结果存在一定的定量方面问题(图 3), 表现在对臭氧高峰值存在一定的低估(如 8 月 5—19 日期间的 3 个高峰值)或漏报(如 5 月 13 日)或 1~2 天的迟滞(如 6 月 12 日), 对低谷时段则存在一定的高估(如 6 月 17—19 日), 但模拟值与观测值之间的时间变化趋势保持良好的一致性, 可见 3 个模型都能对成都市 2019 年夏季臭氧进行较好的模拟。模型之间相较而言, MLR 及 RF 模型在定量方面能够更好地再现臭氧高污染时段, 更接近污染高峰观测值, 其中 RF 模型虽具有更小的 GE, RMSE 及分类误判率, 但在整体上存在一定的高估(其在测试集及回顾预报集中的 BIAS 分别为3.88 和 3.53), 在某些时段的变化趋势识别上不如MLR 模型精准。整体而言, 在 3 个模型中, MLR 模型具有最好的预报能力。
图3 成都市 2019 年夏季 O3 浓度观测值及 MLR, NN 和 RF 模型模拟值时间序列Fig. 3 Timeseries of O3 concentrations: observed versus simulated by MLR, NN and RF models for Chengdu in summer 2019
表1 成都市臭氧污染潜势模型模拟效果评估Table 1 Evaluation of the ozone pollution potential forecast models in Chengdu
同样针对成都市冬季(11—2 月) PM2.5污染建立MLR, NN 及 RF 潜势预报模型, 模型在训练集和测试集中的结果见 xbna 附录 8 和表 2。在训练集和测试集中, MLR 及 NN 模型的各项评估结果较为接近,且 MLR 和 NN 模型在测试集中的模拟能力反映在相关系数上与训练集无明显差别, GE, RMSE 和分类误判率则略有降低。RF 模型在训练集中的相关系数最大, GE, RMSE 及分类误判率等各项误差最小。RF 模型在测试集中的表现整体上与 MLR 和NN 模型相似, 但对比其在训练集中的表现, 相关性明显降低, 各项误差(GE, RMSE 和分类误判率)显著增大, 可见 RF 模型依旧存在一定程度的过拟合问题。MLR, NN 和 RF 模型对 PM2.5污染潜势的模拟能力较为相似, 表现稳定, 能够对成都市冬季PM2.5污染进行较好的模拟, 且模拟效果(表 2)优于其在臭氧污染潜势模拟中的表现(表 1)。
表2 成都市PM2.5 污染潜势预报模型模拟效果评估Table 2 Evaluation of the PM2.5 pollution potential forecast models in Chengdu
对成都市 2019 年 1—2 月和 11—12 月的 PM2.5浓度进行回顾模拟, 评估建立的污染潜势预报模型的预报能力(表 2 和图 4)。MLR 及 RF 模型的预报性能整体上较为稳定, 与测试集中的评估结果接近。这两个模型预测值与观测值的相关系数分别为 0.83和 0.85, GE, RMSE 及分类误判率等误差值也都保持在同一水平, 但 RF 模型的 BIAS 高于 MLR 模型,说明 RF 模型的高估程度更大。NN 模型的预报能力相较于测试集显著降低, 其预测值与观测值的相关系数降至 0.78, 虽然其 GE 和 RMSE 值与 MLR 和RF 模型较为接近, 但 BIAS 为 4.01, 说明 NN 模型在回顾预报集中亦存在一定程度的高估, 且分类误判率比测试集中的 22.92 增加 38.2%。MLR, NN 及 RF模型的模拟结果与观测时间序列皆较为吻合(图 4),对 PM2.5的变化趋势都能够进行较好的模拟, 且都能够识别主要的高浓度时段(如 12 月 8—15 日的连续重污染时段)。对比 MLR, NN 及 RF 模型的预报性能, NN 模型的相关系数相对较低, 分类误判率误差较高, 在时间序列中也存在更多的不一致; MLR及 RF 模型具有更好的模拟能力。虽然 MLR 模型预测结果与观测值的相关性最强, 各项误差皆较低,但在各项评估指标与 MLR 模型相近的情况下, RF模型对 PM2.5的重污染时段具有更好的识别能力(如1 月 6—9 日和 2 月 5 日)。从整体上看, RF 模型对成都市冬季 PM2.5污染的预报性能最佳。
图4 成都市2019 年冬季PM2.5 污染观测值及MLR, NN 和RF 模型模拟值时间序列Fig. 4 Timeseries of PM2.5 concentrations: observed versus simulated by MLR, NN and RF models for Chengdu in winter 2019
2.3.1 臭氧中长期潜势预报
本研究选定的成都市臭氧及 PM2.5污染潜势预报模型的关键入模变量主要为相关气象因子(基于WRF 回溯模拟结果)及前一日污染浓度变量(基于观测数据)。在 2.1 及 2.2 节的提前一天(1-day lead)污染潜势预报中, 我们利用 WRF 当日气象回溯模拟结果及前一日污染浓度观测结果对当日臭氧和PM2.5污染潜势进行预测, 而通过迭代预报结果生成前一日污染物浓度变量(即利用当天的浓度预报值作为下一天预报中的前一日污染物浓度值), 则可对未来 2~15 天(2–15-day lead)的污染潜势进行提前更长时间的预报(xbna 附录 9)。利用建立的 MLR,NN 及 RF 模型, 对成都市 2019 年夏季(4—8 月)臭氧及冬季(1—2 月及 11—12 月) PM2.5的污染潜势进行提前 1~15 天的预报, 评估 MLR, NN 及 RF 模型对中长期污染潜势预报的性能。
在 MLR 模型的中长期臭氧潜势预报结果(图 5和 6)中, 不同提前天数的预报浓度数值非常接近,除提前 1~3 天(1–3-day lead)的预报结果外, 其余提前各天(4–15-day lead)的预报浓度时间序列几乎完全重叠, 且都能与实测浓度数据的变化趋势较好地吻合(图 5)。当从提前 1 天增加至提前 3 天预报时,MLR 模型预报结果与实测值的相关性有所下降(由 0.77 降至 0.73), 各项误差指标有所增加, 但不显著(GE, RMSE 和分类污染率分别增加 5.6%, 6.0%和 6.7%); 当提前预报时间延长至 7~15 天(7–15-day lead)时, 各项误差指标保持稳定, 不再发生明显的变化, 始终保持较高的预报性能(图 6)。在 NN 及RF 模型中也观察到短期预报(提前 1~3 天)误差微弱增加、中长期(提前 7~15 天)预报趋于稳定的特征(图 6), 可见 3 个模型在中长期臭氧潜势预报中都有较好的预报性能, 其中 MLR 模型能够更准确地识别臭氧重污染时段(图 5), 在定量上与观测结果更接近, 中长期污染潜势预报性能最佳。
图5 成都市2019 年夏季臭氧污染潜势提前1~15 天预报值和观测值时间序列Fig. 5 Timeseries of 1–15-day lead O3 pollution potential forecasts versus observations for Chengdu in summer 2019
图6 成都市2019 年O3 污染潜势提前1~15 天预报性能评估结果Fig. 6 Evaluation of 1–15-day lead forecasts of O3 pollution potential for Chengdu in summer 2019
考虑到在提前 1~15 天的臭氧污染潜势预报测试中, 各模型关键预报因子中的相关气象因子均无变化(基于当日 WRF 回溯模拟气象场), 仅前一日臭氧浓度预报因子(O3_YEST)由预报模拟值迭代重新生成, 在不考虑 WRF 模拟气象场的不确定条件下,臭氧中长期污染潜势预报的准确性差异主要受 O3_YEST 变量的影响。由前面的分析可知, O3_YEST变量对中长期污染潜势预报模拟的影响极为有限,表现在提前 1~3 天的预报中 O3_YEST 的改变对预报性能影响较小, 而当预报时间超过 3 天时, O3_YEST 变量的影响几乎消失。为进一步验证 O3_YEST 变量对成都市夏季臭氧污染潜势预报性能的影响, 去除 O3_YEST 变量后重新构建 MLR, NN 及RF 潜势预报模型(评估结果见 xbna 附录 10 和 11)。对比包含 O3_YEST 变量的模型预报效果(2.1 节),不包含 O3_YEST 变量的 MLR, NN 及 RF 模型在回顾预报集中的相关性分别略为下降至 0.72, 0.71 和0.74 (xbna 附录 11, 与表 1 对比), GE, RMSE 及分类误判率都小幅增加(GE, RMSE 及分类误判率增幅分别为 7.9%~10.6%, 6.4%~8.9%和1.7%~10.3%)。3 个模型预报结果的时间序列变化趋势也都依旧保持与观测值良好的一致性(xbna 附录 10)。可见在模型建立的过程中, 虽然 O3_YEST 变量对臭氧潜势模型预报性能的提升起到一定的作用, 但效果有限, 成都市 O3污染潜势预报模型的预报效果主要受各相关气象因子的影响。
2.3.2 PM2.5 中长期潜势预报
同样地, 利用建立的 MLR, NN 及 RF 模型对成都市 2019 年 1—2 月和 11—12 月的 PM2.5污染进行提前 1~15 天的预报模拟, 结果如图 7 和 8 所示。MLR 模型在提前 1~3 天(1–3-day lead)的预报测试中相关性降低 17.6%, BIAS 由 1.75 增至 5.2, GE, RMSE及分类误判率分别增加 41.9%, 41.3%和 58.9%(图8), 模型误差显著增加, MLR 模型的预报效果明显下降。当延长至提前 7~15 天(7–15-day lead)的预报时, 各误差指标(GE, RMSE 及分类误判率)依旧存在一定程度的增长趋势, 且 BIAS 持续增加说明高估问题更加显著, 但各误差指标仍处于可接受范围内。从图 7 预报值的时间序列中亦可见, 1~3 天预报结果之间的差异较为显著, 随着预报提前时间的延长, 对 PM2.5的高估愈加明显(如 2019 年 2 月 15 及11 月 25 日前后)。当延长至提前 7~15 天时, 预报值时间序列出现很大程度的重叠, 但依旧与观测值的时间变化趋势大体上保持一致。同样的结果在 NN及 RF 模型的中长期潜势预报测试中亦可见, 尤其是 NN 模型, 其性能变差更为显著。对比 3 个模型对提前 1~15 天预报的性能评估结果, 可见 RF 模型的预报效果更为稳定, 与观测结果的时间序列保持更好的一致性, 具有最好的预报性能。针对成都市PM2.5污染建立的 MLR, NN 及 RF 模型对中长期PM2.5污染潜势预报的性能均随提前预报时长的增加而明显地下降, 其中 NN 模型的预报性能下降最严重, MLR 和 RF 模型预报性能的下降幅度较小。综合来看, 3 个模型的预报性能都仍处于可接受的范围[61]。
图7 成都市2019 年冬季PM2.5 污染潜势提前1~15 天预报值和观测值时间序列Fig. 7 Timeseries of 1–15-day lead forecasts of PM2.5 pollution potential versus observations for Chengdu in winter 2019
在 PM2.5模型中, 相关气象预报因子数据不变的情况下, 成都市 PM2.5中长期污染潜势预报模拟效果的显著降低主要受前一日 PM2.5浓度(PM2.5_YEST)变量的影响。尤其在提前 1~3 天的短期预报中, PM2.5_YEST 的影响极为显著, 而当延长至提前 7~15 天时, 其预报性能趋于相对稳定, PM2.5_YEST 的影响显著变小。去除 PM2.5_YEST 后重新建立成都市冬季 PM2.5污染潜势 MLR, NN 和 RF 模型, 进行预报效果测试(评估结果见xbna 附录 11 和12)。与包含 PM2.5_YEST 变量的模型预报效果(表2)相比, 去除 PM2.5_YEST 变量后, 新建的 PM2.5模型预报性能显著下降(xbna 附录 11), 各模型预报值在回顾预报集中与观测值的相关系数由原来的0.78~0.85 下降至 0.38~0.47, 且各项误差指标(GE,RMSE 及分类误判率等)的增幅都达到 90%~130%,尤其是分类误判率皆达到 50%以上, 不论是在定性还是定量方面, 各模型模拟的时间序列(xbna 附录 12)都与观测值存在很大的差异。PM2.5_YEST 对 PM2.5污染潜势预报模型的建立具有显著影响, 该变量能够明显地提升模型的预报性能, 可见 PM2.5潜势模型的预报性能随提前预报时长的增加而显著降低主要是对 PM2.5_YEST 这一变量的依赖所致。
本文以成都市为例, 利用 2016—2019 年 WRF模式回溯模拟气象场及同期 O3及 PM2.5日值观测数据, 利用影响污染物转化、扩散和传输的主要气象条件及相关因子建立潜在预报因子数据集。通过筛选影响成都市夏季(4—8 月) O3及冬季(11 月—来年2 月) PM2.5污染的关键预报因子, 利用多元线性回归、随机森林以及 BP 神经网络等机器学习算法,分别建立夏季 O3及冬季 PM2.5污染潜势预报模型。对比分析各模型对成都市 O3及 PM2.5浓度的预报效果, 讨论基于机器学习方法建立的污染潜势预报模型的中长期预报能力。
基于多元线性回归、BP 神经网络、随机森林等算法建立的 MLR, NN 及 RF 模型对成都市夏季臭氧浓度均具有良好的预报性能, 模型泛化能力较好,能够准确地识别成都市典型的臭氧高污染时段。在不考虑气象模拟准确性的情况下, 建立的潜势模型亦能够较好地应用于成都市夏季臭氧中长期(提前7~15 天)污染潜势预报。随着预报提前时间延长,模型预报性能并未显著降低, 表现稳定, 主要原因是各模型都对前一日臭氧浓度变量的依赖性较小。其中, MLR 模型对成都市臭氧浓度具有相对最佳的预报性能, 臭氧高值更接近观测结果, 且与观测结果的时间变化趋势更加吻合。
基于关键气象因子和前一日 PM2.5浓度变量建立的 MLR, NN 及 RF 模型能够较好的预测成都市冬季 PM2.5浓度的变化趋势, 与观测时间序列保持较好的一致性, 各项误差指标较低, 3 个模型均具有较优的预报性能。通过迭代生成前一日 PM2.5浓度变量, 可利用建立的 MLR, NN 及 RF 模型, 对 PM2.5污染的中长期潜势进行预报。受前一日 PM2.5浓度变量的影响, 随着提前时长的增加, 各模型的预报性能均有所降低, 但仍处于可接受范围。其中, RF 模型在保持良好误差指标的同时, 在定量上对 PM2.5的高浓度数值有更好的表现, 具有相对最优的预报能力。