龚安保,解 欢,于阳春,沈楠驰,杜雨飞,张 坤,陈姝芮,吴 彤,管 旭*,李 莉
1. 山东省生态环境规划研究院,国家环境保护陆海统筹生态治理与系统调控重点实验室,山东 济南 250101
2. 上海大学环境与化学工程学院,上海 200444
近年来,随着经济的快速发展以及工业化和城市化的广泛推进,能源消费持续增加,大气污染问题愈发凸显. 自《大气污染防治行动计划》[1]实施以来,以细颗粒物(PM2.5)为首要污染物的大气污染得到一定控制,PM2.5和二氧化硫(SO2)质量浓度明显下降,但O3污染日益严重[2-4]. O3对于人体健康、生态系统和气候变化都有重要影响[5-9]. 近地面O3主要由其前体物(如NOx和VOCs) 在光照条件下通过一系列光化学反应生成[10],此外,气象条件对于O3污染的扩散与传输也起到至关重要的作用. 因此,O3观测值往往受到排放及气象条件的共同影响[11-14]. 如何识别排放及气象条件对O3污染的影响,对于评估已有管控政策的实施效果、制定新的政策具有重要意义.
当前已有多种方法用来评估排放和气象条件对O3的贡献,如化学传输模型、数理统计和机器学习等. 化学传输模型通过调整排放清单和气象设置,设计多情景分析以表征排放和气象条件对空气质量的影响[15-16]. 但化学传输模型作为一种数值模拟,其对计算机资源需求相对较高,此外,排放清单和气象场数据的不确定性均在一定程度上弱化了解析结果的可靠性. 数理统计方法主要利用多元线性回归、经验正交函数或KZ 滤波等方法构建气象或排放数据和空气质量观测浓度之间的关系[17-20]. 这些方法通常旨在通过数学方程拟合或剥离单个影响因素,但由于O3与其前体物之间存在强烈的非线性关系,且受到多个气象因素的影响,因此往往难以用统计数据准确捕获它们之间的关系. 近年来随着大数据分析技术的快速崛起,机器学习方法开始被广泛用于剥离气象条件和排放对空气质量的影响[21-25]. 例如,Grange 等[21]利用随机森林模型研究了1997-2016 年瑞士PM10的排放趋势;Vu 等[22]利用气象标准化的方法评估了阶段性的“清洁空气行动计划”的效果和影响;Dai 等[24]运用机器学习的方法量化了特定事件中气象条件和排放的贡献. 这些研究已充分证明了机器学习方法可以有效剥离气象条件和排放对空气质量的影响. 相较于其他方法,机器学习方法低廉的使用成本无疑是其另一优势,这也使得机器学习方法有着更广泛的应用潜力.
山东省地处我国东部沿海地区,东部毗邻日本和韩国,南北承接长三角、京津冀两个国家级城市群,是中国重要的城镇密集地区[26]. 山东省经济发展迅速,随之而来的大气O3污染问题日益严峻,这也严重制约了山东的空气质量持续改善和经济可持续发展[27-28].目前山东省O3污染的相关研究多集中于时空变化特征和源解析等[28-30],较缺乏长时间周期、大空间尺度的评估排放和气象条件对区域O3污染的贡献. 基于此,本研究利用2020-2022 年山东省地面监测站点的污染和气象数据,运用随机森林的方法剥离了排放和气象条件对于O3污染的贡献,进一步运用沙普利加和的方法分析了不同气象因子对O3的影响程度,并定义了区域O3污染事件,对区域O3污染事件发生时段的排放和气象条件贡献进行了剖析,以期为区域O3污染成因剖析和防控治理提供参考.
山东省位于中国东部沿海地区,濒临渤海和黄海,地处黄河下游,地跨34°22.90′N~38°24.01′N、114°47.50′E~122°42.30′E 之间,自北至南与河北、河南、安徽、江苏四省接壤. 山东省地形以平原丘陵为主,中南部山地突出,西南、西北低洼平坦,东部是缓丘起伏的山东半岛.
山东省近地面国控站点2020-2022 年O3逐小时浓度数据来自中国环境监测总站(http://www.cnemc.cn).地面气象及污染物观测站点分布见图1. 对于部分异常数据,根据《环境空气质量标准》(GB 3095-2012)[31]中针对数据有效性的规定进行剔除;对于部分缺失数据,则采用线性内插法[32]补全被剔除数据和缺失数据,即
图1 山东省气象监测站和空气质量监测站分布Fig.1 The distribution of meteorological and air quality monitoring stations in Shandong Province
式中,Xn为缺失数据,XP和Xq分别代表缺失前、后的值.气象数据来源于国家气象数据中心(http://data.cma.cn),观测因子包括温度(T)、相对湿度(RH)、风速(WS)、风向(WD)、降水量(RP)和大气压强(Press). 每个城市选取所有空气质量监测站的平均值代表该城市的污染水平,选取以城市命名的气象站点数据代表该城市的气象条件.
1.3.1 随机森林算法和沙普利加和解释
随机森林是一种机器学习算法,常被用于预测PM2.5和O3等污染物浓度,具有较高的准确性和泛用性[16]. 该算法主要通过在训练数据集上训练多个决策树来实现预测. 按照时间先后顺序对历史气象数据进行随机采样,将采样结果输入数学模型中,预测O3浓度. 按照“随机采样-模型预测”的步骤重复完成1 000 次,将1 000 次的预测结果进行平均,得到气象标准化后的O3浓度(O3_rmw). 气象标准化的O3浓度(O3_rmw)和原始的O3浓度(O3_obs) 的差值就可以认为是气象所引起的O3浓度(O3_met). 但随机森林模型作为一种集成的机器学习方法,难以对模型中各输入参数的影响进行解释. 因此,本研究采用沙普利加和解释方法以弥补上述缺陷. 沙普利加和解释方法作为一种基于合作博弈论的机器学习解释方法,可将预测结果合理分配到每个特征上,从而克服了机器学习可解释性差的问题[33],其具体原理如下:
式中:f为原始随机森林模型; Φ0(f)为模型预测结果的平均值,是模型的基线值;M为模型特征的数量;Φi(f,x)为特征i的SHAP 值,是特征i对预测结果f(x) 的贡献. 当 Φi(f,x) >0〔或 Φi(f,x)<0〕时,意味着特征i会增加(或减少)f(x), |Φi(f,x)|越高,表示特征i越重要;R是所有特征排序的集合,PiR是在排序R中排在特征i之前的所有特征的集合.
1.3.2 区域O3污染事件的定义
根据《环境空气质量评价技术规范(试行)》(HJ 663-2013)[34]对山东省各监测站点O3小时浓度数据进行审核统计,基于审核后的有效数据计算O38 h滑动平均浓度,将O3日最大8 h 平均值 (MDA8 O3)超过160 μg/m3(GB 3095-2012)[31]视为O3超标日.本研究定义单个城市O3超标日持续3 d 及以上,且同时涉及城市超过8 个(山东半数以上城市)为一次污染事件.
2.1.1 气象标准化
鉴于山东省行政区域面积广阔及其半岛特征,地理位置及经济发展水平的差异可导致不同城市O3污染形成机制存在较大差异. 因此在进行气象条件和排放贡献剥离分析前,首先利用聚类分析将山东省各城市聚类. 聚类计算基于2020-2022 山东省大气氧化剂Ox(即O3+NO2)观测数据,应用K-means 聚类分析方法,将山东省16 市分为三个亚区域(见图2),分别为鲁西(包括济南市、德州市、聊城市、菏泽市、济宁市、泰安市、淄博市和枣庄市)、鲁中(包括滨州市、东营市、潍坊市、日照市和临沂市)和鲁东(青岛市、烟台市和威海市). 这一区域划分也与Wang 等[35]研究的山东省O3污染空间分异结果相一致.
图2 2020-2022 年山东省Ox 聚类结果空间分布Fig.2 Spatial distribution of the cluster of Ox in Shandong Province
按照纬度近似原则,在山东省鲁西、鲁中及鲁东三个亚区域各选取一个典型城市-济南市、潍坊市及烟台市作为代表,对其2020-2022 年O3观测值和气象标准化值进行统计(见图3). 从O3气象标准化值看,三个亚区域O3前体物排放整体变化上呈逐年上升趋势,年变化速率分别为3.3%(鲁西)、7.8%(鲁中)和4.4%(鲁东). 2020 年气象标准化值普遍偏低,也与当年前半年的新型冠状病毒感染疫情影响有关;而后2021 年各地普遍复工复产,O3前体物排放明显抬升. 从O3观测值和气象标准化值看,2020 年,鲁西(济南市)、鲁中(潍坊市)、鲁东(烟台市)O3气象标准化结果均分别高于观测值(分别为8.26、6.14、6.60 μg/m3),说明气象条件有利于高浓度O3的消减,属于“天帮忙”;2021 年三市气象条件对3 年平均浓度的贡献分别为-4.39、-4.74、-2.27 μg/m3,均略低于2020 年同期,说明气象条件的有利效果有所减弱;而2022 年三地不利气象条件影响分别为8.73、10.69、5.16 μg/m3,气象条件有利于高浓度O3的生成.
图3 2020-2022 年济南市、潍坊市、烟台市O3 气象标准化结果与观测值Fig.3 Meteorological standardization results and observed values of O3 in Jinan, Weifang and Yantai from 2020 to 2022
为进一步厘清不同气象因素对于O3浓度的贡献,选取山东省O3污染高发的4-9 月(即夏半年),基于上述三个典型城市,分析2021-2022 年4-9 月山东省O3观测值、气象标准化值和气象条件贡献的平均浓度,结果如图4 所示. 相较于2020 年上半年受新型冠状病毒感染疫情较大的影响,2021 年和2022 年的月际变化更加客观,因而选择2021-2022 年来观察各指标的月际变化. 从观测值来看,各市各月O3观测值多表现为2022 年高于2021 年,少数月份中两年O3观测值浓度相仿;8 月较为特殊,2022 年的O3观测值月均浓度明显下降,这一变化或与当年天气形势变化(诸如台风等)有关[36]. 气象标准化结果中,各市各月O3平均浓度差异不大,从年际变化看,2022年略高于2021 年. 从气象条件贡献看,2021-2022年各市气象条件贡献均为正值,说明在山东地区2021-2022 年夏半年气象条件有利于O3的生成. 比较各月间气象贡献,发现济南市(鲁西)、潍坊市(鲁中)气象条件对O3浓度的贡献最强,而在烟台市(鲁东)气象条件对于O3浓度贡献的最高值出现在5 月,这可能是因为在山东东部地区城市因沿海而有着更高的湿度水平,故而在更早的月份达到了气象条件贡献的峰值水平.
图4 2021-2022 年济南市、潍坊市、烟台市的O3 观测值、气象标准化结果、气象条件贡献的月际变化Fig.4 Inter-monthly changes of the observed, meteorological standardized O3 levels and meteorological condition contribution to O3 in Jinan, Weifang and Yantai from 2021 to 2022
2.1.2 气象条件影响归因
不同气象因子对于当地O3贡献的SHAP 值如图5 所示,可以看出在典型城市的所有年份中相对湿度(RH)和温度(T) 都是影响O3小时浓度的主控因素,这与刘杰等[37]的研究结果一致. 温度通过控制大气中的化学反应过程可直接影响O3浓度[38],也可通过调节气孔的吸收强度影响O3干沉降过程[39]. 作为沿海城市的烟台市,其风向(WD)对于O3小时浓度的贡献较为显著. 由各亚区域间对比可以发现,鲁西、鲁中地区气象条件对于O3的影响水平相仿,且明显大于鲁东地区,这可能由于鲁西及鲁中地区前体物排放强度更高,在不利气象条件下更容易导致O3的生成. 对比各亚区域3 年的结果可以发现,气象条件对当地O3的整体贡献逐年趋于正向影响. 2020-2021年00:00-09:00 气象因子对当地O3小时浓度呈负贡献,随后在11:00-19:00 呈正向影响,20:00 后转为负向;2022 年00:00-08:00 呈负贡献,09:00 开始气象因子对当地O3贡献呈正向,且正贡献持续时间增加. 为进一步对比不同城市间气象条件影响的差异,统计了山东省16 市日间(07:00-17:00) 各气象因子对O3小时浓度贡献的平均值(见图6). 整体来看,温度(T) 和相对湿度(RH) 对O3小时浓度的贡献最为重要;而部分沿海城市风向(WD)的贡献比重明显上升,这与沿海地区频繁的海陆风影响相吻合[40].
图5 2020-2022 年济南市、潍坊市、烟台市气象条件对O3 小时浓度的影响Fig.5 Effect of meteorological conditions on O3 hourly concentration in Jinan, Weifang and Yantai during 2020-2022
图6 2020-2022 年山东省16 市日间各气象因子对于O3 浓度的贡献Fig.6 Contribution of each meteorological factors to daytime O3 concentrations in 16 cities in Shandong Province
根据区域O3污染事件发生的定义进行统计分析,山东省2020-2022 年共经历24 次区域O3污染事件,2020 年、2021 年、2022 年分别为9、7、8 次,全部出现在4-9 月. 区域污染期间,全省16 个城市MDA8 O3范围为70~319 μg/m3,平均值为179.4 μg/m3. 对O3污染事件时段利用随机森林的机器学习方法进行气象标准化分析,并对各年度O3污染事件时段O3平均浓度的观测值和气象标准化值进行统计,结果如图7 所示. 总体来看,在O3污染事件发生时,O3_obs明显高于O3_rmw,说明不利气象条件是区域O3污染发生的主要贡献者. 从年度变化看,气象条件影响整体呈现逐年上升的趋势,特别是在2022 年,济南市、潍坊市和烟台市不利气象条件贡献分别达到59.19、51.93 和41.45 μg/m3,远高于全年平均水平. 为进一步分析不同气象因子的贡献,对2020-2022 年O3污染事件时段不同气象因子对于O3贡献的SHAP 值进行统计(见图8),可以看出温度(T)和相对湿度(RH)是影响O3小时浓度的主控因素,其中温度(T)的影响最为显著,济南市、潍坊市和烟台市三市日间峰值影响分别为89.61、66.62 和33.36 μg/m3. 这与王治非等[41]的研究结果一致,温度在影响O3浓度的气象因子中占据主导地位,且鲁西大于鲁东. 气温升高时O3前体物的排放增加,O3浓度也随之增加[42]. 此外,对比3 年间结果可以发现,夜间气象因子的负贡献逐渐减弱,而日间的正贡献逐渐增强,整体上对于当地O3贡献逐年趋于正向影响. 比较不同区域,则发现不利气象条件的影响在三个亚区域呈现鲁西>鲁中>鲁东.
图7 2020-2022 年济南市、潍坊市、烟台市在区域O3 污染事件期间气象标准化结果与观测值比较Fig.7 Comparison of meteorological standardization results and observed values during regional O3 pollution incidents in Jinan, Weifang and Yantai from 2020 to 2022
图8 2020-2022 年济南市、潍坊市、烟台市区域O3 污染事件期间气象条件对O3 浓度的影响Fig.8 Influence of meteorological conditions on O3 concentrations during regional O3 pollution events in Jinan, Weifang and Yantai from 2020 to 2022
a) 随机森林模型分析结果显示,2020-2022 年山东省不利气象条件是导致其O3污染的重要诱因.从气象条件影响看,2020 年及2021 年气象条件有利于高浓度O3的消减,属于“天帮忙”;而2022 年气象条件有利于高浓度O3的生成.
b) 相对湿度(RH) 和温度(T) 都是影响O3小时浓度的主控因素,而作为沿海地区的鲁东城市烟台市,其风向(WD)对于O3小时浓度的影响较为突出.
c) 区域O3污染事件期间,排放的贡献与非污染期间接近,而不利气象条件是O3污染形成的主要诱因. 从单气象因子看,区域O3污染事件期间温度和相对湿度是影响O3浓度的主控气象因素,其中温度的影响最为显著,对O3小时浓度的贡献为33.36~89.61 μg/m3. 后续应更加重视在高温、低湿条件下的O3污染防控工作.