沈培福,靳全锋,2*,周雨欣,徐端妙,黄海松
1. 丽水职业技术学院,浙江 丽水 323000
2. 福建农林大学林学院,福建 福州 350002
城市化和工业化进程的加快,导致大气污染加剧,从而引起国内外广泛关注. 尽管我国生态环境部出台了一系列环境保护政策[1-2],但我国区域O3浓度仍呈增长态势[3-4],在京津唐、长三角和珠三角地区O3已取代颗粒物成为主要污染物[5-7]. 因此,我国越来越重视O3污染的监测与管理[8],高精度的O3浓度拟合方法对解决O3问题尤为重要.
研究[9]发现,O3主要由氮氧化物(NOx)、挥发性有机化合物(VOCs)、一氧化碳(CO)、甲烷(CH4)和烃类等多种前体物经复杂光化学反应产生. 长期暴露在高浓度O3环境对人类健康和生态系统有显著影响[10-11]. 高浓度O3会抑制植被光合作用、改变植被理化性质、降低植被养分利用率,通过影响植被有机物积累进而直接或间接改变生态系统结构[12-14]. 研究[15-16]表明,高浓度O3会增加人类心血管和呼吸系统疾病的发生概率,同时也会显著影响人血糖和血压等生理生化指标,甚至导致过早死亡[17]. 卫生计量评估研究所(IHME)全球疾病负担(GBD)项目研究显示,2016年全球因O3导致过早死亡的人数达233 638 人[18],2015年中国因O3导致过早死亡的人数超过80 280 人[19]. 同时,高浓度O3也可显著影响生态环境[20]. 因此,解决O3问题是全社会共同利益. 鉴于长三角目前面临着复杂的O3污染问题,全面了解O3污染时空格局及其影响因子对开展环境流行病学研究和拟定适当的O3污染控制策略具有重要意义.
目前,我国正处于经济上升期,长三角作为工业生产密集区,工业生产和人类活动大量排放O3前体物,从而加剧O3污染. 浙江省位于长三角经济核心区,因此探索浙江省O3时空格局及相关因子对解决我国亚热带区域O3污染问题尤为重要. 目前,国内关于O3污染的研究已取得一定进展[1,19-21],为探究气象因子和前体物对O3浓度的影响,在全国[20]、北京[3]、长三角[22-23]和珠三角[24]等不同尺度区域探索了O3浓度的驱动因子. 多数研究集中在O3污染的时空格局[1,21]、O3污染对人类健康的影响[19]以及O3浓度与气象因素之间的相关关系[25],国内外学者运用多元线性回归分析法[26]、分位数回归分析法[27]、主成分分析法[28]、收敛交叉映射算法[25]和空气质量模型[20]等拟合地面O3浓度与气象和人为因子相关关系,但忽略了季节对O3污染的影响. 鉴于此,该研究以浙江省2014-2019年O3浓度小时监测数据为研究对象,应用多元线性回归方法结合气象因子,探究不同时间内O3污染时空分布及相关影响因子,以期为相关模型研究和O3污染防控提供科学依据.
浙江省位于中国东部,区域范围为27°06′N~31°11′N、118°01′E~123°10′E,面积为1.02×105km2. 该区域属亚热带季风性湿润气候,自然条件较优越,年均气温为15~18 ℃,年均雨量为980~2 000 mm,年均日照时长为1 710~2 100 h[23-24].
2014-2019 年O3浓度小时监测数据来源于中国环境监测中心(http://www.cnemc.cn). 该研究基于浙江省及周边56 个监测站点的O3小时浓度数据,计算每天、每月和每年的O3浓度平均值. 气象数据来源于中国气象数据共享网络(http://cdc.cma.gov.cn),浙江省及周边42 个国家基准站每日气象数据共包含蒸发量、降水量、相对湿度、温度、风速、光照和地表温度等22 个气象因子,该研究对气象数据进行了预处理,去除了由于仪器设备损坏缺失的数据,剩余气象因子包括蒸发量(mm)、日均地表气温(℃)、日最高地表气温(℃)、日最低地表气温(℃)、日均风速(m/s)、日最大风速(m/s)、日最大风速的风向(°)、日极大风速(m/s)、日极大风速的风向(°)、日降水量(mm)、日均气压(hPa)、日最高气压(hPa)、日最低气压(hPa)、日照时数(h)、日均气温(℃)、日最高气温(℃)、日最低气温(℃)、日均相对湿度(%)和日最小相对湿度(%)共19 个气象因子.
1.3.1 后向轨迹聚类分析
后向轨迹聚类分析是一种用于计算、分析大气污染物运输、扩散轨迹的专业模型,目前广泛运用大气污染物的溯源、追踪和区域源解析研究[29]. 该研究以气象数据(ftp://arlftp.arlhq.noaa.gov/pub/archives)为基础运用MeteoInfo 软件进行数据可视分[30]. 基于已有研究[31-32],考虑到500 m 高度风场能够准确反映边界层的平均流场特征,则以500 m 为模拟高度. 同时模拟不同季节典型时刻(00:00、04:00、08:00、12:00、16:00 和20:00)24 h 后向轨迹.
1.3.2 多元线性回归模型及多重共线性诊断
多元线性回归模型是用多个自变量解释因变量变化的一种常用统计模型[33],其自变量的多重共线性是自变量之间相关关系的重要表现,若模型存在较高共线性,会导致显著性检验失去意义及模型的预测功能失效. 因此,建模前应对自变量进行多重共线性诊断,逐步剔除有显著共线性的自变量. 该研究运用方差膨胀因子(VIF)进行多重共线性检验,当VIF≥10时,表明自变量间存在多重共线性,将其剔除并以逐步回归法得到最优结果;当VIF<10 时,表明自变量间不存在多重共线性.
1.3.3 模型变量的选择及运算
该研究将总样本数据随机分成70%的训练样本和30%的测试样本,进行有放回随机抽样,重复5 次,分别得到5 组样本,对5 组样本进行多元线性回归运算,建立5 个中间模型,选择5 次测试中出现3 次或以上的显著变量进入全样本数据拟合. 应用R 软件的Relaimpo 包计算显著性变量的贡献率.
浙江省O3浓度精度验证是对O3浓度实测值与预测值计算均方根误差(RMSE)、均方绝对百分比误差(MAPE)以及变异解释量(R2)来评估O3浓度精度.RMSE、MAPE 和R2计算公式参考文献[33].
由图1(a)可见,浙江省O3浓度月变化存在差异,总体呈“M”型分布,其中最高值多集中在5 月和9 月,最低值多集中在6-7 月,1-12 月O3平均浓度分别为32.16、48.63、56.44、66.74、77.13、68.03、61.22、67.85、70.37、60.38、35.54 和27.49 μg/m3. O3浓度具有明显的季节性差异,呈夏季(68.80 μg/m3)>秋季(66.20 μg/m3)>春季(57.26 μg/m3)>冬季(31.73 μg/m3)的特征. 研究[34-35]显示,冬季O3浓度较低,夏季O3浓度较高,O3浓度受太阳辐射和温度等自然因子的影响,因此夏季气象条件更适合光化学反应,相反冬季紫外线强度低,光化学反应不足以形成较高的O3浓度.
由图1(b)可见,2014-2019 年浙江省大气O3平均浓度总体呈上升趋势,2014-2019 年O3平均浓度分别为55.76、53.85、54.40、58.81、56.93 和55.89 μg/m3,年均增长率为1.34%,与Yang 等[1]研究结果一致.
图1 2014—2019 年浙江省O3 浓度时间变化及年变化情况Fig.1 Time variation and annual variation of O3 concentration in Zhejiang Province from 2014 to 2019
2014-2019 年浙江省四季和年均O3浓度变化如图2 所示. 由图2 可见:春季、夏季、秋季和年均O3浓度均在07:00 左右达到最小值,之后逐步上升,至15:00 达到峰值后逐步下降,而冬季O3浓度最小值出现时间较其他季节晚1 h. 笔者研究结果与Yang等[1,36]研究结论一致,即O3形成受温度和太阳辐射等因子影响[37]. 早上随着太阳辐射和温度升高,光化学反应急剧,加快了O3形成,14:00 温度和光照均达到最大值,O3转化效率较高,由于O3积累存在一定的延迟,最终在15:00 达到峰值[38].
图2 2014—2019 年浙江省O3 浓度日变化情况Fig.2 Daily variation of O3 concentration in Zhejiang Province from 2014 to 2019
由图3 可见,2014-2019 年浙江省O3浓度时空分布不均匀,O3浓度较高的区域多集中在浙江省东北区域和北部区域,中部区域O3浓度相对较低. 杭州市、湖州市、嘉兴市、金华市、丽水市、宁波市、衢州市、绍兴市、台州市、温州市和舟山市O3年均浓度分别为59.82、65.13、68.80、58.86、56.95、65.27、58.96、60.82、65.01、53.78 和59.48 μg/m3. 研究表明,O3浓度与NOx和VOCs 浓度密切相关[39-41],浙江省北部是重工业分布区,排放大量NOx和VOCs[33],可有效促进区域空间O3浓度的增加[42-43].
图3 2014—2019 年浙江省O3 浓度空间分布Fig.3 Spatial distributions of O3 concentration in Zhejiang Province from 2014 to 2019
该研究以2014-2019 年不同季节气象数据为基础,运用MeteoInfo 软件模拟高度为500 m,模拟时间为24 h 的后向轨迹,按传输速度和方向对气流轨迹进行轨迹类型聚类(见表1).
表1 2014-2019 年浙江省四季的气流后向轨迹聚类Table 1 Backward trajectory clustering of four seasons in Zhejiang Province from 2014 to 2019
春季后向轨迹聚类为6 类(见表1),聚类Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ的占比分别为5.43%、7.61%、8.70%、38.04%、22.83%和17.39%. 聚类Ⅰ来自河北省,经过山东省并穿越安徽省和江苏省,然后到达杭州市;聚类Ⅱ来自湖北省,经安徽省南部达到杭州市;聚类Ⅲ起源于湖南省与广东省交汇处,贯穿江西省到达杭州市;聚类Ⅳ起源于皖南直达杭州市;聚类Ⅴ集群源于浙江省东部沿海;聚类Ⅵ集群起源于黄海,穿越江苏省和上海市直达杭州市.
夏季,后向轨迹聚类为6 类(见表1),聚类Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ的占比分别为4.40%、1.10%、26.37%、15.38%、20.88%和31.87%,其中聚类Ⅲ、Ⅴ和Ⅵ总占比为79.12%,其起源多为本省或邻省周边区域.
秋季,后向轨迹聚类为5 类(见表1),聚类Ⅰ、Ⅱ、Ⅲ、Ⅳ和Ⅴ的占比分别为6.59%、15.38%、36.26%、26.37%和15.40%,其中Ⅲ和Ⅳ分别起源于黄海和江西省北部,二者占比超过60%.
冬季,后向轨迹聚类为6 类(见表1),聚类Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ的占比分别为2.25%、37.08%、13.48%、11.24%、28.08%和7.87%. 聚类Ⅰ、Ⅱ、Ⅳ、Ⅴ和Ⅵ均源于西南方向,其起源多集中在安徽省和湖北省,聚类Ⅲ源于江西省北部区域.
该研究基于方差膨胀因子(VIF<10)和因子解释率(Img>1%)对各季节因子进行逐步剔除,最终结果见表2、3.
表2 多元线性回归模型因子筛选Table 2 Factor screening for multiple linear regression models
不同季节多元线性回归模型因子存在差异(见表3):春季,日蒸发量、日最低气压、日照时长和日最低气温均与O3浓度呈正相关,日最高气温、日最小相对湿度和NO2浓度对O3浓度有抑制效应;夏季,日极大风速、极大风速的风向、日降水量、日最高气温和日平均相对湿度均与O3浓度呈负相关,日蒸发量、日最高气压和日照时长对O3浓度有促进作用;秋季,日最大风速、日最大风速的风向、日降水量和NO2浓度均与O3浓度呈负相关,日蒸发量、日平均风速、日极大风速和日照时长对O3浓度有促进作用;冬季,日蒸发量、日最高地表气温、日极大风速和日平均相对湿度均与O3浓度呈正相关,日最低地表气温、极大风速的风向、日最高气压和NO2浓度对O3浓度有抑制作用. 不同季节最终模型中各因子对O3浓度影响差异显著,其中,秋、春两季蒸发量对O3浓度的贡献率超过20%,而夏季日平均相对湿度贡献率超过40%,秋季日光照时长贡献率超过40%,秋、冬两季NO2浓度贡献率超过35%(见图4).
图4 浙江省各季节自变量对因变量的贡献率Fig.4 Contribution rate of independent variables to dependent variables in each season of Zhejiang Province
表3 最终多元线性回归模型Table 3 The final multiple linear regression models
由表4 可见:不同季节训练样本和测试样本方差解释度、调整R2以及O3浓度观测值与预测值的相关性均存在较大差异. 其中,春季平均方差解释度为44.60%,调整R2为0.446,观测值与预测值的相关性为0.669;夏季平均方差解释度为37.76%,调整R2为0.377,观测值与预测值的相关性为0.593;秋季平均方差解释度为44.06%,调整R2为0.441,观测值与预测值的相关性为0.665;冬季平均方差解释度为46.31%,调整R2为0.463,观测值与预测值的相关性为0.682. 结果表明,春季、冬季和秋季拟合效果优于夏季.
表4 多元线性回归模型中调整R2、方差解释度以及O3 浓度观测值与预测值的相关性Table 4 Adjust R2, variance explained and correlation values between observed and predicted values in the multiple linear regression model
由图5 可见,春季回归模型的RMSE、MAPE 和R2分别为0.213、26.45%和0.422,夏季分别为0.234、30.49%和0.359,秋季分别为0.169、24.02%和0.445,冬季分别为0.154、34.14%和0.419. 结果表明,不同季节多元线性回归模型拟合结果存在差异,拟合效果在秋季最好,其次依次为春季、冬季和夏季,春、秋两季的拟合效果显著优于夏、冬两季,与已有研究结果[20,44-45]一致.
图5 O3 浓度精度验证Fig.5 Accuracy validations of O3 concentration
研究[46]发现,降水、气温、相对湿度、日照时间、地表气压和风速等气象因子是影响O3浓度的主要因素. 而O3浓度的影响因子在四季存在差异,主要是由于前体物、气象条件和光化学反应的差异导致[47]. 不同季节O3浓度影响因子存在较大差异,在春季日蒸发量、日最低气压、日照时长、日最高气温、日最低气温、日最小相对湿度和NO2浓度等7 个因子对O3浓度的影响较为显著. 研究[45]显示,O3浓度与日蒸发量呈显著正相关,由于日蒸发量与地表气温呈正相关,因此日蒸发量对O3浓度的影响在一定程度上反映了温度对其的作用. 随着气温的升高,日蒸发和植被蒸腾作用显著增加,地表植被挥发物(BVOCs)呈增加趋势,进而促进O3形成[48]. 笔者研究显示,在夏季日极大风速、极大风速的风向、日降水量和和日平均相对湿度等4 个因子与O3浓度呈显著负相关,一方面,湿润海洋气团被海风带入浙江省,增加了空气湿度,降低了O3浓度,而夏季海洋气团占比较少,其对大气底层O3浓度影响较小;另一方面,稳定的气流运动将周边NOx和VOCs 等前体物带入浙江省,日照时长的增加,增强了有效光化学反应,导致夏季O3污染加剧[20,49]. 冬季前体物浓度最高,但O3浓度最低[20,22],主要影响因子是日蒸发量、日最高地表气温、极大风速的风向和前体物浓度. 由于气流将高污染区域的前体物带到浙江省,污染物浓度的增加促进了光的散射,降低了日最高地表气温以及减少了日蒸发量,进而降低光化学反应能力和O3浓度[26,50]. 而秋季和春季O3浓度影响因子与夏、冬两季具有一定相似性.
a) 2014-2019 年浙江省O3浓度时间分布不均匀,O3年均值整体呈上升趋势,四季变化存在差异,总体呈夏季>秋季 > 春季>冬季的特征.
b) 浙江省春季、夏季、秋季和全年O3浓度在07:00 左右达最小值,之后逐步上升,至15:00 达峰值后逐步下降,冬季O3最小值出现时间较其他季节晚1 h 左右.
c) 浙江省O3浓度空间分布不均匀,O3浓度较高的区域集中在浙江省东北区域和北部区域,中部区域O3浓度相对较低.
d) 春季气流以偏西和东南方向为主,偏西气流占比最高;夏季偏西和西南气流占比最大,占比超过45%;秋季海洋气流占比最大,超过50%;冬季气流皆来源西北和西南方向.
e) 浙江省不同季节O3浓度模型影响差异显著,其中,春、秋两季蒸发量贡献率超过20%,而夏季平均相对湿度贡献率超过40%,秋季日光照时长贡献率超过40%,秋、冬两季NO2浓度贡献率超过35%.
f) 春季多元线性回归模型均方根误差(RMSE)、均方绝对百分比误差(MAPE)和变异解释量(R2)分别为0.213、26.45%和0.422,夏季分别为0.234、30.49%和0.359,秋季分别为0.169、24.02%和0.445,冬季分别为0.154、34.14%和0.419,表明多元线性回归模型的拟合效果在浙江省春、秋两季显著优于夏、冬两季.