周智敏 孙丹 喻琴昆
摘 要:文章利用气象要素和PM2.5质量浓度数据,对四川省PM2.5的时空变化和定量模拟进行了研究。結果表明:西、北地区PM2.5污染最轻,污染呈改善趋势,四季变化不明显;东、南地区污染较重,四季变化明显,其中成都、巴中空气质量改善较大,宜宾、内江和自贡空气质量改善不明显。同时,混合效应模型会显著提高气象要素与PM2.5之间的相关性,绵阳模拟效果最好,交叉验证后,R2为0.82,RMSE为7.32 μg/m3,PRE为13.39%;宜宾最差,三者分别为0.74、23.61 μg/m3和34.54%;八地市平均为0.78、16.31 μg/m3和26.68%。
关键词:四川省;时空演化;定量模拟;混合效应模型;十折交叉验证
中图分类号:X513;TP391.9 文献标识码:A 文章编号:2096-4706(2021)19-0111-06
The Spatiotemporal Evolution Characteristics and Quantitative Simulation of PM2.5 in Sichuan Province
ZHOU Zhimin1, SUN Dan1, YU Qinkun2
(1.ABA Teachers University, Aba 623002, China; 2.Zigong Meteorological Office, Zigong 610072, China)
Abstract: This paper studies the spatiotemporal evolution and quantitative simulation of PM2.5 in Sichuan Province by using meteorological elements and PM2.5 mass concentration data. The results show: PM2.5 pollution in Sichuans western and northern regions is the lightest and displays a trend of continual improvement, and the change in four seasons is not obvious; the eastern and southern regions are heavily polluted, with obvious changes in four seasons. Among them, the air quality in Chengdu and Bazhong has improved greatly, the air quality in Yibin, Neijiang and Zigong has not improved significantly. At the same time, the mixed effect model will significantly improve the correlation between meteorological elements and PM2.5, Mianyang has the best simulation effect. After the cross validation, R2 is 0.82, RMSE is 7.32 μg/m3 and PRE is 13.39%; Yibin is the worst, the three index are respectively 0.74, 23.61 μg/m3 and 34.54%; the average value of eight cities are 0.78, 16.31 μg/m3 and 26.68%.
Keywords: Sichuan Province; spatiotemporal evolution; quantitative simulation; mixed effect model; 10-fold cross-validation
0 引 言
近数十年,我国社会经济及城市化的飞速发展,导致了环境空气质量日益恶化,其中以津京冀、长三角、珠三角以及四川盆地最为突出[1,2]。诸多研究表明,细颗粒物(PM2.5)是大气污染问题的决定性影响因素之一,且城市大气污染俨然已发展成重大民生问题之一[3]。对此,2017年,国务院常务会议部署了对大气重污染研究项目,并由环保部(现生态环境部)结合科技部、中科院、气象、高校等部委和多单位协同攻关,设立了大气重污染成因与治理攻关项目,旨在解析津京冀地区“2+26”城市大气重污染成因以及治理管控技术[4],随着攻关项目的开展,现已扩大到覆盖四川盆地等全部四大重污染区域。
PM2.5浓度的时空变化是研究大气污染的基础,但针对区域污染,通常只能采用“以点代面”的方法进行研究[5]。对此,发展了诸多反演技术,如卫星遥感反演[6,7]、气象要素反演[8,9]、能见度反演[10]、自回归预测[11,12]、机器学习[13-15]等。
目前的反演统计学模型基本为确定性模型,通常选取与PM2.5密切相关的因子进行建模,如风、降水、温度、相对湿度等[16],该类模型的精度受制于因子的时空易变性难以提升。针对PM2.5模拟,Lee等[17]首次提出了混合效应模型,并取得了更优的拟合度。Zheng等[18]和Xie等[6]将其引进我国,模拟出与实测值更贴近的PM2.5浓度,但主要在北方运用,且通常基于AOD数据,部分地区难以业务化,本文将改用易获取的气象要素来反演,具有一定的实用价值。
1 资料与方法
1.1 资料获取
PM2.5浓度数据来源于四川省各国控站点2014年1月—2018年12月的逐日数据以及2019年1月—2019年4月的逐时数据;气象数据来自NCDC(美国国家气候数据中心),ftp://ftp.ncdc.noaa.gov/pub/data/noaa/isd-lite/,选取同时空范围内的站点数据。
经数据质控,将缺失6小时或连续4小时以上的天剔除,共得到485天数据,选取数据匹配度不低于70%的城市(即配对天数≥340天),包括成都、绵阳、乐山、宜宾、内江、泸州、达州和雅安8地市。
1.2 研究方法
1.2.1 混合效应模型介绍
混合效应模型是固定效应和随机效应的组合模型。固定效应认为各独立研究的结果基本相同,无显著性差异;随机效应则是频率派(所有样本均来源于一个无限的群体)结合贝叶斯模型(视固定系数为服从正态分布的随机变量)的体现,是经典线性模型的推广;部分学者认为混合效应模型实质上是经验贝叶斯或半贝叶斯模型。同时,随机效应可使模型的自由度(df)变小,这对于高维数据分析有着至关重要的作用。
1.2.2 混合效应方法
诸多研究结果显示,利用混合效应模型预测PM2.5浓度效果更优[6,17,18]。为探究研究区内PM2.5与其影响因子随时间的变化特性,本研究中采用混合效应模型来模拟四川各区市PM2.5的浓度分布。
在研究中,首先找到影响各地区PM2.5浓度的气象因子,建立PM2.5预报因子(Pre-forecast index, Pfi),因此,混合效应模型Pfi-PM2.5的具体表达式为:
(1)
式中,PM2.5ij表示第i个点位第j天的浓度;α、μj为固定截距、随机截距,β、vj为固定斜率、随机斜率,Pfiij为PM2.5预报因子集合Pfi的向量表征,Si为站点i的空间随机效应,εij为站点i在第j天的随机效应误差项,以及随机效应的方差—协方差矩阵。模型中固定效应部分不随时间、站点变化;随机效应μj、vj仅随时间变化,体现了Pfi-PM2.5随时间的变化关系;随机效应Si仅随站点变化,表征了Pfi-PM2.5关系的空间差异。
1.2.3 验证方法
十折交叉验证常常用评估预测模型的准确性,随机打乱数据排序,然后将其平分为10份,分别利用9份训练模型,一份做测试,重复10次,最后将10次结果求平均,视为该模型的准确度。
本研究用预测、实际值之间的相关系数R2、均方误差(RMSE)和相对预测误差(RPE)作为评估预测模型的准确度。其中,RMSE和RPE的表达式如下:
(2)
RPE=RMSE/mean(PMobs)×100% (3)
式中,obs代表实际观测,model代表模型预测,n为样本总量,mean(PMobs)表示实际PM2.5浓度的平均值。
2 结果与讨论
2.1 四川省PM2.5时间变化特征
图1给出了2014—2019年四川省PM2.5质量浓度的时间变化特征及空间分布情况。根据四川省各国控站点PM2.5数据,通过反距离权重插值方法,得到四川省PM2.5空间分布图。从整体空间分布上看,四川省西、北部地区的甘孜、阿坝以及凉山州等地区污染最轻,东、南部地区的污染明显偏重,这与四川省内工业发展密切相关。从年际演变上看:2013年污染最严重的地区为东南部泸州以及中部成都地区;2014年主要是巴中、成都及资阳地区;2015—2018年內江和自贡地区污染最重,与邓中慈等[19]研究结论一致;2019年根据1—4月的数据显示,污染较重的区域为宜宾、乐山、自贡以及达州等地区。其中,成都和巴中市空气质量改善最为明显,宜宾、内江和自贡等地区空气质量改善相对最差。
图2显示了四川省PM2.5浓度的四季分布图,整体上还是东部地区污染更严重。从图中可看出,大部分地区PM2.5四季存在明显变化,均是冬季污染最严重,其次是春季,夏季污染相对最小。从各地区来看,甘孜、阿坝、凉山以及攀枝花地区四季PM2.5浓度变化较小,其余地区变化均较大,特别是成都、内江、自贡、达州、泸州以及宜宾等地区。
2.2 模型拟合及交叉验证结果
利用混合效应模型对各站点进行空气质量模拟,并进行十折交叉验证,其中南充市数据匹配较好(配对天数381天),但由于空气质量站点与气象观测站点距离过大,导致各站点的模拟结果偏差均很大。
2.2.1 八地市结果偏差分析
表1中统计了各监测站点的随机偏差值,其中距离表示空气质量监测站距气象要素观测站的直线距离(km),样本表示PM2.5与Pfi预报因子配对天数,为方便各地市之间的横向对比,均只列出了各地市样本量排名前4的站点。经统计发现,大部分预报因子Pfi不是能见度的站点,也即意味着使用温度、风速等气象要素作为混合效应模型的预报因子,大多取得的效果低于能见度。
由表1还可看出,通常数据样本量越大,模拟值的偏差相对越小,而空气质量站点离气象观测站点越远,其偏差也相对较大;但也存在完全相反的情况,如达州凤凰小区站与市环境监测站,造成该结果的可能与数据质量有关。成都、绵阳、雅安等地区部分站点偏差出现明显负值,表明这些站点的PM2.5浓度会受到周围地区污染物传输的影响。这表明了站点的随机效应能一定程度上反馈在模型结果上,但当距离过远时,其结果误差会显著变大;同时还受制于数据的样本量。
2.2.2 混合模型与交叉验证结果分析
图3给出了成都市模型拟合的PM2.5浓度值与实测值之间的相关关系图,从中可发现,混合效应模型中相关系数R2为0.87,RMSE和PRE分别为10.62 μg/m3、14.26%;交叉验证后的R2降低到0.76,RMSE和PRE分别增高到17.74 μg/m3和26.5%,比确定性统计模型在成都地区的结果提高,表明气象要素的时间和空间变化确实能造成一定程度上的变异。经过交叉验证后,R2降低,RMSE和PRE比验证前有所增大,表明了混合模型确实存在一定的过拟合现象,而交叉验证能一定程度上降低过拟合。
表2给出了八地市,混合效应模型拟合与交叉验证的R2、RMSE和PRE。从表中可看出,各站点混合效应模型的R2介于0.77~0.91,拟合结果相关性最好的绵阳0.91,最差的是宜宾0.77,经过交叉验证后,R2介于0.74~0.82之间,拟合相关性最好和最差仍然是绵阳和宜宾。各地区混合效应拟合R2和交叉验证拟合R2的差距介于0.02~0.09之间,再次证明了混合效应模型存在一定的过拟合现象。从均方误差上看,各地区的RMSE介于5.95 μg/m3~ 16.88 μg/m3之间,平均为12.26 μg/m3;交叉验证后的RMSE介于7.32 μg/m3 ~ 23.61 μg/m3之间,平均为16.31 μg/m3。从相对预测误差上看,各地区的PRE介于10.89%~24.97%之间,平均为19.83%;经校验验证后PRE介于13.39%~34.54%,平均为26.68%。
3 讨 论
目前,存在多种要素反演地面PM2.5质量浓度的方法,其中较为全面的为卫星AOD反演,但AOD产品的下载以及后处理需要耗费大量时间,因此,利用观测站气象要素反演地面PM2.5质量浓度则是其中最为便捷的方法之一。
混合效应模型擅长建立处理时间序列,诸多研究也发现该模型对时间变化效应的校准大于空间变化效应,但也能在一定程度上反应出空间变化效应的影响。从本文构建的模型来看,考虑了监测站点的随机效应后,能一定程度上消除空间尺度差异所导致的预测误差。但不能完全消除空间差异,即成都、绵阳、雅安等地区多个站点的偏差均为负数。
本文利用的PM2.5监测数据均来自于城区的国控站点,分布密集,区域代表性不强,随着国家监测站点网络的逐步完善,可加入更多的省控、市控监测站点,以提高训练样本的区域代表性。
4 结 论
利用气象要素数据和国控站点PM2.5质量浓度数据,首先讨论了四川省地区PM2.5的时空变化规律,然后基于混合效应模型结合十折交叉验证,针对2018—2019年1—4月四川省八地市气象要素反演PM2.5质量浓度进行了建模。结果表明:
(1)从整体上看,四川省西、北部地区的甘孜、阿坝以及凉山州等地区PM2.5污染最轻,东、南部地区的污染明显偏重,这与四川省内工业发展密切相关。从年际演变上看,污染较轻的西、北部地区改善较大,污染较重的东、南部部分地区有改善,如成都和巴中市空气质量改善最为明显,宜宾、内江和自贡等地区空气质量改善相;从四季变化上看,PM2.5污染较重的东、南部地区,其浓度值四季存在明显变化,均是冬季污染最严重,其次是春季,夏季污染相对最小,甘孜、阿坝、凉山等西、北部地区,四季PM2.5浓度变化则很小。
(2)气象要素与PM2.5之间的直接相关性通常不高,在采用混合效应模型拟合的R2最低为0.77,最高为0.91,经过交叉验证后R2介于0.74~0.82,说明混合效应模型能较大程度上提高二者之间的相关性;模型均方误差RMSE平均为12.26 μg/m3;交叉验证后的RMSE平均为16.31 μg/m3。从相对预测误差上看,各地区的PRE平均为19.83%;经校验验证后PR平均为26.68%。即模型能较好地预测一定范围内的地面PM2.5质量浓度。
参考文献:
[1] 吴兑,吴晓京,李菲,等.1951—2005年中国大陆霾的时空变化 [J].气象学报,2010,68(5):680-688.
[2] 吴丹,于亚鑫,夏俊荣,等.我国灰霾污染的研究综述 [J].环境科学与技术,2014,37(S2):295-304.
[3] 张小曳,孙俊英,王亚强,等.我国雾-霾成因及其治理的思考 [J].科学通报,2013,58(13):1178-1187.
[4] 杨婷,王自发,何立涛,等.衡水市大气污染成因研究及治理经验 [J].环境科学研究,2019,32(10):1730-1738.
[5] 陶金花,张美根,陈良富,等.一种基于卫星遥感AOT估算近地面颗粒物的方法 [J].中国科学:地球科学,2013,43(1):143-154.
[6] XIE Y Y,WANG Y X,ZHANG K,et al. Daily Estimation of Ground-Level PM2.5 Concentrations over Beijing Using 3 km Resolution MODIS AOD [J].Environmental Science & Technology,2015:49(20):12280-12288.
[7] FANG X,ZOU B,LIU X P,et al. Satellite-based ground PM2.5 estimation using timely structure adaptive modeling [J].Remote Sensing of Environment,2016,186:152-163.
[8] 張晨雷,陈报章,王瑾.WRF模式气象数据在遥感反演PM(2.5)中的应用研究 [J].地理空间信息,2018,16(2):45-47+11.
[9] 黄善斌.关于PM2.5与气象条件关系及其预报研究 [D].济南:齐鲁工业大学,2017.
[10] 崔蕾,倪长健,孙欢欢,等.能见度反演PM(2.5)质量浓度方法的对比分析 [J].生态与农村环境学报,2016,32(2):338-341.
[11] 李为东,李莉,徐岩.基于时间序列分析的北京地区PM2.5浓度研究 [J].运筹学学报,2018,22(2):115-126.
[12] 宋国君,国潇丹,杨啸,等.沈阳市PM(2.5)浓度ARIMA-SVM组合预测研究 [J].中国环境科学,2018,38(11):4031-4039.
[13] SUN Q,ZHU Y M,CHEN X M,et al. A hybrid deep learning model with multi-source data for PM2.5 concentration forecast [J].Air Quality Atmosphere & Health,2021,14:503-513.
[14] 范竣翔,李琦,朱亚杰,等.基于RNN的空气污染时空预报模型研究 [J].测绘科学,2017,42(7):76-83+120.
[15] FENG R. Investigating wintertime air pollution in Hangzhou,China [J].Air Quality,Atmosphere & Health,2020,13(3):321-328.
[16] 孙欢欢,倪长健,崔蕾,等.成都市大气颗粒物污染特征及与气象因子的关联性分析 [J].环境污染与防治,2016,38(5):55-60.
[17] LEE H J,LIU Y,COULL B A,et al. A novel calibration approach of MODIS AOD data to predict PM2.5 concentrations [J].Atmospheric Chemistry & Physics,2011,11(15):7991-2011.
[18] ZHENG Y Y,ZHANG Q,LIU Y,et al. Estimating ground-level PM2.5 concentrations over three megalopolises in China using satellite-derived aerosol optical depth measurements [J].Atmospheric environment,2016,124:232-242.
[19] 鄧中慈,康平,胡成媛,等.四川盆地PM(2.5)时空分布及影响因子研究 [J].环境污染与防治,2020,42(11):1334-1337.
作者简介:周智敏(1991—),女,汉族,广东梅州人,科员,硕士研究生,主要研究方向:大气环境污染;通讯作者:孙丹(1986—),女,汉族,重庆万州人,科长,硕士研究生,主要研究方向:机器图像与视觉、模式识别。