大气PM2.5遥感制图研究进展

2020-01-06 02:31:12沈焕锋李同文
测绘学报 2019年12期
关键词:时空反演站点

沈焕锋,李同文

1. 武汉大学资源与环境科学学院,湖北 武汉 430079; 2. 地球空间信息技术协同创新中心,湖北 武汉 430079

随着经济的快速发展,细颗粒物(fine particulate matter,PM2.5)污染已成为全球范围内的重大环境问题。2016年世界卫生组织发布的报告显示,全球92%的人口暴露于年均>10 μg/m3的大气PM2.5污染中[1],公众健康受到极大的威胁。因此,对大气PM2.5污染进行动态监测至关重要。地面站点监测是获取大气PM2.5污染状况最为直接的手段[2-3],然而,监测站点建设成本高昂、实施难度较大,空间分布相对较为稀疏,难以实现大范围空间连续监测。

遥感卫星能够提供大范围的观测数据,有效弥补了地面监测站点分布稀疏这一不足[4-5]。利用卫星遥感技术监测气溶胶的研究始于20世纪七、八十年代[6],而大气PM2.5遥感定量反演则是在近十几年取得了蓬勃的发展。初期,主要利用简单回归方法及大气模式对PM2.5遥感反演进行探究,文献[7]利用化学传输模型与卫星观测数据绘制了2001—2006年全球大气PM2.5平均浓度分布图,引发了国际社会的广泛关注;其后,随着地面监测网的发展,基于统计模型的反演方法发展十分迅速,由全局简单回归模型发展到顾及时空异质性的高级统计模型、由线性模型发展到非线性模型,并引入了气象条件、土地利用等诸多影响因素。目前,大气PM2.5遥感反演技术日趋成熟,在大气环境监测应用中发挥着重要的作用。

本文主要从大气PM2.5遥感反演与验证、大气PM2.5偏差校正与无缝制图两方面进行综述,并总结大气PM2.5遥感制图的前沿研究方向。

1 大气PM2.5遥感反演与验证

1.1 大气PM2.5遥感反演方法

基于卫星遥感的大气PM2.5反演研究通常采用卫星气溶胶光学厚度(aerosol optical depth,AOD)产品,其方法主要可归为以下4类(图1)。①模式比例因子法[7-10]。利用大气化学传输模型模拟AOD与大气PM2.5的比例因子,从而由遥感AOD数据估算地面大气PM2.5浓度。其优势在于不依赖地面站点大气PM2.5数据,直接由卫星观测值反演大气PM2.5浓度,然而,其模型结构与模拟过程十分复杂,并且污染物排放清单常常存在较大的不确定性,这往往导致大气PM2.5反演精度有限。②基于物理机理的半经验法[11-13]。基于物理机理,建立卫星AOD与地面大气PM2.5的物理关系方程,其优势在于具备严密的理论推导,然而参数的求解一般需要通过经验统计关系拟合。③统计模型与机器学习方法[14-19]。构建卫星AOD与站点大气PM2.5之间的定量关系,并将此关系扩展至面域大气PM2.5反演。该类方法易于实现,并且精度较高,是目前大气PM2.5遥感反演最为流行的手段。④混合模型。将上述方法混合使用,较为流行的方式是首先通过大气模式模拟[20-22]或其与遥感AOD结合[23](即第1类方法)得到初始大气PM2.5数据,其次将该初始大气PM2.5数据作为统计模型与机器学习的建模输入变量。

图1 大气PM2.5遥感反演方法示意Fig.1 Schematic of atmospheric PM2.5 remote sensing retrieval methods

在上述4类方法中,基于统计模型与机器学习的方法已经成为大气PM2.5遥感反演最为重要的技术途径,以下进行详细阐述:

(1) 简单回归模型。2003年,文献[19]首次定量探讨了卫星观测AOD与地面站点大气PM2.5的相关性,论证了卫星AOD用于地面大气PM2.5反演的可行性。在此基础上,AOD-PM2.5关系容易受到气象因子、地形条件等诸多因素影响,多元线性回归模型由此引入到大气PM2.5遥感反演中[18]。值得注意的是,利用多元线性回归构建站点观测大气PM2.5及周边地理要素变量间的关系,即为土地利用回归建模[24]。其次,通过分析大气PM2.5与影响变量之间的数值分布规律,引入数值先验(如指数函数关系),文献[25]发展了半经验统计模型,其一般转换为多元线性回归模型进行求解。此3类简单回归模型的结构分别如式(1)—(3)所示

PM2.5=β0+βAOD·AOD

(1)

PM2.5=β0+βAOD·AOD+βX·X

(2)

PM2.5=eβ0·AODβAOD·eβX·X

(3)

式中,X指代其他辅助输入变量;β0、βAOD与βX为模型回归系数。

(2) 广义可加模型。广义可加模型(generalized additive model,GAM)是简单线性模型的扩展,表现在引入了非线性函数[26],从而能够描述AOD-PM2.5关系的非线性特征。模型结构如式(4)所示

PM2.5=βo+SAOD(AOD)+SX(X)

(4)

式中,SAOD()与SX()表示AOD及其他辅助变量的非线性函数。

例如,文献[27]利用GAM模型,结合卫星AOD、气象、土地利用等辅助数据,对地面大气PM2.5浓度估算进行建模。该方法对预测变量间的交互作用顾及不足,仅能通过手动添加交互项进行弥补。

(3) 线性混合效应模型。上述回归模型一般建立大气PM2.5浓度与影响因素间的全局关系,并没有考虑AOD-PM2.5关系的时空异质性。线性混合效应(linear mixed effects,LME)模型[16,28-30]通常在时间维度上添加随机效应,用以考虑AOD-PM2.5关系的时间异质性,如式(5)所示

PM2.5=(β0+β0,t)+(βAOD+βAOD,t)·AOD+

βX·X

(5)

式中,β0与βAOD为不随时间而变的模型固定效应系数,而β0,t与βAOD,t则为模型随机效应系数,随时间而改变,反映AOD-PM2.5关系的时间变异性。

需要注意的是,LME模型在时间维度上能够反映AOD-PM2.5关系的变异性,而在空间维度上是全局的,即:没有考虑空间异质性。有学者尝试在LME建模时添加空间随机效应,但在空间制图过程中,对空间随机效应进行了舍弃处理[31]。该模型基于线性假设,无法反映AOD与大气PM2.5间的非线性关系。

(4) (时空)地理加权回归。考虑到AOD-PM2.5关系的时空异质性,单时间(如天、小时)地理加权回归模型(geographically weighted regression,GWR)[32-34]利用局部回归技术,构建基于卫星观测AOD的大气PM2.5局部估算模型,其结构为公式(6),该模型建立的AOD-PM2.5关系是空间位置的函数。

PM2.5,s=β0(μs,vs)+βAOD(μs,vs)·AODs+

βX(μs,vs)·Xs

(6)

式中,(μs,vs)表示空间位置s处的坐标,即:模型系数随空间位置而改变。

然而,此模型仅利用单个时间数据进行建模,没有考虑时间上的依赖性,难以处理单个时间AOD-PM2.5匹配样本较少的情况。此外,进一步引入时间依赖性,时空地理加权回归模型(geographically and temporally weighted regression,GTWR)[35-36]能够更为有效地应对大气PM2.5卫星反演问题。其建模思路与GWR模型类似,主要改进在于引入时间依赖性,即在式(6)的求解过程中加入时间维度信息,进一步提高模型的稳定性。尽管此类模型考虑了时空异质性,但其是基于线性假设的,对AOD-PM2.5关系非线性特征的刻画仍然存在局限。

(5) 机器学习模型。鉴于卫星AOD与站点大气PM2.5间具有很强的非线性关系,AOD-PM2.5关系的机器学习建模是近年来的研究热点。不同于传统统计模型,机器学习是数据驱动的,其优势在于强大的非线性刻画能力。其中,神经网络被率先应用于大气PM2.5遥感反演[17,37],其模型性能相比传统统计模型取得了较大的提高。此外,随机森林[38-39]、支持向量机[40]、梯度提升学习[41]、深度学习[42-44]等模型也逐渐得到了学者们的青睐,如文献[44]利用卷积神经网络(convolutional neural network,CNN)估算美国区域的大气PM2.5浓度,模型结构如图2所示。同时,多种机器学习模型集成(ensemble learning)方法[45-47]在大气PM2.5卫星估算研究中也得到了较为深入的应用。然而,基于机器学习的大气PM2.5遥感反演方法仍然存在以下局限:①机器学习模型一般仅仅拟合大气PM2.5与影响因素之间的数值对应关系,对大气PM2.5本身的地理和物理特征考虑不足;②机器学习模型的可解释性不强,无法理清大气PM2.5反演的内在机制;③机器学习模型的训练需要大量样本,在地面观测样本不足情况下的建模能力有待提升。针对第一点,文献[43]在深度置信网络(deep belief network,DBN)中引入了大气PM2.5的时空自相关性,从而发展了地理智能深度学习方法(Geoi-DBN),模型结构如图3所示;同时,顾及PM2.5与影响因子间关系的时空异质性,文献[48]发展了地理加权extreme learning machine(ELM)模型,有效提升模型的整体稳健性。

图2 基于CNN模型估算大气PM2.5浓度示意[44]Fig.2 Structure of CNN model for the estimation of atmospheric PM2.5[44]

图3 Geoi-DBN模型结构[43]Fig.3 Structure of Geoi-DBN model[43]

模型优势缺陷简单回归模型结构简单过于简单,无法刻画复杂关系广义可加模型线性模型的非线性扩展对预测变量间的交互作用顾及不足线性混合效益模型可反映AOD-PM2.5关系时间异质性基于线性假设,无法描述AOD-PM2.5关系的非线性特征(时空)地理加权回归考虑了AOD-PM2.5关系的时空异质性基于线性假设,无法描述AOD-PM2.5关系的非线性特征机器学习模型具备强大的非线性刻画能力对物理、地理特性顾及不足

总结上述模型,其优势与缺陷归纳如表1所示。总而言之,早期简单回归模型由于结构过于简单,目前应用较少。较为流行的是GWR/GTWR、LME和机器学习模型,尤其是机器学习模型,近年来取得了快速的发展。其中,对于GWR和GTWR模型,在不考虑计算量和调参难度的情况下,应优先选择GTWR模型。同时,与LME模型相比,GTWR模型进一步考虑了空间异质性,往往能够取得更好的反演效果[36,49];当研究区域较小时(空间异质性不强),LME模型或许能够表现出一定优势,并且其计算效率比GTWR高。其次,机器学习模型具备强大的非线性拟合能力,但对地理相关性与时空异质性的考虑尚显不足,能够两者兼顾的机器学习模型[43,48]是新的发展趋势。

此外,目前大气PM2.5遥感反演方法通常都采用AOD产品,而AOD产品一般是利用大气辐射传输模型由卫星反射率反演得到的[50-51]。那么,能否直接由卫星反射率反演地面大气PM2.5浓度是一个非常值得探讨的问题。文献[52]基于深度置信网络模型,利用MODIS红、蓝、2.1 μm通道表观反射率与观测角度反演地面大气PM2.5浓度;同样地,文献[53]基于随机森林模型,利用AHI传感器红、蓝、2.3 μm通道表观反射率及相应观测角度进行大气PM2.5估算建模。此类研究利用机器学习模型挖掘卫星反射率与大气PM2.5之间蕴含的潜在关系,避免了AOD反演过程,为大气PM2.5遥感制图提供了新的视角。

1.2 大气PM2.5遥感反演验证方法

基于站点观测对遥感估算结果进行精度验证是通用的方法,因此,交叉验证[54]常被用于基于统计模型与机器学习的大气PM2.5遥感反演模型的精度验证。当前最为流行的两种方式是留一交叉验证和十折交叉验证,前者将样本(站点、区域或时间)逐一用于模型验证,而后者将样本(站点、区域或时间)随机平均分成十份,其中一份用于模型验证,重复以上过程,直至所有样本(站点、区域或时间)都已用于验证。大气PM2.5遥感反演的验证方法主要可归为5类,其方法特点、适用条件和局限性见表2。

表2 大气PM2.5遥感反演验证方法汇总

总的说来,基于样本验证方法适用于反映模型的整体预测能力,基于站点验证和基于区域验证方法适用于空间预测能力的评估,基于时间验证和历史验证方法则适用于评价模型的时间预测能力。对于大气PM2.5遥感制图而言,最适合的为基于站点的验证方法,因为其与遥感估算的空间扩展目的契合得较好。

以全国为研究案例,选择常用的大气PM2.5遥感反演方法并重点关注其空间预测能力,验证结果见表3(表中评价指标R2为决定系数,无单位;RMSE是均方根误差,单位为μg/m3)。对于反距离插值、LME和GWR模型而言,基于样本验证的结果与基于站点验证结果相差不大,表明这些模型的总体预测能力与空间预测能力相似。而对于GTWR和Geoi-DBN模型来说,基于站点验证的性能比基于样本验证的性能有较大下降,原因是这两个模型均利用了站点历史数据进行建模。值得注意的是,对于基于样本、基于站点的验证,反距离空间插值比LME、GWR、GTWR等常用的遥感反演方法取得了更好的结果。究其原因,地面监测站点的空间分布常常是不均匀的,一般集中在城市中心区域,导致站点之间的距离非常近;在验证过程中,验证站点离建模站点很近。此外,相比于基于样本、基于站点的验证结果,各模型基于区域(省份)验证的结果均有显著的下降,一定程度上表明,由于站点分布不均匀,基于样本验证、基于站点验证方法容易高估大气PM2.5遥感估算的精度。因此,如何在大气PM2.5遥感反演模型验证过程中考虑站点的不均匀分布,仍需进一步深入研究。

表3 基于不同验证方法的常用反演模型性能对比

2 大气PM2.5偏差校正与无缝制图

2.1 卫星反演大气PM2.5合成产品偏差校正

卫星反演大气PM2.5数据的时相合成(如月均、季均或年均)对污染宏观监控具有重要意义,然而,由于卫星数据的缺失,时相合成一般仅利用能够获取的数据进行平均,这给PM2.5合成数据产品带来了系统偏差,其校正方法主要包括以下两种:

(1) 比例因子校正法[49,60]。以站点观测大气PM2.5均值为真值(无采样偏差),计算其与用于建模的站点大气PM2.5观测均值(与卫星观测对应,含有采样偏差)之间的比例因子,并进行空间插值,从而对卫星反演大气PM2.5合成产品偏差进行校正,可表示为

(7)

式中,AvgGPM2.5,all为站点观测大气PM2.5均值;AvgGPM2.5,model为用于建模的站点大气PM2.5均值;AvgSPM2.5,model表示卫星反演大气PM2.5均值;CSPM2.5表示校正后的卫星反演大气PM2.5均值。此方法应用较为广泛,但其局限性在于空间插值的不确定性较大。借鉴比例因子校正法的思想,有学者利用大气模型模拟PM2.5对卫星反演大气PM2.5合成产品偏差进行校正。文献[10]计算时间连续大气PM2.5模型模拟均值与卫星有效观测时间的大气PM2.5模型模拟均值之间的比例关系,并对相对误差进行分析,表明中国北方易出现低估现象而南方相反。

(2) 时空信息融合方法[37]。将站点观测进行空间插值,得到大气PM2.5时空无缝浓度初始场;假设不同时相间站点插值结果的差异与卫星反演大气PM2.5结果的差异相等,从而对缺失信息进行预测。模型可表示为

Li,p-Li,m=Fi,p-Fi,m+εi,m,p

(8)

式中,Li,p表示时间p空间位置i的站点插值,而Fi,p表示时间p空间位置i的卫星反演值,εi,m,p为随机误差。该方法的优势在于能够有效利用时空互补信息,其缺陷为地面站点插值的精度有限。图4所示为卫星反演年均大气PM2.5数据示例图,由于数据的缺失,卫星反演大气PM2.5直接合成结果与站点插值数据的空间分布趋势存在较大差异,最明显的表现为华南区域浓度值偏高(与文献[10]结论相符)。经过时空信息融合方法校正后,与站点插值结果在空间分布上基本保持一致。

然而,已有研究多针对星-地联合建模时段内的大气PM2.5制图,基于卫星遥感的大气PM2.5历史预测结果合成产品的偏差校正仍然是一个挑战。分析上述两种方法,前者可利用建模时段内计算得到的校正因子,扩展至历史预测数据的校正,其基本假设为各站点偏差校正因子随时间变化不大,这个假设本身具有较大的不确定性;而后者无法应用于历史数据的偏差校正。综上,对于大气PM2.5历史预测结果的偏差校正亟待突破,其可能的解决思路是联合多源卫星观测AOD或大气模型模拟AOD,尽量减少AOD数据的缺失,从而减少或消除历史预测结果合成产品的偏差。

图4 2014年年均大气PM2.5浓度示意[37]Fig.4 Distribution of annual mean atmospheric PM2.5 concentration in 2014[37]

2.2 卫星反演大气PM2.5缺失信息重建

受云覆盖、高亮地表等因素的影响,卫星AOD数据往往存在空间缝隙,从而导致基于AOD反演的大气PM2.5空间信息缺失问题。因此,对于卫星反演大气PM2.5缺失信息重建的研究主要可归纳为两个方面:一是AOD缺失信息重建,从而减少或消除大气PM2.5数据的空间缝隙(图5红色线);二是直接对卫星反演大气PM2.5进行无缝重建(图5绿色线)。

图5 卫星反演大气PM2.5重建示意Fig.5 Schematic of satellite retrieved atmospheric PM2.5 reconstruction

(1) 卫星AOD数据重建。对大气PM2.5遥感反演文献中AOD重建方法进行归纳,主要包括空间插值、多源AOD数据融合、大气PM2.5站点辅助建模、统计回归与机器学习方法等。其中空间插值方法[34]较早地应用于AOD数据的重建,适用于缺失区域较小的情况。考虑到多源数据的互补性,文献[10]融合多传感器AOD数据,文献[36]对相同传感器的不同算法AOD数据进行融合。对于大气PM2.5站点辅助建模法,文献[61]首先基于线性假设求解大气PM2.5站点处的AOD值,其次利用空间插值对AOD进行缺失信息重建。统计回归与机器学习方法近年来逐渐流行,通过构建AOD与其他辅助变量的映射关系,对缺失区域进行预测。文献[55]利用多重填补法,建立AOD与模型模拟AOD、气象参量等的关系,实现AOD数据空间全覆盖;文献[62]构建AOD与云雪信息、气象参量等的随机森林模型,对AOD缺失区域进行重建。

(2) 卫星反演大气PM2.5数据重建。主要包括两类方法,即:空间平滑方法、星-地时空信息融合方法。其中,空间平滑方法构建卫星有效反演值与区域(或缓冲区)均值、空间位置的半参数回归方程,随后对缺失信息进行预测。该方法由KLOOG团队[63-66]提出,然而并未得到广泛应用,其缺陷在于仅仅利用了空间信息,适用于小面积缺失区域重建。对于星-地时空信息融合方法[67],以卫星反演结果为高分辨率数据,以站点插值结果为低分辨率数据,借鉴时空信息融合模型[68-70],对缺失信息进行重建。该类方法引入了其他时相的辅助数据,对大面积缺失区域的重建理论上更具优势。如图6所示,星-地时空信息融合模型能够对大气PM2.5缺失区域进行重建,生成小时级无缝大气PM2.5数据,对提升大气PM2.5卫星监测能力具有重要意义。

图6 2016年2月28日小时级大气PM2.5无缝重建示例,左边为反演数据,右边为重建数据[67]Fig.6 Example of hourly and gapless atmospheric PM2.5 concentration on Feb. 28, 2016. Left: satellite retrieved PM2.5; right: gapless PM2.5 data[67]

3 总结与展望

大气PM2.5遥感制图经过近十几年的蓬勃发展,取得了可喜的成绩,已经得到了较为广泛、深入的应用。本文主要从大气PM2.5遥感反演与验证、大气PM2.5无缝制图两方面进行了综述,需要说明的是,影响大气PM2.5遥感制图精度的因素很多,如卫星数据的时空分辨率、AOD产品自身的质量、输入变量的筛选等[71],然而,本文旨在梳理大气PM2.5遥感反演与制图的模型与方法,上述影响因素并非是本文的重点,有待于将来进一步梳理与总结。当前,大气PM2.5遥感制图仍是国内外的研究热点,其前沿方向主要包括:

(1) 时空大数据支持的大气PM2.5遥感制图。大气PM2.5的时空分布受到气象、地形、土地利用、人为活动等诸多因素的影响,这给大气PM2.5精确制图带来了挑战。时空大数据技术的发展为大气PM2.5遥感制图带来了新的机遇,基于时空大数据筛选对大气PM2.5精确制图具有重要贡献的变量,构成能够深入解释与表征大气PM2.5时空变化的样本集;引入深度学习技术,自动学习与大气PM2.5相关的本因特征,深度挖掘时空大数据中蕴含的复杂关系,提高大气PM2.5遥感制图的精度。

(2) 物理/地理约束的机器学习反演模型。基于机器学习的大气PM2.5遥感反演是近些年来国内外的研究热点,已经取得了长足的进展,然而,对大气PM2.5自身物理、地理特性的考虑尚显不足。当前机器学习模型在模拟大气PM2.5反演物理模型方面有少许尝试,但如何构建物理关系的正则化约束准则需要进一步研究。与此同时,地理相关性、时空异质性与机器学习结合的框架取得了一定的突破,然而,在时空自适应参数选择、优化求解等方面仍有待提升。

(3) 新型卫星与低成本地面监测网的融合。大气PM2.5遥感制图已取得了快速的发展,但在区域尺度精细监测应用中仍存在诸多限制。随着卫星遥感技术的发展,新型卫星(如中国的风云四号、高分五号,日本的Himawari-8/-9等)传感器设计更为先进,能够提供更高时间、空间、光谱分辨率的观测数据,对大气PM2.5高时空分辨率动态制图具有天然的优势。此外,地面低成本小传感器监测已成为大气PM2.5制图的研究热点之一[72-74],为精细尺度的星-地联合建模提供了加密观测数据。新型卫星、低成本小传感器监测网的引入,以及两者的融合,将是重要的发展趋势。

(4) 多传感器大气PM2.5三维立体监测。光学卫星一般仅能提供二维观测数据,无法在垂直方向上对大气PM2.5进行立体监测,从而限制了大气PM2.5三维分布与传输特性的研究。随着大气探测技术的发展,星载、机载、地基激光雷达能够获取垂直廓线信息,无人机搭载颗粒物传感器可实现垂直方向的监测[75-76],并与区域大气质量模型等手段相结合,探索点-线-面观测数据的跨尺度融合方法,从而构建大气PM2.5浓度三维时空连续场,是一个十分重要的新挑战。

(5) 多源数据融合的大气PM2.5组分制图。大气PM2.5组分信息对污染成因解析、人体健康分析等至关重要,其时空动态制图是一个重要的发展方向。化学传输模型可以模拟大气PM2.5组分信息,融合卫星观测、地理要素、模型模拟大气PM2.5组分信息、地面观测等多源数据,是当前大气PM2.5组分时空分布制图的常用方法[22,77],然而,地面成分观测网的建设仍不完善,如何克服对地面观测的依赖,实现大气PM2.5组分高精度制图亟待进一步的研究。

猜你喜欢
时空反演站点
反演对称变换在解决平面几何问题中的应用
中等数学(2022年5期)2022-08-29 06:07:38
跨越时空的相遇
镜中的时空穿梭
基于Web站点的SQL注入分析与防范
电子制作(2019年14期)2019-08-20 05:43:42
2017~2018年冬季西北地区某站点流感流行特征分析
玩一次时空大“穿越”
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
首届欧洲自行车共享站点协商会召开
中国自行车(2017年1期)2017-04-16 02:53:52
怕被人认出
故事会(2016年21期)2016-11-10 21:15:15