董金芳,何慧娟,王 娟
(1.陕西省农业遥感与经济作物气象服务中心,西安 710016;2.陕西省气象局秦岭和黄土高原生态环境气象重点实验室,西安 710016)
随着经济水平的提高,工业生产和交通运输污染排放迅猛增长,大气污染物危害人体健康、损害植物、影响天气和气候,对人和生态环境造成非常恶劣的影响。大气气溶胶作为主要的大气污染物,是指悬浮在大气中的固体和液体微粒与大气本身共同形成的包含固态、液态和气态的多相体系[1]。大气气溶胶光学厚度(aerosol optical depth,AOD)是大气气溶胶最重要的光学特性之一, AOD的获取方式主要有两种,地基观测数据和遥感图像反演[2-4]。遥感图像反演方法由于数据获取简单、反演方法成熟、覆盖范围广、分辨率高等优点是AOD获取的重要方法,但遥感图像的反演和验证离不开地基数据的支持[5-7]。目前国际上应用最为广泛的气溶胶地基监测系统是美国NASA在全球布设的气溶胶自动观测网(aerosol robotic network,AERONET),AERONET在我国站点十分有限且分布不均匀,城市站点主要集中在北京和东南沿海地区,沙尘站点主要集中在甘肃、内蒙古和新疆区域,在中部地区少有分布[8]。为了对我国气溶胶光学特性进行长期、系统、全面、稳定的观测,中国气象局在全国范围内建立了气溶胶光学特性监测网(China aerosol robot sunphotometer network,CARSNET)。与AERONET选用的太阳光度计相同,均为法国CIMEL公司生产的CE318型窄波段太阳光度计,但CARSNET的关注度和利用率远不如AERONET,这主要是因为CE318的观测数据较为复杂,处理困难,需要进行周期性定标以维持气溶胶光学厚度计算结果的精确性和稳定性[9]。光度计定标方法主要有仪器定标法和Langley定标法[10],仪器定标的方法操作复杂,价格昂贵,且定标仪器本身同样存在误差[11];传统Langley定标法对环境要求苛刻,用以计算定标值的数据筛选困难,具有很大的不确定性[12]。 本文利用数理统计的方法,对数据进行质量控制、云检测,提取用以计算定标的数据,三倍标准差去除极端值,最终完成辐射定标,形成自动化处理、普适性、可操作性强的太阳光度计定标流程,为CARSNET数据推广和应用提供技术支撑。
选用西安市泾河站2019—2020年的太阳直辐射测量数据进行处理和研究,泾河站位于关中盆地,北靠黄土高原,南邻西安城区,由于地形和地理位置的原因污染水平较高,污染物种类复杂[13-14]。
泾河站配置的CE318太阳光度计共有8个观测通道,中心波长分别为1 020、936、870、670、500、440、380、340 nm,带宽均为10 nm,涵盖可见光至近红外波谱范围,其中936 nm中心波长处位于水汽吸收带,定标方法与其他波段不同,此处不做讨论。太阳光度计的数据文件为K7格式,利用CIMEL公司提供的ASTPWin软件将数据转换为逐日的ASCII码文件,数据内容不同,转换后数据文件后缀名不同,分别是:ALL(等高度角扫描向左扫描半圈的数据)、ALR(等高度角扫描向右扫描半圈的数据)、BLK(暗电流测量数据)、NSU(8个通道3次太阳直射辐射测量数据)、PP1(主平面扫描数据)和STA(仪器状态数据),本文的数据采用后缀名为NSU的太阳直接辐射数据进行处理,其中2019年共有349个日值观测数据,2020年由于仪器检修,9—11月有缺测,共有294个日值观测数据。
由于CE318太阳光度计采用自动跟踪扫描的方法进行观测,大量云污染的数据也被记录在内。目前云剔除的方案主要是应用Smirnovt A提出的“数据质量检验—三重观测稳定性检验—日稳定性检验—平滑检验—标准偏差检验”规则[15],但这种检验方法是基于气溶胶光学厚度数据的检验,在定标系数尚未确定的情况下无法有效应用。本文对Smirnovt A提出的方法进行改进,使其适用于定标值的计算。
CE318太阳光度计从大气质量数m=6时自动开始监测工作,下午大气质量数m=6时结束观测,观测时长随着日照时数的变化而变化,表现为冬季时间短,夏季时间长,内置的湿度传感器控制仪器在降水时停止工作[16]。CE318太阳光度计间隔3~10 min获取一次NSU观测数据,天气晴好的情况下每日获取的数据观测量在45条以上,多的时候达200余条。根据CE318的观测特性,对原始数据制定三条数据质量检验标准,分别是:①是否为仪器故障或数据传输错误等产生的异常值,数据表现为‘HErr’、‘----’、‘!!!!’,如发现以上三种数据,则将去除该时间点观测数据。②在CE318自动观测期间,无云的状态下,各波段的观测值量级为百,判断观测数值是否小于100,如果是,则去除该时间点观测数据。此处设置的阈值标准较低,仅能够去除较厚云层遮挡的观测数据。③在进行①、②处理后日观测数量是否少于15条,如果少于15条,则认定该日观测数据质量较差,不宜进行后续处理操作,该观测日数据检验不合格。经过数据质量三重标准检验之后,符合条件的数据集分布如表1所示。
表1 质量检验处理后数据分布统计
CE318太阳光度计每个时间点观测数据由三次测量值组成,间隔时间为30 s,三次观测1 min即可完成。在无云和大气状态稳定的情况下,对于所有波长,大气气溶胶光学厚度的变化在0.02以内[15]。这里采用统计的方法计算阈值,判定三次观测值是否稳定。计算经过数据质量检验后的2019、2020年每一组三重观测数据最大值和最小值的差值。为了避免极端值的影响,以频率分布为依据,将差值结果由小到大进行排序,以5%为间隔获取差值。在70%以下,差值变化较为平缓,如表2所示,因此将70%处差值结果设置为阈值,按照中心波长由长到短阈值分别为253、266、372、278、99、208、89。图1显示了2020年12月30日500 nm原始观测值曲线和处理前后均值曲线的变化。图1a显示原始数据在多个时间点上三次观测值有明显的差异,未经处理的三次观测均值曲线如图1b所示,在10:17—11:47和12:47左右有低谷,经过稳定性检验将异常值去除后得到的均值曲线较为平滑,如图1c所示。
表2 2019—2020年泾河站CE318太阳光度计观测的每组数据的偏差统计
图1 2020-12-30 CE318太阳光度计观测的500 nm处观测值及处理前后观测均值的变化曲线
根据Beer-Lambert定律阐述的物质对光的吸收程度和吸收介质厚度之间的关系,地面上测得的太阳单色辐射照度E可以由如下公式计算:
E=E0R-2Tgexp(-mτ)。
(1)
其中E0为太阳到地球的平均距离1 AU(即一个天文单位)上的大气外界太阳辐照度。R为观测时刻的日地距离,单位为AU,m为相对大气质量,在天顶角h≥20°时,可以用1/sinh来近似的估算,τ为大气垂直光学厚度,Tg为吸收气体透过率。
根据仪器输出电压转换得到的太阳光度计观测值V与仪器光学窗口入射的太阳单色辐照度E成正比,仪器定标常数V0表示太阳单色辐照度为E0时太阳光度计的观测值,将V、V0带入式(1),可以得到以观测值为参数的式(2),将式2两边取对数得到式(3)。
V=V0R-2Tgexp(-mτ) ,
(2)
LnV=LnV0-LnR2+LnTg-mτ。
(3)
在大气状态稳定的情况下,大气垂直气溶胶光学厚度τ保持不变,以相对大气质量m为自变量x,LnV+LnR2为因变量y,在没有气体吸收的通道Tg近似为1,x和y满足斜率为-τ、截距为LnV0的线性关系,如式(4)所示。
LnV+LnR2=-mτ+LnV0。
(4)
根据式(4)利用观测值V求解V0的过程即为Langley定标法。
泾河观测站距离紧邻西安市,大气消光稳定性受人为因素影响在一天内可能发生较大波动[16],因此对上、下午数据分别进行拟合。线性回归拟合系数是由最小二乘原理计算得到,回归系数容易受到离群值的影响而失去客观性和准确性,因此在线性回归分析中,在相关系数r2<0.99时,剔除线性拟合残差最大的点,为了防止过拟合,设定剔除离群数据量占原始数据量的比值<30%,并且剩余观测数据量>15个、相关系数r2>0.99、大气质量数变化范围mmax-mmin>3.5时才能用来计算定标值V0。为了防止气溶胶光学厚度随大气质量线性变化导致的定标失真,将拟合结果带入式(5)
τ=-(LnV0-LnV-LnR2)/m。
(5)
以大气质量m为自变量x,气溶胶光学厚度τ为因变量y进行线性拟合,若拟合斜率绝对值<0.02且相关系数r2<0.5,则认为大气质量与气溶胶光学厚度不存在线性变化关系[12],拟合结果可以用于下一步计算。
图2显示了2019年4月1日上午380 nm处观测数据在剔除离群值前后线性回归拟合的变化,经过处理后,离群值被剔除,重新线性拟合后相关系数由0.987提升到0.997,拟合系数也随之发生细微变化。
图2 2019-04-01上午 CE318太阳光度计380 nm处观测值剔除离群值前后线性拟合变化
在这一步中,对2.3中获得的回归方程在y轴上的截距LnV0进行筛选,在多次线性回归中得到的LnV0理论上符合正态分布。在正态分布中,平均值为ū,标准差为σ,测量值在ū±3σ范围内的概率为99.7%,超出这个范围的观测值视为极不可能值,将其排除。经过3σ检验后对LnV0进行统计,结果如表3所示,AOD均值随波长增加而增加。这是因为太阳光通过大气时,波长较短的紫、蓝、青色光容易被散射,而波长较长的红、橙、黄色光散射较弱,因此波长越短,大气的衰减作用越强[17],相应的AOD均值越大。
表3 泾河站CE318太阳光度计各个波段定标值
通过对泾河站CE318太阳光度计数据进行处理,提出了一套自动筛查检测的Langley定标方法,并进行了实际操作,得出了具体的定标值。主要结论如下。
(1)经过数据质量检验可以筛查掉由于仪器故障、传输故障等硬件故障以及较厚云层导致的无效数据。
(2)三重观测稳定性检验对云层引起的观测极端值去除有明显的效果,经过三重观测稳定性检验的结果更具有真实性。
(3)在利用Beer-Lambert进行定标的过程中,通过删除最大残差值得方法可以得到拟合度更优的线性方程,显著增加了符合定标条件的数据量,这对于气溶胶状态不稳定的区域尤为重要。
(4)对最后得到的定标值进行三倍标准差检验可以有效地去除极值,缩小测量值与真值的误差。