周 露,宋承运 ,王艳丽 ,孙时雨,2
(1.安徽理工大学 空间信息与测绘工程学院,安徽 淮南 232001;2.安徽理工大学 矿山采动灾害空天地协同监测与预警安徽普通高校重点实验室,安徽 淮南 232001)
地表温度是反映大气地表环境的重要参数,在许多研究领域被广泛应用,包括气候变化、农业干旱监测和城市热岛效应等,对地球-大气边界的物质循环和能量相互作用起着关键的推动作用。因此,精确获得区域地表温度和分析地表温度的时空变化特征具有重大意义[1]。
传统的地面气象站可以获取精确的点尺度地表温度,但由于站点受观测环境、成本等因素影响,分布大多较为分散,很难在大区域内获取面尺度上地表温度。另一方面,使用站点观测值验证网格值会有代表性误差[2]。随着遥感技术的快速发展,遥感卫星数据成为地表参数反演、干旱监测、生态环境保护以及农作物估产等领域的重要数据源。但是,不同区域的反演地表温度由于探测波段、大气环境和反演方法等因素的影响,精确度差异较大。单一卫星热红外传感器不能提供同时具有高空间分辨率和高时间分辨率的遥感热红外数据,从而造成了单源遥感地表温度数据在时间分辨率和空间分辨率上不可兼得的矛盾局面[3]。因此,地表温度反演与应用的重要内容之一是如何有效地将多源地表温度数据进行整合,提高地表温度数据的精确度以及该地区的适用性。多源数据的融合是组合单一遥感数据的重要途径,可以弥补单一地表温度数据信息不全面的缺点[4]。数据融合可以解决地表温度在时间和空间上的难题,将长时间序列、大范围的遥感地表温度数据与地面实际数据进行融合,获得的地表温度数据信息更加丰富,相对于融合前的单一地表温度数据更加具有真实性。数据融合不仅可以弥补单一数据的缺陷,也可以获得精度更高的地表温度数据。因此,多源地表温度数据的融合对研究地表温度具有重要意义[5]。
针对不同的传感器、数据类型和应用目的,目前已有70多种时空融合模型被提出。根据不同的原则,按照构造思路的侧重点,将时空融合模型分为5类:权重模型[6]、解混模型[7]、学习模型[8]、贝叶斯模型[9]和混合模型[10]。虽然时空融合的理论和技术得到了充分发展,但是仍有一些难点尚待解决。在地表温度层面上,也存在着不同于其他产品特性的研究门槛。首先是多源遥感数据的差异性:时空融合技术需要2个及以上的传感器数据,包括同质数据和异质数据。其次是遥感数据的空间连续性:用于融合的原始影像需要转换到同一坐标系下,并且要具备相同且完整的空间范围。然而对于大多数卫星数据来说,会受到由于云污染引起的数据缺失的极大限制。最后是地表温度的时间敏感性:像地表温度这种自然观测数据在时间上具有明显的周期性和波动性,所以对于过境时间不同且访问周期较长的卫星来说,无法避免的时间差异增加了数据融合的难度[11]。1998年,由Stoffeled发展了可以回避求取“真值”的数据质量评价方法——Triple-Collocation (TC),可以客观地估计3个并列数据集的随机误差,并可用于多源数据的融合,适用于区域及全球尺度[12]。随后,国内外学者利用该方法评价土壤水分、海洋风速以及叶面积指数等精度,进行了相关的数据融合研究。王树果等[13]基于TC方法,在那曲地区的2种不同的空间尺度上对3种相互独立的土壤水分产品进行融合,结果表明,经过TC方法融合后的土壤水分产品拥有更丰富、更精确的数据。李昶明等[14]分析了2013—2015年中国地区多源降水产品适用性,结果显示,南方地区TC方法相对偏差为4.5%,青藏高原地区TC方法均方根误差(RMSE)为0.61,利用TC方法估计降水结果在中国区域值得信任。由上述关于TC方法的研究可知,国内学者关注土壤水分[15]、降水以及积雪的融合分析,而针对地表温度的融合分析较少,运用TC方法融合多源地表温度数据具有重要研究价值。
鉴于以上分析,利用FY-3C/VIRR 地表温度产品、MODIS 地表温度产品和地面观测资料,以TC融合方法为基础,以淮河流域为研究区域,研究多源地表温度数据融合方法。首先,利用地面气象观测站数据,采用IDW空间插值方法,获得2018年淮河流域地表温度;然后,由FY-3C/VIRR 地表温度、MODIS 地表温度遥感产品,结合由地面观测数据IDW空间插值区域地面温度数据,以TC方法为基础,通过最小二乘法,进行多源地表温度数据匹配,模拟得出淮河流域地表温度的“真实值”,并利用地面验证站点对结果验证分析,进一步分析淮河流域地表温度区域时空分布特征。
本文的研究区域是介于长江、黄河两大流域之间的淮河流域,111°55′E~121°20′E,30°55′N~36°20′N,地处中国中部河南和华东苏皖地区。淮河流域地跨湖北、安徽、河南、江苏和山东五省,经南阳、信阳、阜阳、六安、蚌埠、阜宁和滨海注入黄海,发源于河南省南阳市桐柏县槐淮源镇,流域包括豫、皖、鲁、苏和鄂五省,长约1 000 km,流域面积约27万km2,属暖温带半湿润季风气候区,冬季干旱少雨,夏季闷热少雨。淮河流域地形以山区、平原和丘陵为主,是我国重要的农业区,农作物以小麦、水稻和油菜为主,工业以轻工业为主,包括纺织业、农副产品等。
1.2.1 MODIS数据
MODIS是一种中分辨率成像光谱仪,分别搭载在Terra和Aqua这2颗卫星上,具有36个光谱波段。其中,热红外波段有16个,可以提供每天2次的观测数据,具有光谱范围广、更新频率高等特点。
MODIS地表温度产品是利用广义的分裂窗算法反演得到的,分裂窗算法主要针对NOAA-AVHRRR的2个相邻的热红外通道4和5的数据进行推导反演,而MODIS的第31、32波段也是2个相邻的热红外波段[16]。MODIS 地表温度的时间分辨率为1 d、空间分辨率均为1 km,可以提供白天和夜间2次地表温度数据。由于日尺度地表温度产品受云覆盖等影响,导致数据缺失严重,而8 d的地表温度数据则是根据日尺度像素合成的平均值,数据缺失较少,研究中选取AQUA/MODIS MYD11A2 8 d地表温度产品。研究时间为2018年的1月、4月、7月、10月,共13景影像。
1.2.2 FY-3数据
风云三号(FY-3)气象卫星是以中期数值天气预报、全球变化研究、自然灾害及地表生态环境监测、军事气象等为服务对象的我国第二代极轨气象卫星。其中,FY-3C于2013年9月23日由“长征四号丙”运载火箭在太原卫星发射中心发射升空,卫星上载有12台遥感仪器,地表温度监测与反演使用可见光外扫描辐射计(VIRR)。FY-3C/VIRR 地表温度由第4、5通道,采用基于地表覆盖类型获取地表比辐射率的BeckerandLi算法反演得到[17]。FY-3C/VIRR 地表温度空间分辨率也是1 km,提供每日白天和夜间2次地表温度数据。 为保持数据的统一性,选用2018年1月、4月、7月、10月FY-3C/VIRR每日地表温度数据,并通过选取无云时期地表温度数据平均值的方法,获得8 d地表温度数据。
1.2.3 气象站数据
气象站数据采用的是由国家气象信息中心-中国气象数据网提供的包含1951年1月以来我国699个基准、基本气象站,包括气压、降水量和0 cm地表温度等要素的“中国地面气候资料日值资料集(V3.0)”资料,数据的质量和完整性都有所保障。
研究中选用了淮河流域内39个气象观测站的0 cm日地温数据,并将气象站点分为融合站点与验证站点,其中融合站点共20个,用于地表温度数据的融合;验证站点共19个,用于融合结果的验证,2类站点空间分布相对均匀,具体验证站点与融合站点如表1所示。融合站点的地表温度数据通过取均值的方法合成得到8 d的地表温度数据,并采用IDW插值法[18],得到了空间连续的地表温度数据。
表1 淮河流域验证与融合气象站点信息
TC方法称为三重融合,可用于3套独立的数据相互验证,估计反射率、植被指数、土壤水分和地表温度等产品[19]。在做产品验证时会发现,不同数据集中在同一地球物理变量,如果为了估算其他数据集的误差而任意选择某个数据集作为验证值是不准确的,会因为各种因素造成一定的误差,所谓的“ 真值”是不能确定的,这时候可以选择TC法来解决。TC法的实现需要3种数据的相互独立集合。一般认为每个独立数据集的样本数是大于100的,以避免误差估计过程中出现的数值问题[20]。
假设基于气象站点的融合地表温度、MODIS 地表温度、FY-3C/VIRR地表温度这3种相互独立的地表温度与假设的地表温度真值之间存在下列线性关系:
(1)
式中:Ta、Tb、Tc分别表示融合地表温度、MODIS地表温度和FY-3C/VIRR地表温度,Tt表示地表温度的真值,aa、ab、ac分别表示3个地表温度数据集相对于真值Tt的加偏差系数,βa、βb、βc分别表示3个地表温度数据集相对于真值Tt的乘偏差系数,γa、γb、γc分别表示3个地表温度数据集相对于真值Tt的均值为0的误差[21]。
为了消除真值,可以在方程两边同时除以βa、βc,得到:
(2)
令上面3组等式两两相乘并取均值,可以得到每种地表温度数据的方差:
(3)
(4)
将(4)式两两相乘并取时间序列均值,计算出乘偏差系数βi(i=a、b、c),得到下列等式:
(5)
利用乘偏差系数可以得到加偏差系数ai(i=a、b、c),得到下列等式:
(6)
3种地表温度数据集的误差方差可以由计算得到的系数的式(5)和式(6)代入式(3)得到:
(7)
本文在结果分析上选用了决定系数(R2)、RMSE和平均绝对误差(MAE)这3种精度指标。
淮河流域验证站点与融合地表温度、MODIS地表温度和FY-3C/VIRR地表温度进行对比分析,图1为2018年1月、4月、7月、10月8 d合成不同地表温度数据与验证站点实测数据的R2(图1(a))、RMSE(图1(b))和MAE(图1(c))。由图1可知,3种地表温度与验证站点地表温度的R2中, 融合后的地表温度大部分影像R2高于其他2种地表温度数据,除了2018年7月20日,其余都在0.5以上,平均值为0.74,FY-3C/VIRR 地表温度的R2最低,平均值为0.60。融合后地表温度的RMSE最低,低于1.5 K,FY-3C/VIRR 地表温度 RMSE值最大,大于2 K。融合地表温度的MAE基本维持在1.0以下,低于MODIS与FY-3C/VIRR 地表温度,其中,FY-3C/VIRR 地表温度最大,平均值为5.7 K。
(a)R2柱状图
(b)RMSE柱状图
(c)MAE柱状图
不同地表温度与验证站点地表温度散点图如图2所示。可以看出,3种地表温度产品与地面验证点数据具有良好的相关性,R2均大于0.80,表明3种地表温度数据都可以有效地监测地表温度的季节变化,而融合后的地表温度 R2最高,相关性更高。经过TC融合后的地表温度与验证站点地表温度的R2达到了0.98,RMSE和MAE分别为1.10和0.88;MODIS 地表温度的R2为0.92,RMSE和MAE分别为2.59和2.18;FY-3C/VIRR 地表温度的R2为0.84,RMSE和MAE分别为6.68和5.35。TC 地表温度相对于其余2种地表温度的精度最高,其次是MODIS 地表温度,误差最大的是FY-3C/VIRR 地表温度。由于TC 地表温度是直接受融合的3种地表温度的影响,所以较低精度的FY-3C/VIRR 地表温度是影响TC 地表温度的精度的重要因素之一,通过提高参与融合的地表温度数据精度也可以在一定程度上提高融合结果。
(a)TC地表温度散点图
(c)FY-3C/VIRR地表温度散点图
以TC方法为基础,融合得到2018年淮河流域地表温度数据,将融合后的地表温度数据分别与FY-3C/VIRR 地表温度和MODIS 地表温度数据进行对比。以2018年7月21—28日融合后的地表温度为例,融合后的地表温度在研究区中西部及边缘区域温度较高,东部温度相对较低,与实际情况基本相符,淮河流域中西部区域位于陆地内部,而东部区域为沿海区域,温度略低于中西部。与FY-3C/VIRR 地表温度相比,在中部区域温度分布更为连续,而与MODIS 地表温度相比,与东部地表温度的温差可以更好地表现出来。总体来说,融合后的地表温度数据更能表现出淮河流域地表温度的分布与差异,且MODIS 地表温度与TC融合后的地表温度产品温度分布特点更为接近。
融合后得到淮河流域2018年1月、4月、7月、10月的平均地表温度,如表2所示。由表2可以看出,淮河流域2018年7月的地表温度最高, 7月的平均温度在304 K左右,地表温度的空间分布表现为中部区域温度较高, 而四周边缘区域温度较低。4月和10月次之,4月淮河流域的地表温度呈现南部地区高、中北部地区低的分布特点,10月呈现西南地区高、东北地区低的分布特点。1月的地表温度最低,平均温度为274 K,呈现东部和北部边缘高于中部及西部的分布特征,原因可能是东部边缘地区沿海,而冬季温度较低,所以沿海地区的地表温度要比内陆的地表温度要高。整体具有明显的季节性特征。
表2 2018年地表温度均值
从2018年淮河流域1—4月、4—7月、7—10月的温度变化看, 1—4月,淮河流域的东部地区以及中南部温度升高,最高可达到22 K;北部地区的温度升高较小,但最低也有9 K。4—7月由春季进入夏季,大部分地区都有明显的温度上升,最高可达到21 K,仅有南部及西部边缘地区温度变化最小。7— 10月的淮河流域整体的温度降低,中部、南部以及西部地区温度都有明显的降低,最高降低25 K,东北部地区温度降低比较小,有少部分边缘地区温度有所上升,但不超过2 K。由月份间温度变化可以看出,淮河流域的温度变化具有明显的季节性规律,东部沿海地区比内陆地区的温度变化幅度小,最主要的温度变化出现在淮河流域的中部、西部和南部地区。
本文采用TC法融合了MODIS 地表温度,FY-3C/VIRR 地表温度以及利用地面站点进行插值的地表温度这3种,得到了TC 地表温度,并对融合后的结果进行了精度评价,主要得到以下结论:
① 经过TC融合后的地表温度与实测地表温度的R2达到了0.98,RMSE和MAE分别为1.10和0.88,融合后的精度良好。3种地表温度产品在整体上的变化趋势基本一致,且与实测数据的R2均在0.80以上,经过TC融合后的地表温度精度明显提高。
② 经过TC融合后的淮河流域地表温度具有明显的季节变化规律,季节间的温度变化值大部分在20 K以上,相较于东部沿海地区,淮河流域的中部、南部以及西部温度变化要的更为明显。
③ 与MODIS数据地表温度数据相比,FY-3C/VIRR 地表温度的精度较低,大大影响了TC 地表温度的精度,若可以提高FY-3C/VIRR 地表温度的精度或者是用更高精度的数据代替,则TC 地表温度的精度也会随之提高。遥感数据受到云覆盖的影响容易出现无效值,所以通过研究方法生成高空间、高时间分辨率的遥感数据应当成为日后研究的重心。