秦巴山区MODIS LST时序数据重建及特征分析

2016-05-25 00:37勇,韩玲,戚
地理与地理信息科学 2016年1期
关键词:时点海拔高程

韩 晓 勇,韩 玲,戚 鹏 程

(1.长安大学地质工程与测绘学院,陕西 西安 710054;2.南阳师范学院环境科学与旅游学院,河南 南阳 473061)

秦巴山区MODIS LST时序数据重建及特征分析

韩 晓 勇1,韩 玲1,戚 鹏 程2

(1.长安大学地质工程与测绘学院,陕西 西安 710054;2.南阳师范学院环境科学与旅游学院,河南 南阳 473061)

地表温度(LST)是大气—地表水热平衡的重要参数,但受云等大气状况影响,MODIS LST 时间序列产品存在大量缺失数据,限制了LST 数据使用。该文以陕南秦巴山区为研究区,从LST与高程、归一化植被指数(NDVI)、经度和纬度的相关性特征出发,首先,针对不同的相关性特征自适应确定重建因子;然后,设计了以时点重建模型为主算法、总重建模型为备用算法的LST时间序列重建流程;最后,对研究区的地温特征进行分析。结果表明,高程与LST呈较为稳定的负相关关系,NDVI随植被的物候期变化与LST的相关性呈周期性变化,纬度与LST白天时点以正相关为主,夜晚则呈负相关特征;白天重建数据的平均绝对误差(MAE)变化范围较大,夜晚的变化范围小且平均值较低;71.8%的白天重建数据和78.2%的夜晚重建数据的误差可控制在3℃以内;研究区内平均地温随着高程的升高而下降,海拔1~2 km区域的年均地温比海拔低于1km区域低2.0℃,海拔大于2 km区域的年均地温比海拔1~2 km区域低2.6℃。

MODIS;地表温度;相关性分析;数据重建;秦巴山区

0 引言

地表温度(LST)是衡量大气—地表水热平衡极其重要的参数,在气候变化、水文循环、生态环境等研究中具有重要意义[1]。传统的LST数据来源于气象站点观测,并利用地统计插值获得空间连续数据,我国中、西部地区气象站点的密度低,分布不均匀,地形状况复杂,地物类型多样,使得地统计插值方法很难达到最优效果[2]。随着遥感技术的不断发展,可以利用热红外遥感获取区域范围的LST数据[3]。其中MODIS传感器因为其优化的时空分辨率成为比较理想的数据源,在农业、生态环境以及全球变化等领域得到了广泛应用[4,5]。

目前,MODIS LST产品在天气晴朗条件下平均精度可达1 K[6],但由于传感器对地观测时,受云、气溶胶、观测角度和太阳光照角度等影响,产生部分观测值失真数据。MODIS LST标准产品已采用MODIS全球云掩膜产品进行失真像元的剔除,这又导致频繁出现无效像元,从而制约了监测应用效果。为消除数据缺失和数据质量不高对数据使用带来的影响,插补缺失观测值,优化时间序列数据为相关研究提供更完备的基础数据,国内外学者已开展对MODIS LST产品重建的研究。有学者从时间序列数据滤波处理的角度进行LST数据重建,如Julie等[7]使用HANTS变换对欧洲地区1982-1999年的LST数据进行去云重建,并对LST的年际变化特征进行分析;徐永明等[8]利用HANTS方法对长江三角洲地区2005年8天LST合成数据进行谐波拟合,得到重建的LST时间序列数据;苏红等[9]综合考虑LST年变化和日变化的周期性,利用谐波分析方法对河南省2011年的LST时间序列进行拟合。此外,有学者从LST与其他地理因子的相关性出发,通过建立回归模型实现LST数据重建。如柯灵红等[10]利用高程与温度的回归关系重建青藏高原MODIS 8 天LST产品,并用气象站0 cm LST进行验证;刘梅等[11]利用无云区像元NDVI与LST 的负相关关系,基于短期NDVI 稳定的特点,重建临近时段云区LST。

虽然对LST重建开展了大量研究,但由于LST在空间上差异较大,时间上变化较快,单从滤波处理的角度将LST数据分解成不同周期的谐波变量,会丢失LST的突变信息。若仅考虑高程或NDVI与LST的回归关系,又将LST的回归模型限制为单因子模型,难以保证长时间序列重建模型的稳健性。为此本文从长时间序列LST与高程、NDVI、经度和纬度4个因子的相关性出发,针对不同的相关性特征自适应确定回归因子和回归模型,以保证LST重建模型的稳健性,在此基础上对所选研究区的地温特征进行分析。

1 研究区域与数据预处理

1.1 研究区概况

本文选择陕西省内秦巴山区(31°43′~35°6′N,105°29′~111°0′E)为研究区,主要包括商洛、汉中和安康,此外由于西安、宝鸡南部也属于秦巴山区,故本文将两市也纳入研究区,土地总面积98 713 km2。秦岭是黄河、长江两大水系的分水岭和我国南北气候分界线,其北坡为暖温带气候,南坡为北亚热带气候,在陕西境内连绵约500 km,海拔多在1 000 m以上,主峰太白山海拔3 767 m。巴山是嘉陵江和汉江的分水岭,其北麓为北亚热带气候,南麓为中亚热带,海拔平均1 500~2 500 m。该区是陕西省最大最主要的林区,属于暖温带落叶阔叶林地带和北亚热带常绿落叶阔叶混交林地。秦岭与巴山之间,分布着汉中盆地、安康盆地、商丹盆地和洛南盆地,盆地内耕地集中,农业生产水平较高,是陕南重要的农业生产区和人口聚居区。此外研究区还包括了部分渭河平原和渭北旱塬丘陵沟壑区。

1.2 研究数据及预处理

MODIS地温数据: 从EOSDIS(http://reverb.echo.nasa.gov/)下载2005-2014年的MODIS LST 8天合成产品,每期数据包括白天/夜晚4个时点(1:30、10:30、13:30、22:30),该产品是8天内每日对应时点有效LST的算术平均,空间分辨率1 km,每年4个时点各46期数据。产品中还包括与每个像元对应的质量控制标记数据,使用MRT工具将每期HDF文件中的LST和LST质量控制数据分别进行拼接、裁剪,并统一转换到WGS84 UTM N49投影带,利用质量控制文件保留质量标记最优的LST像元值(标记值为0)。

MODIS植被指数数据:从EOSDIS获取研究区对应年度的MODIS植被指数产品,空间分辨率1 km,每16天一期数据,10年共230期数据,利用质量控制文件剔除质量差的像元。使用较常用的Savitzky-Golay(S-G)滤波方法对MODIS NDVI产品进行数据重建,S-G滤波能有效抑制噪声,并保证NDVI的变化趋势[12]。为了使植被指数数据与LST数据的时间尺度一致,将S-G滤波后的相邻两期NDVI数据的均值作为二者中间期的NDVI数据,使得NDVI的时间分辨率与LST数据一致。S-G滤波处理后首尾几期数据无法重建,故本文最终统一设置为每年37期数据。

DEM数据:本文从地理空间数据云网站(http://www.gscloud.cn/)下载了研究区的SRTM DEM数据,空间分辨率为90 m,利用双线性插值法将DEM降尺度至1 km空间分辨率。

气象数据:从中国气象数据网(http://data.cma.gov.cn/)下载了国际交换站气候资料日值数据集,使用数据集中西安站和汉中站的0 cm地温数据对MODIS LST数据重建效果进行评价。

Z-Score标准化:由于研究数据间的量纲不同,为了使数据间具有可比性,保证LST重建模型的稳定性,将LST、DEM、经度和纬度数据进行Z-Score标准化如下:

(1)

式中:x为原始数据,μ和σ分别为有效LST抽样数据均值与标准差。

由于2009年度NDVI数据质量整体较差,本文未对该年度进行LST重建。

2 研究方法

MODISLST数据进行重建的基本思想:由于LST在空间上差异大,时间上变化快,单从LST数据自身进行数据重建,难以保证数据精度。通过LST数据与其他地理因子的相关性分析,确定与当前时点LST数据相关性较强的因子,利用多元回归方法构建重建模型。换言之,利用相关性分析确定能够在某一时点反映LST数据特征的地理因子,进而建立多元回归的LST重建模型,具体流程如图1。

图1 LST数据重建流程

Fig.1 Flow chart of LST reconstruction

2.1 随机抽样

为避免样本值过度集中,根据研究区的地形特征,利用高程分段进行随机抽样,高程分段及各段抽样比例见表1,随机抽样后只保留有效LST样点数据。本文每次抽取660个样点数据进行LST重建模型构建,另按此抽取方案抽取500个样点的LST数据用于精度评价与控制。

表1 随机抽样点各高程分段比例

Table 1 Proportion of random sampling points in different elevation section

高程(km)<0.50.5~11~1.51.5~22~2.5>2.5比例(%)8304010102

2.2 重建模型

首先,将抽样点海拔、NDVI、经度和纬度 4个因子与LST进行相关性分析,将相关性显著的因子作为重建模型的构建因子。本文根据LST时序数据特点进行了总体相关性分析和时点相关性分析。总体相关性是将研究区内不同年度同期同时点全部LST样点数据进行LST与4个因子的相关性分析,该参数可从宏观上判断不同时间LST与各因子的相关性,计算公式如式(2)。时点相关性是将LST样点数据逐期同时点进行LST与4个因子的相关性分析。然后利用相关系数阈值判断条件(白天时点绝对值大于0.2、夜晚时点大于0.15)自适应确定重建模型的构建因子。

(2)

对时点相关性分析确定的重建因子,采用逐步线性回归的方法建立时点重建模型如式(3),然后利用式(4)计算得到真实LST数据。时点重建模型用于有效抽样数据占比大于25%,此时有效样点数量较多,可保证回归模型的可信度,是LST数据重建的主算法。对于研究区数据缺失面积过大(理论上大于75%的数据缺失),则使用对应时点总体相关性分析确定的构建因子,基于逐步线性回归的方法构建此时点的总重建模型以实现该类数据的重建,该方法是LST重建的备用算法。

(3)

LST=σLST*+μ

(4)

式中:αi为第i个影响因子的权重系数,xi为第i个影响因子,b为常数项,m为相关分析确定的影响因子数;μ和σ分别为有效LST抽样数据均值与标准差,研究区内取值范围分别为-12.2~32.9℃、1.8~5.52。

2.3 质量控制

本文引入MAE作为质量控制条件,根据苏红等[9]对LST数据修复精度,将MAE的阈值设置为3.0℃。利用重建LST与原始LST计算MAE,判断是否超过阈值,若小于阈值则此模型可用,否则重新抽样再次构建重建模型,并加入循环次数控制条件,本文设定为10,若10次循环均无法满足MAE的阈值,则此时点数据无法完成重建。

(5)

式中:LST与LST′分别为原始数据与重建数据,n为验证点数量。

2.4 地温数据特征分析

数据重建完成后,本文按照小于1km、1~2km、大于3km3个高程区间对研究区内LST特征进行分类研究。首先利用重建后的LST数据平均计算月平均地温,然后对月平均地温数据按年度求出年平均地温,并利用回归趋势线的方法对地温数据的年际变化率进行了计算,公式如下[13]:

(6)

式中:n为时间序列长度,本文取n=9;LSTYi为第i年年均地温值;θslope为趋势线年际变化率;θslope>0,说明研究区的LST在该时段内呈增加趋势;θsiope<0,表示呈减少趋势;θslope=0,则表示未发生变化。

3 结果分析

3.1LST与影响因子相关性

3.1.1 总相关性特征 总相关系数可反映LST与4种影响因子的总体规律,图2是研究区内4个时点按期序的LST与4种影响因子的相关系数折线图。白天两个时点(图2a、图2c)的相关系数时序变化较相似,夜晚两个时点(图2b、图2d)的变化也较为相似,白天与夜晚差异较大。从各个因子看,经度在4个时点与LST的相关系数表现为波动较小的正相关,但相关性较低,白天两个时点相关系数在0.2附近波动,晚上在0.15附近波动,为此本文将0.2和0.15分别设置为白天与夜晚相关系数的判断阈值,相关系数的绝对值大于该阈值的影响因子才可进入重建模型的回归分析。高程与LST的相关系数表现为较为稳定的负相关关系,白天两个时点的相关系数均值为-0.43,夜晚两个时点的均值为-0.39,说明高程在白天和夜晚对LST的影响较稳定,夜晚两个时点1-5期的相关性较低,基本在-0.2左右,在9-34期内高程是与LST的相关性最高的因子,此时段高程对LST的影响最大。NDVI与LST的相关系数变化较大,白天两个时点在1-10期(2月-4月中旬)与LST的相关性不显著,此时段植被从休眠期到萌芽期,11-37期NDVI与LST表现为显著的负相关特征,其中11-22期(4月下旬到7月底)二者间的相关性大于高程与LST相关性,此时植被从快速生长过渡到稳定生长阶段, 23-33期(8月-10月中旬)NDVI与LST的相关系数变化较小,在-0.40附近波动,相关性略低于高程,此时植被处于稳定生长期,34-37期(10月下旬-11月)NDVI与LST的相关性急剧下降,此时段植被从衰落期过渡到休眠期;夜晚NDVI与LST的相关性整体较低,其中1-10期以正相关为主,除5-7期外均大于0.15,这应与此时段NDVI高值区主要分布在纬度较低的常绿林区有关,12-32期二者之间为负相关关系,其中15-27期的相关系数小于-0.15,33-37期又表现为正相关,夜晚的相关性变化也与植被的物候特征有关,但不如白天显著。纬度与LST的相关性在白天两个时点9-31期二者基本为正相关关系,其他期则表现为负相关,高值区主要集中在17-22期,该时段LST随纬度增加呈增加的特征,但在夜晚二者之间均为负相关,除18-25期(夏季)的相关系数大于-0.15外,其他期的相关系数均小于-0.15,这说明区内除夏季之外夜晚的LST纬向逆分布明显。

3.1.2 时点相关性特征 同总相关系数相比各影响因子与LST的时点相关系数时序变化随机性较强,这与地温短时间变化随机性强的特点一致,海拔与LST的相关系数为较稳定的负相关特征,白天时点NDVI与LST的相关系数也能反映植被不同生长阶段与LST的关系。利用时点相关系数最终确定参与重建模型的构建因子,表2中为最终各因子能参与重建模型构建的数量,其中高程占比达86%,其次为NDVI因子,且NDVI在白天时点的参与率比夜晚模型高,经度参与率最低,这说明了高程因子在LST数据重建中的重要性,但其他3个因子均拥有一定的参与度,因此LST重建时需综合考虑几个因子的影响。

图2 LST与影响因子总相关性(时点:a.10:30;b.22:30;c.13:30;d.1:30 )

Fig.2 Total-correlation of LST and impact factors(Time point:a.10:30;b.22:30;c.13:30;d.1:30)

表2 各因子参与重建模型的期数Table 2 Periods of each impact factor participating reconstruction model

3.2 LST数据重建质量

图3为利用有效样点对9年4个时点的LST数据重建前后逐期计算的MAE,图中黑点为平均的MAE,细线表示不同年份同期MAE的变化区间。白天LST修复数据的MAE(图3a、图3b)变化区间较大,其中2-16期的平均MAE均大于2℃,从17期开始逐渐降至2℃以下。夜晚两个时点的平均MAE(图3c、图3d)较低,基本分布在1.5~2℃,且MAE的变化区间较小。第30期数据9年共36景影像,仅有4景可用主算法重建,其他景均为备用算法实现,导致该期的MAE整体偏高,这与备用算法较主算法的精度低有关。从表3中可知,71.8%的白天重建数据和78.2%的夜晚重建数据的数据偏差可控制在3℃以内,总体上90%以上数据误差可控制在5℃以内,表明本文方法对原始影像中的缺失数据的重建是可行的。图4是研究区代表性的一景(2005年15期 13:30)LST影像重建前后对比,左图中的黑色区域为无值区,可见LST修复数据空间分布特征合理,并能抑制原始数据中噪声数据的影响。

表3 重建LST与原始LST数据偏差频率统计

Table 3 The frequency statistics of origin and reconstructed LST difference

时点<2[2,3)[3,5]>510:3051.119.819.29.913:3053.519.319.67.622:3058.018.615.38.11:3062.517.311.98.3

图3 LST重建数据平均MAE(时点:a.10:30;b.13:30;c.22:30;d.1:30)

Fig.3 Average MAE of reconstructed LST(Time point:a.10:30;b.13:30;c.22:30;d.1:30)

图4 原始影像( 左) 与重建影像( 右) 对比

Fig.4 Comparison of original(left)and reconstructed images(right)

利用研究区内的两个基本气象站点观测的日均LST数据对重建数据进行验证。先将气象站点日均LST重新计算为与重建LST数据时间对应的均值数据,重建的LST数据则按期计算4个时点的均值。图5为两者之间的绝对误差分布,重建数据与站点数据的绝对误差较小,其中西安站的最大误差为2.8℃,汉中站的最大误差为-2.3℃,重建数据与站点数据绝对误差在9-27期以低估为主,其他时段以高估为主,存在地温较高的时段以低估为主、地温较低的时段以高估为主的特点。

图5 重建地温与站点数据的绝对误差Fig.5 Absolute errors of reconstructed LST and the meteorological data

3.3 地温变化分析

图6左图为9年内不同高程的月均LST,月均LST年度周期性变化特征明显,随着高程的升高呈下降趋势;右图为年均LST,不同海拔的年均LST呈平行分布的特点,其中海拔1~2 km的区域年均LST比海拔小于1 km的区域平均低2.0℃,海拔大于2 km的区域年均LST比海拔1~2 km区域平均低2.6℃。利用回归趋势线的方法计算三者的年际LST变化率分别为:0.04、0.02和0.06,这表明不同海拔区域的年均LST均呈缓慢增长趋势,且海拔大于2 km的区域年均LST增长速率最快,海拔1~2 km的区域年均LST增长较慢。

4 结论与讨论

本文以秦巴山区为研究区域,在LST与影响因子相关性分析的基础上对9年的MODIS LST数据产品进行重建,实现了研究区LST数据的高质量重建。研究取得了如下结论:1)LST数据与各影响因子的相关性不尽相同,高程与LST呈较为稳定的负相关关系;NDVI则随植被的物候期变化与LST的相关性也呈周期性变化,白天两个时点尤为明显;纬度与LST的相关性白天与夜晚的差异较大,白天以正相关为主,而在夜晚全年呈负相关。2)白天LST重建数据的MAE变化区间较大,夜晚MAE的变化区间小且均值较低,基本分布在1.5~2℃,71.8%的白天重建数据和78.2%的夜晚重建数据的误差可控制在3℃以内,总体上90%的数据误差可控制在5℃以内。3)研究区内随着高程的升高平均LST呈下降趋势,海拔1~2 km的区域年均LST比海拔小于1 km的区域低2.0℃,海拔大于2 km的区域年均LST比海拔1~2 km的区域低2.6℃。不同海拔的年际LST变化率分别为:0.04、0.02和0.06,表明不同海拔区域的年均地温均呈缓慢增长趋势。

然而本文研究还存在如下问题需要改善:1)本文的精度评价以绝对误差为主,在LST较高的情况下比较合适,对于LST较低的时段虽绝对误差较低,但相对误差可能较高,今后的研究中考虑LST温度较低的情况下重建问题。2)本文的LST重建未考虑云阴影的影响,虽有学者开展了相关研究,认为将重建LST数据乘一系数转换为真实LST,该系数的合理确定仍需研究。3)本文仅引入了4个影响因子,探讨了空间分辨率较低的LST重建对于分辨率较高的遥感影像适用性问题。4)引入变量中仅包含一个NDVI时间变量,此因子是否削弱了LST的时间变化特征也需进一步研究。此外,本文中的算法是在秦巴山区建立、验证和应用的,若应用于与研究区地貌、气候差异较大的区域,则可能需要引入其他地理因子。

图6 不同高程月平均LST与年平均LST

Fig.6 Monthly mean and annual mean LST in different elevation section

[1] QIN Z H, KARNIELI A.A mono-window algorithm for retrieving land surface temperature from Landsat TM data and its application to the Israel-Egypt Border region[J].International Journal of Remote Sensing,2001,22(18):3719-3746.

[2] 田辉,马耀明,胡晓,等.使用MODIS 陆地产品LST 和NDVI监测中国中、西部干旱[J].高原气象,2007,26(5):1086-1095.

[3] 赵少华,邱国玉,秦其明,等. MODIS数据反演地表温度的应用研究[J].干旱区资源与环境,2010,24(3):51-54.

[4] PARIDA B R,OINAM B,PATEL N R,et al. Land surface temperature variation in relation to vegetation type using MODIS satellite data in Gujarat state of India[J].International Journal of Remote Sensing,2008,29(14):4219-4235.

[5] 于晓静,刘焕军,曲长祥,等. 基于MODIS数据的黑龙江省黑土带地温空间格局分析[J].水土保持研究,2012,19(2):66-70.

[6] WAN Z M. New refinements and validation of the MODIS land-surface temperature/emissivity products[J].Remote Sensing of Environment,2008,112(1): 59-74.

[7] JULIEN Y,SOBRINO J,VERHOEF W. Changes in land surface temperatures and NDVI values over Europe between 1982 and 1999[J].Remote Sensing of Environment,2006,103(1):43-55.

[8] 徐永明,覃志豪,沈燕. 长江三角洲地区地表温度年内变化规律与气候因子的关系分析[J].国土资源遥感,2010,83(1):60-64.

[9] 苏红,刘峻明,王春艳,等. 基于时间序列MODIS LST产品的重构研究[J].中国农业科技导报,2014,16(5):99-107.

[10] 柯灵红,王正兴,宋春桥,等. 青藏高原东北部MODIS LST 时间序列重建及与台站地温比较[J].地理科学进展,2011,30(7):819-826.

[11] 刘梅,覃志豪,涂丽丽,等. 利用NDVI 估算云覆盖地区的植被表面温度研究[J]. 遥感技术与应用,2011,26(5):689-697.

[12] 李杭燕,颉耀文,马明国.时序NDVI数据集重建方法评价与实例研究[J].遥感技术与应用, 2009,24(5):596-602.

[13] STOW D D S,HOPE A. Variability of the seasonally integrated normalized difference vegetation index across the north slope of Alaska in the 1990s[J].International Journal of Remote Sensing,2003,24(5): 1111-1117.

Reconstruction of MODIS LST Time Series and Features Analysis in Qinling-Bashan Mountain Area

HAN Xiao-yong1,HAN Ling1,QI Peng-cheng2

(1.School of Geology Engineering and Geomatics,Chang′an University,Xi′an 710054;2.Environmental Science and Tourism College,Nanyang Normal University,Nanyang 473061,China)

Land surface temperature(LST)is an important parameter for measuring the atmosphere-surface water and heat balance.However,the LST data of MODIS time series product is commonly restricted by data missing owing to the influence of atmospheric conditions such as cloud.Qinling-Bashan Mountain area,south Shaanxi Province,was taken as the study area in this research.Based on the correlations among LST,elevation,NDVI,longitudinal and latitude,the reconstruction factor was determined self-adaptively.Then,a reconstruction process for LST time series data was designed,where the time-point-reconstruction model was considered as the master algorithm and total-reconstruction model was set as the alternate algorithm.Finally,the features of surface temperature were analyzed.The results suggest that the LST is negatively related with the elevation,while the correlation between NDVI and LST varies periodically with the phenology of vegetation.The relationship between latitude and LST data in daytime is mainly positive correlation,whereas the relationship is negative in nighttime.The mean absolute error of the daytime reconstruction data varies wider than that of the nighttime reconstruction data.Moreover,the mean value of the nighttime reconstruction data is relatively low.71.8% of data error about the daytime reconstruction data and 78.2% of data error about the nighttime reconstruction data was controlled within 3℃.The average temperature decreases with the increase of altitude in the research area.The annual average temperature of the area whose altitude is between 1 km and 2 km is 2.0℃ less than the area below 1 km,and the area above 2 km is 2.6℃ less than the area between 1 km and 2 km.

MODIS;LST;correlation analysis;data reconstruction;Qinling-Bashan Mountain area

2015-08-02;

2015-09-25

国家自然科学基金项目“基于空间化模拟方法修复遥感地表温度图像的数据缺失”(41201099)

韩晓勇(1981-),男,博士研究生,主要从事遥感图像处理与特征提取。E-mail:nytchxy@163.com

10.3969/j.issn.1672-0504.2016.01.014

TP79

A

1672-0504(2016)01-0071-07

猜你喜欢
时点海拔高程
高海拔的甘南
8848.86m珠峰新高程
O2O模式下我国网约车企业收入确认的探析
南美三大高海拔球场
论“前后”的时间义
基于二次曲面函数的高程拟合研究
建造中船舶特定化属性分析
SDCORS高程代替等级水准测量的研究
回归支持向量机在区域高程异常拟合中的应用
高海拔地区电子设备散热分析