DEM的不确定性对温度插值精度的影响

2016-05-25 00:37华,刘佳,胡锋,戴
地理与地理信息科学 2016年2期
关键词:台站插值高程

赵 冠 华,刘 正 佳,胡 云 锋,戴 昭 鑫

(1.中国科学院地理科学与资源研究所,北京 100101;2.中国科学院大学,北京 100101;3.中国科学院数字地球与遥感应用研究所,北京 100101)

DEM的不确定性对温度插值精度的影响

赵 冠 华1,2,刘 正 佳3,胡 云 锋1*,戴 昭 鑫1,2

(1.中国科学院地理科学与资源研究所,北京 100101;2.中国科学院大学,北京 100101;3.中国科学院数字地球与遥感应用研究所,北京 100101)

以2001-2010年全国711个气象站点温度观测数据为数据源,在薄板样条插值方法和ANUSPLIN软件支持下,对比分析了使用GTOP30、SRTM3和ASTER GDEM 三种DEM数据作为协变量开展空间插值得到的温度成果数据精度。研究发现:1)GDEM的平均相对误差(MRE)、平均绝对误差(MAE)和均方根误差(RMSE)明显高于其他两套数据,数据质量最差;SRTM3和GTOP30的数据精度较高,各误差评估指标大致相同。2)在全国尺度上,在MAE方面,基于ASTER GDEM所得温度插值结果比其他两组DEM得到的温度插值结果高0.4℃左右;在RMSE方面,基于ASTER GDEM获得的温度比其他两组DEM得到的温度高0.5℃左右。基于ASTER GDEM所得温度插值数据的误差明显高于其他两套数据。3) 在温度插值误差的空间分布格局上,在我国中东部地区,三种DEM温度插值误差分布规律基本相同;在我国西南部地区,基于GTOP30和SRTM3的温度插值结果的数据精度明显好于基于ASTER GDEM的温度插值结果。4)温度插值误差与DEM高程误差呈现明显的耦合特性,这表明DEM数据的精度是影响温度插值结果的重要因素。

温度插值;精度;ANUSPLIN;DEM;统计分析

0 引言

在区域和全球尺度的生态机理模型(如CEVSA[1]、CLM[2]等)中,空间化温度数据均是重要的输入参数。研究人员已开发了大量空间插值方法,如:反距离加权法[3]、空间自协方差最佳插值方法[4]、薄板光滑样条法[5]、多元线性回归法[6]。在这些方法中,空间自协方差最佳插值方法和薄盘光滑样条函数法从原理上看较为适用;考虑到误差估计和计算的简便,插值时大多使用Hutchinson提出的薄板样条法[7,8]。应用薄盘光滑样条法对气候要素进行插值时,DEM数据中的经纬度和高程信息将被作为独立变量协助插值。研究表明,考虑DEM的影响可以有效降低空间插值误差[9-13]。

当前有许多免费DEM数据资源,如GMTED2010、SRTM3 DEM 、GTOP30、ASTER GDEM等。由于原始数据获取方式、DEM制作方法、特殊的地形地貌及土地覆盖等因素影响,这些DEM数据都存在不同的误差[14-20]。WANG等[21]指出,尽管不同DEM数据在表现大尺度地形空间格局时基本相同,但在提取其他DEM衍生指标时会有很大的差异;刘远等[22]以韩江流域为例,发现利用ASTER GDEM提取的河网精度低于SRTM3;高玉芳等[23]以西笤流域为研究区域,发现不同DEM数据源及分辨率会影响流域特征参数的提取。

目前已有大量关于DEM自身精度对其衍生指标精度的影响研究,但关于不同DEM数据对气候要素插值精度的影响研究却很少。鉴于此,本研究以澳大利亚国立大学研发的ANUSPLIN工具包为工具,以SRTM3、GDEM、GTOP30三种不同来源的DEM数据为协变量,对比分析不同温度插值结果在全国和区域尺度上的差异,并由此探讨DEM的不确定性对温度插值精度的影响。

1 数据来源与处理

1.1 气象数据和DEM数据

采用中国气象局长期日平均观测气象记录,时间为2001-2010年,共10年、711个站点。原始记录中记录有台站号、经纬度、日平均温度、最高温度、最低温度。在提取温度数据时,先剔除缺少记录天数过多台站,再把日温度数据转化为旬温度数据,最后将每年的三种温度数据单独保存为文本文件。数据书写格式遵循ANUSPLIN标准格式,包括气象台站号、经纬度坐标、高程值和旬温度值。

采用SRTM3、GTOP30和GDEM三种DEM数据,在ArcGIS支持下,对下载得到的分块DEM数据拼接,提取中国陆域DEM数据并转为Albers等积圆锥投影。然后用双线性插值法重采样[24]得到10 km分辨率数据。Albers等积圆锥投影参数为:双标纬线分别为北纬25°和北纬47°;中央经线为东经105°。

1.2 空间插值方法

采用澳大利亚国立大学开发的ANUSPLIN空间插值软件完成了基于DEM的中国多年平均气温数据的空间插值。ANUSPLIN是对多变量数据采用薄盘光滑样条方法进行插值的工具。薄板光滑样条插值方法可被看做标准多变量线性回归,只是参数模型由合适的光滑非参数函数所替代,拟合函数的光滑度会根据数据拟合表面的最小预测误差通过广义交叉(GCV)自动计算。关于ANUSPLIN的详细插值原理、模型和使用方法,可以参阅文献[25]。

1.3 误差分析方法

采用交叉验证方法对DEM、温度空间插值数据成果进行误差分析。首先将全部711个气象站随机分为两部分:508个站点作为插值站点,剩余203个作为验证站点[26,27]。针对验证站点,采用绝对误差(AE)、相对误差(RE)、平均绝对误差(MAE)、平均相对误差(MRE)和平均误差的平方根(RMSE)5个参数评估实际值与空间插值的差异。各误差分析参数的计算公式如下:

(1)

(2)

(3)

(4)

(5)

式中:计算单个站点误差时Voi为该站点第i年的实际观测值,Vei为估算值,N为总年数。在计算总体误差时,Voi为第i个站点观测值的平均值,Vei为估算值的平均值,N为参与验证总站点数;在计算高程误差时,Voi是测量得到的第i个站点的高程值,Vei是利用ArcGIS中的ExtractValuestoPoints工具提取该站点所在位置的DEM值。

2 结果分析

2.1 站点高程误差分析

表1分析表明:GDEM绝对高程的MAE为155.57m,比最小的GTOP30高75.09m,说明GDEM绝对高程误差波动较大;在MRE方面,GDEM为63.25%,明显高于GTOP30和SRTM3,表明GDME高程精度远远低于其他两种DEM数据;在RMSE方面,GDEM为293.56m,SRTM3和GTOP30相差不大,都在174m左右。总而言之,GDEM的绝对高程精度最低,SRTM3和GTOP的精度较高且差异不大,SRTM3略高于GTOP30。

表1 不同DEM产品的高程误差Table 1 The elevation error of different DEM datasets

图1为气象站点绝对高程的绝对误差AE和相对误差 RE的空间分布。在AE方面,高程误差大的站点主要集中在中国西南部;但在RE方面,高程误差大的站点主要集中在东部沿海一带。究其原因,是因为我国地势西高东低,东部地区靠近海平面,微小的差异就会导致RE很大;而西部海拔高,即便较大的绝对误差也不会过高地影响到相对误差。

对上述三种DEM高程误差进行分级统计可知 (图2):在AE方面,GDEM高程误差小于150 m的台站数量仅占全部台站数量的70%,而SRTM3和GTOP30中,这类台站数量超过了83%,在高程误差大于300 m的台站中,SRTM3和GTOP30中,台站数量在5%左右,而GDEM则超过了15%。在RE方面,误差大于1.2的台站占全部台站数量的比例中,GDEM接近10%,而SRTM3和GTOP30仅在5%左右。总之, GDEM数据高程精度较差,与气象站点的实际高程相差最大;SRTM3和GTOP30数据精度较好,且SRTM3精度略高于GTOP30。

2.2 站点温度误差分析

表2是三个温度指标开展交叉验证后所得的平均绝对误差(MAE)、均方根误差(RMSE)。结果显示:基于不同DEM数据所得的三个温度指标的空间精度表现基本一致。在MAE方面,基于GDEM获得的温度比其他两组DEM得到的温度高0.4℃左右,在RMSE方面,基于GDEM获得的温度比其他两组DEM得到的温度高0.5℃左右。

将验证站点上的高程和温度的误差分析参数(MAE和RMSE)叠加制图(图3),可以发现,无论是高程,还是平均温度、最低温度、最高温度,其误差变化都有着相同的规律,即SRTM3和GTOP30上的误差最小,GDEM上的误差最大。这表明:不同DEM数据在绝对高程值上的精度差异可能是导致不同DEM数据协助空间插值后温度插值结果出现差异的一个原因。

图1 不同DEM产品高程误差(AE和RE)的空间分布Fig.1 The spatial distribution of different DEM datasets elevation error(AE and RE)

图2 不同DEM产品高程误差(AE和RE)的分布直方图Fig.2 The distribution histogram of different DEM datasets elevation error (AE and RE )

表2 基于不同DEM产品的温度空间插值数据的误差Table 2 The error of temperature spatial interpolation data based on different DEM datasets

图3 高程和温度误差分析参数的对应关系Fig.3 The relationship of elevation and temperature error

将上述基于不同DEM产品开展的温度空间插值结果中大误差台站(>2℃)进行统计制图可知(图4),在MAE方面,基于不同DEM产品得到的三种插值温度误差大的台站数量的分布情况是:SRTM3为7.39%~10.84%,GTOP30为6.9%~9.85%,GDEM为15.76%~16.26%;在RMSE方面,基于不同DEM产品得到的三种插值温度误差大的台站数量的分布情况是:SRTM为7.88%~12.32%;GTOP30为7.88%~11.82%,而GDEM为16.75%~19.21%。这表明,通过GDEM插值得到的温度精度最低。

图4 基于不同DEM产品的温度插值大误差(MAE和RMSE)分布的直方图Fig.4 The distribution histogram of temperature interpolation huge error based on different DEM datasets (MAE and RMSE)

绘制基于不同DEM产品的平均温度空间插值产品的误差(MAE和RMSE)空间分布图(图5),可以进一步发现,空间插值产品受到DEM高程绝对误差(AE)的影响。从图5中可以看出,与不同DEM产品的绝对误差(AE)空间分布(图1)相比,平均温度产品的误差在空间上的分布与之非常类似,即其MAE和RMSE的值在中国西部地区明显要比在中国东部地区大。

图5 基于不同DEM产品的平均温度插值成果误差(MAE和RMSE)空间分布Fig.5 The spatial distribution of mean temperature interpolation error based on different DEM datasets (MAE and RMSE)

从空间分布上看,插值温度误差小(<1.5℃)的台站主要集中在我国中东部地区。在中国东部地区:在MAE方面,三种插值温度误差小于1.5℃的台站占89.43%~95.93%,而误差大于2℃的台站占3.25%~8.13%;在RMSE方面,三种插值温度误差小于1.5℃的台站占86.99%~96.75%,误差大于2℃的台站占2.44%~9.76%。这表明,在我国中东部地区,不同的DEM数据作为协变量时对温度插值结果精度的影响不大 。

插值温度误差大的台站(>2℃)主要集中在我国西南部地区,特别是在西藏、青海、四川。详细分析表明,四川、青海、西藏三地区中温度误差较大的站点(>2℃)数量占全国误差较大站点数量的35%~60%。究其原因,一方面是因为这些地区气象站分布稀疏、数量少,影响了插值效果;另一方面也是因为这些地区地形复杂、多高山峡谷,真实温度的空间分布异质性较大。

此外,在西藏、青海、四川,就基于不同DEM协变量的插值效果对比看,基于GDEM所得温度插值数据中,其MAE和RMSE大于2℃的气象台站数量明显比其他两套DEM所得温度插值数据多。GDEM中,大误差台站数在20个左右,而SRTM3和GTOP30的台站数都在10个左右。这说明在该地区SRTM3、GTOP30协助温度插值得到的结果精度要比利用GDEM所得结果精度更好。

3 结论

本文基于全国711个气象站点的温度数据,在ANUSPLIN软件支持下,分别以GTOP30、SRTM3和GDEM三种DEM产品作为协变量,使用交叉验证方法,开展了全国多年平均温度空间插值的精度对比分析。结果表明:1)就DEM自身精度而言,SRTM3和GTOP30数据精度相对较高,GDEM数据精度相对较低;2)应用基于DEM作为协变量的ANUSLPIN薄板样条方法开展空间插值后,基于GDEM产品所得的温度插值数据误差明显低于其他两套产品。3)在中国中东部地区,基于不同DEM产品所得温度插值成果精度没有显著差异;但在西南部地区,基于GTOP30和SRTM3产品的温度插值成果数据精度明显好于基于GDEM的温度插值结果;4)温度插值误差与DEM高程误差的空间分布呈现明显的耦合特性。DEM的绝对误差越大,会导致温度插值成果的误差越大。

[1] 李洁,张远东,顾峰雪,等.中国东北地区近50年净生态系统生产力的时空动态[J].生态学报,2014,34(6):1490-1502.

[2] 王平,沈润平.基于CLM模型的植被覆盖变化对黄土高原气温和降水的影响研究[J].科学技术与工程,2013,13(20):5754-5760.

[3] GONG G,MATTEVADA S,O′BRYANT S E.Comparison of the accuracy of Kriging and IDW interpolations in estimating groundwater arsenic concentrations in Texas[J].Environmental Research,2014,130:59-69.

[4] WU T T,LI Y R.Spatial interpolation of temperature in the United States using residual Kriging[J].Applied Geography,2013,44:112-120.

[5] HUSSAIN I,SPOCK G,PILZ J,et al.Spatio-temporal interpolation of precipitation during monsoon periods in Pakistan[J].Advances in Water Resources,2010,33(8):880-886.

[6] BRUCE D,INGRID S,MASSIMO C,et al.Spatial mapping of ozone and SO2trends in Europe[J].Science of the Total Environment,2010,408(20):4795-4806.

[7] 刘志红,MCVICAR T R,LI L T,等.基于ANUSPLIN的时间序列气象要素空间插值[J].西北农林科技大学学报(自然科学版),2008,36(10):227-234.

[8] 钱永兰,吕厚荃,张艳红.基于ANUSPLIN软件的逐日气象要素插值方法应用与评估[J].气象与环境学报,2010,26(2):7-15.

[9] PRICE D T,MCKENNEY D W,NALDER I A,et al.A comparison of two statistical methods for spatial interpolation of Canadian monthly mean climate data[J].Agricultural and Forest Meteorology,2000,101:81-94.

[10] 蔡迪花,郭铌,李崇伟.基于DEM的气温插值方法研究[J].干旱气象,2009,27(1):10-28.

[11] DODSON R,MARKS D.Daily air temperature interpolated at high spatial resolution over a large mountainous region[J].Clim.Res.,1997,8(1):1-20.

[12] ROBESON S M,JANIS M J.Comparison of temporal and unresolved spatial variability in multiyear time-averages of air temperature[J].Clim.Res.,1998,10(1):15-26.

[13] 潘耀忠,龚道溢,邓磊,等.基于DEM的中国陆地多年平均温度插值方法[J].地理学报,2004,59(3):366-374.

[14] MUKHERJEE S,JOSHI P K,GHOSH A,et al.Evaluation of vertical accuracy of open source Digital Elevation Model (DEM)[J].International Journal of Applied Earth Observation and Geoinformation,2013,21:205-217.

[15] 詹蕾.SRTM DEM的精度评价及其适用性研究[D].南京:南京师范大学,2008.

[16] HIRT C,FILM M S,FEATHERSTONE W.Comparison and validation of the recent freely available ASTER-GDEM ver1,SRTM ver4.1 and GEODATA DEM-9S ver3 digital elevation models over Australia[J].Australian Journal of Earth Sciences,2010,57(3):337-347.

[17] 郭笑怡,张洪岩,张正祥,等.ASTER-GDEM与SRTM3数据质量精度对比分析[J].遥感技术与应用,2011,26(3):334-339.

[18] 赵海涛,张兵,左正立,等.中国及周边区域ASTERGDEM与SRTMDEM高程对比分析及互补修复[J].测绘科学,2012,37(1):8-11.

[19] 陈俊勇.对SRTM3和GTOPO30地形数据质量的评估[J].武汉大学学报(信息科学版),2005,30(11):4-7.

[20] 马龙,李颖.从GTOPO30到SRTM DEM精度研究——以西藏为例[J].水土保持通报,2006,26(5):71-74.

[21] WANG L G,WANG K C.Impacts of DEM uncertainty on estimated surface solar radiation and extracted river network[J].Bulletin of the American Meteorological Society,2015,96(2):297-304.

[22] 刘远,周买春,陈芷菁,等.基于不同DEM数据源的数字河网提取对比分析——以韩江流域为例[J].地理科学,2012,32(9):1112-1118.

[23] 高玉芳,陈耀登,蒋义芳,等.DEM数据源及分辨率对HEC-HMS水文模拟的影响[J].水科学进展,2015,26(5):624-630.

[24] 陈永刚,汤国安,祝士杰.DEM重采样误差空间分布格局及差异性分析[J].中国矿业大学学报,2011,40(4):653-659.

[25] HUMCHINSON M F.Anusplin Version 4.36 User Guide[M].Australian National University,Cauberra,2006.

[26] MA J Y,DONG W J,WEI Z G,et al.Evaluating daily surface maximum temperature interpolation error by adding climate stations near border areas over China[J].International Journal of Climatology.2014.DOI:10.1002/joc.4173.

[27] YUAN W P,XU B,CHEN Z Q,et al.Validation of China-wide interpolated daily climate variables from 1960 to 2011[J].Theoretical and Applied Climatology,2014,119:689-700.

Impacts of DEM Uncertainty on Temperature Interpolation Accuracy

ZHAO Guan-hua1,2,LIU Zheng-jia3,HU Yun-feng1,DAI Zhao—xin1,2

(1.InstituteofGeographicSciencesandNationalResourcesResearch,CAS,Beijing100101;2.UniversityofChineseAcademyofSciences,Beijing100101;3.InstituteofRemoteSensingandDigitalEarth,CAS,Beijing100101,China)

Elevation is an important factor to impact the spatial distribution of temperature.In this paper,the mean temperature,maximum temperature,minimum temperature was extracted by using the data of 711 meteorological stations from 2001 to 2010 in China.This paper compares the accuracy of interpolation results by using different DEM datasets as the covariates at the national scale and regional scale.Three global DEM datasets are used in this paper:GTOP30、SRTM3 and ASTER GDEM.All interpolation work has been conducted with the aid of the software of ANUSPLIN.The analysis shows that:1) The MAE,MRE and RMSE of GDEM is higher than GTOP30 and SRTM3.It indicates that the accuracy of GDEM elevation is lower than GTOP30 and SRTM3.2) In the national scale,GTOP30 and STRM3 showed relatively consistent accuracy for the three temperature variables according to the root mean square error (RMSE) and mean absolute error (MAE).The result of ASTER GDEM is relatively bad.The MAE of ASTER GDEM is higher than GTOP30 and SRTM3 by 0.4℃,the RMSE of ASTER GDEM is higher than GTOP30 and SRTM3 by 0.5℃.3) In the regional scale,three DEM datasets have not obvious different error at the eastern region of China.But the interpolation accuracy of GTOP30 and SRTM3 is higher than ASTER GDEM at region of the Tibetan plateau and the Sichuan basin.4) Temperature interpolation error and absolute error of DEM elevation at the national scale and the regional scale showed consistency.The reason is considered that the temperature interpolation error may be caused by the elevation error .Results suggest that SRTM3 is the best DEM datasets as the accuracy to interpolate temperature.

temperature interpolation;accuracy;ANUSPLIN;DEM;statistics analysis

2015-08-07;

2015-12-30

遥感重大专项(00-Y30B14-9001-14/16);国家重点基础研究发展计划(2010CB9509040102)

赵冠华(1990-),男,硕士研究生,从事空间插值模型应用及精度评估。*通讯作者E-mail:huyf@lreis.ac.cn

10.3969/j.issn.1672-0504.2016.02.005

P208;P423

A

1672-0504(2016)02-0021-06

猜你喜欢
台站插值高程
中国科学院野外台站档案工作回顾
一种适用于高铁沿线的多台站快速地震预警方法
8848.86m珠峰新高程
构造给定极点的有理插值新方法
基于Sinc插值与相关谱的纵横波速度比扫描方法
基于二次曲面函数的高程拟合研究
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
基层台站综合观测业务管理之我见
SDCORS高程代替等级水准测量的研究