宋宏利,张晓楠
(河北工程大学,河北 邯郸056038)
多源土地覆被遥感数据的探索性分析可以深入挖掘每种数据在国家、区域、类别尺度的优点及缺点,是多源数据融合的第一步[1]。当前,国内外学者对全球及区域土地覆被数据间的比较及验证做了大量工作,并得出了许多有价值的结论,但多数研究都是针对早期的1km空间分辨率遥感数据[2-10]。近年来,随着遥感科学技术的发展,一系列高分辨率的全球尺度土地覆被数据相继问世,这些数据较早期的数据相比,无论在数据源的空间分辨率、信息分类算法、数据验证手段等方面均有了较大提高,因此深入了解与分析这些数据在专题及空间的一致性及均质性是当前重要的研究内容。迄今为止,尚未发现有文献记载关于GLOBCOVER,MODIS COLLECTION5及GLCNMO等最新的高分辨率土地覆被遥感数据在中国区域的比较及精度验证研究。为此,本文旨在深入分析GLOBCOVER,MODIS COLLECTION5,GLCNMO和GLC2 000四种数据在中国区域的类别精度、空间一致性及类别均质性空间分布特征,对这些数据精度的定量评价不仅是未来促进土地覆被制图质量提高的前提,而且有助于陆面过程模型及其他应用,最终为用户合理利用这些数据提供科学合理的依据,为多源土地覆被数据融合提供必要的先验知识。
研究所需的 GLOBCOVER,MODIS COLLECTION5,GLCNMO和GLC2000四种全球尺度土地覆被遥感数据均从互联网下载[11-14]。尽管GLC2000和GLCNMO分别表示2000年和2003年的陆表土地覆被分布特征,与GLOBCOVER及MODIS所代表的2005年并不相同,分别有5a和2a的时间差异,但 Martin[15]等通过对比分析 MODIS2000和MODIS2005两个时间基点的土地覆被类别面积得出,对于全球尺度土地覆被遥感数据而言,由于较小时间尺度差异所导致的土地覆被类别变化比例较小,不影响数据间的比较及精度验证,因此本文忽略了数据间的时间尺度差异。
为了定量评价四种全球尺度土地覆被遥感数据的绝对类别精度,本文以中国2000年土地利用遥感数据(CHINA2000)作为参考,从国家尺度对上述四种数据的分类精度进行验证。CHINA2000数据以30m空间分辨率的Landsat TM/ETM 影像为原始数据源,通过人机交互式图像解译方法生成,该数据经过了野外实地考察验证,其准确度达到了95%[16-17],完全可以作为参考数据完成对粗分辨遥感数据的验证。
本文所用数据为中国科学院西北环境与生态科学中心采用最大面积比法对原始数据聚合后获得的1km分辨率数据,在此感谢国家自然基金委西部环境与生态科学数据中心(http:∥westdc.westgis.ac.cn)提供参考数据。表1列出了上述土地覆被遥感数据的详细参数。
表1 研究数据参数
1.2.1 空间数据框架归一化 本文所研究数据的空间参考信息并不相同,其中GLOBCOVER采用Plate-Carrée坐标系统,MODIS采用Intergrid Sinusoidal Grid坐标系统,GLC2000和GLCNMO数据则采用Lat-Lon坐标系统。为了实现多源数据间的空间叠加,在研究中统一使用它们,综合考虑众多数据的空间参考信息、研究结果与其他相关资料的可比性以及研究结果的共享等因素,最终采用WGS84基准面和阿尔伯特等积投影坐标系统作为所有数据的空间框架。
1.2.2 空间分辨率归一化 GLOBCOVER的空间分辨率为300m,MODIS的空间分辨率为500m,GLCNMO和GLC2000的空间分辨率均为1 000m。鉴于GLCNMO和GLC2000均为1 000分辨率数据,同时在深入分析已有研究成果的基础上,本文选择1 000m作为基准空间分辨率,采用最优聚合算法将GLOBCOVER和MODIS两种数据从其原始空间分辨率升尺度转换为基准空间分辨率。在最优聚合过程中,采用Tchuenté[3]提出的算法,在IDL中分别采用3×3窗口和2×2窗口作为初始搜索窗口,将GLOBCOVER和MODIS数据重采样到1/120°,在重采样过程中选择60%作为最优聚合阈值,将聚合窗口内占60%及以上的地类作为该像元的代表地类,如果在初始搜索窗口内未发现优势地类,则扩大搜索窗口范围,直至该窗口内出现优势地类,最后采用最邻近像元法将数据进行二次重采样,使其最终分辨率为1/112°。
1.2.3 分类体系归一化 近年来,国际社会在多源数据分类体系的归一化方面做了大量工作,最终认为LCCS分类体系可以作为未来土地覆被分类的参考及转换标准,该体系严格说是一种分类器,提供了一种通用的转换语言,可以实现现有分类体系间的转换[18]。尽管当前的全球尺度遥感数据的重点都是识别陆表植被类型,但在具体的分类上仍存在较大的差异。例如,GLOBCOVER将耕地分为洪水灌溉地、沟渠灌溉地和雨水灌溉地3种;而MODIS仅仅有耕地一个大类,没有进行细分;GLOBCOVER,GLC 2000和GLCNMO虽然都采用LCCS分类体系,但仍有些类别无法直接比较,例如,GLOBCOVER中存在过多的混合类型,这阻碍了该数据与其他数据的互操作。笔者采用LCCS分类描述语言在8个分类器基础上将四种数据的土地覆被类别聚合为8个大类(表2),在聚合过程中,严格采用LCCS的类别标准和通用的分类阈值。
表2 归一化的土地覆被分类体系
1.3.1 误差矩阵分析 研究采用逐像元对比法建立了中国2000年土地利用数据和MODIS,GLOBCOVER,GLC2000和GLCNMO四种数据之间的混淆矩阵,用以评价四种全球尺度土地覆被数据在中国区域的总体和类别精度,并采用Congalton和Green提出的分类精度检验算法评价了中国多个地理区域多源土地覆被遥感数据间的分类精度优势的显著性[19]。
1.3.2 多源土地覆被遥感数据空间一致性分析 为了获得多源土地覆被遥感数据类别分布在空间上的一致性分布特征,计算像元尺度四种数据类别的一致性程度,笔者在ARCGIS软件中将四种研究数据进行空间叠加,叠加的结果分为4个等级,分别为:(1)完全不一致,四种数据在对应像元呈现出4种完全不同的土地覆被类别;(2)不一致,四种数据在对应像元呈现出3种不同的土地覆被类别;(3)基本一致,四种数据在对应像元呈现出2种土地覆被类别;(4)完全一致,四种数据在对应的像元的土地覆被类别完全相同。
1.3.3 土地覆被类别的均质性分析 国外学者的研究表明景观分布的异质性是影响区域及局部尺度遥感数据土地覆被类别分类精度的关键因子,为了比较GLOBCOVER,MODIS、GLC2000以及 GLCNMO4种数据均质性面积的差别,本文采用一个3×3的像元空间作为计算窗口,当该窗口内与窗口中心像元不同的像元数目为8时,认为该窗口是异质性的;如果该窗口内所有像元值都和窗口中心像元相同,则认为该窗口为均质的。在IDL环境中不断滑动该窗口,直至整个区域计算完毕。
图1表明GLOBCOVER,MODIS,GLC2000和GLCNMO四种数据类别间的混淆表现出相近的特征,说明四种数据在中国区域具有相似的分类精度,总体精度分别为47.22%,56.37%,54.56%和47.10%,最大差值为9.27%,其中MODIS和GLC2000具有较高的总体精度,GLOBOCVER和GLCNMO的总体精度相对较差。四种全球土地覆被遥感数据与2000年中国土地利用数据间的类别混淆主要发生于林地、草地、灌木和耕地之间,这主要因为这四种土地覆被类型具有相似的生命形态特征,导致光谱特征上存在一定的相似性。林地、耕地和裸地在国家尺度均具有较高的分类精度,其生产者精度均达到了80%左右;对于灌木,四种数据灌木的分类精度都相对较低,其生产者精度仅为15%左右,其中大部分灌木被错误分类为林地、耕地和草地,这说明粗分辨传感器识别灌木的精度较低,其准确识别灌木光谱特征能力有待加强;GLC2000草地的分类精度最高,其生产者精度为40.75%,GLCNMO该类别的分类精度最低,仅为14.79%;四种数据耕地的分类精度相差较小,分别为64.74%,71.44%,62.96%和61.76%,这说明四种数据在识别大面积分布,且物候特征明显的地表土地覆被类型时具有较高的精度;对于建设用地、冰雪和湿地等地表类型,GLC2000建设用地的分类精度最低,仅为2.04%,其他三种数据的分类精度较为接近;GLCNMO冰雪的分类精度最低,仅为21.85%。
图1 国家尺度多源土地覆被遥感数据类别混淆
图2揭示了在95%置信水平下计算的GLOBCOVER,MODIS,GLC2000和GLCNMO四种土地覆被遥感数据在国家及区域尺度的差异显著性检验。结果表明,在国家尺度,GLOBCOVER-GLC2000,GLC2000-GLCNMO及GLOBCOVER-GLC2000之间的统计量值均大于1.96(图2中横线所代表值),差异显著,说明在该尺度,GLOBCOVER和GLCNMO两种数据的类别精度显著低于MODIS和GLC2000;在东北区域,GLOBCOVER-GLC2000,GLOBCOVER-MODIS以GLOBCOVER-GLCNMO之间的差异显著,而 MODIS-GLCNMO,MODIS-GLC2000以及GLC2000-GLCNMO之间的差异并不显著;华北区域只有MODIS-GLCNMO之间存在显著差异,其他数据间的差异均不显著;西北区域和四川盆地表现出与东北区域类似的特征;青藏高寒区、东南、西南三个区域的统计值均小于1.96,说明在该区域,数据的总体分类精度相似,并无显著差异。
图3以图谱的形式表达了GLOBCOVER,MODIS,GLC2000和GLCNMO四种全球土地覆被遥感数据在中国区域的空间一致性。从图中可以看出,完全空间一致性区域主要分布于西北地区的沙漠地带、华北中南部的粮食产区、东北东部地区和东南地区北部,其总面积约占研究区域总面积的39.03%,在该区域,地表土地覆被类型较为单一,以林地、耕地、草地为主,光谱特征简单或呈现明显的物候特征;基本一致区域主要分布于完全一致区域周围,表现出土地覆被类型的区域变量特征,该区域的面积约占研究区总面积的40.67%,具体分布在青藏高寒区、西南区、四川盆地中部、内蒙古北部和西北地区南部,该区域主要地表类型为草地和裸地以及草地和耕地为主;不一致区域的面积约占研究区总面积的18.56%,主要分布于东南地区中部、青藏高寒区西北部和东南部、东北和西北分界线的条带区域,该区域地表类型较为复杂,地表景观呈现明显的破碎现象,耕地、林地、灌木、草地交错分布;完全不一致区域约占研究区总面积的1.74%,并且集中分布于“胡焕庸地理分界线“两侧,成典型的带状分布特征。
图2 土地覆被遥感数据类别精度差异显著性构线
以四种土地覆被遥感数据8个类别的完全一致性面积百分比及每种类别的平均生产者精度和平均用户精度为数据源,分析了类别一致性比例与类别精度的相关关系(表3)。结果表明,类别的生产者精度与类别一致性面积百分比存在明显的正相关性,其相关系数R等于0.88(R2=0.77),这意味着某种土地覆被类别的一致性区域的面积越多,该类别的生产者精度越高,即该类别的分类精度越高,相反,如果某类别位于一致性区域的面积比例越少,则该类别的分类精度越低。正如Herold等[5]在非洲大陆得出的结论类似,用户精度与类别面积一致性百分比的相关性不是很强,仅为0.42。
图3 多源土地覆被遥感数据空间一致性分析
表3 类别一致性百分比与类别精度的相关关系
(1)GLOBCOVER,MODIS,GLC2000,GLCNMO四种全球土地覆被遥感数据与中国2000年土地利用数据在空间上存在一定的混淆现象。混淆主要发生于林地、草地、灌木和耕地之间,其中灌木与其他地类的混淆程度最为严重,导致四种数据的灌木的类别精度均较低。类别间的混淆存在明显的地理区域特征,例如在东北区域,混淆主要发生于耕地和林地之间;而在青藏高寒区,混淆则主要发生于草地和灌木之间;在东南区,混淆则主要发生于耕地和草地之间。出现上述混淆的主要是因为这几种土地覆被类别具有相似的光谱特征,生命形态相似,在成像过程中容易形成异物同谱现象,因此在今后的工作中,应该加强叶类土地覆被类别识别算法的改进,特别是灌木和林地之间的类别区分算法的提高。
(2)通过多源遥感数据的空间一致性及均质性分析,深入掌握了数据可靠程度的空间分布状况,这对于今后全球尺度土地覆被遥感制图如何选择“训练数据”提供了合理的科学依据,同时也为未来数据改善的重点区域提供了指导。研究表明类别一致性分析是类别精度的重要影响因子,特别是对于数据的制图精度,一致性区域的面积起到了决定性作用,使得裸地和林地的制图精度均在85%以上,同理,灌木和建设用地的生产者精度均低于10%,也意味着未来的全球尺度土地覆被制图研究应该加强异质性区域地物信息的提取精度的相关研究。
(3) 研 究 表 明 GLOBCOVER,MODIS,GLC2000和GLCNMO四种数据在不同的区域、不同的类别表现出不同的精度,没有哪种数据的精度在所有区域和类别均高于其他数据,而是呈现出明显的区域和类别特征,这对于充分利用不同数据在不同区域及类别的精度优势,从而融合生成高精度土地覆被遥感数据提供了依据。
[1] Wickham J D,Stehman S V,Fry J A,et al.Thematic accuracy of the NLCD 2001land cover for the conterminous United States[J].Remote Sensing of Environment,2010,114(6):1286-1296.
[2] Fritz S,See L,Rembold F.Comparison of global and regional land cover maps with statistical information for the agricultural domain in Africa[J].International Journal of Remote Sensing,2010,31(9):2237-2256.
[3] TchuentéA T K,Roujean J L,De Jong S M.Comparison and relative quality assessment of the GLC2000,GLOBCOVER,MODIS and ECOCLIMAP land cover data sets at the African continental scale[J].International Journal of Applied Earth Observation and Geoinformation,2011,13(2):207-219.
[4] Giri C,Zhu Z,Reed B.A comparative analysis of the Global Land Cover 2000and MODIS land cover data sets[J].Remote Sensing of Environment,2005,94(1):123-132.
[5] Herold M,Mayaux P,Woodcock C E,et al.Some challenges in global land cover mapping:An assessment of agreement and accuracy in existing 1km datasets[J].Remote Sensing of Environment,2008,112(5):2538-2556.
[6] Nakaegawa T.Uncertainty in land cover datasets for global land-surface models derived from 1km global land cover datasets[J].Hydrological Processes,2011,25(17):2703-2714.
[7] 冉有华,李新,卢玲.四种常用的全球1km土地覆盖数据中国区域的精度评价[J].冰川冻土,2009(3):490-500.
[8] 吴文斌,杨鹏,张莉,等.四类全球土地覆盖数据在中国区域的精度评价[J].农业工程学报,2009,25(12):167-173.
[9] Wu W,Shibasaki R,Yang P,et al.Validation and comparison of 1km global land cover products in China[J].International Journal of Remote Sensing,2008,29(13):3769-3785.
[10] 宋宏利,张晓楠,王雨,等.多尺度高分辨率全球土地覆被遥感数据相对一致性比较[J].农业工程学报,2012,28(15):118-124.
[11] Arino O,Bicheron P,Achard F,et al.The most detailed portrait of Earth[J].European Space Agency,2008,136:25-31.
[12] Friedl M A,Sulla-Menashe D,Tan B,et al.MODIS Collection 5global land cover:Algorithm refinements and characterization of new datasets[J].Remote Sensing of Environment,2010,114(1):168-182.
[13] Tateishi R,Uriyangqai B,Al-Bilbisi H,et al.Production of global land cover data-GLCNMO[J].Interna-tional Journal of Digital Earth,2011,4(1):22-49.
[14] BartholoméE,Belward A S.GLC2000:a new approach to global land cover mapping from Earth observation data[J].International Journal of Remote Sensing,2005,26(9):1959-1977.
[15] Jung M,Henkel K,Herold M,et al.Exploiting synergies of global land cover products for carbon cycle modeling[J].Remote Sensing of Environment,2006,101(4):534-553.
[16] Liu J,Liu M,Tian H,et al.Spatial and temporal patterns of China′s cropland during 1990—2000:An analysis based on Landsat TM data[J].Remote Sensing of Environment,2005,98(4):442-456.
[17] 中国资源环境遥感宏观调查与动态研究[M].北京:中国科学技术出版社,1996.
[18] Di Gregorio A.Land cover classification system:classification concepts and user manual:LCCS[M].Food& Agriculture Org.,2005.
[19] Congalton R G,Green K.Assessing the accuracy of remotely sensed data:principles and practices[M].Boca Raton,FL,USA:CRC Press,2008.