费 岚, 宫传刚
(安徽理工大学 测绘学院,安徽 淮南232001)
20 世纪90年代以来,随着计算机制图科技的进步和卫星传感器的持续发展,基于遥感技术的全球土地覆盖数据制图也逐步取得了进展[1]。至今,基于遥感影像数据获得的全球土地覆盖数据产品主要有IGBP - DIS Cover 数据集、UMD 数据集、MODIS 数据集、GLC2000 数据集、GLC2009 数据集五类。由于空间分辨率存在缺陷,2010年欧洲研发了分辨率为300 m 的GLC2009 土地覆盖数据产品[2]。该产品是由欧洲太空局(ESA)、联合国环境规划署(UNEP)、联合国粮农组织(FAO)、欧洲委员会联合研究中心(JRC)、国际地圈-生物圈计划(IGBP)及林地和土地覆盖动态的全球观测(GOFC -GOLD)执行小组共同参与完成的[3]。它具有较高的分辨率,其最新数据能反映全球地表覆盖状况,在生态环境动态监测、土地资源利用等方面得到了广泛应用。
虽然数据生产者对其产品数据的准确性进行了定量评价,部分国外学者验证及分析了该数据产品在不同地区的准确性,但它在中国地区的数据目前尚未得到可靠准确的精度评价,所以,这些全球土地覆盖数据集在中国受到了应用限制[3]。国内学者在提高动态高效遥感技术、全球地表覆盖制图技术的基础上,研制了属于我国的高精度全球土地覆盖产品,为我国研究全球环境变化和地球系统模式提供了可靠依据。笔者利用统一参考数据,以空间分辨率为300 m 的GLC2009 为研究对象,对中国典型区域内数据进行精度验证,定量评价此数据在中国不同区域内的差异。
GLC2009 数据源是来自ENVISAT 卫星平台上的MERIS 数据,空间分辨率为300 m。根据分层分区的分类方法,将自然地理分区进行分层提取[3]。它主要利用土地覆盖分类体系(LCCS),分成22 类全球地表覆盖类型,对全球生态环境变化体系、土地综合利用情况研究有着重要影响[4]。
文中以空间分辨率为30 m 的LANDSAT4 -5 TM 影像数据作为参考数据。LANDSAT 是美国陆地探测卫星系统,LANDSAT 上装备的传感器TM 覆盖了从红外到可见光的七个波段,其覆盖面广,波段1~5 和波段7 的空间分辨率为30 m,波段6(热红外波段)的空间分辨率为120 m。为满足研究对象的时效性、全面性等要求,根据中国行政区域划分,从国际科学数据服务平台网站下载影像,影像数据行列为:华东区域(119,38),东北区域(116,27),西北区域(127,36),华南区域(123,44)。为确保影像质量,以上影像数据的云量均控制在5%以内。
为了便于比较分析,简化参考数据的分类,对全球土地覆盖产品22 类进行类型合并,原土地覆盖产品中相应编码为11、14、20 的类别统一归为耕地,110、120、130、140 的类别统一归为草灌,30~70、90、100、150~180 的类别统一归为林地,190、200、210、220 的类别分别为人工表面、裸地、水体和冰雪。由于永久性冰雪通常处于海拔较高处,此研究区未涉及;裸地主要是沙漠地带,城市裸地较少。因此,裸地及永久冰雪单独给出。
根据训练区特点将地物分为耕地、草灌、林地、水体和人工表面五类,通过建立各类土地利用类型的遥感解译标志,对影像进行目视解译,用最大似然法(Maximum likelihood)进行监督分类[5]。为了避免对结果影像造成误判或界限不清,在目视解译过程中,除考虑地物的光谱特性外,还要考虑地物所处的位置、形态特征等因素[6]。图1 为中国典型区监督分类。
图1 不同区域监督分类Fig.1 Supervised classification of different area
比较分析法是检验遥感数据产品精度的主要方法,对比分析待验证数据与参照数据的相似性与一致性,前后数据的吻合度越高则说明待验证数据准确度越高[7]。通常数据产品精确度验证主要有空间位置精度验证和数量验证两方面。空间位置精度验证注重评价数据间各相应类别在空间分布上是否相似,而数量精度验证注重评价被验证数据与参考数据在数量上的一致性[1]。该研究的参考数据是监督分类后的四个区域影像数据,对四个区域的面积数量和空间位置的一致性进行精度分析。混淆矩阵中的元素是各类的像素数量或其占总像素数量的百分比。其主对角线上的像素数量越大或百分比越高,则表示分类精度就越高,反之越低[8]。通过混淆矩阵Kappa 系数来评价参考数据的分类精度,从而评价整个分类图的精度。以东北区域为例,表1为影像数据与监督分类结果所对应的混淆矩阵,计算得到东北区域监督分类总体精度为93.61%,Kappa 系数为0.892 1。
表1 东北区域监督分类混淆矩阵Table 1 Cofusion matrix of supervised classifcation in northeas area
通过计算合并后的GLC2009 土地覆盖产品与监督分类后的中国四个区域的面积相关系数,评价这两种数据类型面积相对参考数据的偏离程度。相关系数(Ri)表示的是两变量之间的线性关系。相关系数平方表示两变量相关的强度或大小[9]。
式中:i——评价的土地覆盖类型产品;
k——不同的土地覆盖类型,k=1,2,…,5;
xk——各类型的总面积;
yk——参考数据各类型的总面积;
x——所要评价的五类土地覆盖数据类型面积的均值;
y——对应类型在参考数据中的均值。
面积是土地覆盖数据产品蕴涵的重要信息,对面积的比较具有现实意义。对四个典型区域的土地覆盖产品GLC2009 数据及参考数据进行各类型的面积对比,结果见表2。
表2 面积一致性比较Table 2 Consistency comparison of area
从表2 可以看出,四个区域面积总体上差异较大。华东区域的精度较高,这是因为华东区域地势比较平坦,水体在光谱上容易区分,而农田因为有明显的人类耕作季节特征,在光谱上表现为NDVI年变化,呈现多峰、双峰和单峰特征,因而也较易识别[10]。西北及东北区域的耕地类型偏差达100%,东北区域的耕地面积为0,是因为土地覆盖产品GLC2009 将耕地类型分类为裸地、草灌和林地三类。西北区域的耕地面积远远高于参考数据,是因为西北区域的耕地比较零散,而且主要是黄土高原。人工表面覆盖的面积在四个区域均比参考数据小,误差大于50%以上。草灌、林地面积相对于土地覆盖产品的差距也较大,与西北区域的林地面积最为接近,两者相差9.53%。由表2 中误差比例可知,利用遥感方法进行中国土地分类的难点在于准确地对林地、草灌进行分类。
根据相关系数公式求得东北、西北、华东、华南四个区域的相关系数,分别为0.73、0.66、0.98、0.66。从土地覆盖数据产品中的四个区域与参考数据面积总体的相关性可以看出,华东区域的精度最高,东北次之,西北和华南区域精度较低。
仅评价遥感数据产品的面积精度,会影响该数据产品质量的真实性和可靠性,因为遥感制图相对容易描述一个区域某一土地覆盖类别的总数量特征,但其空间位置制图并不准确。所以,文中对空间位置精度进行评价分析[11]。
GLC2009 土地覆盖产品与监督分类结果的混淆矩阵见表3~6。GLC2009 土地覆盖数据在华东区域与参考数据的一致性最好,Kappa 系数为0.77,总体精度为92.62%,主要表现在,耕地类型及水体类型的精度是四个区域内精度最高的,分别达到95.59%和98.97%。但华东区域的草灌精度很低,为5.42%,这是因为有46.05%草灌被分为耕地,41.93%草灌被分为水体。与参考数据一致性最差的是东北区域,Kappa 系数为0.02,总体精度是32.19%,其耕地类型精度是土地覆盖产品GLC2009在四个区域内最低的。GLC2009 土地覆盖产品在西北和华南区域的总体精度相差不大,各类型的分类精度不等,西北区域内人工表面的精度是最高的,达到75.02%,同时,将人工表面分为草灌的比例为0.16%,是四个区域内最小的。这是以草灌的精度损失为代价的,分类精度为0。
GLC2009 土地覆盖产品在以上四个区域内,耕地与草灌,林地与草灌,林地之间,耕地之间,人工表面与耕地,草灌与林地、耕地之间,水体与耕地、草地之间都存在不同程度的混分现象。
从以上分析可知,未来我国开展高精度的土地覆盖分类制图的关键在于,提高各种类型精度,特别是草灌和人工表面,因为在中国的人工表面用地周围一般都是耕地,尤其是面积小且分散的农村地区,其与耕地严重混淆,草灌一类也分布较散,不能区分。在中国山地丘陵区域,地形起伏大,耕地零星分布,而且与其他植被类型高度混合,使得地表复杂程度高于卫星传感器的识别能力。中国山区具有地形起伏、耕地分散的显著特点,但与其他植被类型高度混合,使得卫星传感器的识别能力不能满足复杂的地表情况。在这些区域进行土地覆盖制图时使用低空间分辨率的遥感数据,很可能引起更大的误差,精度随之降低,土地覆盖制图显然会有更多的错误和不确定性[12]。
表3 东北区域混淆矩阵Table 3 Confusion matrix in northeast area
表4 华东区域混淆矩阵Table 4 Confusion matrix in east of China
表5 西北区域混淆矩阵Table 5 Confusion matrix in northwest area
表6 华南区域混淆矩阵Table 6 Confusion matrix in south of China
(1)GLC2009 土地覆盖数据集在中国华东区域的面积一致性和空间位置一致性方面均有较高的整体分类精度,西北和华南区域的空间位置分类精度次之,而东北区域的空间位置总体精度与Kappa 系数远低于其他三个区域。
(2)GLC2009 土地覆盖数据集在四个不同区域内都存在着明显的分类错误:在华东区域内,GLC2009 土地覆盖数据的分类结果显示含有永久冰雪一类,而在东北区域内的耕地面积为0,导致GLC2009 数据集在东北区域的精度很低。
(3)LANDSAT4 -5TM 影像作为参考数据进行分类,尚可以反应全球土地覆盖产品在中国典型区域内的总体评价,但分类结果的精确度尚待提高。
[1]吴文斌,杨 鹏,周清波,等.四类全球土地覆盖数据在中国区域的精度评价[J].农业工程学报,2009,25(12):167-173.
[2]王 洁,张增祥,张委伟.基于生态地理分区的5 套土地利用/覆盖数据的不确定性研究[J].遥感技术与应用,2012,27(6):389 -395
[3]牛振国,单玉秀,张海英.全球土地覆盖GlobCover 2009 数据中的中国区域湿地数据精度评价[J].湿地科学,2012,10(4):389 -395.
[4]徐文婷,吴炳方,颜长珍,等.用SPOT -VGT 数据制作中国2000年度土地覆盖数据[J].遥感学报,2005,9(2):204 -214.
[5]陈 超,江 涛,岳远平.监督分类和目视修改相结合在高分辨率遥感影像中的应用[J].国土资源信息化,2009(5):37 -40.
[6]王玉丽,马 震.应用ENVI 软件目视解译TM 影像土地利用分类[J].现代测绘,2011,34(1):11 -13.
[7]宋宏利,张晓楠.中国区域多源土地覆被遥感产品精度分析与验证[J].农业工程学报,2012,28(22):204 -214.
[8]汤国安,韦玉春,杨 昕.遥感数字图像处理[M].北京:科学出版社,2004.
[9]冉有华,李 新,卢 玲.四种常用的全球1km 土地覆盖数据中国区域的精度评价[J].冰川冻土,2009,31(3):490 -499.
[10]李晓兵,陈云浩,喻 锋.基于遥感数据的全球及区域土地覆盖制图:现状、战略和趋势[J].地球科学进展,2004,19(1):71 -80.
[11]LAMBIN E F,GEIST H.Land-use and land-cover change:Local processes and global impacts[M].Germany:Springer,2006.
[12]刘纪远,张增样,庄大方,等.20 世纪90年代中国土地利用变化时空特征及其成因分析[J].地理研究,2003,22(1):1 -12.