廖顺宝,葛乐玮,王艳萍,李峰
(防灾科技学院 生态环境学院,北京 101601)
土地利用/土地覆被变化(land use-cover change,LUCC)既是全球环境变化的重要原因[1-4],也是研究全球变化和区域可持续发展的基础数据。因此,土地利用/土地覆被数据被广泛应用于地质水文模型[5-7]、生态系统碳循环模型[8-9]、社会公共健康和生态环境系统评价[10-11]、农业和自然资源管理[12-13]等研究。在遥感、地理信息系统等高新技术日趋完善的今天,土地覆被信息主要是通过对卫星遥感信息的解译获得。由于遥感技术本身存在同物异谱、异物同谱现象以及受地形、云雾等因素的影响,基于遥感获得的土地覆被信息不可能与地面的实际情况完全一致,有时差异很大。因此,对遥感土地覆被数据进行分类精度评价以及如何进一步提高分类精度一直是该领域的研究热点。
地形地貌决定区域人口、水文、地质、土地利用/覆被等要素的基本骨架[14],高程、坡度等是影响土地利用/覆被分布的基本因素[15]。因此,地形因子对土地覆被类型的形成与分布有重要影响[16]。如果在土地覆被分类过程中适当考虑地形因子,必然会提高分类精度。一些学者计算了土地利用类型与高程、坡度、坡向、地形起伏度等地形因子间的相关系数[17-20],但并没有构建出具体的定量模型。
研究表明,构建地形因子与土地覆被类型面积占比之间的定量模型,可以明显提高土地覆被产品的分类精度[21]。构建土地覆被类型面积占比与地形因子之间的模型,可以在两个层面上进行,一是基于整个研究区的参考数据,二是仅基于研究区中分类精度较高区域的参考数据。众所周知,不论是参考数据,还是待评价、待改进的目标数据,都不可能与地面的实际情况完全一致。如果把参考数据与目标数据进行空间叠加,叠加结果的属性为二值:分类一致区和分类不一致区,显然,分类一致区的数据更加可靠。因此,理论上,基于整个研究区数据建模改进目标产品的分类精度的效果不如基于一致区数据建模改进目标产品的分类精度的效果。目前,前者有少量研究,而后者尚无相关报道。
鉴于此,本文以京津冀为研究区,以中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer,MODIS)土地覆被产品为研究对象,以该区域1∶25万土地覆被数据为参考数据,探讨仅基于分类一致区数据建立土地覆被类型面积占比与地形因子之间的模型,并以此改进MODIS土地覆被产品分类精度的新方法。
京津冀地区包括北京、天津和河北3个省市,共计204个县级行政区划单元,总面积约为 21.56×104km2。研究区地势西北高、东南低,由西北向东南逐渐倾斜,地形地貌复杂多样,西北部以山地、丘陵和高原为主,其间分布有盆地和谷地,东南部为广阔的平原地带[22]。齐全的地貌类型导致植被在垂直方向上表现出垂直分带特点,水平方向上表现出明显交替性。研究区的自然植被类型主要为落叶阔叶林和草原植被、森林草原。
本研究所需数据包括:研究区数字高程模型(ASTER GDEM)数据、县级行政区划数据、1∶25万土地覆被数据及MODIS土地覆被产品(MCD12Q1)。
1)研究区ASTER GDEM数据。从地理空间数据云下载(http://www.gscloud.cn),共下载了49幅30 m×30 m(1弧秒×1弧秒)分辨率的ASTER数据(数据范围:36°N~43°N,113°E~120°E),利用ArcGIS将49幅数据做拼接处理。数据的坐标系是WGS_1984,格式为“.img”。
2)研究区县级行政区划数据。包括研究区一省二市的县级行政区边界、行政区代码和名称等属性数据,WGS_1984坐标系。主要用作构建土地覆被类型面积占比与地形因子关系模型时的控制参数以及模型模拟结果的分析。
3)研究区1∶25万土地覆被数据集(2005年)。源于国家科技基础平台-地球系统科学数据共享国家平台,由中科院遥感所、中科院地理资源所等八家单位共同完成。该产品的全国土地覆被制图总体准确率为91%,各类型准确率也达89%以上[23]。该数据包括6个一级类和25个二级类,采用Albers投影。
4)研究区MODIS数据产品(2005年)。从美国国家航空航天局(National Aeronautics and Space Administration,NASA)官网下载,数据空间分辨率是1 000 m,数据格式为“.hdf”,采用国际地圈生物圈计划(international geosphere biosphere programme,IGBP)的分类系统。本文所使用的MCD12Q1产品由四幅数据拼接而成,四幅数据轨道号分别为h26v04、h26v05、h27v04、h27v05。
由于上述数据各自的空间范围、空间分辨率、投影方式、分类系统都不同,需要对数据统一空间范围、空间分辨率、投影方式及分类系统。另外,本文是以地形因子为自变量,各县区各地类的面积占比为因变量构建多元线性逐步回归模型。因此,需要基于DEM提取地形因子,计算在分类一致区内各县区各地类的面积占比。具体数据处理内容如下。
1)投影转换与重采样。为了使各地类土地覆被面积数据无损失,将研究区的数据进行Albers投影转换。本文以MCD12Q1数据1 km空间分辨率为基准,利用ArcGIS软件将研究区1∶25万土地覆被数据重采样为1 km空间分辨率。
2)统一分类系统。土地覆被产品精度评价的前提条件是不同土地覆被产品具有统一的分类体系。研究区1∶25万土地覆被数据地类为6个一级类和25个二级类,MCD12Q1土地覆被分类为17种类型。根据本研究需要,将统一后的土地覆被分类系统定义为五类,包含耕地、林地、草地、建设用地和其他地类。分类系统的对应关系见表1。
表1 统一后的土地覆被分类系统
3)地形因子提取。以30 m分辨率的ASTER GDEM为基础,利用ArcGIS软件对选取的五个地形因子进行提取,得到坡度、坡向、地表切割深度、地形起伏度四个地形因子,加上海拔高度本身,共五个地形参数。其中,海拔高度、坡度、坡向为微观地形因子,地表切割深度、地形起伏度为宏观地形因子。
4)分类一致区提取。将参考数据与目标数据进行空间叠加,叠加结果的属性为二值:分类一致区和分类不一致区,显然,分类一致区的数据更加可靠。因此,后续建模仅基于分类一致区数据。
5)一致区内地形参数统计。以县级行政区划为统计单元,利用ArcGIS软件统计海拔高度的最大值、最小值和平均值,坡度、坡向的平均值。基于统计结果计算得到各县(分类一致区内)的地表切割深度和地形起伏度参数。
6)一致区内各地类面积占比计算。以县级行政区划为统计单元,对各县一致区内的耕地、草地、林地、建设用地和其他地类进行分区统计,得到各县一致区内每类土地覆被的面积,由此计算出各地类的面积占五种地类总面积的百分比。
以分类一致区内各县地形因子(平均值)为自变量,各县区各类土地覆被面积占比为因变量,利用SPSS软件构建回归模型,同时设置回归方程常数为0和常数非0共两种情况。构建的一致区模型方程见表2。
表2 各类土地覆被类型面积占比与地形因子之间的回归模型
为保证模型的拟合效果和精度,对表2中的模型进行分析。复相关系数是判定系数,判定线性回归的拟合程度,其值越大,拟合程度越好。最终选择常数为0的草地、林地、建设用地和耕地模型以及常数不为0的其他地类的回归模型对产品进行精度提高。
为验证回归模型的可靠性,本文利用最优模型计算的各地类面积占比与实际各地类的面积占比的相关性、模型数据与参考数据的空间一致性比率两种方法对模型精度进行验证,从而选出精度高的模型改进MODIS土地覆被产品精度。
1)一致区内各县各地类实际的面积占比与模型计算的面积占比相关性。图1表示的是县级尺度上一致区(常数为0的)林地、草地、耕地的模型计算结果与实际情况的相关关系分析结果。由图1及表3可知,在五个地形因子与五种地类的相关性分析中,草地的相关性最高,相关系数为0.941,其次是林地、耕地、其他地类和建设用地,相关系数分别为:0.778、0.583、0.371、0.244。其中,草地、林地与地形因子高度相关,耕地显著相关,建设用地和其他地类为低度相关。
图1 县级尺度模型计算的各地类面积占比与实际面积占比的相关关系
表3 模型计算面积占比与实际面积占比的相关系数
2)空间一致性分析。两种产品的相对精度可以用空间一致性来衡量。一致性比率越高,说明两种产品越接近。两种产品第i种地类的一致性比率定义如式(1)所示。
(1)
式中:Ni、Mi分别为土地覆被产品N和土地覆被产品M中第i种土地覆被类型的像元数;Ti为在相同位置两种产品都为土地覆被类型i的像元数。
为了获得回归模型计算结果与参考数据的最大空间一致性比率值,需要对回归模型计算数据进行阈值实验,实验步骤如下。
步骤1:在ArcGIS软件中,使用栅格计算器,对所构建的多元线性逐步回归方程进行栅格计算,得到一致区内五种地类的土地覆被方程回归计算面积占比,回归计算面积占比的取值范围是0~1。
步骤2:对回归计算面积占比结果进行归一化处理,并将处理结果调整到0~10 000之间。
步骤3:各类土地覆被线性回归计算面积占比设定阈值记为M(0≤M≤10 000),将回归计算面积占比数值等于或大于设定阈值M的栅格视为该土地覆被类型,小于设定阈值M的栅格视为非该土地覆被类型。
步骤4:计算阈值M下与参考数据1∶25万的空间一致性比率。根据阈值实验得到空间一致性比率,见表4。
表4 模型实验阈值与参考数据各地类空间一致性比率最高值
由表4可知,一致区(常数为0)模型在林地、草地、耕地三种地类的空间一致性比率高于MODIS产品的空间一致性比率,而建设用地(常数为0)和其他地类(常数不为0)的空间一致性比率低于MODIS产品的空间一致性比率。根据面积占比相关性以及空间一致性分析结果,最终选择林地、草地、耕地三种地类的回归模型来提高MODIS土地覆被的分类精度。
利用上面建立的精度较高的回归模型对林地、草地、耕地三种地类的分类进行改进。具体步骤和流程如下。
步骤1:利用ArcGIS软件中的栅格计算器,依据栅格面积占比最大原则得到模型计算的林地、草地、耕地三种地类的土地覆被分布图,记为MLR-1。
步骤2:利用ArcGIS软件中的提取工具,从MODIS土地覆被分布图中提取出不一致区内林地、草地、耕地的分布图,记为MCD-1。
步骤3:利用掩模工具,以MCD-1为掩模,对MLR-1进行提取,得到MCD-1范围内的MLR-1部分,记为LCGMCD-1。
步骤4:将一致区、LCMCD-1以及未改进地类进行叠加,得到整个研究区改进效果图,记为一致区域建模改进产品NEW-1-1。详细技术流程见图2。
图2 基于分类一致区模型改进MODIS土地覆被产品的技术流程
将研究区原始MODIS土地覆被图、1∶25万土地覆被图及改进后的土地覆被图NEW-1-1进行对比,见图3。由图3可知,改进后的土地覆被产品中林地空间分布有所增加,在研究区北部和西南部边缘,增加最为明显,林地分布的总体格局与1∶25万土地覆被数据中林地的分布更接近;改进后的土地覆被产品中草地的空间分布明显减少,与1∶25万土地覆被数据中草地分布更相似;改进后的土地覆被产品中,耕地的空间分布有所增加,特别是在研究区的北部,增加最为明显。
注:该图基于自然资源部标准地图服务下载的审图号为GS(2019)3333号的标准地图制作,底图无修改。图3 研究区改进前后土地覆被产品与参考数据土地覆被图的对比
以1∶25万土地覆被产品作为参考数据,对改进前的MODIS产品和改进后的MODIS产品NEW-1-1从各地类面积构成比例和空间一致性比率两个方面进行定量分析。
1)面积构成比例分析。利用式(2),计算MCD、NEW-1-1、LC-TYPE三种数据中林地、草地、耕地三类土地覆被面积构成比例,结果见表5。
(2)
式中:Pi为第i类土地覆被地类的面积占比;Si为第i类土地覆被地类的面积;S为研究区范围内五种地类的总面积。
由表5可知,改进后土地覆被产品中林地、草地的面积占比与改进前相比更接近于1∶25万参考数据中林地、草地的面积占比,说明改进效果明显。其中,草地改进效果最明显,与1∶25万参考数据相比,由改进前的相差22%减少到相差5%。因此,从面积占比这一指标看,林地、草地这两类自然植被的改进效果较明显,耕地的分类效果并没有得到改进。此外,建设用地和其他地类的面积占比变化不大,主要是由前面三种地类的改进而引起的被动变化。
表5 参考数据产品与改进前和改进后的产品各地类面积占比 %
2)空间一致性分析。分别计算原 MODIS土地覆被产品、改进后产品 NEW-1-1与参考数据之间的空间一致性比率,结果见表6 。NEW-1-1与参考数据中的林地、草地、耕地三种地类的空间一致性比率都要高于MCD。其中,NEW-1-1的草地空间一致性比率最高,为81.87%,其次为耕地和林地,分别为78.92%、61.66%。改进后产品比改进前产品在林地、草地、耕地的空间一致性比率上分别提高了30.02%、40.87%和4.94%。由于建设用地、其他地类与地形参数之间的关系并不显著,因此,这两个地类没有被改进,空间一致性指标值变化不大,其微小的变化主要是由前面三种地类的改进而引起的被动变化。
表6 改进前后的MODIS产品与参考数据产品空间一致性 %
上述结果与基于整个研究区域建模改进分类的效果(林地、草地、耕地的空间一致性比率分别提高8.55%、27.44%、7.23%)相比,林地、草地等自然土地覆被类型的改进效果更加明显,分别由8.55%和27.44%上升到30.02%和40.87%;耕地的改进效果基本持平且略有下降。主要原因是,本文基于土地覆被类型分布与地形因子之间的关系来改进土地覆被分类精度,由于京津冀地区的绝大部分耕地都分布在低海拔的平原地区,而在平原地区,地形参数基本趋同(没有差异),难以起到控制参数的作用。因此,出现了林地、草地(主要分布在丘陵、山地、高原,地形因子丰富)空间一致性大幅度提升,而耕地的空间一致性比率变化不大的情况。
因此,可以得到结论:对于林地、草地等与地形因子关系密切的自然土地覆被类型而言,基于分类一致区数据建模改进MODIS土地覆被产品分类精度的效果,比用整个研究区数据建模的效果更好。
本文基于参考数据与目标数据的分类一致区,构建海拔高度、坡度、坡向、地表切割深度和地表起伏度等地形因子与土地覆被类型面积占比之间的定量关系,并以此来改进目标数据中分类精度较低区域的分类精度,从而达到提高目标产品整体分类精度的目的。主要结论如下。
1)地形地貌对土地覆被类型的形成具有重要影响,甚至起着决定性的作用。土地覆被类型(面积占比)与地形因子之间具有很强的相关关系,基于这种定量关系对土地覆被分类进行改进是完全可行的。
2)基于土地覆被类型(面积占比)与地形因子之间的关系模型来改进土地覆被分类,建模所用数据是关键。在参考数据与目标对象的分类一致区,由于土地覆被分类的可靠性更高,所建模型的精度也会更高。因此,理论上,基于分类一致区建模来改进目标产品的分类精度,比基于整个区域建模改进目标产品的分类精度的效果更加明显。
3)本文从面积构成比例和空间一致性比率两个指标实际证明了,基于分类一致区建模来改进目标产品的分类精度,比基于整个区域建模改进目标产品的分类精度的效果更加有效,特别是对那些与地形因子关系密切的林地、草地等土地覆被类型。