李 卓,韩文超,胡起源,高 翔,王林林,肖 飞,刘文超,郭文华,孙丹峰※
(1. 中国农业大学土地科学与技术学院,北京 100193;2. 自然资源部城市国土资源监测与仿真重点实验室,深圳 518034;3. 自然资源部信息中心,北京 100036)
土地利用/覆被分类是自然资源监管督察的重要内容之一。充分挖掘遥感技术在土地利用/覆被信息提取的优势,可快速、持续且成本低廉地为决策部门提供基础资料[1-2]。当今,日益复杂的土地利用模式和破碎的地物斑块对基于遥感技术的土地利用/覆被分类提出了新挑战[3]。一方面,以像元为基本单元的传统遥感影像解译法存在着混合像元对精度影响的弊端[4]。另一方面,如何综合利用地物光谱、纹理、形状信息及各对象间的关系结构特征一直是土地利用/覆被分类研究的重点和热点[5-6]。因此,进一步探索多种方法融合的土地利用/覆被分类技术,实现基于遥感影像的自动化、高精度的土地要素识别和特征信息提取,对构建土地资源调查监测技术体系和国土空间优化布局具有现实意义。
面向对象的土地利用/覆被分类技术是以相邻像元为对象,综合考虑光谱、形状和纹理等多种属性[7],在一定程度上削弱了混合像元对地物特征信息提取的干扰,因此具有精度高、时效性强等优势,已得到了广泛的应用[8-10]。基于光谱、形状和纹理特征构建的地物信息提取规则是面向对象分类法的优势,但也存在一定缺陷。相较于传统基于像元的土地利用/覆被分类法,面向对象分类法的优势在于地物形状特征和纹理特征的应用,但对地物光谱特征的利用还存在一定的改进空间[11-12]。面向对象分类法对光谱信息的使用主要是通过多种光谱指数构建目标地物的光谱特征集。利用众多的光谱指数如植被指数、土壤指数、水体指数和建筑指数等,虽然能在一定程度上增强了不同地物在不同波段上光谱信息的差异性[13-14],但对地物的物理意义解释仍然不足[15]。另外,受遥感影像空间分辨率的限制,由多种地物组成的混合像元模糊了地物的典型光谱特征,影响了真实地物信息的提取。因此,有必要基于典型地物的光谱特征信息,改进光谱特征的提取规则,提高地物信息的提取效率。
光谱混合分解模型将混合像元的光谱信息分解为多种光谱端元和端元丰度值[16]。地表标准光谱端元是一种具有物理意义的单位空间[17],其丰度值表征了各地物在混合像元中所占的比例,可以连续地描述地表物质的异质性梯度,能更准确地反映地表信息[18]。光谱混合分解模型依靠具有典型物理意义的端元及其简洁性,已被广泛应用于土地利用/覆被信息提取、分类制图、生物量估算等研究领域[19-20]。基于上述分析,利用典型光谱端元优化地物信息的提取规则,对提升土地利用/覆被分类的准确率具有较大潜力。一方面,光谱混合分解的过程,本质上是对混合像元进行亚像元尺度的分解,是理解光谱变异的有效方法。另外,多端元的融合增强了地表的组分信息,相较于传统光谱指数,在反演植被等景观要素的信息时具有显著优势。因此,本文以江苏省南京市六合区为例,基于Sentinel-2A遥感影像,开展融合光谱混合分解与面向对象法的土地利用/覆被分类研究,旨在优化地物光谱特征的提取规则,提高分类精度,为土地资源调查监测技术体系的构建提供技术支持。
六合区位于江苏省南京市北部,是长三角地区重要的现代化服务中心。如图1所示,研究区选择为六合区北部竹镇、马鞍街道、程桥街道3个乡镇,区域面积共计590 km2。研究区地貌大部分为丘陵山岗,属宁镇扬山区。该区域土地覆被类型丰富,其中耕地分布最为广泛,是主要的土地利用类型。另外,低山、高丘分布有大量的林草地,城乡居民用地分布相对集中,主要处于平原圩区。另外,在研究区选择了120个样本点,进行地物提取规则改进前后的精度评价。
本研究使用的Sentinel-2A 遥感影像来源于欧洲航天局(European Space Agency, ESA),获取时间为2018年9月4日。该影像数据级别为L2A级,已通过辐射定标、正射校正、大气校正等预处理,数据质量良好。该数据具有13个波段,覆盖范围从可见光、近红外到短波红外,空间分辨率最高可达10 m。Sentinel-2A遥感影像具有丰富的光谱波段和较高的空间分辨率。因此,该数据集契合了基于面向对象法土地利用信息提取的基本要求,可充分发挥地物多尺度分割的优势[21-22]。另外,该影像的3个植被红边波段(B5、B6、B7)已被证实在植被信息的提取中具有较好的应用前景[23]。得益于该数据集丰富的光谱信息,为本研究基于光谱混合分解模型优化光谱特征的地物信息提取规则提供了巨大潜力[24-25]。
参考《土地利用现状分类》(GB/T21010-2017)、中国科学院土地利用遥感监测分类系统和研究区土地利用特征,本研究主要对水体、耕地、城乡用地、交通用地和林草地共5类土地利用类型进行提取试验。在本研究中,水体包含了河流、湖泊、坑塘等,耕地主要为水田和旱地,城乡居民用地为城镇、村庄等,林草地主要为林地、灌木林地、园地及草地。另外,由于研究区内的交通用地在影像展示出显著的形状、纹理特征,因此本研究将其单独列为提取对象之一,用于检测形状特征和纹理特征的地物提取规则的可行性。研究区不同土地利用/覆被类型的典型影像如图2所示。
影像的多尺度分割是面向对象分类法成功的关键,但分割效果受波段数量、形状参数、尺度参数等多种因素影响,易造成分割尺度的过度或不足导致土地利用信息的提取精度的降低[26]。通常确定最佳分割尺度要综合考虑研究区地物和影像特征,进行反复测试、模拟。ESP(Estimation of Scale Parameter)工具是一种自下而上的区域合并技术,能通过迭代分割产生最优分割参数[27]。本研究使用ESP工具评估了研究区影像的最优分割参数。最佳分割尺度的判定通常以分割对象同质性局部方差(Local Variance,LV)及其变化率ROC(Rates of Change)表示[28]。ROC的计算公式为最佳分割尺度时应具有代表性,突出所选不同分割尺度的特点。本研究充分考量了所选分割尺度周边区域多个极值点的差异性,尽可能突出不同峰值间的特征,目的是最大化地区分不同地物的最佳分割尺度。基于ROC曲线的趋势可以看出,变化率在0.4以上时曲线变化较大,且在分割尺度为70时,出现了显著的极小值,因此在其前后分别选择65和80作为两个最佳分割尺度;当变化率低于0.4时,ROC曲线的变化程度不大,因此在分割尺度较大处选择125为另一个最佳分割尺度。最终,本研究选择65、80、125为最佳分割尺度,几种典型地物的分割效果如图4所示。
式中ROC为LV的变化率,%,Ii为目标层第i对象层的平均标准差,Ii-1为目标层i-1对象层的平均标准差。本研究设置的分割层数为200,步长为5,光谱因子为0.7,形状因子为0.3,紧致度为0.5,光滑度为0.5。ESP分割尺度评价结果如图3所示,ROC在不同分割尺度出现了多个极值点。ROC的多个极值点是不同地物最佳分割尺度的体现,即各极值点均可能是最佳分割尺度。由于不同的分割尺度决定了影像分割的破碎程度,因此在选取
从不同分割尺度的对象中提取地物特征信息是面向对象法的关键[29]。因此,选择地物信息提取的具体方法尤其重要。本研究中采用模糊分类法,依据地物信息提取的难易程度,由易到难逐层提取土地利用/覆被信息,从而避免了误差的积累,提高了分类精度[30]。模糊分类在描述地物信息概念差异时,通过隶属度函数进行相对判断,削弱了主观设定的阈值的差异性,更符合真实规律[12]。在eCognition软件中,基于3个最优分割尺度,构建了具有3个层次的土地利用/覆被信息提取结构(图5)。在不同层次结构中共设置了NDWI(Normalized Difference Water Index)、NDVI(Normalized Difference Vegetation Index)、SBL(Soil Background Level)、Density等8个特征参数(表1)用于表达不同地物的光谱、形状和纹理特征,并使用模糊函数基于地物斑块进行地物信息的逐层次提取。具体步骤如下:
表1 地物特征提取变量集Table 1 Feature variable set in extraction rules
1)层次1中使用的分割尺度为125,用于水体和非水体的划分。基于归一化水体指数(NDWI)和缨帽变换的湿度指数(WET),设置模糊函数-0.3<NDWI<0.52、-630<WET<900提取水体。
2)层次2中使用的分割尺度为80,用于植被与非植被的划分。归一化植被指数(NDVI)对植被覆盖度具有较好的表征[14],本文设置识别植被的阈值为:NDVI>0.58。
3)层次3中设置的分割尺度为65,进行耕地、林草地、城乡居民点及交通用地的信息提取。在植被中设置阈值:SBL(土壤背景值)<2400、SBIMSS(土壤亮度指数)<3050,区分林草地与耕地。通过测试多种特征,在非植被中选择设置阈值为:Density(密度)<0.9、Length/Width(长宽比)>1.5和Entropy(熵)<5.8区分道路与城乡居民用地。
线性光谱混合分解模型的理论假设为传感器接收到的地面目标像元的辐射亮度只与各组分所占的面积比例有关[31]。因此,目标像元各个波段的反射率为像元内各端元在相应波段的反射率以及其所占像元面积比例为权重的线性组合。根据像元光谱计算亚像元级的各标准端元在像元内的面积百分比,即端元丰度值。具有明确物理意义的端元丰度值能更好地反映植被等景观要素的信息,这相较于其他传统信息提取理论来说,其精度相对更高[32]。
光谱混合分解的主要过程为端元选取和丰度值估计。本文采用主成分分析法对光谱空间进行主要特征的提取。表2为遥感影像经主成分变换后,前6个主成分的累计方差贡献率。前3个主成分的累计贡献率超过93.79%,说明前3个主成分几乎包含了所有的光谱特征信息,因此确定影像光谱信息的典型端元为3种。全球非冰层陆地表面均可由光谱空间中基质(SL;岩石和土壤)、植被(GV;光合作用叶片)和暗色物质(DA;阴影和水)3种通用端元进行表达[32]。然后在二维散点图的端点处分别选取3种端元光谱,最后进行丰度值估计。在本研究区中,暗色物质中的阴影主要为由山体遮挡、光谱反射率特征被削弱的植被。本研究区的3端元光谱特征曲线如图6所示,相应的丰度值见图7。
表2 前6个主成分的累计方差贡献率Table 2 Cumulative variance of the top six principle components
基于上述面向对象的分类规则(图5),尝试融合3端元增强地表组分信息,优化地物光谱特征的提取规则,提高土地利用/覆被的分类精度。首先通过均值法将斑块内的每个像元的端元丰度值聚合到该斑块,然后通过模糊函数进行地物信息的逐层次提取。具体步骤如下:
1)层次1中使用的分割尺度为125,用于水体和非水体的划分。基于DA,设置模糊函数DA>0.4提取水体。
2)层次2中使用的分割尺度为80,用于植被与非植被的划分。设置识别植被的阈值为:GV>0.44。
3)层次3中设置的分割尺度为65,进行耕地、林草地、城乡居民点及交通用地的信息提取。在植被中设置阈值:SL>0.25区分林草地与耕地。在非植被中选择设置阈值为:Density<0.9、Length/Width>1.5和Entropy<5.8区分道路与城乡居民用地。
为了评估3端元的光谱特征对地物信息提取规则的优化效果,分别计算融合光谱混合分解前后的土地利用/覆被分类结果的混淆矩阵。通过制图精度(Producer’s Accuracy, PA)、总体精度(Overall Accuracy, OA)和Kappa系数3项精度指标定量评估。总体精度和Kappa系数用于比较两种方法的整体提升效果,制图精度评估每种土地利用类型信息提取的优化程度。3项精度指标的计算公式(公式(2)~(4))分别为:
式中N为验证样本量,k为土地利用类型个数,Nii为正确提取的样本量,Ni+为第i类土地利用类型的监测样本量,N+i为第i类土地利用类型的真实样本量。
图8 为未使用3端元的面向对象土地利用/覆被分类结果(图8a)和融合3端元的分类结果(图8b)。对比结果,基于光谱混合分解模型改进后的地物提取规则,并未有大面积差异。本研究通过实地调查和其他高分辨率影像选取了120个样本点(图1b),分别对地物提取规则改进前后的进行分类精度评价。表3和表4为方法改进前后的混淆矩阵。土地利用/覆被信息提取规则改进后,总体精度由80.83%提升至90.00%,Kappa系数由0.76提升至0.88。对比各项地物类型的制图精度可以看出,耕地和水体的提升最大。图9为研究区土地利用/覆被分类规则改进后的主要纠错对象,即耕地错分为林草地和水体错分为城乡居民用地。
表3 未使用3端元的土地利用/覆被分类结果的混淆矩阵Table 3 Confusion matrix of land use/cover classification without three end members
表4 融合3端元的土地利用/覆被分类结果的混淆矩阵Table 4 Confusion matrix of land use/cover classification with three end members
光谱混合分解模型对地物提取规则的改动主要有:在第1层次中,以DA替代NDWI和WET指数;在第2层次中,以GV替代NDVI;在第3层次中,以SL替代SBL和SBIMSS。改进后的规则在降低特征维数的同时提高信息提取精度,证明了基于线性光谱混合分解模型的SL、GV、DA3端元替代传统光谱指数的可行性。端元对混合像元的精细化解译,提高了局部复杂景观要素的信息分类精度。例如,土地利用信息提取中,耕地被错分为林草地的概率较大,尤其是当耕地作物植被覆盖度较大时,两者土壤亮度相似,传统土壤-植被光谱指数不具有在亚像元尺度增强土壤与植被的差异化信息的优势。另外,水体被错分为城乡居民用地,主要发生在河岸泥沙、悬浮物较多的细碎区域,如图9所示。这是由于仅通过可见光和近红外波段的构建的水体指数难以准确抑制植被、土壤信息导致。而DA端元是多波段光谱混合分解后的水体信息,更能突出水体与其他地物的差异性。
基于面向对象的土地利用/覆被分类能充分利用高空间分辨率遥感影像的形状、纹理信息,具有较好的应用前景。但由于高空间分辨率影像的光谱波段有限以及传统光谱指数对混合像元解释力不足等原因,有必要融合光谱混合分解模型改进光谱特征的提取规则,提高分类精度和效率。本研究以Sentinel-2A遥感影像为数据源,尝试融合光谱混合分解与面向对象法的土地利用/覆被分类研究,得出以下结论:
1)通过面向对象的多尺度分割算法,构建的光谱、形状和纹理的地物提取规则,在3个层次使用模糊函数和阈值法进行土地利用/覆被分类,取得了较高的精度。研究区5种地物的分类总体精度为80.83%,Kappa系数为0.76。
2)由线性光谱混合分解所得的基质(SL;岩石和土壤)、植被(GV;光合作用叶片)和暗色物质(DA;阴影和水)3端元能够很好地表达研究区地表组分信息。融合3端元的地物提取规则提高了分类精度,总体精度提升至90.00%,Kappa系数提升至0.88。
3)对比融合光谱混合分解前后的分类结果,主要的纠错对象为耕地与林草地以及水体与城乡居民用地。错分的主要原因是常用的光谱指数是对植被与土壤间的亮度信息解析度不充分,而具有明确物理意义的3端元的融入增强了像元内各组分信息的差异性,为高效、正确的土地利用/覆被分类提供了帮助。
融合光谱混合分解与面向对象方法的土地利用/覆被分类简化了地物提取规则,提高了分类精度。本研究使用的3端元为通用的基础端元,后续针对不同研究区可进一步增添其他典型端元用于更精细的土地利用/覆被分类,如在干旱地区增设沙、盐等端元进行沙地和盐碱地的提取。