廖珊珊 张建宇
摘 要:本文以广西扶绥县为例,在对甘蔗种植区特征分析基础上,运用面向对象的高分辨率影像特征提取的方法,采取多尺度分割,分别采取不同的信息提取策略,得到试验区信息分类成果。着重讨论面向对象的高分辨率遙感信息提取的关键技术,探讨光谱特征、形状特征、纹理特征、典型特征等在甘蔗地种植区信息提取中的最优参数选择及具体应用,并对其分类结果进行精度验证和评价。研究结果表明,试验区影像分类的精度较高,且在一定程度上提高了面向对象信息提取的效率和自动化程度。
关键词:面向对象 多尺度分割 高分辨率影像 甘蔗 精度评价
中图分类号:S566 文献标识码:A 文章编号:1674-098X(2019)06(b)-0124-03
本文以广西扶绥县为研究区域,以甘蔗地种植区为研究对象,采用面向对象的遥感影像分析方法,在影像分割基础上得到对象,充分利用对象特征,探讨利用eCognition软件对北京二号高分遥感影像进行分类具体应用,从而实现信息有效提取。基于面向对象的甘蔗种植区的遥感影像处理技术,突破了着眼于关注地物局部细节而忽略地物图斑的整体纹理及结构信息导致的分类精度降低的缺陷,解决了“同谱异物”及“同物异谱”问题,避免了“椒盐现象”[2],有效地提高了甘蔗地识别的精度和效率,对广西糖料蔗生产保护区及“双高”基地的划定、管理及监测具有重要意义。
1 试验区数据
1.1 试验数据
试验所用的遥感图像数据为北京2号卫星拍摄的广西扶绥县遥感影像,成像时间为2017年8月,影像数据共有4个光谱波段,空间分辨率为0.8m,波段范围分别为:蓝光波段0.45~0.9?m、绿光波段0.52~0.59?m、红光波段0.63~0.69?m、近红外波段0.77~0.89?m。本文选取具有代表性的4000*4000像素的子区进行试验研究。影像经过辐射定标、大气校正、正射校正和融合处理等预处理后,获取研究区影像。根据试验区所在区域的先验知识、专题资料和人工目视解译,将研究区地物大类分为道路、水体、建筑物、林地、耕地、裸地和云层共7种地物类别。
1.2 真值数据
广西第一次全国地理国情普查成果数据2017年通过验收,数据范围覆盖了广西全省经过遥感人工目视解译与外业实地调绘核实的地理国情要素,可认定为真值。
2 研究方法
2.1 技术路线
在影像多尺度分割的基础上,以遥感影像认知和地学理解为主要分析视角,合理选择目标地物的分类特征,开展研究区高分辨率影像分类研究。本文探讨采用eCognition软件对广西扶绥县高分影像进行最优分割尺度分割,根据特征类别对影像对象特征赋值,再依据人工目视解译数据用于样本训练,并结合样本监督分类,高效高精度地提取地物对象,最后利用国情普查数据检查样本,并对分类结果进行精度评价分析,分类结果精度较高。具体技术路线如图1所示。
2.2 多尺度影像分割
影像分割依据同质性或异质准则,把图像分为一定数量具有特征差异的子区域,这些子区域内部像元具有某种共性,且内部相互联系,且相邻的子区域有明显的差异性,是面向对象的遥感影像分类的基本单元[1]。eCognition软件中的多尺度分割算法,是采用基于异质性最小的一种区域合并算法,其目标是实现分割后影像对象保持各自同质性最大的限度同时其平均异质性最小化,完成两两区域合并实现的自上而下的分割方法[3]。经试验,FNEA分割算法符合试验区数据要求。FNEA分割算法异质性规则加权成分如图2所示,其中Wcolor代表的是颜色因子权重,Wshape指的是形状因子权重,两者权重相加之和为 1;Wcom和Wsmo则表示紧凑度和平滑度的权重,两者权重和也为1[2]。试验区多尺度分割结果如图3所示。
2.3 特征类别分析
2.3.1 形状特征
一般情况下,人工地物的几何形状较为规则,如道路、建筑用地等。地类对象的几何形状特征提取是基于影像对象的矢量来建立几何形状特征提取的模型,形状指标由光滑度和破碎化程度两个参数来决定,两参数权重和为1。
2.3.2 光谱特征
植被的反射光谱特征可使其在遥感影像上与其他地物相区别,可利用光谱特征提取植被要素。随着遥感影像空间分辨率的提高,高分辨率影像中同类地物的光谱特征也表现的更复杂也更多,最直接的表现是:影像中的单个像元混合表现多个地物的情况减少了,而仅表现一个地物的单个像元增多了,高分辨率影像中不同类别的地物能在影像空间上区分出来了。
2.3.3 纹理特征
面向对象的纹理分析,一种方法是使用eCognition Developer提供的预定义纹理特征,即由子对象的光谱属性、对比以及形状属性等纹理表征来描述影像对象;另一种是分析已分类的子对象的组成,类相关特征(Relations to Sub-Objects)可用于提供一个影像对象的纹理信息。灰度共生矩阵(GLCM)可提供影像灰度值的方向、变化幅度和间隔等信息,但灰度共生矩阵并不能直接区别纹理之间差异,因此需要对灰度共生矩阵提取一些能够定量描述纹理特征的相关统计属性。常用于描述影像中纹理信息的灰度共生矩阵的统计属性主要有8种。
本试验区以突出影像中纹理的脊线和谷线的信息对比度为目的,一方面能够更大显示纹理信息,另一方面也能够去除对影像产生质量影响的各种噪声。首先把全色的影像进行转换而生成灰度影像,然后对得到的灰度影像再进行归一化处理,最后再对归一化成果进行二值化处理,从而得到纹理特征增强后的影像,最后利用灰度共生矩阵特征量描述影像区域纹理用以提出影像地类信息[4]。
2.3.4 典型特征
遥感图像上的植被信息主要通过绿色植物叶子和植被冠层的光谱特性及其差异、变化反映。基于样本学习,根据上述特征分类可有效剔除平地层中大部分的水体、裸地、道路、居民地等非植被地物,并区分出植被大类,如林地与耕地。但要从耕地内区分出甘蔗种植区,还需要增加三个典型特征指数,比值植被指数(RVI)、归一化植被指数(NDVI)和归一化水指数(NDWI)。NDVI、NDWI、RVI值的综合应用可提取植被信息,也可以根据NDVI值与RVI值的范围剔除非甘蔗地种植区的其它植被作物。不同地类反应的NDVI和RVI范围值不同,甘蔗地种植区的NDVI值区间在0.25~0.55,RVI值区间在1.8~3.0。
2.4 決策树算法
决策树算法(CART分类树和回归树)是常见的用于数据约简的方法,需要做一系列的决策以将数据分为许多个内部同质的子集,其目标是创建一个模型基于一些输入的变量可以预测目标变量值,树可以通过对基于属性值的测试将原集分割为子集进行学习。建立树算法进行分析的目的是为了决定一系列if-then逻辑(分割)条件,决策树算法中每个节点需要的样本数量的最小值取决于参数Min sample count。如果决策树有太少的分支会失去提高分类精度的机会,而如果有太多的分支则会出现冗余,需在eCognition中通过设置“Cross validation folds”进行交叉验证。对于交叉验证来说,分类树根据学习样本计算出来,并其预测精度由测试样本进行测试[3]。该试验区决策树分析过程如图5所示。
3 结果与分析
3.1 分类结果
通过对影像特征类别隶属度函数分析,隶属度值的计算是根据函数的斜率计算隶属的函数值,依据对象与样本的不同距离,可得到不同的隶属度值。设定特征类别函数的模糊区间,将其相互之间差异大的进行组合,被分类的对象与样本的特征空间距离由所有特征的标准差、波段均值、亮度等特征值进行标准化,可实现不同特征在特征空间中的组合分类。经过反复大量的实验,进行影像信息提取决策树规则的构建,再由每种特征确定出最准确的分类阈值范围,根据以上结果,进行“与”运算,由于本次试验主要目的是提取甘蔗种植区信息,重点将对耕地分类予以确定,基于面向对象分类后的耕地图斑按特征类别分类综合提取后,分类为耕地甘蔗地种植区(Farmland sugarcane)以及耕地非甘蔗地种植区(Farmland No sugar)。试验区基于面向对象的分类效果如图6所示。从图中可看出,甘蔗种植区域分布较广,种植面积大小较为规则,旱地与水田均有甘蔗种植区,道路周围区域种植面积较多也较为成片。
3.2 精度评价
混淆矩阵法是目前分类精度评价中使用范围最广的方法。本试验区以人工目译与先验知识获取的218个样本对象为精度评价的样本,该训练样本均匀分布在整个研究区,约占总分类对象的15%,而检验样本则利用随机采样法选取620个地类要素图斑点为真值数据检验点进行分类结果验证,云层无真值不参与精度评价故删除,最后采用混淆矩阵方法获得试验区误差矩阵,对试验区各种类别遥感信息的制图精度、用户精度、Kappa系数进行分析并得出面向对象分类精度评价,Kappa系数为0.87394,甘蔗地种植区的用户精度和生产精度均高于95%,结果显示见表1,可得出试验区影像分类的精度较好,满足应用的需求。
3.3 结果分析
对比分析以上试验,得出如下结论。
(1)基于面向对象的信息提取方法可灵活运用地物的形状、光谱和纹理等特征信息,相比基于像元的传统分类方法,能得到更多的地物信息和更好的提取效果。
(2)通过多尺度影像分割算法,基于面向对象的信息分类提取方法能保持分类对象在空间上的连续性,有效避免椒盐噪声现象。
(3)纹理是图斑精细分类信息提取最重要的影响因素。寻找对象的显著特征对面向对象的信息提取至关重要,虽费时长但精度高。在后续深度学习中,可强化纹理特征提取方法的应用。
(4)决策树算法可更充分合理的利用提取的这些对象的特征,能从众多的特征中选择出最优的特征,进而提取出分类规则,对提出的决策树规则能够实现可视化,并在分类过程中对建立的规则加入人工干预。
综上所述,随着影像空间分辨率的提高,基于面向对象的影像分类信息提取方法通过机器学习影像特征类别自动分析识别分类,并通过决策树算法人工干预分类规则与类别参数,用于精细化提取出甘蔗地,既减少外业核查工作量,又提高地类识别提取效率。
参考文献
[1] 陈启浩.面向对象的多源遥感数据分类技术研究与实现[D].中国地质大学,2007.
[2] 李莉.面向对象的高分辨率遥感影像信息提取研究[D].成都理工大学,2012.
[3] 张振勇,王萍,朱鲁,等.eCognition技术在高分辨率遥感影像信息提取中的应用[J].国土资源信息化,2007(2):15-17.
[4] 李敏,崔世勇,李成名,等.面向对象的高分辨率遥感影像信息提取—以耕地提取为例[J].遥感信息,2008(6):63-66.