李晓靖,彭道黎,王海宾
(北京林业大学 林学院, 北京 100083)
基于最优尺度和规则的高分辨率影像分类研究
李晓靖,彭道黎,王海宾
(北京林业大学 林学院, 北京 100083)
高分辨率影像的广泛应用推进面向对象影像分析(OBIA)的发展,而分割作为面向对象分类的关键步骤,其尺度的选择直接关系到地物信息的提取。空间尺度是地物的固有属性,在合适的分割尺度下可以更好地挖掘地物信息。本文结合最大面积法和分割质量评价模型对张山营镇影像进行分割实验,先通过分析对象最大面积初步得到最优尺度范围,后结合分割质量评价模型以确定最优分割尺度层次。在此基础上,综合样本提取的光谱、纹理等特征进行规则训练,最终完成面向对象的土地覆被分类研究。结果显示:基于多层次最优尺度的规则分类方法获得更好的分类结果,其总体精度为88.8%,Kappa系数为0.861,而基于单一尺度的最邻近法总体精度81.4%,Kappa系数0.773,基于单一尺度的规则分类法总体精度为83.2%, Kappa系数为0.85。
面向对象分类;多尺度分割;最优尺度;规则;尺度层次
面向对象影像分析(OBIA)是一种公认的处理高分辨率遥感影像的有效手段,克服传统基于像元的分类技术中存在的缺陷,如“椒盐现象”、不易区分同谱异物的地物类型、运算速度缓慢等,提高分辨率影像的分类处理精度[1-7]。虽然在理论上图像分析表现优异,但是实际操作中精度依赖于分割尺度的确定和分析水平。影像分割是影像处理的重要环节,分割尺度的选择直接关系到后续分类的效果,分割尺度合适的情况下,地物的信息能够被更好的挖掘,分类精度也会随之提高。不同地物间最优分割尺度差异很大,如何确定适宜各类地物的分割尺度,提高分类精度是目前面向对象影像处理的热点问题之一[8-10]。
在探索最优分割尺度的过程中,国内外研究人员提出并试验了多种方法,具体主要包括指标评价法、模型计算法和经验选择法三类[11]。Woodcock通过计算局部方差来确定最优尺度,这一方法也成为研究尺度问题的经典[12];张俊针对“类内同质性大、类间异质性大”的分类原则,提出了面向对象的RMAS法[13];朱成杰采用评价指标(准确率P、查全率R、相对相似性S)来度量欠分割和过分割的程度[14];陈杰通过计算信息熵分析有效尺度范围,使影像丘陵农田的提取精度达到73.06%[15]。这些研究表明,通过实验确定最优分割尺度可改进影像的分类效果,但是基于单一方法判断最优分割尺度以及单一的最优尺度依然存在一些局限。据此,本文采用最大面积法和分割质量评价模型,对北京市延庆区张山营镇的QuickBird影像进行分割实验。先通过计算分割对象最大面积得到最优尺度的取值范围,后依据评价模型判断最终的最优尺度层次,并根据地物样本的光谱和空间特征信息建立多层次的分类规则结构。结果表明,这种基于多层次最优尺度和规则的分类精度明显优于基于单一分割尺度的分类方式。
多尺度分割(Multiresolution Segmentation)是eCognition软件的核心分割算法,能够有效利用光谱信息和空间信息进行图像分割[16]。它是一种自下而上(bottom-up)的区域合并技术,在分割的过程中,执行邻域间异质性的计算,若异质性小于预设阈值,则将像元合并入内部,若异质性超过阈值时则停止合并[17]。这种分割方式最终得到数个内部像元同质性最大的对象,而且预设尺度越大,生成的分割对象越少,面积越大。在处理影像时,可以构建多层次分割体系,进行不等空间的多次分割与合并,确保目标地物能一个或多个地物来表示,避免欠分割现象的发生。所以尺度的确定是本研究的一个关键问题之一。多尺度分割参数(形状、紧实度)的设定组合差异同样影响地物的信息提取,为不影响分割尺度效果判断,本研究中统一设定为0.3,0.5[1]。
1.1 主要涉及的最优尺度计算方法
1)最大面积法。最大面积在这里是指影像分割对象的最大面积,随分割尺度的逐渐增大,影像对象的面积大小应不超过其类别实体的固有大小,即在一定尺度范围内,影像对象的最大面积值保持稳定,那么该尺度范围能较好的表示该类地物的实际大小[18]。但对于地物比较复杂的遥感影像,该方法并不能适用于所有类别,因为有些地物在分割尺度变化过程中一直处于最大面积状态,这样地物的最优分割尺度难以确定,需要配合其他方法使用。
2)均值方差法。当分割尺度适合某类地物时,分割对象大小与地物实际面积对应,此时对象与其他对象之间在光谱、纹理、空间结构等方面都存在较大的差异,达到较好的分割效果。当对象间均值方差最大时,其所对应的分割尺度是最优的,这种方法能够有效避免目视分割效果的主观误判。但是在使用均值方差法评价分割质量时,只考虑了单波段的信息,且没有考虑对象内部同质性变化对分割效果的影响。
1.2 最优尺度确定方法及改进的基于多波段的模型计算
首先通过统计对象最大面积,绘制统计曲线图,得到一个最优分割尺度的模糊取值范围。结合模糊取值范围和分割效果评价模型的计算结果,最终确定分割体系的最优层次尺度。
理想分割结果特征在各个波段都能够一定程度上体现。李朝奎面向对象和规则的高分影像分类研究中,只考虑了对象间的异质性情况分割尺度,忽视了内部同质性的分割效果[10]。综合考虑多波段特征及对象内外信息,提出了改进的最优尺度评价模型,以便确定最优的分割尺度层次。
最优尺度的分割质量由两部分体现,一部分是对象内部的同质性,以对象内部的标准差来表现[16]。另一部分是对象间的异质性,以对象间均值方差来表现[10]。
(1)
(2)
式中:Vb为b波段的对象同质性指数,n为分割对象的总个数,ai是对象i的面积,引入面积因子是为了避免小对象造成的不稳定性,Vi是对象i在b波段的标准差;V为总同质性指数,其数值为各个波段的同质性加权平均值,N为波段个数,tb为波段b的权重。V数值越小,意味着内部异质性越小,同质性越高,分割效果则越佳。
(3)
(4)
(5)
(6)
为了得到量纲一致的同质性和异质性指数,对上述结果先做归一化处理,后根据同质性和异质性的标准化因子构建分割质量评价模型F:
(7)
(8)
F=wF(V)+(1-w)F(S2).
(9)
式中:F为分割质量评价函数,也就是目标函数,F(V)为归一化同质性函数,F(S2)为归一化异质性函数,w为权重,其范围为[0,1]。
基于模型计算,可以得到试验尺度范围的分割质量值,通过绘制质量值曲线,确定波峰位置,其所对应的尺度即为所求。
2.1 数据与预处理
本文采用北京市延庆县张山营镇的QuickBird影像作为数据源,其多光谱影像空间分辨率为2.44 m(包括蓝、绿、红、近红外4个波段),全色影像空间分辨率为0.6 m。影像经过几何校正、影像融合、影像裁剪的预处理。在前人有关高分辨率影像融合的研究中, Gram-Schmidt Pan Sharpening算法具有较好的融合效果[19],故本文选择此种方法进行影像融合。为了对地区进行完整的分类研究,影像的裁剪区域较大,为7 594像素×9 276像素。最后以研究区踏查结果和同期延庆县二类调查小班数据结合目视解译结果作为验证数据源。
2.2 最优分割尺度的确定
确定分割尺度是面向对象分类中至关重要的一环,直接影响着最终分类的精度。为了确定各种地物类别对应的最优分割尺度,本文选择30~200的尺度范围进行尺度梯度分割实验,间隔单位设为10。通过影像目视解译,确定研究区地物主要类型有:水体、林地、耕地、苗圃、建筑、道路、裸地7类,其中研究区建筑类地物面积较小,水体分布分散且有很多面积较小的小水洼,林地、耕地、苗圃的单位地物面积大。当分割尺度设定较大时,建筑、水体等会发生欠分割现象,与植被、裸地能混为一体,只有当分割尺度设定较小时,单个地物才能被完整的分割出来。不同尺度的分割效果见图1。
图1 不同预设尺度的分割效果
2.2.1 计算对象最大面积
根据分割尺度及其所对应的对象最大面积值绘制折线图(见图2),由图2分析可知最优分割尺度范围位于[60,70],[80,90],[100,120],[130,140],[160,200]。
图2 最大面积法最优尺度选择
2.2.2 基于多波段的分割质量模型计算
根据上述对象最大面积与分割尺度关系图,可以得到初步的最优分割尺度范围,借助分割质量模型进一步判定。确定各尺度下的同质性和异质性,把波段权重暂且都设为1。随分割尺度的递增,分割对象的数目越来越少,同质性指数总体呈递减趋势(见图3),异质性指数总体呈递增趋势(见图4),同质性和异质性因子本身的矛盾性。在本次分割实验中,侧重考虑异型性对分割结果的贡献,所以设w=0.3,也就是说同质性指标权重为0.3,异质性指标权重为0.7,分割质量模型结果如图5所示。
图3 同质性指标值与分割尺度的关系
图4 同质性指标值与尺度的关系
2.2.3 最优分割尺度选择
从图5可以看出,当分割尺度为160,150,100,60时,分割质量值位于波峰位置,同时结合最大面积的尺度取值区间,最终确定最优分割尺度为160,100,60三个层次。根据经验及目视分割效果确定不同地物类别的所属层次,林地、耕地、苗圃单位地物面积较大,为了避免过分割现象,采用160的尺度;水体、建筑具有很多面积很小的个体,为了保证最小的个体能够被完整的分割出来,故采用60的尺度;裸地、道路采用100的尺度,效果如图6所示。
图5 分割质量值与分割尺度的关系
2.3 特征信息提取与分类规则制定
2.3.1 样本采集
要对地物分别制定合适的规则及其他类别区别开来,深入理解各个类别的光谱、形状、空间特征。训练样本的采集和数据分析是理解地物特征的常用方式之一,训练样本的数量和质量直接决定着地物的特征能否被很好的表达与分析。根据7种地物的分割实验,本研究在其各自的最优分割尺度下选择样本。选择样本时注意样本的总面积与该类地物所占影像的总面积成正比,避免选择位于类别边缘、包含混合像元的样本。
2.3.2 特征信息提取
统计样本的光谱、空间特征值范围(部分特征值见表1),结合人工经验分析地物类别间的特征差异:用归一化植被指数NDVI值区分植被和非植被,归一化水体指数NDWI值区分水体和非水体[20];耕地、苗圃、建筑的形状偏向矩形,可以由Rectangular Fit与其他类别区分;道路有亮色、暗色两类,可以分别制定规则,裸地、道路(亮)及建筑的亮度值偏高;道路区别于其他地物的特征是其长宽比值大;苗圃一般位于交通便利的位置,可以用Distance to Road区别于一般林地。
2.4 建立分类规则体系
研究区域较大,为提高分类精度,需要利用光谱信息、空间信息等多方面的知识进行判断提取。在综合利用地物多种特征统计值的基础上,以eCognition软件为平台,进行多次分类试验,确定最终多层次分类判别规则,见表2。
表1 各地类样本部分特征值统计
表2 分类体系与规则
在实际分类操作中,结合合并工具,采用分割尺度递增的分类模式,具体分类过程如图7所示。首先基于60的尺度进行全图分割, 60的尺度下阴影为单独研究对象,且与水体光谱相近,在此利用NDWI值区分水体和非水体,阴影部分被很好地区分;然后合并非水体类别,对非水体执行尺度为160的重分割,后根据NDVI值区分植被和非植被部分。研究区大部分阴影为树影及山地起伏造成,由于其NDVI值较高且实际地类也属于植被区,故不单独提取;对于非植被区,重分割设置尺度为60,建立建筑提取规则,由于建筑和部分道路的光谱特征重合,暂时会有一定的错分情况;接着将剩余的非植被区合并,再进行尺度为100的重分割,设置道路和裸地的提取规则,同时对建筑类也执行合并与重分割,再根据道路提取规则(Length of main line等)排除错分的道路部分;最后对于植被区,设置苗圃和耕地的提取规则,提取这两类后,余下的部分为林地。这种多层次逐级分类方式,既能避免经典的由大尺度分割到小尺度分割造成的小类别归并错误,又能充分利用层次间的继承关系与局部差异性,提高高分辨率影像分类的效率与准确性。
为了更好地比较本方法与以往单一尺度分割方式的分类结果,进行基于单一尺度的分割分类试验。在实验中,保证所选样本位置固定,基于各个分割尺度执行最近邻分类,采用基于样本点(踏查结果、二调数据结合目视判别)的混淆矩阵进行精度验证,故分类精度最高的结果对应的尺度即为最优单一分割尺度,具体最近邻分类方法原理见文献[19]。实验结果表明,最邻近分类实验得到的最优尺度为110,此时分类精度相对最高,总体精度为81.4%,Kappa系数为0.773,但错分地类零星散布,建筑、裸地、苗圃分类效果较差,见图8(c)。同样基于110的分割尺度,延续上文所用隶属度函数(少量修改,如去掉面积约束)的规则分类结果,其总体精度为83.2%,Kappa系数为0.85,总体效果尚可,但个别类别如苗圃,精度只有48.3%,见图8(b)。而经本文的方法进行分类后,地类破碎程度得到很大程度的改善,将分类结果与已知类别的验证样本比较,结果显示,基于最优尺度层次和规则的面向对象分类总精度为88.8%,Kappa系数为0.861(见表3),比基于单一尺度的分类精度提高了6%~8%,且高度改善了小面积地物的错分情况,如图8(a)所示。从单个类别的分类结果分析,水体、林地的分类效果较好,而光谱信息相近的建筑、裸地、道路三类别效果欠佳,其中裸地的错分现象、建筑的漏分现象比较严重,苗圃的分类规则也还需要完善。另外,经提取过程后,仍然有零星的建筑阴影没有被赋予类别,因为其面积很小,对整个研究区的分类影像可以忽略,故在此没有进行进一步的研究。
图7 具体分类流程
上述结果表明,基于多层次最优尺度的分类优于基于单一分割尺度的方法,能够充分利用类别间局部差异和继承关系,而制定规则区分地物的分类方法可以帮助减少地物的零散与错误情况。总的来说,本文研究方法能够有效区分高分辨率影像的地物类别,为将来影像精细分类提供经验参考。
1)本文利用面向对象的方法,综合分割对象最大面积和评价模型确定多尺度分割层次,弥补使用单一方法在判断合适尺度的局限和不足。在分割尺度的选择上,确定最优尺度层次而非单一最优尺度,能够利用不同类型地物的完整信息和类间关联进行提取。在分类的过程中,结合合并工具的使用,进行由小尺度地物到大尺度地物的分类,使地物间的继承关系与局部差异较好的体现。在分析地物特征信息的基础上,采用基于规则的方法对张山营镇的影像进行分类,总体精度达到了88.8%,Kappa系数为0.861,明显优于基于单一尺度的最近邻分类和规则分类。表明结合最优分割尺度和基于规则的方法能够较为准确获取土地利用类型,为高分辨率的精细分类提供了经验和参考。
2)规则的制定直接影响最终的规则分类结果,由于提取建筑的规则较为粗泛,所以研究中建筑的过度提取比较明显,其生产者精度高而错分现象较为严重,所以用户精度只有不到80%。而对于某些地类,如建筑、苗圃等,其光谱信息与其他某些地类没有明显区别,单一以纹理、空间信息加以区分效果较差,建筑生产者精度只有66.2%,苗圃的生产者精度只有63.3%,说明现有的方法和规则不能对其进行准确地信息提取,需要进一步的研究。
3)同时,基于规则的分类方法依赖于研究者的主观分析判断水平,为提高分类效果,本文选取特征规则数目较多,优选、排除的过程也较为繁杂,如何改进、简化分类过程也是后续的研究方向。
[1] 崔一娇,朱琳,赵力娟. 基于面向对象及光谱特征的植被信息提取与分析[J].生态学报,2013,33(3):867-875.
[2] ANDRESEN T, MOTT C, ZIMMERMANN S, et al. Object-oriented information extraction for the monitoring of sensitive aquatic environments[C]. IEEE International Geoscience and Remote Sensing Symposium(IGARSS), 2002, 5:3083-3085.
[3] JACQUIN A, MISAKOVA L. A hybrid object-based classification approach for mapping urban sprawl in periurban environment[J]. Landscape and Urban Planning, 2008,84:152-165.
[4] BLASCHKE T. Object based Image Analysis for Remote Sensing[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(1):2-16.
[5] 朱俊杰,范湘涛,杜小平. 面向对象的高分辨率遥感图像分析[M].北京:科学出版社,2014:4-10.
[6] 陈杰,邓敏,肖鹏峰,等.粗糙集高分辨率遥感影像面向对象分类[J]. 遥感学报,2010,14(6):1139-1155.
[7] 甘甜, 李金平, 李小强, 等. 面向对象的高分辨率遥感影像建筑物震害信息提取[J]. 测绘工程, 2015,24(4):11-15.
[8] 郭建聪,李培军,肖晓柏. 一种高分辨率多光谱图像的多尺度分割算法[J]. 北京大学学报(自然科学版),2009,45(2):306-310.
[9] JOHNSON B, XIE Zhixiao. Unsupervised image segmentation evaluation and refinement using a multi-scale approach[J]. SPRS Journal of Photogrammetry and Remote Sensing, 2011, 66:473-483.
[10] 李朝奎,方文,董小姣. 面向对象和规则的高分辨率影像分类研究[J].测绘通报,2015(9):9-13.
[11] 朱红春,蔡丽杰,刘海英,等. 高分辨率影像分类的最优分割尺度计算[J].测绘科学,2015(3):71-75.
[12] WOODCOCK C E, STRAHLER A H. The factor of scale in remote sensing[J]. Remote Sens Environ, 1987, 21(3):311-332.
[13] 张俊,朱国龙,李妍. 面向对象高分辨率影像信息提取中的尺度效应及最优尺度研究[J].测绘科学,2011,36(2):107-110.
[14] 朱成杰,杨世植,崔生成,等. 面向对象的高分辨率遥感影像分割精度评价方法[J].强激光与粒子束,2015,27(6):37-43.
[15] 陈杰,陈铁桥,梅小明,等. 基于最优尺度选择的高分辨率遥感影像丘陵农田提取[J].农业工程学报,2014,30(5):99-106.
[16] 刘兆祎,李鑫慧, 沈润平,等. 高分辨率遥感影像分割的最优尺度选择[J].计算机工程与应用,2014, 50(6):144-147.
[17] 宋晓阳,姜小三,江东,等. 基于面向对象的高分影像分类研究[J]. 遥感技术与应用,2015,30(1):99-105.
[18] 黄慧萍. 面向对象影像分析中的尺度问题研究[D].北京:中国科学院研究生院(遥感应用研究所),2003.
[19] 别强,何磊,赵传燕. 基于影像融合和面向对象技术的植被信息提取研究[J].遥感技术与应用,2014,29(1):164-171.
[20] 孔博,邓伟,李爱农,等. 多源数据的面向对象国际河流土地覆被分类研究[J].武汉大学学报(信息科学版), 2015, 40(7):943-949.
[责任编辑:李铭娜]
Classification of high-resolution image based on optimal scale and rule
LI Xiaojing, PENG Daoli,WANG Haibin
(Forestry College,Beijing Forestry University,Beijing 100083,China)
The development of object-oriented classification technology has been promoted by extensive application of high-resolution image, and with segmentation as one key step of object-oriented classification, the selection of segmentation scale determines the result of information extraction. Spatial scale is an inherent attribute of the object, and the information of the object can be better recognized under the appropriate segmentation scale. Based on QuickBird image of Zhangshanying town, a segmentation experiment has been carried out in the scope of 30~200scale. An optimal scale range is obtained by analyzing the maximum area of the objects, and then the final scale level is determined by the segmentation quality assessment model. According to the spectrum and texture feature provided by the samples, the rules of object-oriented classification are built to finish the extraction of land cover type. The result shows that the method based on optimal scales and rules is more effective in high-resolution image information extraction than that based on single scale, which overall accuracy reaches 88.8%, and Kappa coefficient is 0.861.While the overall accuracy of the nearest neighbor method based on single scale is 81.4% and the overall accuracy of the method based on rules and single scale is 83.2%.
object-oriented classification;multi-scale segmentation;optimal scale;rule;scale level
2016-06-27
国家林业局948资助项目(2015-4-32);国家重点林业工程监测技术示范推广项目(2015-02)
李晓靖(1991-)女,硕士研究生.
彭道黎(1963-)男,教授,博士.
著录:李晓靖,彭道黎,王海宾.基于最优尺度和规则的高分辨率影像分类研究[J].测绘工程,2017,26(9):14-22.
10.19349/j.cnki.issn1006-7949.2017.09.004
TP75;S257
A
1006-7949(2017)09-0014-09