基于分水岭变换的遥感影像面向对象分类

2014-05-04 08:05朱文球邓刘昭芦胡永祥李建飞
湖南工业大学学报 2014年4期
关键词:分水岭面向对象聚类

朱文球,邓刘昭芦,胡永祥,李建飞

(计算机与通信学院湖南工业大学,湖南株洲412007)

基于分水岭变换的遥感影像面向对象分类

朱文球,邓刘昭芦,胡永祥,李建飞

(计算机与通信学院湖南工业大学,湖南株洲412007)

为了提高面向对象分类的自动化程度,提出将分水岭变换与ISODATA聚类相结合对遥感影像进行面向对象分类。首先利用改进的分水岭变换对高分遥感影像进行分割,获得分割的对象后,利用ISODATA聚类方法对其进行分类。试验结果表明,该方法取得了较好的分类效果,且分类速度快,一定程度上提高了遥感影像分类的自动化。

面向对象分类;分水岭变换;ISODATA聚类;高分辨率遥感影像

0 引言

随着高分辨率遥感影像的推广,使更多的遥感图像信息应用于遥感图像分类成为可能。由于类内混合像元及大量阴影的存在,从光谱波段非常有限的暗绿遥感影像中,获取准确的类别信息较困难[1]。然而,对于单个像元的光谱信息,利用其纹理、形状、尺度等特征可提高分类精度,但难以达到理想效果。因此,如何充分利用遥感影像各特征之间所存在的内在联系,成为了提高遥感影像分类精度的一大突破口。近年来,面向对象的遥感影像分类技术顺势而出。利用面向对象分类技术对遥感影像进行信息提取时,处理的最小单元不再是像元,而是含有更多语义信息的多个相邻像元组成的多尺度对象[2]。与传统的仅利用单个对象的光谱信息方法相比,面向对象分类技术可以充分利用对象的几何、语义、纹理和拓扑关系,且精度和效率更高。

遥感影像分割是面向对象分类技术的关键。M. Baatz 和A. Sch pe 于2000年提出了多尺度的FNEA(fractal net evolution appmach)分割算法[3]。该算法采用区域生长方法,由一个像元开始逐渐合并成较大影像对象,并采用多尺度分割寻求最佳分割尺度。该算法获得了较好的分类结果,因而被广泛使用。林卉等人[4]利用分水岭变换对遥感影像进行多尺度分割,取得了理想的效果。陈杰等人[5]将分水岭变换与空间聚类用于面向对象分类,提高了分类精度的同时,也提高了自动化程度。然而,针对不同的遥感影像,基于多尺度分割的面向对象分类技术需要经过多次分割,以取得最佳分割尺度,且参数设置也较复杂,不利于自动化与应用化。因此,在陈杰等人[5]所提方法的基础上,本文提出一种改进的标记分水岭变换与迭代自组织算法相结合的面向对象遥感图像分类方法,本方法的分类精度和自动化程度更高。

1 算法介绍

1.1基于边缘检测的标记分水岭变换

遥感影像分割是面向对象分类方法的关键,它直接影响着最终的分类精度。基于分水岭算法的形态学分割方法具有计算速度快,能精确定位遥感影像的边缘且易于并行处理等优点而被广泛关注。但该方法对图像噪声比较敏感,容易造成过分割。为了抑制过分割现象,通常采用前处理或分割后处理方法[6]。前处理包括对原始影像进行滤波处理、减少或消除噪声和修改梯度函数,获得重建的梯度图像。后处理是对分割后的影像进行区域合并,以减少过分割现象。由于遥感影像中地物类型多样且分布复杂,过分割现象成为影响面向对象分类精度的关键因素。因此,本文提出一种基于边缘检测的标记分水岭分割方法,改进了标记的产生方式。算法具体步骤如下:

1)预处理。采用中值滤波消除图像噪声,再对滤波后的图像采用开闭合运算,进行梯度重建。

2)边缘检测。利用相位一致模型对梯度图像进行边缘检测,并将检测到的边缘点储存。

3)标记初始化。手动对图像一些较大区域进行标记,作为分水岭算法的增长种子点。选择大区域可以提高种子点的扩张速度。

4)标记生长。采用标记分水岭算法的标记生长方式,利用FIFO(first input first output)队列,梯度差小的水位优先生长,并将边缘检测作为生长的终止条件,直到种子区域生长完全。

5)标记扩散。本文改进了标记的产生方式。传统的标记分水岭算法是通过局部最小值来标定。本方法是在初始种子点完全生长的情况下,采用扩张标记的方法,即将完全生长种子区域作为父类向周围区域扩散,生成子类种子区域。新种子点有3种情况,如图1所示。

图1 新种子点扩散生长情况Fig.1New seeds point spread

由图1可知,种子点完全生长的情况下,生长点周围只存在标记点和边缘点。在图a中,种子点的四邻域内只有1个边缘点,则水从该种子点溢出,将垂直于边缘生成新的种子点;在图b中,四邻域内有2个边缘点,则水从此处溢出,将在生长点的斜对角处产生新的种子点;在图c中,当四邻域内有3个边界点时,生长点周围可能存在2个盆地的情况,因此无法判断有多少个盆地,为了不产生过分割现象,本文处理此种情况时,采用将不产生新种子点的方法。

6)跳至步骤4。

本文采用扩散生长方式,因此,单个子类区域会产生唯一标记,从而避免了同一区域存在多个最小连通量标记而产生的过分割现象。同时,采用边缘检测手段,以保证生长不会跨越分水岭而造成错误分割。

1.2迭代自组织数据分析算法

ISODATA算法(iterative self-organizing data analysis technique)是聚类分析中的一种常用算法,称为动态聚类或迭代自组织数据分析技术。该算法是一种软性分类方法,可以认识到大多数分类对象在初始认知或是初始分类时不太可能显示的最本质属性,这种模糊聚类的过程以一种逐步进化的方式来逼近事物的本质,可以客观地反映人们认识事物的过程,从而使得分类方法更加科学[7]。它是一种非监督分类方法,可以自动地分类合并,以达到合理的分类数,兼顾了各空间实体之间的相关信息,各个区域的特征的非均匀性可包含在初始图像分割处理中,且可以形成原始图像的特征空间,而不会像硬分割那样产生偏倚[8]。

ISODATA算法实现步骤如下。

2)样本分类。计算各类中诸样本的距离指标函数,按照与聚类中心距离最小的原则将各样本归入最近的类中。

3)判断类分裂、合并及迭代。

①若迭代次数已达到I,跳到步骤4),运算结束;若Nc≥2C,或者进行了偶数次迭代且,则转至步骤②,合并处理;否则,转至步骤③,分裂处理。

式中,ni,nj分别为类Vi和Vj的样本数。合并操作完成后,更新Nc值即Nc=Nc-M。在一次迭代中,某一类最多只能被合并一次。上加上和减去而其他分量不变。k的选取应该使和仍在Vj的类域空间中,且其他类的样本到和的距离较远。本文取k=0.5。

4)若最后一次迭代运算结束或过程收敛,则结束运行;否则转至步骤3),继续迭代。

1.3算法流程

本文分类方法的流程如图2所示,其中,方框表示各步骤或结果,实心单箭头表示流程。首先对原始图像做预处理,修改灰度梯度并排序;然后用改进的分水岭算法对图像进行分割,生成对象;最后,利用ISODATA算法对分割后的影像进行非监督分类,得到最终结果。

图2 面向对象分类流程图Fig.2The flow chart of object-oriented classification

2 试验结果与分析

2.1试验数据

试验采用从深圳市南山区高分辨率遥感影像上截取的865×725像素图像。如图3为蓝、绿、红多光谱数据分别与全色波段数据进行Pansharp融合[9],得到的空间分辨率为0.61 m的真彩色图像。图4是图3的全色影像。由图3和图4可见,影像区域内主要包括水面、树林、农田、居民地以及少量道路。其中,田地、树林和水面占了大部分面积,道路和房屋等相互交错。

图3 原始影像Fig.3Original image

图4 全色影像Fig.4Panchromatic image

2.2基于标记分水岭的对象获取

对原始影像进行中值滤波,减少图像噪声后,获得灰度梯度,并按由低到高的顺序进行排序。计算各灰度梯度所占的梯度百分比,突出感兴趣的灰度梯度。通过改进后的分水岭算法获得初步的分割图像,然后对过分割的小区域和椒盐噪声进行区域合并,把不感兴趣的小区域合并到感兴趣的大区域中,得到最终分割对象。图3分别经分水岭算法和改进的分水岭算法的分割影像如图5所示。

图5 分水岭分割影像Fig.5Segmentation result

由图5可知,经过改进后的分水岭分割获取对象,分水线与影像地物边缘吻合;影像对象大小适中,细小区域对象都与周围区域合并,成功地抑制了分水岭的过分割现象。

2.3基于ISODATA的对象分类结果

获取对象之后,用对象的中心特征代表整块区域,利用ISODATA对分水岭分割后的影像对象进行聚类,通过原始影像初步判断可分为5类,分别为水面、田地、森林、房屋和路面。因此,设置参数期望聚类数C为5,迭代次数I为20。图6为ISODATA聚类后的结果。图中,区域1为水体,区域2为森林,区域3为田地,区域4为房屋建筑,区域5为道路以及土地等。由图可以看出,水体和房屋得到了很好地区分,由于道路所占面积较少且与房屋、林地等对象交错,产生了很多小区域数据。

图6 ISODATA分类结果Fig.6Result of ISODATA classification

2.4试验结果比较

eCognition是目前所用商用遥感软件中第一个基于目标信息的遥感信息提取软件,它提出了革命性的分类技术——面向对象的分类方法,大大提高了高空间分辨率数据的自动识别精度,被研究者广泛使用。

本文采用分割尺度为70的多尺度分割算法获得对象,然后通过最邻近分类器对分割后的对象进行分类。图7为通过eCognition面向对象分类软件对原始图像进行分类的结果。图中,区域1为水体,区域2为田地,区域3为森林,区域4为建筑,区域5为土地。

图7 基于ecognition分类结果Fig.7Ecognition-based classification

由图7可知,由于图像分辨率较高,因此,分类结果较好。比较图6和图7可知,2种分类方法都是采用面向对象的分类思想,均取得了较好的分类结果,且水体及建筑物分类效果较好,但因本方法采用非监督分类,导致田地与森林的区分较困难,因此,总体分类效果略有降低。但非监督分类不需要大量的人工干预,因此提高了该算法的自动化程度。

为了更好地说明算法的分类效果,本文从分类总精度和Kappa系数2方面对算法进行定量对比。其中,Kappa系数是一种计算分类精度的方法,其是通过将所有地表真实分类中的像元总数(N)乘以混淆矩阵对角线(Xkk)的和,减去某一类地表真实像元总数与被误分成该类像元总数之积对所有类别求和的结果,再除以总像元数的平方差减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的。本文分别从2种算法的分类结果中选取田地(94个)、房屋(90个)、树木(42个)、水体(57个)、 土地(49个)样本像元进行分类精度比较。分类结果如表1所示。从表1可以看出,本文的分类精度与eCognition面向对象分类软件的分类精度均到达了0.850以上。尽管eCognition软件能够综合多重处理途径得到不错的分类结果,但多参数与多特征的最佳搭配方式需要反复尝试和大量的先验知识。相比结合多尺度分割和监督分类,本文将分水岭算法与ISODATA聚类算法相结合,在减少大量人为干预的前提下获得了较好的效果。

表1 2种分类方法总精度和Kappa系数的比较Table 1Comparison of two methods of classification in overall accuracy and Kappa coefficient

3 结语

本文首先利用分水岭变换分割得到影像对象,然后用迭代自组织算法对分割后的对象进行聚类。不同于广泛使用的多尺度分割算法,分水岭变换算法极大地减少了寻找最优分割尺度所需时间,在保持原有分类精度的基础上,减少了人为的干预,简化了图像分割获取对象的复杂度,提高了分类的自动化程度。虽然本文方法从分类复杂度与分类精度取得了较好的平衡,但仍存在一些问题有待深入研究,如田地与森林分类的准确度、阴影等的干扰消除、道路等较小对象的提取等。

[1]Laliberte A S,Rango A,Havstad K M,et al. Object-Oriented Image Analysis for Mapping Shrub Encroachment from 1937 to 2003 in Southern New Mexico[J]. Remote Sensing of Environment,2004,93(1):198-210.

[2]张春晓,候伟,刘翔,等.基于面向对象和影像认知的遥感影像分类方法:以都江堰向峨乡区域为例[J].测绘通报,2010(4):11-15. Zhang Chunxiao,Hou Wei,Liu Xiang,et al. Remote Sensing Image Classification Based on Object-Oriented and Image Cognition:A Case Study in Xiang’e Dujiangyan [J]. Bulletin of Surveying and Mapping,2010(4):11-15.

[3]周春艳.面向对象的高分辨率遥感影像信息提取技术 [D].青岛:山东科技大学,2006. Zhou Chunyan. Object-Oriented Information Extraction Technology of High Resolution Remote Sensing Image[D]. Qingdao:Shandong University of Science and Technology,2006.

[4]林卉,刘培,夏俊士,等.基于分水岭变换的遥感影像面向对象多尺度分割算法研究[J].测绘通报,2011 (10):17-19. Lin Hui,Liu Pei,Xia Junshi,et al. Research on Object-Oriented Multi-Scale Segmentation Algorithm Based on Watershed Transformation[J]. Bulletin of Surveying and Mapping,2011(10):17-19.

[5]陈杰,邓敏,肖鹏峰,等.基于分水岭变换与空间聚类的高分辨率遥感影像面向对象分类[J].遥感技术与应用,2010,25(5):597-603. Chen Jie,Deng Min,Xiao Pengfeng,et al. Object-Oriented Classification of High Resolution Imagery Based on Watershed Transform and Spatial Clustering[J]. Remote Sensing Technology and Application,2010,25(5):597-603.

[6]徐奕奕,刘智琦,刘琦.基于改进的分水岭算法图像分割方法研究[J]. 计算机仿真,2011,28(9):272-275. Xu Yiyi,Liu Zhiqi,Liu Qi. Image Segmentation Based on Watershed Algorithm[J]. Computer Simulation,2011,28 (9):272-275.

[7]Vincent L,Soille P. Watersheds in Digital Spaces:An Efficient Algorithm Based on Immersion Simulations[J]. IEEE Transaction on Pattern Analysis and Machine Intelligence,1991,13(6):583-598.

[8]曾江源.ISODATA算法的原理与实现[J].科技广场,2009(7):126-127. Zeng Jiangyuan. Principle and Implementation of ISODATA Algorithm[J]. Science Mosaic,2009(7):126-127.

[9]Zhang Yun. Problems in the Fusion of Commercial High-Resolution Satelitte As Well As Landsat 7 Images and Initial Solutions[J]. International Archives of Photogrammetry Remote Sensing and Spatial Information Sciences,2002,34(4):587-592.

(责任编辑:邓彬)

Object-Oriented Classification of Remote Sensing Image Based on Watershed Transform

Zhu Wenqiu ,Dengliu Zhaolu,Hu Yongxiang,Li Jianfei
(School of Computer and Communication,Hunan University of Technology,Zhuzhou Hunan 412007,China)

In order to improve the automation of object-oriented classification,combines the watershed transform and ISODATA clustering to implement a quick and efficient object-oriented classification of remote sensing image. Firstly, uses the improved watershed transform to achieve better segmentation of high resolution imagery; then uses the ISODATA clustering to classify the object segmentation. The experimental results show that this new method obtains better classification effect and fast classification, and greatly enhances the automation of remote image classification.

object-oriented classification;watershed transform;ISODATA clustering;high resolution imagery

TP751.1

A

1673-9833(2014)04-0076-05

10.3969/j.issn.1673-9833.2014.04.017

2014-05-16

交通运输部重点基金资助项目(2012-364-208-802-2),国家自然科学基金资助项目(61170102),湖南省自然科学基金资助项目(11JJ3070),湖南省教育厅科研基金资助项目(12A039)

朱文球(1969-),男,湖南工业大学教授,硕士生导师,主要从事图像处理,模式识别等方面的研究,E-mail:wenqiu_zhu@126.com

邓刘昭芦(1989-),男,湖南工业大学硕士生,主要研究方向为遥感图像处理,E-mail:dengliuzhaolu@163.com

猜你喜欢
分水岭面向对象聚类
选 择
基于K-means聚类的车-地无线通信场强研究
2019,一定是个分水岭!
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
面向对象Web开发编程语言的的评估方法
峰丛洼地农作物面向对象信息提取规则集
江淮分水岭地理内涵辨析
基于面向对象的车辆管理软件的研制与开发
一种层次初始的聚类个数自适应的聚类方法研究