高 博
(中国电子科技集团公司第二十研究所,陕西 西安 710068)
遥感影像被广泛应用于环境监测[1], 地表覆盖观测[2-3],变化检测[4-5]和气候研究[6]等领域。对于远程遥感应用,遥感影像聚类是一种重要的技术,它是将给定的遥感影像划分为几个同质的区域,每个区域往往表示一种特定地物类型[7]。一般地,聚类通过相似度度量,将给定遥感影像划分为K个区域。同时,一般聚类在遥感影像中的表现可能会受到噪声或者混叠像素的影响。模糊聚类对噪声或者异常值具有较好的鲁棒性,往往能够取得更好的聚类结果。实际上,聚类是一个优化问题,可以通过最小化特定的目标函数来实现[8]。
梳理相关文献,可以发现,遥感影像聚类方法可以归为两类,即有监督聚类和无监督聚类[9]。有监督聚类需要一个训练集用于训练分类器,而无监督聚类则通过分析给定数据来实现像素的分类,无需训练样本。聚类将一幅图像划分为非重叠连续的区域,每个区域关于特定的特征是一致的,比如关于像素强度,纹理或者上下文信息。模糊C均值(FCM)是最著名的聚类方法之一,它成功地将模糊逻辑引入到聚类中。与传统的硬聚类方法相比,尽管FCM能够保留更多的信息,但它依然对噪声和异常值很敏感,这是因为它没有考虑到空间和上下文信息。后来,许多研究者成功地把局部空间信息引入到标准的FCM中,以提高聚类表现[10-11]。文献[11]提出一种广义的模糊C 均值聚类算法(FGFCM),它对噪声和异常值不敏感,可以弥补标准FCM的劣势。
近年来,基于进化优化的聚类方法受到很多研究者的关注。与FCM[12]和FGFCM[11]相比,基于进化优化的聚类方法往往具有更强的全局搜索能力,能够取得一个最优或者近似最优的解[8]。多种基于生物激发的进化算法[13-15]被提出来用于聚类任务。这些方法往往仅优化单个聚类评价标准,但是一个单一的评价标准很难适用于具有不同特征的数据[7]。另外,这些方法中的目标函数是两个或者多个冲突的评价指标的加权和。因此,可考虑使用多目标优化来处理多个冲突目标的求解问题。
不同的目标函数可能有其不同的侧重点,也许表征了遥感影像的一种特定结构[7]。大部分情况下,一个单一的目标函数无法适用于不同类型且具有复杂结构的遥感影像聚类问题。为了增强聚类的推广能力,本文考虑使用同时优化多个目标以探索给定图像的不同特征。因此,可以将聚类任务转化为多目标优化问题。最终的解往往包含许多Pareto最优解,但是任何一个目标函数的增大必然伴随着另一个目标函数的减小[9]。
一些多目标聚类算法已经被提出并且应用于遥感影像聚类问题[7,9,16]。文献[7]中,两个模糊聚类评价标准在快速和精英非支配排序遗传算法(NSGA-II)[17]的框架下被同时优化,其中Xie-Beni指数和FCM 评价函数Jm被用作两个目标函数。2013年,钟等人提出来一种两步聚类方法[16],其中一个由优化层和分类层组成的两层系统被建立起来。 在优化层,一个可行的聚类数可以通过最小化Jm和Xie-Beni指数来确定,然后,在分类层聚类结果可以通过使用非支配和拥挤距离排序来获得。2009年,Andrea Paoli等为高光谱图像聚类提出一种多目标粒子群优化框架[9]。在该方法中,3种不同的优化标准(log似然函数,类间巴氏统计距离和最小描述长度)被同时优化。文献[11]中,FGFCM被提出并被应用于图像聚类任务,它以一种新颖的方式将局部空间信息引入到FCM 中,克服了经典的FCM算法的缺点,并提升了聚类表现。
空间信息是图像的一个非常重要特性[18]。FGFCM通过引入局部空间信息增强了对噪声的鲁棒性。因此,本文将FGFCM的聚类评价函数和其相应的XB指数作为两个冲突的目标函数同时进行优化。该方法引入了图像的空间邻域信息而非仅仅是单个像素强度,保证了其对噪声的鲁棒性。
许多算法[7,9,16]使用FCM的聚类评价函数作为多目标优化的一个目标。与FCM相比,FGFCM对噪声更鲁棒,因为其将局部空间信息和灰度级信息引入到聚类评价函数中,该算法的时间复杂度取决于图像的灰度级而非图像尺寸[11]。目标函数可以定义如下
(1)
其中,γl是指灰度值为l的像素个数,l=1,2,3,…,q,而且
(2)
uil表示在条件为
(3)
对任意l成立的情况下,灰度值l属于第i类的模糊隶属度。q(q≪N)表示测试图像的灰度值的个数,vi是第i个聚类的聚类中心,xi是新产生的图像xi的第i个像素,其计算方式如下
(4)
其中,ξi表示图像ξ的第i个像素的灰度值,xi是窗口中心像素xi的邻域的灰度值,Ni是中心像素xi的邻域,Sij是第i个像素与第j个像素之间的局部相似度度量[11]。
由文献[19]可知,XB指数可以通过下式进行计算
(5)
其中,Js表示给定数据的c个类别的类内紧密程度,反映出所有类别上的类内方差。Js的值越小,聚类结果越好。XB指数是给定数据的类内紧密程度与其划分之比。容易发现XB指数与Js非常相似。但是XB指数的分母包含了一个附加项,这个附加项表示任意两个不同聚类的间隔。大多数情况下,这两个目标函数,即Js和XB指数对同一种划分方式不会同时达到各自的最优解。
本文提出了一种应用于遥感影像的多目标模糊C均值的聚类算法(MOFCM)。MOFCM使用了多目标优化的框架,并应用到了遥感影像的分类问题中。该框架的详细描述在表1中。
在种群的初始化过程中,初始种群P是随机生成的,在P中的每个个体x=(x1,x2,…,xc)可以表示为一个c维的一个向量,其中,c是聚类中心的数量。然后,种群的适应度值分别通过式(1)和式(3) 计算得到。
表1 MOFCM算法流程
变异操作可以表示为
(6)
x′=λ1x+λy
y′=λ1y+λ2x
(7)
其中,x和y是种群P中的两个个体,x′和y′表示两个新的子代,λ1和λ2分别是两个[0,1]的随机数。
经过交叉和变异操作之后,子代种群的适应度值就可以通过式(1)和式(5)计算得到。父代种群P与子代种群childpop结合,构成新的种群Pcombine。然后通过精英保留策略[17],从Pcombine中选出最优的N个个体,作为下一代的父代。
本文进行了两个实验,仿真数据实验和真实数据实验,并与传统的聚类算法FCM和FGFCM进行了比较,实验结果很好的证明了进化多目标算法MOFCM的有效性。
算法FCM、FGFCM和MOFCM的实验结果展示在图1中。从图1(a)中可以看出,使用的大小为282 251的图像应该被分为两部分,一部分是黑色背景,另一部分是灰色的图形。为了说明算法对噪声的鲁棒性,本文对该图像增加了高斯噪声(30%)。在FGFCM中,本文通过采用大小为5×5的窗口来引入局部邻域信息。由MOFCM获得的PF面展示在图1 中,每一个点代表一个解。通过图1可以看到,PF面非常光滑,而且解也是具有很好的多样性,这意味着通过运行MOFCM一次,就获得不同的聚类结果。
表2 MOFCM与FCM、FGFCM聚类精度比较
表2展示了3种不同的算法在包含多个噪声水平的图像上的聚类结果。噪声越大,聚类结果越差。由图2可以看出,FCM的聚类结果包含了很多噪声点,FGFCM和MOFCM几乎不包含多少噪声点。也就是说,通过引入局部邻域信息,FGFCM和MOFCM获得了更好的聚类效果。此外,MOFCM通过引入多目标框架,只要运行一次,就可以获得很多不同聚类精度的结果。
图1 MOFCM聚类Pareto前沿面
图2 模拟数据集图像聚类结果
这部分使用的真实数据是Campbell数据。Campbell数据是由ALOS-PALSAR传感器于2010年6月在Campbell 河上获取的合成孔径雷达影像数据。由于是由合成孔径雷达获取的,这使得这图像很容易受到斑点噪声的污染,这给聚类结果带来很大的影响。原始图像和3种不同方法获得的聚类结果分别展示在图3中。
由图3可知,Campbell遥感影像能够被聚类为两类,陆地和水域。由于没有参考图,本文在此无法给出一些定量的分析,但是可以通过视觉上的效果来判断聚类结果。从图3中可以看出,这些方法对Campbell 河水域的聚类效果很不错,把大片的水域都分出来了。然而,对于陆地而言,3种算法的分割结果就有所差别了。FCM将很多小块的陆地分成了水域,而且它对斑点噪声很敏感。FGFCM和MOFCM通过引入局部邻域信息,使得这两种算法对噪声具有很好的鲁棒性,得到较好的聚类结果。然而,FGFCM将一陆地中相当一部分细小的水域误分为了陆地。通过与FCM和FGFCM比较,MOFCM获得更好的聚类效果。
图3 Campbell河数据聚类结果
本文提出了一种遥感影像多目标目标聚类算法MOFCM,该算法同时优化广义模糊C均值聚类评价指标Js和XB指数这两个相互冲突的目标函数。由于单一评价标准难以将复杂的遥感影像数据进行良好的建模,因此本文提出算法MOFCM,将遥感影像聚类问题建模为多目标优化问题。通过引入多目标优化框架,本文提出的算法可以同时优化多个相互冲突的目标函数,从而可以获取了一组非支配解。模拟数据和真实数据上的实验结果证实了本文所提出的多目标进化聚类算法对于遥感影像分类问题的有效性。
[1] Weng Q.Remote sensing of impervious surfaces in the urban areas:Requirements,methods and trends[J].Remote Sensing of Environment,2012,11(7): 34-49.
[2] Belward A S,SkØien J O.Who launched what, when and why; trends in global land-cover observation capacity from civilian earth observation satellites[J].ISPRS Journal of Photogrammetry Remote Sensing,2014(9):58-66.
[3] Chen J,Chen X,Cui X,et al.Change vector analysis in posterior probability space: A new method for land cover change detection[J].IEEE Geoscience and Remote Sensing Letters,2011,8(2):317-321.
[4] Volpi M,Tuia D, Bovolo F,et al.Supervised change detection in VHR images using contextual information and support vector machines[J].International Journal of Applying Earth Observation,2013,20(6):77-85.
[5] Liu Z G,Mercier G,Dezert J,et al.Change detection in heterogeneous remote sensing images based on multidimensional evidential reasoning[J].IEEE Geoscience and Remote Sensing Letters,2014,11(1): 168-172.
[6] Vinukollu R K,Wood E F,Ferguson C R,et al.Global estimates of evapotranspiration for climate studies using multi-sensor remote sensing data: Evaluation of three process-based approaches[J].Remote Sensing of Environment,2011,115(3):801-823.
[7] Bandyopadhyay S,Maulik U,Mukhopadhyay A.Multiobjective genetic clustering for pixel classifcation in remote sensing imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(5):1506-1511.
[8] Ma A,Zhong Y,Zhang L.Adaptive multiobjective memetic fuzzy clustering algorithm for remote sensing imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(8):4202-4217.
[9] Paoli A,Melgani F,Pasolli E.Clustering of hyperspectral images based on multiobjective particle swarm optimization[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(12): 4175-4188.
[10] Krinidis S,Chatzis V.A robust fuzzy local information c-means clustering algorithm[J].IEEE Transactions on Image Processing,2011,19(5):1328-1337.
[11] Cai W,Chen S,Zhang D.Fast and robust fuzzy c-means clustering algorithms incorporating local information for image segmentation[J].Pattern Recognition,2007,40(3): 825-838.
[12] Bezdek J C,Ehrlich R,Full W.FCM: The fuzzy c-means clustering algorithm[J].Computers & Geosciences,1984, 10(2):191-203.
[13] Das S,Abraham A,Konar A.Automatic clutering using an improved differential evolution algorithm[J].IEEE Transactions on Systems, Man and Cybernetics,Part A: Systems and Humans,2008,38(1): 218-237.
[14] Zhong Y,Zhang L.A new fuzzy clustering algorithm based on clonal selection for land cover classifcation[J]. Mathematical Problems in Engineering,2011(11):198-206.
[15] Bandyopadhyay S,Maulik U.Nonparametric genetic clustering: comparison of validity indices[J].IEEE Transactions on Systems, Man and Cybernetics,Part C: Applications and Reviews, 2001,31(1): 120-125.
[16] Zhong Y,Zhang S,Zhang L.Automatic fuzzy clustering based on adaptive multi-objective differential evolution for remote sensing imagery[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2013,6(99):1-12.
[17] Deb K,Pratap A,Agarwal S,et al.A fast and elitist multiobjective genetic algorithm:NSGA-II[J].IEEE Transaction. Evolution Computing,2002,6(2):182-197.
[18] Jin B,Hu W,Wang H.Image classifcation based on pLSA fusing spatial relationships between topics[J].IEEE Signal Processing Letters,2012,19(3): 151-154.
[19] Xie X L,Beni G.A validity measure for fuzzy clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13(8): 841-847.