一种利用K均值和SOM进行遥感图像分类的方法

2011-09-27 10:43张涛
地理空间信息 2011年1期
关键词:权值均值神经元

张涛

(武汉大学遥感信息工程学院,湖北武汉 430079)

一种利用K均值和SOM进行遥感图像分类的方法

张涛

(武汉大学遥感信息工程学院,湖北武汉 430079)

探讨了一种将K均值算法和SOM神经网络算法相结合的方法,并将其应用于多光谱遥感图像分类,通过与K均值算法、ISODATA算法和SOM算法的对比实验,验证了该方法的有效性。

遥感图像分类;神经网络;自组织映射;K均值算法

遥感技术已经广泛应用于很多领域,遥感影像分类是遥感技术应用的关键问题。传统的遥感图像非监督分类方法过于依赖图像数据的分布,人工神经网络不基于数据分布的特性,作为一种智能信息处理的重要方法,为实现图像自动分类创造了条件[1]。具有非监督学习能力的自组织映射网络,结构简单、易于实现,应用于数据分类时能够取得较好的效果。在SOM的众多分类改进算法中,通常是对其自身网络参数如初始化权值进行改进[1,2],或将 SOM 与常规的聚类算法相结合[3,4]。其中,将SOM和K均值进行结合可以有两种策略:一种是用SOM对K均值算法进行改进,即用SOM神经网络改进K均值聚类算法的初始化中心和确定聚类中心数目,并已应用于图像分割[5]、文档聚类[6]、客户分类[7]和声波数据分割[8]等领域;另一种是用K均值改进SOM算法,即先进行K均值聚类,然后再进行SOM聚类。该方法已被应用于遥感图像分类。Su和Chang用K均值算法改进SOM网络的初始权向量,即用K均值算法找到的N×N个聚类中心作为SOM网络的初始化权值,但是遥感图像的分类数目不一定能满足N×N的条件[9]。Zhou等将小波分解出的不同尺度下的遥感图像进行分步处理,即先用K均值算法对粗尺度的遥感图像进行分类,再在此基础上用SOM算法进行细尺度的分类,抗噪性强,提高了分类精度和速度;但该方法也存在分类类别数需要预先确定问题[10]。

本文在前人的研究基础上,探讨了一种将K均值和SOM相结合进行多光谱遥感图像分类的方法。首先用K均值算法对遥感影像进行粗聚类,以减少SOM聚类模式的输入量,然后将K均值的聚类结果作为SOM的网络输入值进行自组织学习训练,每一个像素点对应的获胜神经元作为它的判别类别,并在输出层设置一个迭代阈值,将聚类数目小于该阈值的神经元所分的类别划分到最近的神经元中,实现类别合并,最终实现遥感影像分类。将本文的分类方法与K均值算法和ISODATA算法以及SOM算法进行遥感图像分类的对比试验,本文的分类方法取得了较好的分类效果,实验结果验证了该方法的有效性。

1 K均值与SOM算法原理

1.1 K均值算法

K均值算法属于一种典型的划分聚类方法[11],其基本思想是通过迭代把数据对象划分到不同的簇中,使簇内对象之间的相似度很大,而簇间对象的相似度很小。

K均值算法的具体过程如下:1)选取k个对象作为初始的聚类中心;2)根据聚类中心值,将每个对象(重新)赋给最相似的簇;3)重新计算每个簇中对象的平均值,用此平均值作为新的聚类中心;4)重复执行步骤2和步骤3,直到聚类中心不再发生变化为止。

K均值算法聚类结果受初始聚类中心选择的影响较大,如果初始聚类中心选取不当,聚类结果可能会陷入局部最优解,从而得不到较好的聚类效果。

1.2 SOM算法

自组织映射网络是一种模拟哺乳动物大脑皮质神经元的侧抑制、自组织等特性的神经网络模型。它是一种竞争式学习网络,自适应学习能力和鲁棒性强,能无监督地进行自组织学习,且能够把多维数据映射到低维空间,同时保持多维数据的拓扑结构和信息。

SOM 的拓扑结构一般为两层:输入层和竞争层,如图1所示。其神经元的排列有多种形式:一维线阵、二维平面阵和三维栅格阵。最典型的结构是二维形式,它更具有大脑皮层的形象[12]。

图1 二维阵列SOM网络模型 [13]

2 利用K均值和SOM的聚类方法

传统的聚类方法,如K均值、ISODATA等算法在处理低维、小数据量时具有较高的效率,但对图像的数据分布依赖性强,抗噪能力弱,常常难以达到理想的分类效果;SOM算法拥有神经网络不基于数据分布的一般特性,分类过程中能够实现数据的降维。本文对将K均值与SOM相结合的方法进行探讨,首先采用K均值算法进行粗聚类,K均值算法的聚类个数超过最终聚类个数,将容易错分的数据先分到数目较小的类别中;然后将聚类中心值替换原有像素点的值,作为SOM网络的输入模式,进行二次聚类。这样可以保持K均值算法初始聚类中心的随机选取和SOM初始权值的随机选取的特性,避免K均值算法易陷入局部最小的缺陷,同时充分利用SOM算法抗噪性强的特点进行处理,减少网络训练次数,达到提高SOM网络分类效率的目的。算法步骤如下:1)进行K均值聚类,得到超过目标聚类数目的聚类类别数;2)权值初始化。记wij为第j个输入端与第i个神经元的权值,j=1,2,...,n,n为输入层神经元数目,i=1,2,...,m,m为输出层神经元数目。权值初始化是指用较小的随机数初始化输入层到竞争层的连接权值wij,记为wij(0)。建立初始优胜邻域Nc(0)和学习率a初值;3)输入步骤1)中得到的聚类结果模式作为一个输入模式。从训练集中取一个输入模式x,令t=0。4)计算竞争层的所有权值向量和输入向量的欧式距离:

5)寻找距离最小的神经元c,即为胜出神经元:

6)定义优胜邻域Nc(t)。以c为中心确定t时刻的权值调整域,初始时t∈0。一般初始域Nc(0)较大(为总结点的50%~80%),训练过程中Nc(t)随训练时间收缩。7)调整优胜邻域Nc(t)内的所有节点的权值:

式中,a(t)是学习因子,一般随时间而递减,范围0<a(t)<1;Nc(t)是c的邻域,其中半径随t而减小[14]。

7)令t=t+1,转步骤4);8)当t=T0(T0为时间阈值),或a<amin(amin为学习率阈值)时,停止对当前样本的学习,转步骤3);9)重复步骤3)~9),直至所有样本参与聚类。

聚类阈值是实现确定最终聚类数目的关键步骤。本文的方法通过SOM输出层设置的聚类阈值,实现最终聚类数目的确定。SOM网络在学习训练结束后,其各个输出层神经元拥有的像素点数目可能存在极小的情况。设置一个聚类阈值,将聚类数目小于该阈值数目的神经元消去,将属于该神经元的点分到最近的神经元上,即实现类别自动合并。聚类阈值的数值可以根据具体的图像大小和目标聚类类别数目进行确定。

3 遥感图像分类实验及结果分析

本文选取宜昌地区TM遥感影像进行分类实验,影像分辨率为 30 m,如图2(a)所示。依据目视判读,影像分为水体、植被、居民区、裸露地四类。对影像采用本文的方法进行聚类试验,聚类结果如图 2(b)所示。采用传统K均值方法和ISODATA方法对影像进行分类,分类结果如图2(c)、(d)所示。K均值分类结果中的居民地和植被、水体混淆严重;ISODATA分类结果中的居民地和植被、水体混淆现象稍微减弱;本文的方法将居民地和植被、水体准确地提取出来,减少了它们之间的混淆程度。

图2 聚类结果

对上述几种分类方法进行精度评定,分类精度及Kappa系数比较结果如表1所示。

表1 分类精度

对图2(a)使用SOM算法进行分类,迭代2 302次后收敛,本文的方法中先使用K均值69次迭代后收敛,然后使用SOM 102次迭代后收敛。相对于单独使用K均值方法和SOM方法,本文探讨的将二者相结合的聚类方法具有较高的分类精度和较快的速度,对比实验验证了本文方法的有效性。

4结语

本文探讨了一种将K均值算法和SOM算法结合进行遥感影像分类的方法。该方法既发挥了K均值算法在对相对较小数据量进行聚类时效率较高的特点,又保持了SOM算法自组织的特点,并且将二者结合的方法在分类性能上也得到了提高。通过实验表明,该方法具有比传统K均值算法和ISODATA算法更好的分类精度,比传统的SOM算法更高的聚类效率和更好的聚类性能。进一步的研究方向包括:对SOM聚类方法进行改进,使其能够处理高分辨率的多维数据,从而研究出适合于高效处理大数据量的多维遥感图像的分类方法。

[1] 谌德荣,陶鹏,宫久路,等.一种基于SOFM神经网络的高光谱图像快速分类方法[J].兵工学报,2009,30(2):165-169

[2] 吴柯,方强,张俊玲,等.基于改进Kohonen神经网络的遥感影像分类[J].测绘信息与工程,2007,32(2):47-49

[3] 张钊,王锁柱,张雨.一种基于SOM和PAM的聚类算法[J].计算机应用,2007,27(6):1400-1402

[4] GoncalvesML,Netto MLA,Costa JAF,et al.An Unsupervised Method of Classifying Remotely Sensed Images Using Kohonen Self-organizing Maps and Agglomerative Hierarchical Clustering Methods[J].International Journal of Remote Sensing,2008,29:3171-3207

[5] 许海洋,王万森.基于SOM神经网和K-均值算法的图像分割[J].计算机工程与应用,2005,41(21):38-40,57

[6] 杨占华,杨燕.一种基于SOM和k-means的文档聚类算法[J].计算机应用研究,2006,23(5):73-79

[7] Kuo RJ,An YL,Wang HS,et al.Integration of Self-organizing Feature Maps Neural Network and Genetic K-means A lgorithm for Market Segmentation[J].Expert Systems with Applications, 2006,30:313-324

[8] Godin N,Huguet S,Gaertner R.Integration of the Kohonen's Self-organising Map and K-means A lgorithm for the Segmentation of the AEData Collected during Tensile Tests on Cross-ply Composites[J].NDT&International,2005,38:299-309

[9] Su MC,Chang HT.FastSelf-Organizing Feature Map A lgorithm [J].IEEETransactionson NeuralNet works,2000,11(3):721-733

[10]Zhou ZS,WeiSY,Zhang XW,etal.Remote Sensing Image Segmentation based on Self-organizing Mapat Multiple-scale[J].Geoinformatics 2007:Remotely Sensed Data and Information, 2007,6752:E7520-E7520

[11]Kanungo T,Mount DM,Netanyahu NS.An Efficient K-means Clustering Algorithm:Analysis and Implementaion[J].IEEE Transactionson Pattern Analysis and Machine Intelligence,2002, 24(7):881-892

[12]秦昆.智能空间信息处理[M].武汉:武汉大学出版社,2009

[13]陈泯融,邓飞其.一种基于自组织特征映射网络的聚类方法[J].系统工程与电子技术,2004,26(12):1864-1866

[14]史忠植.神经网络[M].北京:高等教育业出版社,2009

Rem ote Sensing Image Classification Utilizing K-m eansand SOM

by Zhang Tao

Amethod ofm ultispectra l remote sensing im age classification was discussed in the paper,which utilized K-means and SOM neuralnetwork.The com parison experim ents w ith K-means,ISODATA and SOM verify the validity of themethod.

remote sensing image classification,neuralnetwork,selforganizingmap,K-means (Page:109)

P237

B

1672-4623(2011)01-0109-03

2010-07-09

项目来源:武汉大学2009年大学生科研基金资助项目(S2009291)。

张涛,本科,主要研究遥感影像分类。

猜你喜欢
权值均值神经元
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
跃动的神经元——波兰Brain Embassy联合办公
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
基于二次型单神经元PID的MPPT控制
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制