基于多特征组合的彩色遥感图像分类研究

2014-06-23 13:52左小清陈震霆
激光技术 2014年2期
关键词:特征向量纹理彩色

熊 羽,左小清*,黄 亮,陈震霆,2

基于多特征组合的彩色遥感图像分类研究

熊 羽1,左小清1*,黄 亮1,陈震霆1,2

(1.昆明理工大学国土资源工程学院,昆明650500;2.昆明冶金高等专科学校计算机信息学院,昆明650033)

为了解决利用单一特征对彩色遥感图像进行分类效果不理想、普适性不强等问题,提出了一种基于颜色和纹理特征组合的支持向量机彩色遥感图像分类方法。该方法尝试将彩色遥感图像的颜色信息和纹理信息相结合作为支持向量机算法分类的特征向量,据此对遥感影像进行分类,并进行了实验验证。结果表明,颜色和纹理特征组合的支持向量机分类方法能够取得较高的分类精度,其分类效果优于传统的单一颜色或纹理特征分类,是一种有效的彩色遥感图像分类方法。

图像处理;分类;支持向量机;颜色特征;纹理特征

引 言

如何对卫星遥感数据进行自动分类和信息提取一直是遥感应用的一个重要研究方向。现有的遥感图像分类方法大多都以模式识别技术为基础,其中常用的主要有最大似然算法、人工神经网络方法和聚类方法等,然而这些算法存在着一个较大缺陷,即只有在样本趋于无穷大以及正态分布时,才能获得理想的分类结果。而在实际应用中,样本的数目往往是有限的,这就限制了上述方法有时无法取得较为理想的分类效果[1]。

支持向量机(support vector machine,SVM)是由VAPNIK和他的合作者提出的一种机器学习新方法[2-3],它是一种监督式学习的方法,已经广泛地应用统计分类以及回归分析等领域中。目前基于SVM的遥感图像分类方法很多,如利用图像灰度信息、灰度共生矩阵纹理信息、Gabor小波纹理信息等。但目前大多研究处理的仍都是灰度遥感图像,对彩色遥感图像直接进行分类的研究却不是很多。为了解决对彩色遥感图像分类的问题,HUANG等人通过对图像颜色的空间相关性进行分析并提取,然后通过使用分类树的方法对彩色遥感图像进行分类[4];SZUMMER则通过使用颜色直方图这一颜色特征来对彩色图像进行SVM分类[5];VAILAYA等人则利用颜色直方图和边缘方向直方图等特征,通过使用Bayesian分类器实现了对彩色遥感图像进行了分类[6]。

基于SVM的彩色遥感图像分类效果很大程度上依赖于所用特征,用于彩色遥感图像分类的特征有很多,而图像的颜色、纹理特征是两种最常用的特征向量。高分辨率彩色遥感图像所包含的信息丰富,其中有些区域颜色比较相近,然而其纹理特征相差较大,如草地和林地;而有些区域纹理相似,但颜色却差异较大,如道路和裸地。而颜色和纹理都只能对遥感图像的一部分特征进行描述,作者在分类过程中,如果只使用单一的颜色或纹理特征来表征图像的信息,其并不能全面地描述图像所包含的内容。因此,本文中提出将颜色和纹理特征相结合,从不同方面更加详细地对遥感图像的内容进行描述,从而实现更好的分类结果。

1 SVM分类的基本原理

1.1SVM基本原理

下面通过图1对SVM算法的基本原理进行说明,图中圆圈和方块来表示两类样本,其中称H为分类超平面,假设有两个平面H1和H2,且它们满足以下条件:(1)H1和H2需要经过距离H最近的两类样本;(2)H1和H2到H的距离相等;则称H1和H2之间的距离为分类间隔。如何将两类样本正确分开且使分类间隔最大的超平面称为最优分类超平面[6-9]。

Fig.1 Basical theory of SVM

1.2SVM线性分类

假设存在一个线性可分样本集(xi,yi),i=1,2,…,n,x∈Rd,即x是d维训练样本中的特征向量,xi是待分类样本;y∈{+1,-1}是类别标号,d维空间线性判断函数的分类面方程一般形式为:

式中,w为权向量,b为分类阈值。如果要求对所有样本都正确分类,则两类样本需要满足以下条件:

满足上述条件且使‖w‖2最小的分类面称为

式中,和b*分别为最优解和最优分类阈值。

1.3SVM非线性分类和核函数

在非线性情况下,可以通过使用非线性变换的方法,把学习样本变换到高维空间中,将其再次转化为线性可分问题,但这会产生另外一个新的问题,即特征空间的维数骤然增加,也就是“维数灾难”问题。仔细观察(3)式,可以发现其在计算过程中只涉及到训练样本之间的内积运算,因此,可以通过使用核函数K(x,y)来代替原来的内积运算(x·y),则(3)式变为:最优分类面,H1和H2上的训练样本点称作支持向量。解这个最优化问题后得到的最优分类函数是:

SVM中有多种不同的核函数,目前常用的核函数主要有:(1)多项式核函数K1(x,y)=[(x·y)+1]m,其中m为多项式的次数,m=1,2,3,…;(2)径向基核函数(radial basis function,RBF)K2(x,y)=exp(-γ‖x-y‖2),其中γ为核参量;(3)Sigmoid函数K3(x,y)=tanh[k(x·y)-μ],其中,k,μ为常数。RBF的性能优异,在遥感图像的分类中已经得到了广泛使用[4],RBF主要有两个参量:惩罚因子C和核参量γ。惩罚因子C主要用来控制训练精度,其数值越大,表示对错误分类的惩罚也越大;核参量γ主要影响样本数据在高维特征空间中分布的复杂程度。

2 特征提取

2.1颜色特征提取

颜色特征作为数字图像最直观、最重要的感知特征之一,具有计算简单、容易提取的优点,因此利用颜色特征进行图像分类受到了广泛关注[7-9]。

现有的图像设备大多采集R,G,B值作为图像的颜色信息,因此,RGB颜色空间作为图像处理的基础,也是最常用的一种颜色空间。在RGB空间中,可以将感兴趣的部分看作一单位立方体,这样R,G,B值便都均匀分布于区间[0,1]中。定义原点处为黑色,则其3个分量均为0,这样离原点最远的顶点处则为白色,即3个分量均为1。在此RGB模型中,从原点到离其最远处顶点的连线能够表示从黑到白的所有灰度值,即可以通过使用空间中的一个点或一个矢量来表示任意一种颜色[9]。

对于一幅彩色遥感图像,其任意一个像素点的颜色信息,都可以通过使用R,G,B的值来进行组合表示,因此,通过提取每个像素点的R,G,B值,便能够提取得到图像的颜色信息特征。颜色特征定义明确、容易提取、计算简单,相对于其它特征,颜色特征非常稳定。但是基于颜色特征算法必须用于具有不同类别颜色变化比较明显的区域或者图像,否则,提取颜色特征不仅不能正确提取图像的特征信息,而且会导致产生大量的错分、误分。

2.2纹理特征提取

在遥感图像分类中,图像的纹理特征也是一种常用的特征向量。常用的纹理特征主要有Tamura纹理特征、Gabor小波纹理特征和灰度共生矩阵等形式。其中灰度共生矩阵(gray level co-occurrence matrix,GLCM)通过研究灰度的空间相关特性对图像的纹理信息进行描述,其不仅能够反映图像的亮度分布特性,而且同时还能够反映具有同样或接近亮度的像素之间的位置分布特性,逐渐成为一种用来进行分析图像纹理特征的重要方法。灰度共生矩阵的定义为[10-13]:

式中,δ为生长步长;θ为生成方向,一般取0°,45°,90°,135°这4个方向,其值决定Pδθ,ij的大小;表示所有满足δ和θ条件的所有点对数;Pij表示满足δ和θ条件的灰度值分别为i,j的点对数出现的概率。

灰度共生矩阵通过计算图像一些相应的特征值来描述图像的纹理信息,参考文献[5]中提出了14种基于灰度共生矩阵的纹理特征参量,本文中选取其中4种描述能力较强的参量,即对比度、能量、熵和相关[14]。

(1)能量

能量又称为角二阶矩(angular second moment,ASM),由(5)式可以看出,它主要是通过计算灰度共生矩阵元素值的平方和而得到,其主要反映图像灰度分布的均匀程度,若ASM值越大,则能量越大;反之,则能量越小。

(2)熵

熵是图像所具有的信息量的度量,若共生矩阵中元素均匀分布,则熵值较大;反之,若元素分布比较集中时,则熵值较小。

(3)对比度

对比度用于反映图像的清晰度和纹理沟纹深浅程度。纹理沟纹深则对比度大,视觉效果也就清晰;反之,纹理沟纹浅则对比度小,视觉效果模糊。

(4)相关性

相关值大小用于反映图像中局部像素的灰度关联性。局部像素形成的矩阵像元值均匀时,相关值大;反之,矩阵像元值差别很大时,相关值小[14-15]。

基于纹理特征的SVM算法必须用于具有明显纹理现象的区域或图像。对于那些没有明显纹理现象的区域或图像,提取纹理特征不仅不能正确表述图像的底层特征,还有可能导致错误的结果。

2.3综合特征提取

根据第2.1节和第2.2节中的内容,把颜色和纹理特征进行组合,便能够得到一个7维的特征向量如下:

式中,前3维是彩色遥感图像的RGB特征向量,后4维是彩色遥感图像转换为灰度遥感图像后所提取的纹理特征向量能量、熵、对比度、相关性。使用综合特征的SVM分类算法将图像的颜色特征和纹理特征相结合,其不仅适用于各类别之间颜色变化比较明显的图像,而且对于各类别之间的颜色信息比较接近的图像,由于其结合了纹理信息,则仍能够对图像进行较好的分类。而对于纹理特征不明显的图像,由于结合了图像的颜色信息,则仍能对图像进行较好的分类,相对于前两种算法其适用范围更加广泛。

由于颜色特征和纹理特征的物理意义并不相同,需要对颜色和纹理的向量特征进行外部归一化,其归一化公式如下所示:

式中,fn′是特征向量f的第n维特征值,fmax和fmin分别是特征向量f中的最大值和最小值,归一化后得到的f中所有特征向量的取值范围为[0,1]。

2.4算法分类流程

本文中的算法分类流程图如图2所示,主要包括影像预处理、样本选择和特征提取、SVM分类和分类效果验证等几个过程。

Fig.2 Flow chart of the method in the paper

(1)对实验图像进行预处理,主要包括对实验图像进行几何校正和辐射校正,其中几何校正采用二次多项式,其误差控制在0.5个像元之内,辐射校正采用6S模型。

(2)选取样本,提取样本的综合特征,并进行归一化处理。其中纹理特征的计算,以选取的各个样本点为中心,采用5×5的窗口分别计算能量、熵、对比度、相关性4个纹理特征值关于4个方向(0°,45°,90°,135°)的平均值,加上3个颜色特征值,共有7个特征向量。

(3)利用SVM算法进行分类。核函数选择RBF,其中惩罚因子C=32,核参量γ=0.125。训练整个训练样本集,得到分类器模型。然后利用该分类器模型对整幅遥感得到图像进行分类,得到分类结果图。其中,在计算整幅图像的纹理特征时,采用距离为1、大小为5×5的滑动窗口[16]计算由GLCM得到的4个特征值关于4个方向(0°,45°,90°,135°)的平均值。

(4)利用canny算子对分类后图像进行边缘检测,得到分类结果的矢量图。并将矢量图与原彩色遥感图像进行叠加,以验证分类效果。

3 实验结果及分析

为了对上述几种特征分类方法进行评价,下面分别用基于颜色特征、纹理特征以及颜色和纹理的组合特征对彩色遥感图像进行分类。并对分类效果进行比较。

3.1实验数据及样本选择

Fig.4 Experimental image 2 and sample selection

本文中的实验数据选用昆明市安宁市的Quick_Bird两幅区域彩色影像,如图3a所示,其成像时间为2009年,空间分辨率分别为0.61m和2.44m,两幅图像的大小分别为319×319个像素和503×503个像素。其中图3a主要包含人工建筑、裸地、林地、阴影等4类典型地物;图3b为使用SVM算法进行分类选取的样本图,其中,4类地物均选用40个样本点作为训练样本。图4a主要包括农用地、道路、人工建筑、林地、水塘、阴影等6类地物;图4b为其样本选取图,其中农用地选取60个样本点,道路20个,人工建筑40个,林地60个,水塘20个,阴影20个。

3.2实验结果及对比

首先对图3a进行分类,其分类结果如图5~图7所示。其中图5为使用颜色特征进行SVM分类的结果,图6为使用纹理特征进行SVM分类的结果,图7为使用颜色和纹理的组合特征进行SVM分类的结果。其中图5a、图6a、图7a分别为使用3种方法的分类结果图,其中灰度值为190代表空地,灰度值为76代表林地,灰度值为240代表建筑,灰度值为127代表阴影;图5b、图6b、图7b为使用canny算子对分类结果图进行边缘检测得到的相应分类矢量图;图5c、图6c、图7c为使用分类矢量图与原分类图像匹配后的结果。

Fig.5 Classification results using color feature

Fig.6 Classification results using texture feature

由图5、图6和图7的结果可以看出,基于单个颜色特征进行分类后的结果(见图5)其主要问题就是将建筑和阴影没有区别开,而将建筑错分为了阴影;基于纹理特征进行分类后的结果(见图6)其主要问题是没能将林地、空地和建筑进行区分,而将部分建筑错分为了空地和林地;本文中提出的基于颜色和纹理特征组合的分类结果(见图7)基本没有明显的错分、误分情况,取得了较好的分类结果。

为了进一步验证本文中算法的分类效果,对图4a进行分类,其分类结果如图8、图9和图10所示。其中图8为使用颜色特征进行SVM分类的结果,图9为使用纹理特征进行SVM分类的结果,图10为使用颜色和纹理的组合特征进行SVM分类的结果。在图8a、图9a、图10a中,灰度值为151代表田地,灰度值为110代表道路,灰度值为220代表水塘,灰度值为50代表林地,灰度值为150代表建筑,灰度值为100代表阴影。为了解决分类结果杂散点过多的问题,分别对图8a、图9a和图10a进行一个形态学的开闭操作,其中形态学算子大小为3×3,类型为“square”。图8b、图9b和图10b分别为图8a、图9a和图10a经过形态学开闭处理后的结果;图8c、图9c和图10c分别为对图8b、图9b和图10b进行canny算子边缘检测得到的分类矢量图;图8d、图9d和图10d分别为分类矢量图与原实验图像进行叠加后的结果。

Fig.8 Classification results using color feature

Fig.9 Classification results using texture feature

Fig.10 Classification results using our method

由上述分类结果可以看出,由于实验的彩色遥感图像分辨率更高,地物情况更复杂,所包含的信息量更大,基于颜色特征的分类结果(见图8)出现了大量的错分、误分情况,如将道路错分为建筑,部分田地错分为林地等;相比于图8,基于纹理特征的分类结果(见图9)对林地和田地进行了较好的分类,但也出现了部分错分情况,如将道路错分为了建筑;本文中提出的基于颜色和纹理特征组合的分类结果(见图10)只有少部分的错分、误分情况,相比于前两种算法,取得了较好的分类结果。

4 小 结

针对高分辨率彩色遥感图像地物情况复杂,包含信息量大的特点,本文中提出了一种基于多特征组合的SVM彩色遥感图像分类算法。将彩色遥感影像的颜色和纹理特征相组合作为特征向量,对彩色遥感图像进行分类。相比于单一特征的分类结果,本文中的算法取得较高的分类精度,是一种有效的彩色遥感图像分类方法。

[1] LIU L F,CHEN Y H,LI J.Texture analysis methods used in remote sensing images[J].Remote Sensing Technology and Application,2003,18(6):441-447(in Chinese).

[2] VAPNIK V N.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.

[3] VAPNIK V N.Support-vector networks[J].Machine Learning,1995,20(3):273-297.

[4] HUANG J,KUMAR SR,ZABLIH R.An automatic hierarchical image classification scheme[C]//Proceedings of the Six ACM International Conference on Multimedia.New York,USA:ACM,1998:219-228.

[5] SZUMMER M,PICARD R.Indoor-outdoor image classification[C]//Proceedings of the IEEE International Workshop on Content-based Access of Image and Video Database.New York,USA:ACM,1998:42-51.

[6] VAILAYA A,FIGUEIREDO M A T,JAIN A K.Image classification for content based indexing[J].IEEE Transactions on Image Processing,2001,10(1):117-130.

[7] DENG Y,MANJUNATH B S,KENNEY C.An efficient color representation for image retrieval[J].IEEE Transactions of Image Processing,2001,10(1):140-147.

[8] HUANG Y Y,HE Y F.An image retrieval method based on color features[J].Journal of Chinese Computer Systems,2007,28(7):1277-1281(in Chinese).

[9] LIANG J.Research on image retrieval technology bases color feature[J].Computer Knowledge and Technology,2010,6(9):2223-2226(in Chinese).

[10] TAMURA H,MORIS,YAMAWAKIT.Texture features corresponding to visual perception[J].IEEE Transactions on Systems,Man and Cybernetics,1978,8(6):460-473.

[11] QIAO Z J,JIANG JF.Texture retrieval based on wavelet transform[J].Computer and Digital Engineering,2006,34(6):75-78(in Chinese).

[12] HARALICK R M,SHANMUGAM K,DINSTEIN IH.Textural features for image classification[J].IEEE Transactions on Systems,Man and Cybernetics,1973,3(6):610-621.

[13] ZHU B H,HUANG J,ZHANGW T,et al.Analysis of characteristics of laser speckles based on grey level co-occurrence matrix[J].Laser Technology,2012,36(5):620-622(in Chinese).

[14] CONNERSRW,HARLOW C A.A theoretical comparison of texture algorithms[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1980,2(3):204-222.

[15] ZHANG D S,LUO X H,ZHANG ZW.Image retrieval base on dual-tree complex wavelet transform and gray co-occurrence matrix[J].Journal of Xihua University(Natural Science Edition),2010,29(3):111-115(in Chinese).

[16] LIL,WANG H,LIU Q S,et al.Land cover classification using ALOS image based on textural features and support vector machine[J].Remote Sensing For Land&Resources,2011,23(4):58-63(in Chinese).

Classification of color remote sensing images based on multi-feature combination

XIONGYu1,ZUOXiaoqing1,HUANGLiang1,CHENZhenting1,2
(1.Faculty of Land Resource Engineering,Kunming University of Science and Technology,Kunming 650500,China;2.Faculty of Computer Information,Kunming Metallurgy College,Kunming 650033,China)

In order to improve the classification results and solve the universality in color sensing image classification using unique feature,a new support vector machine(SVM)color remote sensing image classification algorithm based on color feature and texture feature combination was proposed.The method used the combination of the color information and the texture information of color remote sensing image as the eigenvectors of SVM algorithm.The results show that the method can achieve higher precision compared with the traditional method using unique feature or texture feature.The method is effective to classify the remote sensing image.

image processing;classification;support vector machine;color feature;texture feature

P237

A

10.7510/jgjs.issn.1001-3806.2014.02.005

1001-3806(2014)02-0165-07

熊 羽(1988-),女,硕士研究生,主要从事遥感图像处理方面的研究。

*通讯联系人。E-mail:zuoxq@163.com

2013-07-04;

2013-07-17

猜你喜欢
特征向量纹理彩色
彩色的梦
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
彩色的线
克罗内克积的特征向量
基于BM3D的复杂纹理区域图像去噪
有那样一抹彩色
使用纹理叠加添加艺术画特效
彩色的风
一类特殊矩阵特征向量的求法
TEXTURE ON TEXTURE质地上的纹理