融合谱聚类和多特征的遥感图像分割

2020-05-28 09:36冒伟
软件导刊 2020年3期
关键词:图像分割特征提取

摘 要:为解决传统谱聚类算法在图像分割时计算量大、使用单一特征分割的局限性问题,设计一种融合谱聚类和多特征的图像分割算法。首先进行超像素分割以减少计算量,分别提取每个超像素的颜色特征和纹理特征,构建超像素相似度矩阵;然后采用特征加权方法线性融合颜色和纹理特征的超像素相似度矩阵;最后采用谱聚类算法进行聚类分割。在UCMerced_LandUse和Berkeley数据集上进行实验测试,并与现有方法进行比较。实验结果表明,大多数实验图像IOU指标均在90%以上,相比于传统方法有了显著提高。

关键词:谱聚类;超像素;图像分割;特征提取

DOI:10. 11907/rjdk. 191657

中图分类号:TP317.4   文献标识码:A                文章编号:1672-7800(2020)003-0248-04

Fusion Spectral Clustering and Multi-feature Remote Sensing Image Segmentation

MAO Wei

(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)

Abstract: In order to solve the problems like large amount of computation and segmentation limitation based on single feature of traditional spectral clustering algorithm in image segmentation, this paper design a fusion spectral clustering and feature of image segmentation algorithm, first of all to pixel division to reduce amount of calculation, respectively to extract each pixel color features and texture features, build super pixel similarity matrix, and then adopt the method of feature weighted linear fusion of color and texture feature of pixel similarity matrix, then using spectral clustering algorithm for clustering segmentation. We performed experimental tests on the ucmercedes d_landuse and Berkeley data sets and compared them with the existing methods. The experimental results showed that for most experimental images, the IOU index of our method was above 90%, which was significantly improved compared with the traditional methods since multiple features of the images were considered simultaneously.

Key Words: spectral clustering; super pixel; image segmentation; feature extraction

0 引言

遥感图像由于具有较强的地物特征表达能力,在地球科学中发挥着重要作用,广泛应用于环境监测[1]、城市规划[2]和国防[3]等多个领域。随着遥感观测技术的迅速发展,可获得的遥感影像数量也急剧增加,如何自动处理和分析这些遥感图像,从中提取有用信息是研究热点。图像分割作为一种自动提取特征和区分不同对象的方法[4]广泛应用在遥感图像处理中。

目前应用于遥感图像分割的算法主要有监督学习和非监督学习方法。支持向量机(SVM)是一种典型的有监督学习方法[5]。有监督学习方法需要许多带有已知类标签的像素点作为训练集。当有监督学习方法应用于高光谱或高分辨率图像时非常耗时,而且许多情况下类标签是未知的。与有监督学习方法不同,非监督学习方法利用观察特征对图像进行分割,不需要训练集,当类标签未知时,通常使用非监督学习方法。大多数非监督学习方法采用聚类算法,划分方法和层次方法是常用的两种聚类方法。典型的划分方法包括最小生成森林、模糊C均值聚类FCM及其相关扩展算法、K-means及其相关变体算法、迭代自组织数据分析(ISODATA)和谱聚类技术等。层次聚类方法除要考虑图像的基本光谱特征外,还要考虑空间信息[6]。Lee & Crawford[7]利用层次聚类和同一簇的像素在空间上相邻的理论对超光谱数据进行分类;Bruzzone、Carlin[8]和Huo[9]將SVM与层次聚类相结合,对空间分辨率很高的图像进行分类。以上聚类方法大多只考虑了图像的单一特征,图像分割结果有一定局限性。

本文提出融合谱聚类和多特征的遥感图像分割方法。为解决以像素点为单位的分割方法计算量庞大问题,首先通过 SLIC 超像素算法对图像预处理,然后分别提取每个超像素块的颜色特征和纹理特征,对这两个特征分别构建超像素的相似度矩阵,并对两个矩阵进行加权线性组合成一个包含颜色和纹理特征的相似度矩阵,最后再使用谱聚类算法对超像素进行聚类,得到最终分割结果。

1 相关工作

1.1 SLIC超像素算法

超像素就是将一幅原本像素级的图划分成区域级的图,将其看作是基本信息的抽象,可从这些区域级图像中提取有效信息,如颜色、纹理信息等。简单线性迭代聚类(SLIC)是一种边界依附性非常好的超像素分割算法。SLIC类似于K-means算法,首先生成K个种子点,然后在每个种子点周围空间搜索距离该种子点最近的若干像素,将它们归为与该种子点一类,直到所有像素点都归类完毕。然后计算这K个超像素里所有像素点的平均向量值,重新得到K个聚类中心。再以这K个中心去搜索周围与其最为相似的若干像素,所有像素归类完后重新得到K个超像素。更新聚类中心,再次迭代,如此反复直到收敛。实际上,SLIC计算类中心时可在10次迭代内收敛,时间复杂度为o(n)。

1.2 谱聚类

谱聚类是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵特征向量进行聚类。有一组数据点X= {x1,x2,…,xn},可用无向图G={V,E}表示这些数据点。图的每个顶点表示一个数据点xi,顶点与顶点之间的边表示两数据之间的相似性。谱聚类将原始的数据集X聚类转化为图G的划分问题。

Shi & Malik提出归一化切割准则,定义为Ncut:

w(i,?j)为i和j点之间相似度函数,asso(A , V)表示A中所有点与图中所有点相连的权重。

2 算法描述

2.1 超像素分割

通过SLIC算法对图像进行超像素分割,设置超像素大小为200,即将图像分割成200个超像素块。

2.2 超像素块相似性计算

每个超像素作为一个顶点构造图,用图的边权表示超像素之间的相似性关系,分别计算超像素之间的Lab颜色特征相似性和局部二值模式(LBP)纹理特征相似性;然后通过特征加权进行线性融合,最终获得融合图像颜色特征和纹理特征的相似度矩阵。

2.2.1 颜色相似性

计算每个超像素块之间的Lab颜色相似性,定义颜色特征相似度矩阵为:

[W(color)i,j=||AVG(i)-AVG(j)||  超像素i和j相邻||mean(i)-mean(j)||    超像素i和j不相邻]   (5)

当第i个超像素和第j个超像素相邻时,两个超像素之间的差异主要集中在相邻像素点上,AVG(i)表示第i个超像素与第j个超像素相邻的所有像素点的Lab颜色向量平均值。

如果第i个超像素和第j个超像素不相邻,则两个超像素之间的相似性主要体现在超像素内的所有像素点上。对每个超像素内的所有像素点取Lab颜色向量平均值,尽可能保留每个像素点的Lab颜色信息,使用mean(i)表示。

2.2.2 纹理相似性

首先对每个超像素进行LBP特征向量提取:①将检测窗口划分为16×16的小区域(cell);②对每个cell中的像素,将相邻的8个像素灰度值与其进行比较。若周围像素值大于中心像素值,则该像素点的位置标记为1,否则为0。这样,3×3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;③计算每个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率,然后对该直方图进行归一化处理;④最后将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是一个超像素块的LBP纹理特征向量。

提取每个超像素块后,计算它们之间的纹理相似性。定义纹理特征相似度矩阵为:

lbp(i)表示第i个超像素块的LBP纹理特征向量。

综上得到超像素间的颜色相似度矩阵W(color)和纹理相似度矩阵W(texture)。通过加权线性融合方式继而得到融合Lab颜色特征和LBP纹理特征的相似度矩阵W,如式(7)所示。

α为权重参数,通过调节α的大小可以控制颜色和纹理特征在相似度矩阵中所占的比重。

2.3 谱聚类分割

(1)使用下面公式计算度矩阵D,即相似度矩阵W的每一行元素之和D组成的对角矩阵。

(2)计算拉普拉斯矩阵。

(3)计算L特征值,将特征值从小到大排序,取前k个特征值并计算前k個特征值的特征向量。

(4)将上面的k个列向量组成矩阵。

(5)使用k-means算法将新样本点聚类成簇。

(6)输出类标签。

2.4 算法流程

融合谱聚类和多特征的图像分割算法流程:

输入:图像

输出:最终的分割结果

通过 SLIC算法,分割得到超像素;

提取超像素块的颜色和纹理特征,构建超像素颜色相似度矩阵W(color)和纹理相似度矩阵W(texture);

通过调节权重alpha融合两个特征的相似度矩阵W;

通过Ncut对超像素进行聚类;

得到聚类结果,输出分割后的图像。

3 实验结果与分析

3.1 实验对比方法

为验证算法的有效性,评估算法对分割质量的改善,在遥感数据集UCMerced_LandUse和Berkeley数据集上进行测试。在0~1之间设置特征权重,迭代选取最优的分割结果作为最终分割结果。将实验结果与单颜色特征Ncut算法、单纹理特征Ncut算法、FCM算法、FCM_S1算法进行比较。实验环境为:CPU:Inter Core i5-4260U @1.40GHz 2.00GHz,内存:4GB, 操作系统:Windows。

[10]王丹,周锦程.基于聚类和NSCT的遥感图像融合算法[J].计算机仿真,2012(6):278-281.

[11]莫才健,田健榕,武锋强,等. 基于加权小波分析的遥感图像融合算法[J].吉林大学学报:理学版,2018,56(3):617-624.

[12]罗群明,施霖. 图像拼接方法综述[J].传感器与微系统,2017,36(12):4-6.

[13]张小朋,钱海忠,岳辉丽,等. 基于模拟退火的空间聚类算法[J].测绘科学技术学报,2010(4):158-163.

[14]郭玲玲,张立国,吴泽鹏,等.基于受限全变差正则化的遥感图像去模糊方法[J]. 激光与光电子学进展,2013,50(11):88-93.

[15]陈洪,陶超,邹峥嵘,等. 一种新的高分辨率遥感影像城区提取方法[J]. 武汉大学学报:信息科学版,2013, 38(9):1063-1067

[16]吴一全,孟天亮,吴诗婳,等. 基于二维倒数灰度熵的河流遥感图像分割[J]. 华中科技大学学报:自然科学版,2014, 42(12): 70-74, 80.

[17]陈恺,陈芳,戴敏,等. 基于萤火虫算法的二维熵多阈值快速图像分割[J]. 光学精密工程, 2014, 22(2): 517-523.

[18]王樹亮,赵合计. 基于改进粒子群算法的多阈值灰度图像分割[J]. 计算机应用,2012, 32(S2): 147-150.

[19]陶新民,宋少宇,曹盼东,等. 一种基于流形距离核的谱聚类算法[J]. 信息与控制,2012,41(3):307-313.

[20]叶青,胡昌标. 一种改进的基于图论的图像分割方法[J].  计算机与现代化, 2016, 10(9): 64-69.

[21]刘松涛,殷福亮.  基于图割的图像分割方法及其新进展[J]. 自动化学报,2012, 38(6): 911-922.

(责任编辑:杜能钢)

收稿日期:2019-05-06

作者简介:冒伟(1993-),男,上海理工大学光电信息与计算机工程学院硕士研究生,研究方向为机器学习、图像识别。

猜你喜欢
图像分割特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
一种基于LBP 特征提取和稀疏表示的肝病识别算法
基于DSP的直线特征提取算法
基于MED和循环域解调的多故障特征提取
Walsh变换在滚动轴承早期故障特征提取中的应用