基于改进的SLIC和OTSU的遥感影像水体提取

2019-01-21 00:57龚林松李士进
计算机技术与发展 2019年1期
关键词:波段水体阈值

龚林松,李士进

(河海大学 计算机与信息学院,江苏 南京 210098)

0 引 言

水体信息提取是生态保护工作的重要组成部分,如湖泊海岸带管理、海岸线变化检测、洪水预报和水资源评价等。遥感技术具有覆盖范围广、信息获取速度快、包含信息量大、节省人力物力等优势,利用遥感影像的水体信息自动提取技术已经成为水生态监测、水资源调查与利用、水利工程规划与评估等方面的重要研究手段[1]。

目前从遥感图像中提取水体信息的方法主要有四种:单波段阈值法、多波段谱间关系法、水体指数法和决策树。单波段阈值法是利用了水体能够吸收掉绝大多数近红外波段的辐射能量而土壤和植物对该波段具有较强的反射性特点,根据光谱特征的不同提取水体。其中,单波段密度分割法具有较高的水体提取精度,但同时也会包含许多非水体像元[2]。刘建波等利用密度分割法从TM图像中提取水体的分布范围[3]。多波段谱间关系法通过分析比较水体与背景地物(植被、土壤等)的光谱特征曲线,利用数学表达式将遥感图像中的水体信息与其他地物区分开来。邓劲松等在SPOT影像中利用波段间的运算方法成功地将居民地与水体分开[4]。水体指数法寻找多光谱图像中最强和最弱的水体特征反射波段,并借助比例运算扩大最强反射波段和最弱反射波段之间的差距来检测水体。McFeeters等(1996)提出归一化差异水体指数NDWI检测水体[5];徐涵秋等(2005)提出能更好地提取城市水体信息的改进归一化差异水体指数(MNDWI)[6]。决策树方法背后的理论基础是通过使用一定的决定性条件,逐步对原始数据实现二分和细化,以最终提取出水体信息。丁建丽等(2015)提出单波段阈值法与阴影水体指数SWI(shadow water index)相结合的决策树水体信息提取方法用于提取山区水体[7]。

以上这些水体提取方法都有各自的特点,均取得了一定程度上的成功,但它们也都各有缺点。单波段阈值法采用的模型简单,计算效率高,但容易受到阴影,水质变化等因素的影响。多波段光谱关系法有效解决了阴影影响的问题,特别适用于山区水体信息的提取,但使用的光谱特征模型不固定。水体指数法在抑制植被、阴影、土壤等干扰因素方面具有明显的优势,然而却过于依赖地物特征关系表现的强弱,当地物特征关系减弱时,水体指数法并不能得到令人满意的效果。决策树方法除了使用图像本身信息之外还能融入其他先验知识,得到更准确的判断,但是创建一个好的决策规则是很难的。

为了能够实现从高分辨率遥感图像中准确快速地提取水体信息,文中提出了一种基于超像素与OTSU算法相结合的水体提取方法。首先对遥感图像进行预处理,将图像从RGB色彩空间转换到CIELAB空间并融合水体指数特征创建混合特征LABXYW,然后使用该特征对遥感图像做超像素分割。在超像素分割的基础上使用OTSU算法对超像素进行阈值分割,最终提取出遥感图像中的水体信息。

1 遥感图像预处理及水体特征的构建

高分一号16 m分辨率的多光谱宽覆盖WFV(wide field of view)卫星相机共提供四个波段信息,波段总范围为0.45 μm~0.89 μm。其中,0.45 μm~0.52 μm为蓝光波段,0.52 μm~0.59 μm为绿光波段,0.63 μm~0.69 μm为红光波段,而0.77 μm~0.89 μm为近红外波段[8]。高分一号的多分辨率遥感卫星采用DN(digital number)值来表示地物在遥感影像像元中的亮度,代表地物的灰度值。

归一化差异水体指数NDWI是以地物在绿光波段和近红外波段的DN值为基础构建,其计算公式为:

(1)

其中,DNgreen表示绿光波段的DN值,DNNIR表示近红外波段的DN值,对应于高分一号的多光谱遥感卫星中的第二和第四波段。NDWI水体指数抑制陆地植被等信息而突出水体信息,且式1对NDWI数值进行了拉伸,可使不同卫星传感器和成像条件的影像获得的水体指数具有相近的、可比较的统计特性,便于后续建立统一的信息提取模型[9]。

将高分一号的近红外波段、红光波段和绿光波段分别对应于RGB图像的红、绿、蓝三个通道合成标准假彩色数字图像。由于SLIC算法是在CIELAB颜色空间做的运算,所以要把标准假彩色遥感图像通过色彩空间转换公式从RGB颜色空间转换到CIELAB颜色空间。对应每个像素的(L,a,b)颜色值和(x,y)坐标组成一个5维向量V[L,a,b,x,y],两个像素间的相似性可由它们的向量距离来度量,距离越小,相似性越大,反之则越小。最后通过与NDWI(归一化水体指数)相结合,构建用于提取遥感图像中的水体的混合特征空间LABXYW,称为LABXYW特征(W即NDWI水体指数)。LABXYW特征空间不仅考虑了遥感图像中的水体与其他地物在颜色和空间位置特征上的不同,同时也融入了水体指数信息,为后续使用SLIC和OTSU相结合的水体分割方法提供了较强的水体信息的鉴别能力。

2 基于SLIC和OTSU的水体分割

随着遥感技术的不断发展,高分辨率遥感图像被广泛地应用于地物信息的提取上。从遥感图像中提取水体本质上就是对每一个像素做分类,将水体像素与非水体像素分开。由于逐像素地对高分辨率遥感图像中的每个像素进行分类时,不仅需要更长的处理时间,而且每个像素中包含的空间结构信息少,缺乏对水体区域信息进行合理的统计,导致最后的分类结果较差。超像素作为近年来在图像预分割领域的前沿算法,不仅能够较好地描述子区域信息,而且能够更加准确地描述区域的空间结构特征。通过使用前面构建的LABXYW特征对遥感图像进行超像素分割,可以尽可能把水体和其他地物区分开来,使用SLIC预分割是文中水体提取算法的第一步。

2.1 经典的SLIC分割

SLIC是Achanta等提出的一种思想简单,实现方便的超像素分割算法[10],该算法根据颜色和距离2种特征对图像中的像素进行聚类。首先将彩色图像从RGB色彩空间转换到CIELAB色彩空间,将像素在LAB色彩空间的颜色分量以及x,y坐标相组合形成五维特征向量,然后使用K-means算法根据一定的距离度量标准对5维特征向量进行像素聚类,生成一个个大小均匀紧凑的超像素块,且算法的时间复杂度很低。其算法步骤如下:

(2)调整种子点位置:在初始种子点的n×n(一般取n=3)邻域内计算邻领域内所有像素点的梯度值,调整初始种子点的位置为该邻域内梯度最小的地方,这样可以避免种子点落在梯度较大的轮廓边界上,影响后续像素聚类的效果。

(3)分配类标签:在每个种子点的邻域内为该邻域内的所有像素点分配类标签,不同于标准的K-means在整张图片上做搜索,SLIC算法将像素的搜索空间限制在2S×2S范围内,这样可以使算法更快收敛。如图1所示,虽然期望的超像素大小为S×S,但实际的搜索范围是2S×2S。

图1 减少超像素搜索空间

(4)距离度量:距离包括空间距离和颜色距离两个部分。对于每一个被搜索到的像素点,分别计算它和该种子点的欧氏距离,计算公式如下:

(2)

(3)

(4)

(5)

因为每一个像素点都可能会被多个种子点搜索到,所以每个像素点都会有一个与周围种子点的距离,取距离最小的种子点作为该像素的聚类中心。

(5)迭代优化:不断的重复步骤1~4,直到误差收敛到某一阈值或到了最大迭代次数。实验发现在多数情况下,10次迭代对于绝大多数图像都取得了比较好的效果,所以一般设置最大迭代次数为10。

(6)连通性增强:通过步骤1~5迭代优化所形成的超像素有可能出现多连通、尺寸太小和单个超像素被切割成多个不连续的超像素等情况。通过连通性增强可以解决这些问题,具体做法如下:新建一张标记表,表内元素均为-1,按照从左到右,从上到下顺序将图像中尺寸过小和不连续的超像素与邻近的超像素合并,遍历过的像素点分配相应的标签,直到所有像素遍历完毕为止。

2.2 用于水体提取的SLIC算法

直接把经典的SLIC算法应用于遥感图像的水体提取并不能取得令人满意的分割效果,生成的超像素并不能很好地区分水体和非水体,许多超像素中既包含水体像素也有非水体像素。对于高光谱遥感图像,将光谱、纹理等特征结合起来可以提高算法的准确性[11]。基于此,文中对用于水体提取的经典SLIC算法做了改进,不仅考虑遥感图像上像素的颜色和距离特征,同时把水体指数特征也考虑进来。在SLIC算法做K-means聚类时,把水体指数距离也作为距离度量的一部分,这样可以尽可能地把超像素聚类成水体和非水体两类。相对于上面经典的SLIC算法的第四步,改进后的SLIC算法的距离度量公式变为:

(6)

(7)

(8)

则最终用于水体提取的SLIC算法的距离计算公式为:

(9)

如图2所示,通过以上新的距离度量公式,水体和非水体得到了很好的区分,水体超像素中不再包含非水体像元,很好地把遥感图像中的像素聚为水体和非水体两类。

2.3 基于最大超像素类间方差的水体提取

最大类间方差法(OTSU法),是由大津展之在1979年提出的,所以又叫大津算法[12]。该算法是在判决分析的基础推导出来的,是一种自动的无参数无监督的阈值分割算法。大津算法是一种基于一维灰度直方图,计算简单的阈值分割方法,应用十分广泛[13]。

图2 加入NDWI所形成的超像素

不同于经典的基于像素的OTSU算法,文中提出一种基于改进的SLIC和OTSU相结合的水体提取算法。其基本思想是首先对每一个超像素都计算出其水体指数,对于确定不是水体的超像素可以令其为0,便于后续算法的精确阈值的计算。然后在超像素的基础上做最大类间方差计算。具体步骤如下:假设所有超像素中每个超像素的水体指数范围为[0,L],则待分割图像可以分为前景超像素(水体)和背景超像素(其他地物)两类。设阈值为K,则可以将遥感图像中的超像素分为[0,K]和[K+1,L]两类,设ηi为水体指数为i的超像素个数,图像中超像素的总个数为N,则水体指数为i的概率为:

(10)

前景超像素和背景超像素的概率分别为:

(11)

前景超像素和背景超像素的水体指数均值为:

(12)

所有超像素的水体指数均值为:

μ=ω0μ0+ω1μ1

(13)

则最大超像素类间方差定义为:

(14)

最大超像素类间方差算法计算水体指数的最大阈值T的公式为:

(15)

根据上面的公式可知,当超像素的水体指数值位于两个类别的临界处时最大。若有前景超像素或者背景超像素被错分,都会导致超像素的类间方差减少。如式14所示,当前背景超像素的水体指数均值差别最大时,类间方差达到最大值,前背景分割的效果最佳。

3 实验结果及分析

为验证文中方法的有效性,对江苏省溧阳市天目湖沙河水库进行遥感图像水体信息提取。实验数据来源于中国卫星资源应用中心高分一号卫星拍摄的分辨率为16 m的遥感影像,选取2013年第四季度的图像进行实验。沙河水库位于江苏省溧阳市南部丘陵地区,地处东经119°25',北纬31°18'。湖泊水面面积为11.6 km2,集水面积152 km2,平均水深7 m,最大水深14 m[14]。沙河水库是国家4A级旅游景区,也是溧阳市的主要饮用水水源地,承载着该市65万人的饮用水供给,它的研究、开发和保护对江苏的生态保护具有重要意义[15]。

3.1 水体提取效果

文中采用的SLIC和OTSU相结合的算法是一种快速的提取水体方法,通过调节SLIC中超像素的数量可以在时间效率和提取准确度上进行平衡。当提取的准确性比较重要时,可以设置超像素的数量多一点。当时间比较重要时,可以设置超像素的数量少一点。文中算法通过设置超像素种子点间的距离S来控制超像素的数量,如图3所示。

图3 不同超像素数量提取结果

图3(a)为实验所用的图像,图3(b)为S=5时水体提取的结果。结果表明当选用的S较小时,所生成的超像素面积更小,数量更多,可以提取出图像这个更加微小的水体,但耗费的时间更长,共用时90.3 s。图3(c)为S=10时水体提取的结果。结果表明虽然没有提取出微小的水体,但提取出的水体结果还是令人满意的,基本不存在误提取现象,提取用时15.3 s。图3(d)为S=20时水体提取的结果。结果表明,由于选用的S变得更大,每个超像素的面积也变得更大了,使得一些微小的水体得不到保留,同时由于生成的超像素中更大了,包含了一些其他非水体元素,所以导致最终提取的结果中也包含一些微小的非水体元素,但提取的时间进一步减少为10.5 s。实验结果表明,文中算法具有良好的分割精度和运行效率。

3.2 水体提取效果对比

为了比较文中算法与其他算法的效果,使用信息检索的评价指标-查全率、查准率、F指数对提取结果进行评价。查全率R和查准率P如下:

(16)

(17)

F评价指数是查准率和查全率的加权调和平均值,文中采用F评价指数作为评估的综合指标,其计算公式为:

(18)

图4 沙河水库提取结果对比

如图4所示,仅使用图像RGB像素值的GrabCut算法提取的效果不好,提取的时间较长且需要人工不断交互,不适合做自动处理。传统的NDWI算法提取的效果一般,比GrabCut算法提取出了更多的水体,提取的速度很快,但精度还有所欠缺,存在漏提取现象。文中算法在设置超像素种子间距离S=10时,提取精度和速度都很好,与其他两种提取算法相比有很大优势,具体的提取结果如表1所示。

表1 不同方法水体提取结果对比 %

4 结束语

提出一种基于改进SLIC和OTSU算法相结合的水体提取方法,将超像素分割算法SLIC与水体指数模型相结合,把图像中的像素聚类成一个个超像素,然后在超像素分割的基础上,对超像素使用OTSU(最大类间方差)算法进行阈值分割,从而提取图像中的水体。通过对沙河水库的高分一号遥感图像进行水体提取的实验结果表明,该方法能够快速提取出水体信息并达到了较高的水体提取精度。

猜你喜欢
波段水体阈值
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
农村黑臭水体治理和污水处理浅探
农村黑臭水体治理与农村污水处理程度探讨
改进的软硬阈值法及其在地震数据降噪中的研究
土石坝坝体失稳破坏降水阈值的确定方法
基于小波变换阈值去噪算法的改进
生态修复理念在河道水体治理中的应用
最佳波段选择的迁西县土地利用信息提取研究