沈吉宝
(甘肃省测绘工程院,甘肃 兰州 730050)
水体分布信息的准确获取在水资源调查、流域综合治理、水利规划、洪水监测与灾害评估等领域具有重要意义[1]。遥感影像具有直观明了、宏观性强的特点,能清楚地反映出区域或者整个流域的水体空间分布情况,利用遥感技术提取水体信息已成为一种趋势。
现有的遥感影像水体提取方法通常采用基于监督分类的方法,该类方法依据水陆对近/中红外波段敏感,采用统计阈值的方法来提取水体信息,原理简单容易实现,但漏提狭小的水体且对阴影区域敏感。或是利用多波段影像信息,通过计算各个波段影像间的综合关系提取水体,可以分为水体指数法和谱间关系法。骆剑承等以Landsat为数据源,在归一化差异水体指数法基础上,采用分步迭代的空间转换机制可初步实现湖泊水体信息的自动提取[2]。杨树文等基于TM影像多波段特性,对多波段谱间关系法进行改进,用于提取山区细小水体[3]。沈金祥等采用面向对象的图像分析方法提取出山区湖泊TM图像的水体信息[4]。胡卫国等利用归一化差异水体指数和归一化差分植被指数对资源一号02C星影像进行适用性研究,提出了更适合资源一号02C星影像的决策树水体信息提取方法[5]。随着影像空间分辨率的不断提高,水体空间分布情况、卫星影像分辨率及波段对水体提取方法的选择有不同的需求。城市内的高层建筑、桥梁、树木等的阴影现象较普遍,对水体信息提取造成干扰,并且城市河道水体一般较窄,从中、低分辨率卫星遥感影像中较难识别[6]。陈爱军等利用模糊C均值算法对影像进行初始分类,然后通过最小邻近聚类方法对分类结果进行优化,剔除虚假水体信息,实现水体信息的快速提取,但该方法提取水体边界不清楚[7]。于晓升等利用机器学习与测地线活动轮廓结合的方法提取水体边界信息,能有效地避免水体边界提取不清晰问题,但算法的粗提取效果依然存在一定的问题[8]。随着近年来机器学习分类器算法不断提出,分类准确率得到提高[9],但分类精度还存在提升空间。
为此,针对高分辨率遥感影像河流识别率较低问题,为了充分挖掘多种特征融合的优势,本文提出利用水体指数、阴影水体指数、LBP局部纹理特征以及颜色特征融合的遥感影像水体提取方法。对提取的影像特征利用机器学习分类器进行学习与识别,针对粗分类结果存在一定误检问题,提出多判据软投票方法剔除错误检测,提高遥感影像水体提取的召回率、精确率和准确率。
水体对入射能量具有强吸收性,在大部分遥感传感器的波长范围内,总体上呈现较弱的反射率,并具有随着波长的增加进一步减弱的趋势。具体表现为在可见光的波长范围里(480~580 nm),其反射率约为4%~5%,但到了580 nm处,则下降为2%~3%;当波长大于740 nm时,几乎所有入射纯水体的能量均被吸收。由于水体在近红外及随后的中红外波段范围内(740~2 500 nm)所具有的强吸收特点,导致清澈水在这一波长范围内几乎无反射率。因此,这一波长范围常被用来研究水陆分界、圈定水体范围。但是随着水体浑浊度(各种有机、无机物质浓度)的增加,水体的反射率会有所变化。如水体泥沙含量的增加会导致反射率的提高,并使光谱曲线的反射峰往长波方向移动。在遥感多光谱影像上水体的纹理一般比较均匀、平滑,并在一定空间范围内趋于平缓;水体形状不一,但与周边地表覆盖类型光谱差异较大。城市中的湖泊、河流如果为正常水体,其在真彩色影像中展示的色彩为墨绿和绿色,在彩红外影像中展示为黑色或蓝黑色,通过目视判别,较易与其它地物进行区分。
归一化差异水体指数(NDWI)是依据水体信息在绿光波段及近红外波段具有较强反射和吸收的特性,将二者的差及和做比值运算,从而达到增强水体信息、抑制背景地物的效果,有效提取水体信息。基于多光谱影像数据的水体提取模型如下:
NDWI=(b2-b4)/(b2+b4)
(1)
式中,b2和b4分别为遥感影像的绿波段及近红外波段的辐射亮度值。理论上可选取NDWI阈值为0,将水体信息与其它地物区分开来,但实际中应根据采用的具体影像及研究区域选取合适的阈值。
基于上述水体指数提取出的水体信息结果往往掺杂城市建筑物、树木等阴影,因此需要将阴影从提取出的暗区中分离出来。根据4个多波段光谱特征,构建阴影水体指数(Shadow Water Index,SWI):
SWI=b1+b2-b4
(2)
式中,SWI为阴影水体指数;b1、b2、b4分别为遥感影像的绿、蓝和近红外波段。
遥感影像上水体区域的纹理比较单一、变化较小,具有一定的旋转不变性,并具有较强的噪声抵抗能力。而非水体地物影像变化较大,局部表面纹理信息比较丰富。采用纹理特征能有效地表达水体信息,由于LBP纹理具有良好的方向选择性与空间局部特性,可以对遥感影像进行不同尺度上局部特征提取,同时LBP局部纹理特征对光照强弱变换不敏感[10],对影像变形与旋转具有一定的不变性[11]。因此,本文采用LBP算法提取影像的纹理特征。原始LBP算子以局部3×3窗口中心像素值为局部阈值,将相邻区域的像素值与中心像素值比较,若中心像素值大于相邻像素值,则将该位置标记为0,否则为1。最终获取一个8位的二进制数,将二进制数转10位即为该中心像素的LBP局部纹理值,该值可以有效地表达该区域的纹理信息,用于提取影像的LBP纹理特征,如图1所示。
图1 LBP纹理特征计算示意图
遥感影像的颜色信息包含大量的稳健性强的特征,在同一轨道高度空间获取的遥感影像水体区域的颜色一般呈现偏黄或偏绿的现象。因此,在颜色空间存在较强的规律,可以提取颜色空间的颜色方差与均值作为颜色空间的特征值。假设n为待检测区域的像素个数,i为影像的波段号(蓝、绿、红、近红外波段),p(i,j)为待提取影像区域中第i波段第j个像素的像素值。因此,第i波段的像素均值表示为:
(3)
(4)
遥感影像数据中无论是水体指数、阴影水体指数、LBP局部纹理还是颜色等单一特征都不能有效地区分水体与非水体地物,给水体提取带来困难。鉴于此,本文通过对遥感影像的水体指数、阴影水体指数、LBP纹理特征以及颜色特征进行学习,提取多种特征进行融合充分挖掘遥感影像信息,进而提高遥感影像水体提取方法的性能。
利用上述方法提取多种特征的数据分别具有不同的数据级,避免某一类特征在分类过程影响其他特征有效表达,对不同的特征数据进行归一化处理。将所有的特征数据变换到同一尺度下,首先提取该特征的最大、最小值并将数据映射到0~1之间。假设x为某一特征的特征向量,xi为某一特征的特征值,max(x)表示特征向量x的最大值,min(x)表示特征向量x的最小值,yi为归一化后的特征值,则:
yi=(xi-min(x))/(max(x)-min(x))
(5)
用于提取水体的特征由水体指数、阴影水体指数、LBP局部纹理和颜色特征组成,采用特征值串联的方式将多种不同类型的特征进行特征融合。则每张遥感影像生成特征影像具有的总维数为:1+1+1+2=5。
水体边界提取可以归属于影像二分类问题,目前常用的分类器为支持向量机(support SVM)分类器、随机森林(RF)分类器、AdaBoost集成分类器以及极限学习机等常用的分类器等。文章从提取多种不同特征出发,采用多种分类器进行实验对比分析,最终选择分类效果最佳的极限学习机作为分类器。实验环境为Windows 7 CoreTM i7-7820X,显卡为丽台Quadro P5000(NVID公司,美国)。利用MATLAB环境运行,SVM分类器选用LibSVM库提供的CSVM模型,核函数参数Gamma取值为0.07,惩罚因子c取值为2。随机森林分类器选用MATLAB机器学习库,其中树的结构数选用100。
文中提取水体指数、阴影水体指数、LBP局部纹理特征以及颜色特征,为了充分挖掘多特征组合的优势,探讨适合融合特征的分类器,分别采用SVM、RF、AdaBoost以及极限学习机分类器对提取的融合特征进行训练与分类实验,不同分类器水体粗检测结果如表1所示。从表1可以看出,极限学习机分类方法对本文选取的多种特征的适应性优于其他分类器。
表1 不同分类器水体提取精度验证
利用机器学习机分类器对整幅遥感影像上的每个对象进行检测,判断影像对象是否属于水体区域。初始检测的结果存在一定的误检测的结果,包括非水体区域的误检测对象、水体区域的误检测对象。因此,需要对初始检测结果进行优化处理,剔除错误的检测结果,提高整体检测正确率。本文利用非水体对象与水体对象的RGB颜色空间距离、LBP纹理相似程度以及角点分布差异剔除误匹配对象。
(1)颜色空间判断依据
(6)
表示待检测对象与水体区域颜色空间的欧式距离。若该对象为非水体对象,则其在颜色空间与水体对象的距离较大,因此采用指数函数PRGB作为判断水体的依据:
PRGB=10DRGB,q
(7)
(2)LBP纹理相似程度
依据文章1.3部分介绍的LBP纹理提取方法,计算该对象各个波段的纹理特征值向量mLBP,q,为避免噪声影响对于大区域的对象采用同颜色空间处理一致的策略,计算纹理均值mLBP, 在纹理特征空间中计算待检测对象与水体对象间的距离DLBP,q=|mLBP,q-mLBP|,从而可以计算待检测对象与水体对象在纹理特征空间的相似程度:PLBP=10DLBP,q。
(3)角点分布差异依据
在遥感影像上水体区域相对比较平坦,复杂物体的边缘以及角点特征数量都比较少,而非水体区域存在大量的角点与边缘线。本文利用MinEigen算子提取遥感影像上角点特征,并计算影像对象上对应角点数量。利用影像对象上存在的角点总数N与像素总数S的比值作为判断角点分布差异性指标,即mcorner,q=N/S,在面积较大的水体对象上同样取5个面积相同的子区域计算均值mcorner,计算角点分布差异Dc,q和相应角点分布判断依据Pc为:
Dc,q=|mcorner,q-mcorner|
(8)
Pc=10Dc,q
(9)
若Pc (4)投票决策 综合上述判断准则,依据软投票的思想决策待检测对象是否为水体区域,待定对象的最终决策函数为: P=PLBP+PRGB (10) 将投票值C 实验采用的训练数据集为武汉大学发布的Gaofen Image Dataset(GID),该数据集包含150景高质量的高分二号影像,影像空间分辨率为1 m全色影像和4 m的多光谱影像,影像大小为6 908×7 300像元,多光谱提供蓝色、绿色、红色、近红外等四个波段影像。选取6块数据作为训练数据,对训练数据进行旋转、平移处理便可以产生更多的样本数据,选取训练样本数据包括山川、城市、田野、河流和森林等不同目标。为了定量评价本文提出水体检测方法的性能,采用测试数据进行实验,利用水体提取结果的召回率R、精确率P以及准确率A等指标进行评价。采用Tp表示检测为水体对象中正确的数量,Fp表示检测为水体对象中错误的数量,Tn表示检测为非水体对象中正确的数量,Fn表示检测为非水体对象中错误的数量。则R、P以及A的计算表达式为: R=Tp/(Tp+FN) (11) P=Tp/(Tp+Fp) (12) A=(Tp+TN)/(Tp+FN+Fp+TN) (13) 通过实验统计选取6块样本数据结果的平均值得到极限学习机检测粗水体与优化后结果的正确率对比如表2所示。从表2中可知,初始检测结果的正确率为91.35%,但其召回率与精确率相对较低,因为水体检测结果存在大量的漏检与误检结果。通过利用多判据软投票法优化粗分类结果,剔除误检与漏检结果后,召回率与准确率均有所提升,精确率为95.86%,召回率与准确率分别提高到91.85%与92.33%,证明该方法的有效性。 表2 水体粗检测结果优化前后对比结果/(%) 采用极限学习机分类器训练样本数据时,依次提取影像对象的水体指数、阴影水体指数、LBP局部纹理以及颜色特征信息,构建5维的特征空间向量,利用极限学习机分类器分类后得到模型。选取两组高分二号数据的遥感影像如图2(a)所示,利用极限学习机分类器获得检测结果如图2(b)所示,利用多判据软投票优化的结果如图2(c)所示。 图2 提取结果对比 由图2可知,利用极限学习机分类器提取水体信息时,由于水体与阴影在近红外波段有交叉部分,提取结果中包含大量建筑物的阴影信息与小面积的阴影信息。通过后期的多判据软投票法去除阴影与建筑区域的干扰,提取出的水体信息较好,基本与目视解译结果一致。 本文提出的多特征融合的遥感影像水体提取方法选取两组高分二号的影像数据为研究区域,分别提取影像的水体指数、阴影水体指数、LBP局部纹理特征以及颜色特征等多种特征,并将多种特征融合,利用多种学习机分类器提取研究区域的水体信息。实验结果表明,通过引用多判据软投票方法能有效剔除抑制阴影信息的干扰,快速提取城市河道水体信息,总体准确率在94%以上,为高分辨率卫星遥感影像提取城市宽度较窄的河道信息提供一定的辅助和参考。但是文中缺少水体的水质变化情况对检测结果的影响分析,这将是下一步的研究方向。3 实验结果分析
4 结 论