遥感影像水体信息提取研究进展

2020-12-05 01:55周鹏谢元礼蒋广鑫胡李发
遥感信息 2020年5期
关键词:光谱水体阈值

周鹏,谢元礼,蒋广鑫,胡李发

(西北大学 城市与环境学院,西安 710127)

0 引言

地表水(内陆和沿海)的位置可持续性受气候和人类活动的影响,又反过来影响气候、生物多样性和人类福祉[1]。近年来,气候变化加剧,水环境恶化以及水资源枯竭等问题日益严峻,成为实现可持续发展亟待解决的问题[2-3]。随着遥感技术的迅速发展,高空间、高时间和高光谱分辨率的遥感数据不断丰富[4]。快速、高效、精确地从各类遥感影像上提取水体信息,已经成为水资源调查[5-6]、水环境保护[7-8]、洪涝监测[9-11]、水利规划[12-13]、水体动态变化分析[14-15]的重要手段。本文主要回顾了国内外专家学者利用遥感影像进行水体信息提取的相关研究,重点对其研究方法加以总结;在此基础上,梳理了影响遥感影像水体信息提取精度的关键问题,并提出可能的解决措施;最后对水体信息提取的发展趋势进行展望。

全球主要的对地观测卫星数据都涉及水体信息的提取[16],逐步形成了高空间分辨率、高时间分辨率和高光谱分辨率的总体发展趋势[17]。常用的数据源主要有低空间分辨率的MODIS[18-19],中空间分辨率的Landsat系列[20-22]、SPOT系列[23-24]、ALOSE[25-26]、ASTER[27-28]、我国的环境一号卫星(HJ-1A/1B)[29-30],高空间分辨率的WorldView[31-32]、QuickBird[33]、Ikonos[34]、我国的GF系列[35-36]、资源系列[37-38]。另外,还有SAR数据[10]和高光谱数据[39-40]等。其中,光学遥感数据是水体信息提取的主要数据源,特别是美国的Landsat系列,由于其空间分辨率相对较高、时间序列较长、全球免费共享,成为大部分研究者的首选。另外,高空间分辨率数据逐渐受到研究者青睐。

众多专家学者针对不同的研究区,开展水体信息提取研究。文献[41]着力解决大规模水体的提取;文献[42]主要针对山区细小水体构建最优提取模型;文献[43]的研究成果为极高海拔地区的水体信息提取提供参考;文献[23]针对典型矿区的水体进行研究;文献[8,44]分别针对不同水质和不同类型湖泊的水体进行实验;文献[45]探讨了平原、盆地、高原3种区域水体提取方法的最优选择。针对不同的数据源、不同的研究区域,专家学者提出了不同的水体信息提取模型,按其提取原理与方法特点,本文将水体信息提取方法归纳为阈值分割法、分类器模型法、基于“全域-局部”的提取法和光谱混合分析法4类[46]。

1 遥感影像水体信息提取方法

1.1 阈值分割法

阈值法主要利用遥感图像中不同地物类型的光谱特征差异,选择一个或多个波段构建模型来增强水体,抑制其他地物,通过选择合适的阈值提取水体信息。主要包括单波段法、谱间关系法和水体指数法。阈值分割法的核心和难点在于最佳分割阈值的确定[47],当前主要有经验法、实验法、直方图波谷法[19]、迭代法[48]、加权灰度阈值法[49],而以最大类间方差法(大津法)、最大熵值法和最小误差法为代表的数理统计法,特别是最大类间方差法[50],由于它可以快速准确地确定提取阈值,从而被广泛应用。对于大范围复杂区域的水体提取,可以先将大区域划分成子区域,然后分别在子区域中自适应进行阈值选择和分割[51]。

单波段法主要利用水体同其他地物在近红外或中红外波段的波谱差异,辅以合适的阈值来提取水体,在研究初期,应用较为广泛。

谱间关系法通过分析遥感影像水体与其他地物的光谱特征曲线,构建逻辑判别规则来突出水体信息。文献[52]基于TM影像率先构建了水体信息提取模型,如式(1)所示。文献[53]在此基础上,加入TM5波段,建立适合平原湖泊的水体信息提取方法,如式(2)所示。相较于单一谱间关系法,该方法提取效果更好、精度更高。文献[16]将缨帽变换(tasseled cap transform,K-T变换)后,反映地物湿度信息的KT3分量作为特征波段来构建谱间关系模型,如式(3)所示。该模型仅利用可见光-近红外波段特征,具有较强的推广性,对中巴资源卫星、环境一号星影像的水体信息提取具有借鉴意义。文献[54]依据水体和阴影的波谱在蓝、绿波段下降幅度差异较大的特征构建新的谱间关系模型,如式(4)所示。

TM2+TM3>TM4+TM5

(1)

TM2+TM3>TM4+TM5and TM5>T

(2)

KT3+TM2>TM4+TM3

(3)

(TM2+TM3)-(TM4+TM5)-(TM1-TM2)>N

(4)

水体指数法。利用水体光谱反射特征强的波段与反射特征弱的波段构建比值运算,进一步扩大二者的差异,从而突出水体信息,抑制植被、土壤等非水体信息。近年来,众多学者在前人研究基础上提出许多改进型的、具有针对性的水体指数模型。文献[55]基于MODIS数据,提出改进型组合水体指数(modified-combined index for water body identification,MCIWI),显著提高了水体同背景地物的区分度。针对GF-1数据,文献[56]提出改进的阴影水体指数法(modified shade water index,MSWI)进行水体信息提取,总体精度达到了93.56%。文献[48]通过高斯变换,建立高斯归一化水体指数(GUSS NDWI,GNDWI),提高河流水体的区分度和连续性。文献[57]提出不依赖于中红外波段的伪归一化差异水体指数(false NDWI,FNDWI)进行城镇周边细小河流的提取。文献[58]针对之前水体提取存在精度较低,阈值不稳定的问题,引入一种新的自动水体提取指数(automated water extraction index,AWEI)。文献[59-60]使用多种水体提取指数进行对比分析,探究模型的最优选择。以上仅列举了近年来常用的几种水体指数,具体如表1所示。

综上,单波段法、谱间关系法、水体指数法均基于水体的光谱特征,辅以阈值分割,针对不同数据源,如Landsat系列、MODIS、GF系列等,均可以据此构建合适的提取模型,简单快速地提取水体信息,但这3种方法各有优劣,如表2所示。在实际应用中,应根据研究区特点,有针对性地选择合适的方法。

表1 水体指数模型

表2 3种水体提取方法结果对比

1.2 分类器模型法

分类器模型法将水体作为一个类别,应用特定算法规则进行分类,最终获取水体信息。包括非监督分类和监督分类,当前研究较多是监督分类,主要有面向对象法、决策树法、支持向量机法、神经网络法、随机森林和光谱角匹配法等[61]。

1)面向对象法。面向对象分类法是一种智能化、自动化的影像分析方法,它的研究对象是由若干像元组成的目标地物[62]。首先按照选定的尺度对遥感影像进行分割,使特征相似、面积不等的同质对象组成子区域;然后综合分析子区域的光谱特征、几何特征、拓扑特征等;最后利用特征建立分类规则,从而实现更高精度的地物识别和目标提取。目前,面向对象法进行水体信息提取的数据源主要是高空间分辨率影像[63]。文献[17]以GF-1为数据源,通过分形网络进化算法(fractal net evolution approach,FNEA)并借助Estimation_Scale_Parameter(ESP)尺度分割工具选取最优分割尺度,使用基于知识规则的面向对象法实现水体信息的高精度提取。文献[31]利用异质性最小的区域合并算法对影像进行尺度分割,面向对象对昆山南部WorldView-2影像进行实验,结果表明,形状一致性和面积一致性都达到了86%以上。文献[33]在QuickBird影像融合的基础上,充分利用影像的光谱特征、纹理信息、拓扑关系等构建判读规则,采用最邻近的面向对象法提取北碚城区的水体。文献[64]利用OLI影像多光谱和全色波段融合后的数据,综合颜色、形状、纹理等特征,采用基于模糊分类的面向对象法提取龙羊峡的水体,漏提率和过提率均低于0.2%以下。

传统的基于像元的分类方法在进行水体信息提取时,较易出现“椒盐现象”和“图斑破碎”情况[65]。另外,在处理高分辨率影像时,通过单一像元表达地物语义信息效果较差,面向对象的分类法则有效克服了基于像元层次分类的不足[66],以区域同质对象为目标,兼顾光谱、纹理等特征,通过最优尺度分割算法,实现基于对象的较高层次的遥感图像分类。该方法主要由图像分割和对象分类2个过程构成[67]。分割是分类的基础,分割中最优尺度和分割参数的确定是关键,这直接决定着分类的精度[68],要保证分割后的子区域具有较好的同质性,与邻接区域具有较好的异质性。目前常用的分割方法有多尺度分割[63]、FNEA算法[17,31]、基于边缘的分割[69]等。分类方法分为3种:最邻近法、模糊分类和基于规则的分类。虽然理论和实践都证明面向对象法用于高分辨率遥感影像水体信息提取的有效性,但是最优尺度分割仍是其制约瓶颈,尺度划分难以把握,最优尺度的评价指标尚不完善。另外,有效的分类规则需要大量先验知识,具有一定的主观性。

2)决策树法。决策树分类法是在综合分析遥感影像光谱特征、研究区空间特征的基础上,通过对地物信息增强、统计、判别,结合专家经验知识,建立分类指标和分类规则,然后对分类条件逐步进行二分和细化,从而实现地物信息提取的方法[70]。文献[40]以机载高光谱数据为数据源,提出一种针对城市河网水体的高光谱决策树法,对嘉兴城区的实验表明,精度可达96.24%。文献[70]引入DEM数据构建决策树分类,提高了水体自动识别的精度,有效去除了山区阴影。文献[71]在对城市典型暗地物特征进行分析的基础上,构建城市水体提取知识决策树模型,实验得到的平均检测率为86.18%,平均虚警率为13.82%。文献[72] 基于高分一号遥感影像,提出单波段阈值法与阴影水体指数相结合的决策树水体信息提取模型,实验精度在92.34%以上。文献[73]利用Canny 算子对彩色合成影像进行边缘检测后,进行决策树建模,最终提取出带有精确边缘的水库水体。

水体种类繁多、空间特征多样,运用单一方法、单一特征,往往难以精确地将水体与其他地物区分开来。决策树法是解决单类地物分类问题的有效途径。该方法分类规则简单直观,分类过程容易理解,针对不同的研究区特点,综合水体的光谱、空间特征建立知识表达模型,还可以借助其他辅助数据完善分类决策规则[74]。数据的特征分割值一般依据特征波段的光谱特征手动确定[75-76]。

3)支持向量机法。支持向量机(support vector machine,SVM) 是基于统计学习理论的一种新的机器学习方法[77]。它的原理是寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,实现对线性可分数据的最优分类[78],在高光谱遥感影像地物识别与分类中得到广泛应用。文献[69]针对GF-1数据,分别应用NDWI阈值法、SVM法和面向对象法,对鄱阳湖水体进行提取,得出SVM 法的提取精度最高,达98%以上。文献[79]选用2景TM影像作为研究区,采用SVM监督分类法进行地表水体提取实验,认为该方法对于地表同质性较好的区域提取精度较高。文献[80]研究认为SVM法可以较为完整地提取狭窄的河渠和小面积水体。

SVM法精度的高低,同核函数类型的选择和参数设置紧密相关。常用的核函数类型有径向基(radial basis function,RBF)核函数、线性核函数、多项式核函数及Sigmoid核函数。文献[81]认为,RBF核函数识别率最高,性能最好,且当训练集减少时,分类性能最稳定。该方法的缺点是训练集规模很大、具有较高的维数并且测试数据超过1 000个维数,所以算法复杂、效率较低。另外,利用核函数寻找最优支持向量进行分类,其本质上属于“黑箱”算法,难以对分类规则进行直观解释[82]。

4)神经网络法。人工神经网络(artificial neural network,ANN),简称“神经网络”(NN),它是由大量简单的处理单元互联组成的非线性、复杂信息处理系统,是模拟抽象人的大脑进行数据接收、贮存、处理和传输的算法[83]。由于神经网络具有自组织、自学习、自适应能力、高容错性、大规模并行处理等特点,近年来逐渐在遥感领域得到重视。目前,神经网络在遥感影像水体信息提取中的应用主要有反向传播(back propagation,BP)神经网络和卷积神经网络(convolutional neural networks,CNN)等。文献[38]以ZY-3为数据源,利用卷积神经网络,提出一种基于深度学习的融合空间与光谱信息的水体提取方法,该方法的水体提取精度达94.19%,且水体边界提取效果较好。文献[84]提出一种基于BP神经网络和光谱特征的水体自动提取方法,对长沙市区TM影像的实验表明,该方法在不设置阈值的情况下,可以达到较好的水体提取效果。文献[85]构建基于MapReduce的分布式BP神经网络水体识别模型,在保证水体识别精度(可达92.5%)的同时,提高了水体提取的速度和自动化程度。

神经网络法可以自适应地计算水体样本的阈值,减少人工选择阈值的主观性,对于复杂区域的水体提取效果较好、精度较高。但是,在运算效率、知识表达的模型化和形式化、多源样本数据联合训练等方面仍需要努力。

5)极大似然分类法。极大似然分类法的基本原理就是将多个波段的数据看作是正态分布来构建地物分类的非线性判别函数集[86],通过选择训练样区,计算各样区的归属概率,从而进行图像分类,又称为贝叶斯(Bayes)分类法。文献[14]以H-J1星2009年台风“莫拉克”前后多时相影像为数据源,在去相关拉伸光谱增强的基础上,采用极大似然分类法提取水体信息,总体精度高于96%。文献[29]将经验模态分解(empirical mode decomposition,EMD)和分形理论相结合,构建EMD分形-极大似然分类法提取水体,较传统的监督分类法,精度明显提高。文献[86]利用GF-1数据,采用极大似然分类法对暴雨造成的廊坊市内涝区水体进行提取。

极大似然分类法可以有效避免“同物异谱”和“异物同谱”现象,在提取城区水体时可以克服城市建筑对水体遮挡的影响。但该方法在处理多模式输入数据集时有局限性,因为需要假定数据为正态分布。实际上,遥感数据很少有正态分布的形式,这就限制了应用。另外,该方法需要预先设定实际地物类别,样本过少还会影响分类精度。

6)光谱角匹配法。光谱角匹配(spectral angle mapping,SAM)是监督分类技术的一种。该算法将图像波谱直接同参考波谱匹配,通过比较图像波谱与地物波谱或波谱库中波谱的差异进行分类,在高光谱数据的处理中应用较广,特别是利用高光谱数据进行矿物填图以及蚀变异常信息提取方面[87]。文献[35]利用GF-4数据,提出一种改进的光谱角匹配(modified SAM,MSAM)水体提取模型,在2个实验区的提取精度均达到98.37%以上,可以准确地提取水体,区分阴影。文献[87]利用光谱角匹配法对黄河小浪底水库周边的水体进行提取,结果表明可以有效避免阴影的干扰。文献[88]将该方法应用到处理ETM+多光谱数据中,利用地物光谱夹角及反射率差异,实现对南京市水体信息的提取,对大规模或破碎水体的提取效果均较好。

光谱角匹配法可以有效克服山体阴影和水体光谱特征相似的缺点,较好区分山体阴影,提取水体。但是,快速、定量地确定光谱夹角阈值需要再作探讨。

7)随机森林法。随机森林(random forest,RF)分类器是一种集成分类器,它使用1组分类回归树(classification and regression tree,CART)进行预测,通过替换绘制训练样本子集和变量生成多个决策树,然后利用决策树集合中得出的预测结果来生成可靠的分类。由于分类的准确性,这种分类器在遥感中很受欢迎[89]。文献[61]以Landsat-8 OLI影像为数据源,分别利用多光谱影像的大气表观反射率和水体指数,来构建增强型随机森林分类器,最后利用2个不同BRF的概率线性求和,以分离水体。文献[90]使用武汉地区长时间序列的遥感数据(Landsat TM、ETM+、OLI以及HJ-1A),为每个传感器构造不同的随机森林分类模型,研究分析1987—2016年武汉湖泊的动态变化。文献[91]使用季节性连续的Landsat TM/ETM+数据和随机森林模型,对默里—达令盆地的地表水和洪水的范围以及动态变化(1986—2011年)进行了综合制图。

随机森林是一种分类树算法,已被广泛用于表征跨时空的遥感数据集。研究表明,如果训练样本和研究区改变,则在分类结果的准确性、所需的训练时间以及分类器的稳定性方面,RF分类器的性能要优于决策树分类器[92]。

1.3 基于“全域-局部”的提取法

前面所提到的阈值法和分类器法,大多是利用单一模型对全域影像进行计算、分割、提取。实际上,受地面背景地物、水质类型等影响,影像上水体很难保持均衡性质,特别是在大范围复杂条件下,利用单一模型势必影响水体提取精度。针对这一问题,文献[41]以复杂背景下多样水体的自动解译为目标,采用“全局-局部”的思想,整合自适应分割与分类、局部迭代等关键技术,实现了对巴尔喀什湖地区和长江中下游地区大规模水体信息的自动提取。文献[43]提出一种基于水体指数的“全域-局部”自动阈值分割法,实现全域阈值的自动选择与局部阈值的自适应调整,并结合DEM生成的坡度和阴影信息,减少水体信息的误判。文献[44]提出基于局部端元光谱表征的水体信息自适应提取方法(local end member spectral characterization,LESC),水体提取精度达到93.7%。文献[93] 基于NDWI提出一种“全域-局部”双尺度变换的自动方法,并结合光谱特征拟合(spectral feature fitting, SFF)方法和迭代算法精确地提取湖泊范围。文献[94]将DEM生成的水系“图”特征和水体的光“谱”特征耦合,通过NDWI的阈值分割和局部自适应迭代机制,实现伊犁河上游支流河道细小水体的自动化、精确化提取。文献[13]结合空间聚合“图”特征和非线性“谱“映射结果,以ETM+为数据源,提出图谱迭代反馈的自适应水体提取方法(WERSTP),实验提取精度达到98.8%,获得很好的效果。

基于“全域-局部”思想的提取法,耦合“图-谱”理论,融合水体的光谱、形态、纹理、分布等特征,全域分割分类与局部分割分类相结合,自适应的局部阈值迭代计算,整个过程减少了人工干预,自动化程度显著提高。但是该方法计算复杂,筛选和优化最显著的“诊断特征”较难,局部阈值迭代终止条件难以确定,对于线状河流水体的提取难以达到较好的效果。

1.4 光谱混合分析法

传统的基元像元的方法,均没有考虑混合像元的问题,而遥感影像无论分辨率多么高,总是不可避免地存在混合像元的问题[95],特别是随着空间分辨率的降低,这种现象就越发严重,混合像元的存在影响了水体信息的提取精度。不少学者对此开展研究,提出混合像元线性分解模型。该方法认为遥感影像中,一个像元内往往混杂着多种地类端元,反映出来的像元值,也是几种地物端元光谱值的混合,因此根据每一个像元在各波段的反射率,分解出像元中各种地物端元所占的比例,从而提高遥感影像的解译精度[96]。文献[97]基于MODIS的反射率数据,利用改进的线性混合像元分解法对青藏高原上的水体面积进行提取,认为该方法提取结果精度较高,河流、湖泊的细节特征提取效果较好;同时,很大程度上消除了阴影的影响。文献[98]基于混合像元分解法提取红碱淖湖的面积,并分析湖面的动态变化。文献[99]以ALOS 影像为数据源,利用线性混合像元分解法获得各像元水体丰度,结合阈值法和数学形态学法,提出水体边界像元面积修正算法,提高水体信息识别精度。

混合像元分解法是解决混合像元问题和“同物异谱”现象的一种有效方法,该方法能够明显减少水体信息提取的误差,并能克服山区阴影的干扰,难点在于地物端元的选取和水陆交界处水体的提取。目前常用的端元选取方法有纯净像元法(pixel purity index method,PPI)、主成分分析法、多指数模型法等。对于水陆交界处混合像元区的水体提取,前人是在提取的纯净水体基础上,利用数学形态法向外膨胀一个像元,再和纯净水体图像进行图像求差,从而实现水陆交界处水体的提取。优化水陆交界处混合像元区滩地水分含量估算方法,改进地物端元确定准则可作进一步研究。

2 遥感影像水体信息提取存在的问题与解决措施

2.1 云和阴影干扰

不管是地形复杂的山区,还是平原地区,抑或是城市内部,都存在云和阴影的干扰,由于水体与阴影的光谱特征类似,容易造成水体的误提,因此消除阴影干扰是以上4种方法提取水体时都无法回避、必须克服的问题。对此,专家学者提出了不同的方法加以解决。文献[61]认为绿色波段较其他波段,对山体阴影具有更好可分性,利用ρ3

2.2 分割阈值的确定

图像分割阈值的确定始终是一个难题,尤其是常用的阈值分割法,必须解决这一问题,关键在于最佳阈值与漏提、误提之间的平衡。对此,学者提出了不同的阈值确定方法(前文已述,这里不再赘述)。计算机自适应确定图像分割阈值是一种不错的尝试,可以迅速锁定阈值范围,减少人工干预。但实际应用中,背景地物复杂,水体理化性质不均衡,仍需要以计算机自动确定的阈值为参考,人机交互决定最佳阈值。

2.3 细小水体的精确提取

针对大规模的水体提取,目前的提取方法较多,精度较高,但是对于细小水体的精确提取,尚面临挑战[101]。细小水体受空间分辨率的影响,在影像上表现出河面较窄、细小狭长的空间特征[102];受周边环境的影响,易形成混合像元;受地形阴影的干扰,易形成噪声。因此,提取结果会出现断流、不连续的现象。文献[65]利用地物光谱特征和形态特征差异,采用“先粗后细”的分级提取法,综合面向对象分割和SVM监督分类并结合形态学开、闭运算,逐步逼近水体边界,最终得到完整、连续的水体。文献[54]在利用多波段谱间关系改进模型提取细小水体基础上,通过数学形态学的膨胀滤波算法实现空洞填充及断流连接,最后进行二值图像细化和边缘追踪,实现细小河流的完整提取。文献[57]提出伪归一化差异水体指数(FNDWI),较好地提取城镇周边细小河流信息。文献[94]以DEM数据生成的水系矢量图作为先验知识,通过光谱水体指数的全局阈值分割和局部自适应阈值选择和迭代计算,实现河道水体的精确提取。

3 结束语

遥感影像水体信息提取为水域动态变化监测、水环境保护提供重要支撑,将得到更多关注和应用。随着多卫星、多传感器的快速发展,多源数据的免费开放与获取,可以利用的数据将日趋多样化,今后,多源数据、多种方法和多种技术的综合应用将为遥感影像水体信息的提取研究带来更大机遇。

多源数据融合使用。引入多源数据可以弥补单一光学遥感数据的不足,如利用DEM数据生成的坡度图和地形晕渲图,可以降低山体阴影的干扰;雷达数据具有全天候的数据获取能力,且不受阴雨和多云天气的干扰,在克服多云和山体阴影干扰方面效果显著;高空间分辨率和高时间分辨率数据的融合在洪水动态监测中具有更广阔的空间。

多种方法综合运用。辅助运用多种方法来改善单一方法的缺陷,如利用数学形态法,对提取结果进行腐蚀、膨胀、开闭运算,可以减少“椒盐”现象,优化水体提取细部,提高细小水体提取精度;光谱特征指数法和面向对象法相结合,可以充分利用水体的光谱特征和纹理、形状特征,增加识别规则。

多种技术善加利用。充分利用多种影像增强技术,如LBV变换,将图像上每个像元的灰度值转换成地物的总辐射水平(L分量)、地物的可见光-红外光辐射平衡(B分量)和地物辐射随波段的变化矢量(V分量)3个物理分量,从另一个角度利用遥感影像水体的光谱特性提取水体;HSV变换,将RGB彩色空间转换为色度(H和S)和亮度(V)分量解耦的HSV(色相,饱和度和值)空间,以弥补在颜色空间上图像分析的不足;利用图像超分辨率(super-resolution,RS)重建技术,提高影像分辨率,从而提高水体解译精度。另外,还可以借助大数据,深度学习算法提高最优尺度分割和最佳阈值选择。

猜你喜欢
光谱水体阈值
基于三维Saab变换的高光谱图像压缩方法
农村黑臭水体治理和污水处理浅探
多源污染水体水环境质量提升技术应用
生态修复理念在河道水体治理中的应用
高光谱遥感成像技术的发展与展望
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于CS-TWR的动态阈值贪婪算法成像研究
基于自适应阈值和连通域的隧道裂缝提取
广元:治理黑臭水体 再还水清岸美
基于迟滞比较器的双阈值稳压供电控制电路