聂欣然, 刘 荣, 聂爱球, 余 健, 王道芸
(1.东华理工大学测绘工程学院,江西南昌 330013; 2.流域生态与地理环境监测国家测绘地理信息局重点实验室,江西南昌 330013;3.江西省交通设计研究院有限责任公司,江西南昌 330022)
地表水体信息的获取对于水资源调查、水利规划、水质监测、湿地保护、流域生态评估等具有重大意义[1]。传统的野外测量方法虽然能够获取较高精度的水体信息,但受气候、地势和水文等因素的影响,不仅费时费力,且难以反映水体在时间和空间上的分布状况。而遥感技术具有大尺度、成本低、周期性和速度快等特点,能够更准确快速地提取水体信息,成为长久监测河流、湖泊和海洋等水体的重要手段[2]。
常用的水体信息提取方法一般分为单波段法和多波段法。单波段法是指通过对近红外波段或中红外波段等单一波段设置合适阈值来提取水体的方法[3],又称单波段阈值法,主要依据水体在近红外和中红外波段的低反射特征以及植被、建筑物和裸地等在这2个波段的高反射特征来区分水体和其他地物。多波段法则通过对多个波段进行组合运算,以达到加强水体信息的目的,主要包括谱间关系法、差值法、比值法、植被指数法、水体指数法等。周成虎等在研究TM影像中水体和背景地物的波谱特征曲线时,发现水体具有TM2加TM3大于TM4加TM5的谱间关系特征,并依此建立逻辑判断规则来提取水体[4]。陈华芳等利用TM影像的第二波段和第五波段进行差值运算,并辅以相应阈值,有效地区别出水体和阴影[5]。王晴晴等根据TM影像中水体的灰度值在第二波段高于第五波段,而其余地物的灰度值在第二波段低于第五波段这一特性,构建了简单比值型水体指数(simple ratio of water index,简称SRWI),快速区分了水体和背景地物[6]。于欢等采用归一化差异植被指数(normalized difference vegetation index,简称NDVI)对内陆湿地水体进行了提取,获得了较好的效果[7]。受NDVI的启发,各种水体指数应运而生,如归一化差异水体指数(normalized difference water index,简称NDWI)、改进的归一化差异水体指数(modified normalized difference water index,简称MNDWI)、薄云覆盖下山区水体指数(light clouds cover down the mountain water index,简称CMWI)、改进型混合水体指数(new combined index of NDVI and NIR for water body identification,简称NCIWI)、经验型归一化差异水体指数(empirical normalized difference water index,简称ENDWI)等[8-12]。本研究重点研究了NDVI和MNDWI 2种常用的水体提取方法后,对二者重新进行了组合,以MNDWI的分子作为新指数的分子,以NDVI的分母作为新指数的分母,构建出一种能够减少裸地错提现象的新型组合水体指数(new combination of water index,简称NCWI)。
选取昆明市滇池、长江下游马鞍山河段、大连市近岸海域3块研究区进行试验。昆明市位于云贵高原中部地区,属北纬低纬度亚热带-高原山地季风气候,全年四季如春,又被称为“春城”,市区南部的滇池为云南省第一大淡水湖,湖泊流域面积2 920 km2。马鞍山市地处安徽省东部,长江下游地区,属亚热带湿润季风气候,地表水资源以河流为主,全市水系发达,境内河流总面积约为26.7 km2。大连市位于辽宁省辽东半岛南端,地处黄渤海之滨,属暖温带大陆性季风气候,为典型的港口城市,全市水资源较为丰富,水系主要包括黄海和渤海两大流域。
试验采用2011年2月26日(轨道号129/43)、2010年8月19日(轨道号120/38)和2010年8月3日(轨道号120/33)分别从昆明市、马鞍山市、大连市上空过境的Landsat TM影像,影像成像质量良好,云量均低于0.2%,已进行过系统辐射校正、地面控制点几何校正和DEM地形校正等处理,研究区影像均通过ENVI 5.1裁剪完成。
1.3.1 水体提取原理 在大多数卫星传感器的波长范围内,水体的吸收能力较强,而反射能力较弱,并且反射率有随波长增加而减小的趋势。清澈水体在蓝绿光波段(0.48~0.58 μm,对应TM影像的第一和第二波段)的反射率介于4%~5%;红光波段(0.58 μm,对应TM影像的第三波段),反射率下降至2%~3%;当波长超过0.74 μm,特别是在近红外波段和中红外波段(0.74~2.50 μm,对应TM影像的第四、第五和第七波段),水体对入射光的吸收能力达到最强,导致反射率降至谷底,接近于零,这也是水体在影像中色调偏暗的原因[13],而植被、建筑物、裸地在近红外波段和中红外波段有较高的反射率(图1),这就为区分水体和背景地物提供了依据。因此,可以总结出清澈水体在各波段的反射率高低依次为蓝光>绿光>红光>近红外>中红外。此外,水体中叶绿素和悬浮物浓度的升高会导致水体浑浊度增加,反射率也会相应提高,使得波谱特征曲线的反射峰向长波方向推进[9]。
1.3.2 水体提取方法
1.3.2.1 归一化差异植被指数(NDVI) NDVI由Rouse等于1973年提出[14],最初用于植被生长状况研究和植被覆盖率监测。相关学者研究发现,水体的反射率从红光波段到近红外波段逐渐减弱,而植被的反射率从红光波段到近红外波段突然增强(图2),根据近红外波段和红光波段的反差构建出的NDVI可以很好地区分出水体和植被,故又被用于提取水体。公式如下:
NDVI=(NIR-Red)/(NIR+Red)。
(1)
式中:NIR为近红外波段,对应TM影像的第四波段;Red为红光波段,对应TM影像的第三波段。
1.3.2.2 改进的归一化差异水体指数(MNDWI) 徐涵秋在研究TM影像的光谱特征后发现,水体的反射率从绿光波段到中红外波段持续减弱,在中红外波长范围内有最强的吸收特性[9],而建筑物的反射率从近红外波段到中红外波段快速增强,根据这种特点,选择绿光波段和中红外波段构建了归一化比值模型,增大了水体和建筑物之间的反差,减小了二者混淆的程度。公式如下:
MNDWI=(Green-MIR)/(Green+MIR)。
(2)
式中:Green为绿光波段,对应TM影像的第二波段;MIR为中红外波段,对应TM影像的第五波段。
1.3.2.3 新型组合水体指数(NCWI) 通过分析各区域的典型地物光谱特征(图1~图3)可以看出,裸地的反射率在绿光波段存在最小值,而在中红外波段则存在最大值,2个波段之间进行差值运算,则可以得到1个负值;而裸地在近红外波段和红光波段的反射率和值要小于在绿光波段和近红外波段的反射率和值(表1~表3),所以在MNDWI的分子不变的情况下,利用NDVI的分母替换掉MNDWI的分母,即运用近红外波段和红光波段的反射率和值替换绿光波段和中红外波段的反射率和值,则计算出来的裸地的指数值将明显减小。相应的水体因为在绿光波段的反射率较高,在中红外波段的反射率较低,2个波段之间进行差值运算后则会呈现正值;而水体在近红外波段和红光波段的反射率和值要大于在绿光波段和中红外波段的反射率和值,所以在替换掉MNDWI的分母后,计算得出的水体的指数值同样会减小。但值得注意的是,裸地指数值减小的幅度要远大于水体指数值减小的幅度,水体与裸地的反差将会得到相当程度的增强,从而降低2种地物的混淆,提高水体提取的精度。公式如下:
NCWI=(Green-MIR)/(NIR+Red)。
(3)
式中:Green为绿光波段,Red为红光波段,NIR为近红外波段,MIR为中红外波段,分别对应TM影像的第二、三、四、五波段。
利用NDVI、MNDWI和NCWI 3种方法对湖泊区、河流区、海洋区3种典型区域的水体进行提取,提取阈值统一选择0.4。并引入反差值指标来描述水体与背景地物的可分离性,反差值越大,说明水体和背景地物的可分离性越好[15]。公式如下:
C=|W-B|。
(4)
式中:C为反差值,W为水体的NDVI、MNDWI或NCWI均值,B为背景地物的NDVI、MNDWI或NCWI均值。
湖泊区选择昆明市滇池(图4-a),背景地物中植被和建筑物居多。从各指数的提取结果来看,虽然NDVI较好地抑制了植被的干扰(图4-b),但因为水体和建筑物的NDVI均值都呈现负值(表1、表2),分别为-0.19和-0.07,容易形成大量的建筑物噪音,所以成片的建筑物被混淆为水体,如滇池东北方向大块建筑物信息被提取出来。此外,裸地的NDVI均值虽然出现正值,为0.11,但和水体之间的反差值较小为0.30,所以仍有部分裸地被误提。而水体的MNDWI均值表现为正值,其余地物的MNDWI均值都表现为负值,所以能较好地抑制背景地物的干扰,尤其体现在对建筑物信息的抑制,水体和建筑物的反差值达到了0.71,远远高于NDVI中的0.12。但MNDWI在水体和裸地的分离上还有所欠缺(图4-c),有相当一部分的裸地被错认为水体一并被提取。而NCWI在利用近红外波段和红光波段的和值替换掉MNDWI的分母后,计算出的裸地的NCWI均值-0.85要小于MNDWI均值-0.56,继续研究水体与裸地的反差值可以发现,CNCWI值1.25比CMNDWI值0.99提升了26.26 %,反差值的升高说明水体和裸地的分离效果得到了加强,通过目视解译也能够发现大部分裸地信息被抑制(图4-d)。
表1 湖泊区不同地物的亮度均值、NDVI、MNDWI、NCWI均值
表2 湖泊区水体和植被、建筑物、裸地的反差值
河流区以植被覆盖程度较高的长江下游河段为例(图5-a),背景地物中约有70 %为植被,建筑物次之,裸地最少。对比图5-b、图5-c、图5-d,不难看出MNDWI和NCWI的提取效果要优于NDVI,主要原因是NDVI提取的水体不够完全,部分零散湖泊和细小河流被漏提,如城区中央的雨山湖和长江左侧的得胜河。并且NDVI也未能消除建筑物和裸地的干扰,从表3、表4可以看出,建筑物与水体的反差值为 0.02,而裸地与水体的反差值也仅为0.08。仔细观察MNDWI影像和NCWI影像可知,MNDWI中仍有少量裸地被识别成水体,而NCWI则进一步消除了裸地的干扰。考察水体和裸地的反差值也可以发现,CNCWI值0.73比CMNDWI值0.71高0.02。
海洋区选在大连市近岸海域(图6-a),背景地物包括植被、建筑物和裸地。分别利用3种指数对水体进行提取,结果见图6-b、图6-c、图6-d。NDVI在划分海岸边界时,部分裸露的滩涂被误认为海水,而在建筑密集区和植被覆盖区也出现了裸地错分为水体的情况。此外,NDVI对于建筑物的抑制效果也不是很理想。相比NDVI,MNDWI虽然消除了绝大部分建筑物噪音,但同样出现了裸地被误认为水体的情况,而NCWI则较好地解决了这一问题,不仅同时抑制了植被和建筑物的干扰,还进一步消除了裸地的错提。从表5、表6可以看出,裸地在NDVI、MNDWI和NCWI影像中的值分别为-0.02、-0.36和-0.50,与海水的反差值分别达到了0.17、0.76 和0.89,3种水体提取方法中,NCWI对于裸地的抑制效果最佳。
为了进一步检验新指数有效性,从各研究区影像中随机选择1 000个水体和非水体检验样本,以目视解译的结果作为参考图,通过建立混淆矩阵计算出总体分类精度、Kappa系数、制图精度和用户精度来评价各水体提取模型的提取精度,精度评价结果见表7。对于NCWI模型,湖泊区、河流区和海洋区的Kappa系数分别达到了0.95、0.96和0.99,皆高于同区域的另外2种提取模型。此外,NCWI在各研究区的总体分类精度、制图精度和用户精度也均超过了90%。综合考虑4种评价指标,可以得出各研究区内3种水体提取模型的精度高低依次顺序为NCWI>MNDWI>NDVI。
表3 河流区不同地物的亮度均值、NDVI、MNDWI、NCWI均值
表4 河流区水体和植被、建筑物、裸地的反差值
表5 海洋区不同地物的亮度均值、NDVI、MNDWI、NCWI均值
表6 海洋区水体和植被、建筑物、裸地的反差值
表7 NDVI、MNDWI和NCWI水体提取精度评价
利用NDVI公式中近红外波段和红光波段的反射率和值替换MNDWI公式中绿光波段和中红外波段的反射率和值构建出的新型组合水体指数(NCWI)可以快速全面地提取水体信息。相比NDVI、MNDWI,NCWI不仅能够有效地抑制植被和建筑物噪音,还能进一步减少裸地信息的干扰,特别是在城市、海岸等植被覆盖程度中等或偏低的区域,NCWI的提取效果更佳。此外,NCWI提取湖泊区、河流区、海洋区水体的总体分类精度、制图精度、用户精度都高于90%,Kappa系数也均达到了0.95及以上,较另外2种水体提取方法精度更高。
研究还发现,NCWI在提取水体的过程中,对于露天矿地的抑制还不够完全;并且受影像分辨率的影响,新指数也存在错分和漏分的现象。在今后研究中将会更深入地分析典型区域的地物光谱特征,同时引入高分辨率遥感影像和多源遥感数据融合技术,进一步提高水体指数的实用性。