尹慧新 樊彦国
(中国石油大学(华东),青岛 266580)
水资源是人类极其宝贵的自然资源之一,我国淡水资源总量虽居世界第四,但人均占有量仅为世界人均的1/4。利用遥感技术准确快速地获取陆上水体动态信息,是水资源调查、面积监测的一种高效技术手段[1]。
现阶段关于水体信息提取的研究不在少数,数据源多为多光谱、高光谱影像数据;研究方法中单波段阈值法、谱间关系法、指数法居多。国外对于水体提取的研究多旨在设计或改进水体指数,消除各种环境噪声。如文献[2]提出了改进归一化差异水体指数(MNDWI)的半自动水体特征提取方法,并证明了其对拉桑山水体提取的可靠性更好。文献[3]提出了一种新的水体指数——自动水体提取指数(AWEI),该方法较MNDWI法、最大似然法分类,提高了包括阴影和暗表面在内的区域分类精度。文献[4]为了消除水体提取中的噪音,提出了一种将归一化差异水体指数和地表温度相结合的方法——水提取表面温度指数(WESTI),该方法去除了80%以上的地形阴影,且具有很好的精确率和鲁棒性。
我国则多是针对特定区域或遥感传感器进行水体提取方法的对比和改进。文献[5]基于Landsat-7卫星遥感影像,采用K-T变换(缨帽变换法)、归一化差异水体指数(NDWI)、增强型水体指数(EWI)提取洱海水体面积,通过面积对比得出,NDWI方法最佳。文献[6]采用NDWI、EWI、MNDWI、新型水体指数(NWI)和AWEI对云贵高原10个湖泊水域面积进行提取,其中洱海采用NWI,提取精度最高。文献[7]基于HJ-1A卫星的高光谱数据,由归一化差异植被指数(NDVI)和NDWI构建了基于指数的水体指数(IWI),试验表明,IWI提高了水体提取精度。
尽管以上文献针对不同数据源采取了不同的水体提取方法,但“珠海一号”卫星组网的高光谱卫星数据在水体提取方面还是一片空白,且在高原湖泊水体提取中以往的方法易存在多种阴影干扰的情况。因此本文利用该高光谱卫星数据,采用单波段阈值法、谱间关系法、三种已有水体指数法及新构建的水体提取指数——阴影建筑指数(SBI)法进行水体提取研究。通过对比各种方法的精度,科学判定洱海水体提取的最佳方法。
(1)研究区概况
洱海,位于云南省大理白族自治州大理市境内,是云南第二大淡水湖[8]。岸直坡陡,湖体狭长。湖水全年水温为12℃~21℃,年平均温度为15.5℃。研究区内除洱海外,还有众多大小不一的水库及池塘,群山环绕,且有少量云层覆盖。建筑物多分布在洱海西部、南部及西南部,大理市区位于西南部,紧邻洱海,景色优美。
(2)数据源
高光谱影像为“珠海一号”卫星星座02组A星(OHS-2A)影像,空间分辨率为10m,单幅成像范围为150km×2 500km,光谱分辨率2.5nm,谱段数32个,波谱范围400~1 000nm,即从可见光至近红外波段。本文包含洱海的OHS-2A卫星影像,成像于2018年11月30日,成像地点为云南大理白族自治州洱源县。数据处理等级为 L1级,已经过相对辐射定标和系统几何校正,需对其进行绝对辐射定标、大气校正、正射校正的预处理工作,用于水体信息的提取。
为了得到研究区域内地类的光谱特征,对影像中6种主要地类分别选取10个特征点[9],如图1所示。为尽量使其均匀分布在研究区域内,并对10个特征点进行光谱曲线平均,最终共得到6条不同地类的光谱曲线,如图2所示。
图1 特征点分布Fig.1 The graph of feature points distribution
图2 主要地类光谱曲线Fig.2 Major terrestrial spectral curves
水体:在480nm和566nm(分别为第2、7波段的中心波长)即蓝、绿波段处,有两个明显的反射峰[10]。在此之后反射率逐渐下降,直至700~880 nm波长范围内达到最低点,反射率几乎为0。即水体在蓝、绿波段处吸收性和透射性相对较弱,反射性较高,而在近红外波段处水体几乎吸收了全部的光波入射能量,反射率很低[11]。
阴影:在720nm波长(第17、18波段处)附近和水体光谱曲线相交,在此之前,反射率低于水体,变化趋势二者几乎一致。730nm波长之后,阴影的反射率略高于水体,变化趋势仍保持一致[12]。阴影信息包括山体阴影和建筑阴影,其和水体光谱曲线的相似性极有可能导致难以将二者区分开,错误提取阴影为水体信息。
其他地类:除植被光谱曲线在可见光范围内反射率偏低外,建筑物、裸山、道路在全光谱波段的反射率均明显高于水体。尤其是裸地,反射率从可见光到近红外几乎呈直线上升。除水体外,其他5种地类的反射率在近红外波段均处于高值状态。
(1)单波段阈值法
单波段阈值法是指选定某一具体波段,通过设置适当的阈值对水体进行提取[13]。阈值定义式为
式中R28为第28波段的反射率值;δ为阈值。当反射率≥δ时判断为非水体,<δ时判断为水体。提取结果如图3(a)。
图3 水体提取结果Fig.3 Results of water extraction
阈值通过分析相关波段的灰度直方图确定。单波段阈值法确定为454,小于454为水体,否则为背景。
(2)多波段谱间关系法
谱间关系法是利用水体与背景地物波谱曲线变化趋势的不同,构建出多个波段间的逻辑关系式[13]。由图2可知,水体在可见光波段的反射率明显大于其在近红外波段的反射率,而其他地物相反,则表达式为
式中R2、R7、R20、R25、R27分别为第 2、7、20、25、27波段的反射率,提取结果如图 3(b)。直方图确定阈值为220,大于220为水体,否则为背景。
(3)已有水体指数法
水体在可见光和近红外波段的光谱特性大不同于其他地物,众多的水体指数均是利用了这一典型特征。如文献[14]对绿、红、近红外波段进行光谱分析后,选取或构建水体指数。本文依据OHS-2A卫星的光谱范围选择适合的水体指数,提取水体信息。
1)归一化差异水体指数法。归一化差异水体指数(Normal Differential Water Index,NDWI)利用了水体在绿波段反射率较高,近红外波段反射率低的特性[15],将OHS-2A卫星高光谱影像的第7、28波段分别作为绿和近红外波段,定义式为
提取结果如图3(c)。阈值设为0.15,大于0.15为水体,否则为背景。
2)改进的阴影水体指数法。改进的阴影水体指数(Modified Shade Water Index,MSWI)是基于阴影水体指数,使阴影和水体的分离程度更高的比值模型[16]。将OHS-2A卫星高光谱影像的第2、28波段分别作为蓝和近红外波段,定义式为
提取结果如图3(d)。阈值设为0,大于0为水体,否则为背景。
3)综合权重水体指数法。综合权重水体指数(Comprehensive Weight Water Index,CWWI)利用蓝、绿、近红外三个波段,通过赋予三个波段不同权值,进行波段组合[17]。定义式为
该方法通过强化水体反射与吸收的差异进一步区分水体与非水体。利用光标定位和灰度直方图,经反复试验,确定水体的CWWI值在600~3 200之间。因此使用图像分割法,设置最低、最高阈值:600、3200,提取水体信息。提取结果如图3(e)。
(4)本文构建的新指数——阴影建筑指数法
阴影建筑指数(Shaded Building Index,SBI)是利用NDWI和近红外波段的乘积,通过阈值选择实现水体的提取。若单纯采用NDWI极容易造成阴影与水体的混淆,噪声杂质较多。研究区中典型地物NDWI值从大到小的排序为:水体、建筑、山体阴影、植被,亮度依次降低,其中水体和建筑明暗度相似,数值交叉现象严重。水体在近红外波段与其它地物有显著差异,反射率从大到小的排序为:植被、山体阴影、建筑、水体[18]。因此,SBI的表达式为
式中 NDWI为归一化差异水体指数;RNIR为近红外波段反射率。提取结果如图4(a)。NDWI与近红外波段的平方相乘,在便于识别结果灰度值和有效提取水体的情况下,能使水体与其它地物的数值差异最大化,尤其与建筑的灰度值不再存在交叉现象。水体分割阈值为0和41 000,分割后图像如图4(b)。
图4 SBI法水体提取Fig.4 Water extraction results by the shaded building index
(1)水体提取结果
基于以上六种方法进行的水体提取试验,根据设定的合适阈值,利用ENVI5.3中的Band Math将其转为二值图[19],即1值(白色)为水体,0值(黑色)为背景。其中CWWI法和SBI法的二值图阈值设置为:B1≠0,B1为相应方法分割后的单波段影像。
由于提取水体范围较大,为了更清楚地对比六种方法的水体提取效果,图5展示了各方法的提取细节。
图5 水体提取细节对比Fig.5 Comparison in detail of water extraction
由图5目视判读可知,单波段阈值法提取的水体内部最纯净,无背景杂质混入,且水体边界清晰。但同时也提取了所有的阴影,主要包括山体阴影和建筑阴影,受背景影响较大。谱间关系法与其相比,山体、植被阴影有所减少,且水体提取相对完整,但关系式的构建更适合于波段数较多的高光谱影像。
三种已有水体指数的提取效果总体来看不如谱间关系法。NDWI极大程度地抑制了植被信息,强化水体信息[20],但在山体阴影和建筑区域与水体产生了混淆,大量被误提为水体。MSWI严重缺失对水体内部信息的提取,尤其是一些长条形的水库,仅提取了外部边界。CWWI对山体阴影的抑制和水体信息的提取虽稍好于NDWI和MSWI,但仍存在大量建筑噪声。
本文构建的SBI,在水体提取的纯净度上,仅次于单波段阈值法;在抑制建筑和山体等噪声方面,展现出了极大的优势:在保留细长河流水体的同时,几乎完全去除了建筑的影响,山体阴影也达到了最小,且水库之间的植被噪声同时被消除,目视提取效果明显优于其他五种方法。
(2)精度评价
采用BIGEMAP中同时期谷歌无偏移地图影像,空间分辨率可达1m,细小水库均清晰可见。因研究区包含众多水库及无名池塘,因此选取最小宽度大于20m的水域,在ArcMap中进行矢量化,见图6。
图6 洱海及周围库塘分布Fig.6 The distribution map of Erhai Lake and its surrounding reservoirs
利用ENVI5.3软件将上述矢量图作为地面真实图像,与六种水体提取方法的分类二值图,生成混淆矩阵及Kappa系数表,进行精度验证。具体见表1。
表1 不同水体提取方法精度比较Tab.1 Precision comparison of different water extraction methods
将各方法的总体精度和Kappa系数可视化,如图7。
从表1及图7可以看出,不同水体提取方法的总体精度从大到小依次为:SBI法>谱间关系法>CWWI法>NDWI法>MSWI法>单波段阈值法,提取精度均在97%以上。Kappa系数除谱间关系法稍低于CWWI法外,其余均与总体精度排序一致,且系数值都在0.8以上。表明这六种方法提取的水体信息与实际情况相符,其中SBI法总体精度最高为99.8%,Kappa系数高于0.98;而单波段阈值法总体精度为97.9%,Kappa系数为0.88,均为六种方法最低值。
图7 六种水体提取方法精度对比Fig.7 The accuracy comparison diagram of six water extraction methods
综合分析,六种算法中,单波段阈值法虽生产精度较高,但错分误差较大,提取了全部的阴影,且Kappa系数偏低。NDWI法和MSWI法的错分误差大大减少,但MSWI法的漏分误差为六种算法中最大值,可见其水体提取能力较弱,且提取了大量山体阴影。谱间关系法和CWWI法的各种精度指标相差不大,仅次于SBI法,说明二者的水体提取能力较强,可满足精度要求。SBI法无论是生产精度、用户精度,还是总体精度和Kappa系数都是六种方法中的最高值,错分误差、漏分误差也是最低值,可见该方法有很强的水体提取性能,不仅完整提取了水体信息,还有效抑制了环境噪声,提高了高原湖泊水体提取精度。
本文利用OHS-2A卫星的高光谱影像,以六种不同的方法对洱海及周围水体进行提取和精度验证,得出以下结论:
1)对于高原湖泊——洱海,本文构建的新指数SBI,对其水体提取精度最高,错分、漏分误差最低;单波段阈值法水体提取精度相对最低。二者相比,用户精度提高了16.47%,Kappa系数提高了0.098 5。
2)数据源为空间分辨率10m的高光谱影像,即在具有精细光谱波段的同时兼具高空间分辨率,本文六种方法表明了其在水体提取方面的可行性。
3)SBI法相比其他五种方法,在完整提取水体的同时,有效去除了建筑噪声,抑制了山体、植被阴影等背景信息的干扰,非常适合于高原湖泊的水体提取。
虽然本文构建的水体指数对建筑噪声有相当好的去除作用,但山体阴影仍然有一部分存在。下一步研究将致力于进一步消除山体阴影,并将该指数用于其他遥感影像或地区的水体提取,验证其普适性和鲁棒性。