邰晓曼,仲 臣
(1.安徽理工大学 空间信息与测绘工程学院,安徽 淮南 232001;2.矿山采动灾害空天地协同监测与预警安徽普通高校重点实验室,安徽 淮南 232001;3.矿区环境与灾害协同监测煤炭行业工程研究中心,安徽 淮南 232001)
随着工业化进程不断加速及环境恶化,水资源日益匮乏,精确及时地获取水体信息变得极为重要。与此同时,遥感影像的易获取性、开放性等促使遥感成为识别和监测水资源的重要手段。目前,提取水体的方法包括水体提取指数模型(NIR、NDVI、NDWI、SWI、MSWI)、监督分类(最大似然法、平行六面体、最小距离、马氏距离、神经网络、SVM等)、非监督分类、决策树、面向对象等,上述方法在低、中、高分辨率遥感影像上提取水体都有较好的效果[1]。
对于高分辨率遥感影像,刘双童[2]等对比分析不同水体指数模型对水体提取精度和稳定性的影响,得到在相同阈值变化范围内不同指数模型在同一研究区内阈值对水体提取精度的影响程度不同;陈文倩[3]等提出将单波段阈值法与阴影水体指数法相结合的决策树算法,结果显示此方法可将山体阴影与水体分开,还能有效消除山体裸地与积雪的影响;对于中、低分辨率遥感影像,李爱民[4]等利用SPOT影像探讨针对不同类型水域选择何种提取方法,此研究表明不同水域需选择相适宜的遥感指数方法。但是对同一水体不同季节的水体提取效果研究较为罕见,文中利用最大似然法、面向对象法以及水体指数模型(NDWI)对同一研究区四季的水体遥感影像进行实验,分析上述方法在不同季节的适用性。
文中选取巢湖作为研究区,巢湖是位于长江中下游的中国五大淡水湖之一,东西长55 km、南北宽21 km,湖岸线周长176 km,平均水深2.89 m,面积780 km2。巢湖位于北纬31°95′、东经117°86′,属于北亚热带湿润季风气候区,气候温和,季风气候显著,冬寒夏热,四季分明。巢湖夏季多爆发蓝藻且周围的主要农作物为水稻。因此,选取巢湖作为研究区可明显区分不同方法在同一季节及相同方法在不同季节对水体提取结果的影响。
根据研究区地理位置,从地理空间数据云网站下载条代号为121、行编号为38的Landsat-8 OLI_TIRS影像作为本实验的数据源。选取日期分别为2017-04-23(春季)、2017-07-25(夏季)、2017-09-14(秋季)、2017-12-19(冬季)的影像,其云量分别为0.64%、0.56%、1.38%和0.09%,获取的影像画面清晰,质量良好,水体部分无遮挡,薄云也不会对结果造成影响。原始影像如图1所示。
图1 巢湖地区Landsat-8 OLI_TIRS影像
研究使用的数据源:由NASA发射的最新卫星Landsat-8,卫星上两个重要的传感器分别是OLI和TIRS,与其他Landsat系列卫星不同的是陆地成像仪包括9个波段,成像宽幅为185 km×185 km,除了分辨率为15 m的全色波段外,其他波段空间分辨率为30 m。在图像预处理方面对多光谱波段进行辐射定标以及大气校正,将高分辨率的单波段影像与低分辨率的多光谱影像重采样,提高分辨率至15 m,并基于自然分割边界进行虚拟边缘裁剪。
文中实验使用的是传统的水体提取指数,即Mcfeeters在1996年提出的归一化差分水体指数(NDWI)[5],用遥感影像的特定波段进行归一化差值处理,以凸显影像中的水体信息,其表达式为
计算完成需检核计算成果,结果介于[-1,1]之间,表示可进行水体提取。通过绘制水体感兴趣区(Region of Interest,ROI),对兴趣区进行统计分析得到阈值,经多次尝试选取0.717 7作为本次实验阈值[6]。采用归一化水体指数法对研究区影像进行水体信息提取,结果如图2所示。
图2中白色像素为提取的目标水体(巢湖),灰色及黑色像素为其余地物,并将上述规则应用于最大似然法、面象对象法提取水体的结果。
在数据集中,监督分类根据用户定义的训练样本类别来聚类像元。训练样本类别是单一波谱或者像元的集合,训练区通常通过感兴趣区域来选择,而且应该尽可能地选择具有单纯像元的ROI。选择最大似然法进行监督分类,这种分类器运行的原理是假设不同类别的数理统计结果都呈正态分布,给定提取出的样本像元属于某一训练样本的似然度,最终提取的样本会归纳合并到似然度最大的一类中[7-8]。
图2 归一化水体指数法四季水体提取
根据巢湖周围环境和地理地貌,选择水体、居民地、耕地、裸地及其他地物作为初始训练样本并绘制各样本的ROIs,通过计算样本的可分离性得到上述样本均为合格样本。利用最大似然法分类后建立新的ROIs作为验证样本区,再通过混淆矩阵分析水体提取的精度。最后更改耕地、裸地、居民地和其他地物的颜色为黑色,水体为白色,突出水体提取效果。采用最大似然法对研究区影像进行水体信息提取,结果如图3所示。
图3 监督分类法四季水体提取
面向对象法在影像对象层次基于判别规则或者判别函数的推理来提高影像的分类精度,从而达到对遥感影像目标信息有效提取的目的[9-11]。面向对象法的总体技术流程如下:研究区影像→多尺度影像分割→手动选取样本对地物进行监督分类→分类后处理。
进行多尺度分割时,若分割尺度不合适,会使得在图像分割的过程中出现过分割或者欠分割的现象,Castilla 认为是否存在欠分割和过分割可以作为评价图像分割结果的标准[12-13]。分割结束后进入监督分类面板,选择与最大似然法相同的样本进行分类。分类后处理包括Majority Analysis、聚类处理(Clump)和过滤处理(Sieve),通过ENVI 设置相应参数完成上述步骤后重新分类细小图斑块,提高分类精度[14-15]。此方法提取如图4所示。
图4 面向对象分类法四季水体提取
完成遥感分类后需要对分类结果进行精度评价,以鉴别分类中产生的错误是否会影响最后的结果。分别对不同模型计算总体分类精度和Kappa系数,得到结果见表1—3。
一方面,参照表中Kappa系数与分类精度对应的关系,3种方法的分类系数都在正常值0.40以上,分类效果都在良好以上。使用面向对象法处理的春季影像的Kappa值为0.800 4,分类结果最好,其余两种方法以及面向对象法在其他季节提取的Kappa值都在0.7以上,分类精度良好。总体来看,在此研究区面向对象法相较于水体指数法及最大似然法的水体提取效果最好,分类精度最高。
表1 归一化水体指数(NDWI)的精度评价结果
表2 最大似然法(监督分类)的精度评价结果
表3 面向对象法的精度评价结果
通过栅格面积计算对3种分类方法的结果进行面积统计,将这两类方法提取的水体面积进行比较,通过了解每种方法对不同季节水体提取的误差大小,确定不同方法对不同季节水体提取的适用性,如表4所示。
表4 各个方法提取的巢湖区水体面积 km2
人工解译矢量化、NDWI、面向对象分类提取的水体面积都存在着夏季水体面积大于春季水体面积大于冬季水体面积大于秋季水体面积这个大小关系式,而对于监督分类的水体面积,除了冬季要远远大于其他三季外,也存在着夏季水体面积大于春季水体面积大于秋季水体面积的关系。
以人工解译矢量化图像得到的水体分类结果为基础进行精度对比,探究哪一种方法与其更为相近,如表5所示。
表5 水体提取方法精度比较 %
总体来看,归一化水体指数法、面向对象分类法与人工解译矢量化的相对精度较小,且面向对象分类法与归一化水体指数法提取水体的精度也没有较大差距,但是监督分类的相对误差较其他两种方法来说大得多。从人工矢量化目视解译的相对误差上看,归一化水体指数法差距较小,监督分类也较平均,但面向对象法波动大,冬季的相对误差较其他季节相比较大,说明冬季水面结冰对使用面向对象提取水体有干扰,这种影响不易消除,所以应尽量避免使用冬季的封冻湖泊遥感影像进行水体提取。在尝试进行不同季节水体提取操作时,面向对象法的相对误差春季的相对精度最小,NDWI法和监督分类法每个季节都较为平均,说明季节的变化对面向对象和监督分类的影响都不大,但从总体提取精度上看,NDWI分类比监督分类更适用于巢湖水体的提取。
文中以巢湖作为研究区域,利用3种常用的水体提取方法:归一化水体指数法、监督分类法和面向对象分类法,分别对1 a中代表4个季节的4个月份的研究区影像进行水体提取,比较3种方法在四季中的提取精度和适用性,并通过计算出的水体面积分析湖泊的动态变化过程,确定3种方法的季节适用性,得到以下结论:
1)文中所研究的3种水体提取方法对封冻住的湖泊(即冰面)的水体提取都不太理想,较为明显的是面向对象结果有较多的错分水体信息,相较之下水体指数法和监督分类法的精度较高,提取效果较好。而除去冬季的其他3个季节,相比于水体指数法和监督分类法,面向对象法更适合进行巢湖的水体提取。
2)在四季变换中,巢湖的水体面积夏季达到最大,在使用同一种方法提取的情况下,春、秋、冬三季的水体面积没有非常大的差异。由于巢湖所在地区夏季多暴雨且安徽多作为泄洪区域,导致巢湖夏季水体面积较春、 秋、冬三季迅速增长。其次,巢湖夏季多爆发蓝藻,导致夏季水体面积变化大。
3)面向对象法可适用于巢湖春、夏、秋三季的水体提取,归一化水体指数法适用于各季节水体提取。文章只选取巢湖作为研究区探究了不同方法对不同季节水体提取的影响,若要确定合适的不同地区不同季节的水体提取方法还需选取与巢湖地理位置、气候条件差异较大的研究区进一步探究。