基于Landsat-8 OLI影像的黔西北高原地表水体提取方法研究

2020-08-31 07:38:52陈凡美任金铜段夕跃
贵州工程应用技术学院学报 2020年3期
关键词:关系法决策树波段

陈凡美,任金铜,简 进,瞿 倩,段夕跃

(1.贵州工程应用技术学院生态工程学院,贵州毕节551700;2.贵州新发展水保生态工程咨询有限公司,贵州贵阳550000)

水体是人类生产生活所必须的一种重要资源,水体信息对区域水资源、气候、农业等具有重要意义。水体变化可能引起洪涝灾害、水资源枯竭、水源性疾病爆发等,因此,精确快速开展水体信息调查是非常必要的[1]。水资源调查及水体信息获取采用传统手段进行监测费时费力,且周期长、时效差,质量难以保障。遥感具有大面积同步观测、时效性强、经济性、数据具有综合性和可比性等特点,利用遥感技术进行大面积水体资源调查、变化检测、洪涝灾害监测等方面具有显著优势[2]。

国内外学者利用不同类型遥感影像及信息提取方法对水体信息提取进行了研究。其中,利用多光谱数据进行信息提取时,最大似然分类算法最为常用,但该方法只能提供较低的分类精度(30%-60%)[3];后来,研究者发现分类回归树(Classification And Regression Tree,CART)[4]和人工神经网络[5]等在一定程度上能够提高信息提取的精度;Khatami等人研究得出支持向量机和随机森林算法分类精度较高,其次是神经网络,最大似然分类则是普遍使用的基准算法[6]。谷金英、晏明等发现利用归一化差异水体指数法,再结合阈值法能够将水体信息完整地提取出来[7];王瑾杰、丁建丽等以GF-1号卫星为数据源提出一种改进的阴影水体指数法(Mmodified Shade Water Index,MSWI)进行水体信息提取[8];张伟、赵理君等以GF-4的PMS传感器影像为数据源,提出了一种基于多时相影像在近红外波段变化方差的快速水体提取方法[9]。此外,针对水体信息提取方面,国内外专家提出了不同的分类算法,以提高水体信息提取精度。其中,张启华、王胜利等基于Landsat-8 OIL影像提出了一种空-谱角匹配与多指数法相结合的水体信息提取方法,对细小水体也具备较好的识别能力[10]。李佳雨、王华斌等以资源三号卫星影像为数据源,发现NMEM模型的水体提取效果最佳,可有效排除大量黑暗阴影的干扰,基本消除椒盐噪声[11]。孔美美、陈锻生利用Landsat遥感影像采用完全约束最小二乘法混合像元分解(FCLS)方法,发现FCLS方法能准确地获取水库水体面积大小及其变化信息[12]。然而,由于喀斯特山区地形复杂、山高谷深、云雾较多,并受到植被覆盖等的影响,针对我国西南喀斯特山区水体信息提取的研究较少。本研究基于Landsat-8 OLI影像,通过对比不同水体信息提取方法,以获取最优提取效果的分类方法,为喀斯特山区水体信息提取提供一定的科学参考。

1 研究区概况及数据预处理

1.1 研究区概况

黔西北高原以喀斯特山区为主,即贵州省西北部,在目前的研究中较少被提及,主要是以毕节市为主,所属区域位于贵州省西北部,与贵阳和遵义构成贵州“金三角”,是乌江、北盘江、赤水河的重要发源地[13]。黔西北高原地处云贵高原北缘,紧邻四川盆地南缘山地,地势北西高而东南低,峰、谷延展方向与构造线方向基本一致,属中至中高山,多分布深切割地形,山切割较深、地貌破碎,土地资源以山地、丘陵为主,平坝地较少[14]。区内主要植被类型为亚热带常绿阔叶林,大部分属于北亚热带温凉湿润气候,年平均气温10.5~15℃,年平均降水量848.6~1394.4mm,地下水系十分发育,地表水系不完整,分属于长江流域和珠江流域两大水系[15]。

1.2 数据源及数据预处理

本研究采用Landsat-8 OLI影像数据开展研究工作,Landsat-8是美国陆地卫星计划的第八颗卫星,于2013年2月发射成功,携带有陆地成像仪(Operational Land Imager,OLI)和热红外传感器(Thermal In⁃frared Sensor,TIRS)[16]。其中,OLI陆地成像仪包括9个波段,空间分辨率为30m,包括一个15m的全色波段,成像宽幅为185×185km。Landsat-8自发射以来得到了广泛的关注,被应用于全球变化、农业、林业、地质、资源环境、水质等研究领域。

本文中遥感影像数据来源于美国地质勘探局①和地理空间数据云平台②(见表1),所选影像数据的条带号位于127-129,行编号为41-42之间。影像选择时间为4-10月,影像质量良好,云量小于5%。在开展水体信息提取前,对影像数据进行辐射定标、FLAASH大气校正、图像融合、裁剪、镶嵌等预处理工作。

表1 研究所用Landsat-8影像数据

2 研究方法

遥感中常用的信息提取方法主要有监督分类[17]、非监督分类[18]、面向对象分类[19]和决策树[20]等。结合前人研究成果,本研究利用单波段阈值法、多波段谱间关系法、NDVI阈值法、缨帽变换法、NDWI、MNDWI和多指数与谱间关系法相结合的决策树等7种分类方法,对研究区湿地信息进行提取。

2.1 单波段阈值法

单波段阈值法是基于Landsat MSS影像提出的一种比较简单的水体自动提取算法,它主要利用水体在近红外波段对入射能力的强吸收性,以及在此波段范围内植被和土壤等背景地物的强反射性特点,能够突出水体与背景地物的明显差异[21]。考虑到水体在近红外和短波红外两个波段大部分能量被吸收,容易与其他地物区分开来。利用这一特点,本研究选用Landsat-8的OLI的第6波段近红外波段(SWIR1),通过反复试验设定阈值如下:

式中,SWIR1即短波红外波段。

2.2 多波段谱间关系法

周成虎等提出多波段谱间关系法是通过对水体和背景地物光谱曲线进行分析,确定水体有别于其他地物的光谱特征,利用遥感影像多波段组合的优势进行水体信息的提取[21]。本研究在现有的多波段谱间关系算法模型的基础上,依据水体、阴影在蓝绿波段所具有的下降幅度差异较大的特征,基于差值运算,构建了新的多波段谱间关系模型,利用该模型可简单、有效、准确地提取水体及消除阴影。该算法模型为:

其中,b1为Blue波段、b2为Green波段、b3为Red波段、b4为NIR波段、b5为SWRI1波段,N为阈值。经反复试验,本研究进行水体信息提取的阈值设置为-700。

2.3 NDVI阈值法

归一化植被指数(Normalized Difference Vegetation Index,NDVI)可准确反映地表植被覆盖状况,它充分考虑到植被在红光波段的强吸收和近红外波段的强反射特点,其计算公式为:

式中,NIR为近红外波段,在Landsat-8 OIL影像中为第5波段;Red为红外波段,在Landsat-8 OIL影像中为第4波段。经过反复试验,得到黔西北的水体信息提取的阈值设为大于0.13最佳。

2.4 缨帽变换法

缨帽变换(Tasselled Cap Transformation),也称为K-T变换,是Kauth和Thomas利用Landsat MSS影像研究植被和作物的生长时提出的。缨帽变换后的影像可以较好地区分土壤、植被及作物信息[22]。其计算公式为:

式中,Y为变换后的主分量空间的像元矢量,X为变换前的多光谱空间的像元矢量,B为变换矩阵。

2.5 水体指数法

归一化差分水体指数(Normalized Difference Water Index,NDWI)用特定波段对遥感影像进行归一化差值处理,以凸显影像中的水体信息。由于水体边缘的部分绿光波段与近红外波段的光谱特征有着明显差异,加上水体的反射作用,使得近红外波的吸收性较强,利用绿光波段与近红外波段的反差得到其NDWI,从而突出水体特征。其算法模型为:

其中,Green是遥感影像中的绿波段,NIR为近红外波段。

徐涵秋2005年针对NDWI提出了改进的归一化差异水体指数MNDWI,在水体信息提取中取得了较好的效果[23],可以较为容易的区分阴影和水体,其表达式为:

其中,Green是遥感影像中的绿波段,MIR为短波红外波段。通过对MNDWI进行阈值分割和反复试验,本研究得到MNDWI<1000有利于进行水体信息提取。

2.6 多指数与谱间关系法相结合的决策树分类方法

由于单一指数对水体信息提取各具特点,根据宋明明[22]等人研究成果,本研究用多指数与谱间关系法相结合的决策树分类方法进行水体信息提取,用到的指数及波段有:NDVI、比值植被指数(RVI)、改进的归一化水体指数(MNDWI),谱间关系法主要用到Landsat-8中的相关波段运算,如:b3+b4、b5+b7、b3+b4+b5+b7等。通过对Landsat-8 OLI影像进行主成分分析,选取主成分分析的3个分量和DEM数据,共提取相关特征指数10个。利用上面的各指数以及谱间关系法构建黔西北高原水体提取的决策树分类模型。经反复试验建立研究区决策树分层分类规则如下:

规则1:Band 6 gt 1350 or主成分(PC1 lt-130、PC2 lt-1000、PC5 lt-186)or Band5+Band7 gt 2000,决策其他地类,否则执行规则2;

规则2:NDVI<0 or RVI<1 or Band1+Band2+Band3+Band4>Band5,决策为水体,否则运行规则3;

规则3:MNDWI<0 or Band5+Band7>Band2,决策为山体阴影。

3 结果与分析

通过选取感兴趣区的方法作为验证样本,对解译结果进行精度验证。借助研究区土地利用数据成果,结合野外实地调查,选取同一景影像15m分辨率全色图像和30m多光谱图像进行融合的图像作为参考底图,对每景融合影像选取200个验证样本点,共选取水体样本点、非水体各1000个样本点,利用随机抽样的方法对分类精度进行人机交互验证。选取Kappa系数、错分率、漏分率、制图精度、用户精度总体精度等分析水体提取情况(见表2)。

表2 不同分类方法进行水体信息提取的精度分析

通过对比分析可知:

(1)从Kappa系数角度来看,指数和谱间关系法的Kappa系数最高,到达0.860,其次是NDVI阈值法、缨帽变换法和多波段谱间关系法,分别为0.812、0.853和0.839;而单波段法和NDWI水体指数法效果最差,分别为0.785和0.730。

(2)从错分率和漏分率情况来看,单波段法、NDVI阈值法和NDWI水体指数法的误分和漏分情况比较严重,尤其是单波段阈值法漏分较严重达到了29.39%,但多指数和谱间关系法相结合的决策树分类法漏分为3.62%,效果最佳。

(3)从制图精度、用户精度和总体精度情况来看,单波段阈值法的制图精度效果最差,单波段阈值法和NDVI阈值法的用户精度低于90%,而其他都高于90%;多指数与谱间关系法相结合的决策树分类法的制图精度、用户精度和总体精度均高于96%,效果最好。

总体来看,由于黔西北高原地处喀斯特山区,细小水体大多在提取过程中会出现漏提和误提的现象出现,所以在选择水体提取方法过程中应该注意研究区的实际情况来选择提取方法。单波段阈值法与多波段谱间关系法相比,多波段谱间关系法的提取精度高于单波段阈值法。改正水体指数法提取精度高于NDWI水体指数法;对于缨帽变换法来说能够有效快速的提取水体并且去除阴影。在本研究中的7种提取方法中多指数和谱间关系相结合的决策树分类方法效果最佳。

4 结论

本文以位于典型喀斯特地区的黔西北高原区域为研究对象,以Landsat-8 OLI影像为数据源,利用单波段阈值法、多波段谱间关系法、NDVI阈值法、缨帽变换法、NDWI、MNDWI和多指数与谱间关系法相结合的决策树分类方法等7种分类方法,对研究区水体信息进行提取,选取Kappa系数、错分率、漏分率、制图精度、用户精度总体精度等分析不同方法的提取精度。结果表明:(1)针对本研究区的Land⁃sat-8 OLI影像数据,利用单波段阈值法、多波段谱间关系法、NDVI法、、缨帽变换法NDWI、MNDWI和多指数与谱间关系法相结合的决策树分类方法能够对水体信息进行自动提取,得到指数和谱间关系法得到的精确度最高。(2)对于在水体信息的提取过程中遇到的山体阴影的干扰,结合波段之间关系进行波段计算,再利用决策树分类方法细分类,可以有效地去除阴影带来的干扰从而提高水体的提取精度。

由于黔西北高原地区的范围过大,考虑到数据的可用性,在选取影像时时间跨度较大,对水体信息提取的准确性存在一定的误差。同时,植被的影响对喀斯特地区水体信息提取的影响较大。

注释:

①遥感影像数据来源于美国地质勘探局网站,http://glovis.usgs.gov/。

②遥感影像数据来源于地理空间数据云平台,http://www.gscloud.cn/。

猜你喜欢
关系法决策树波段
春日暖阳
中华人民共和国对外关系法
重庆与世界(2023年7期)2023-07-29 11:19:38
一种针对不均衡数据集的SVM决策树算法
“与台湾关系法”必输给反分裂国家法(社评)
环球时报(2019-04-11)2019-04-11 11:50:14
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
基于决策树的出租车乘客出行目的识别
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
西藏科技(2015年4期)2015-09-26 12:12:58
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于肺癌CT的决策树模型在肺癌诊断中的应用