最优尺度和随机森林算法下盘锦海岸带遥感监测

2022-08-18 08:53付杰宋伦雷利元李玉龙于喆
遥感信息 2022年2期
关键词:海岸带海岸线盘锦

付杰,宋伦,2,雷利元,李玉龙,于喆

(1.辽宁省海洋水产科学研究院,辽宁 大连 116023;2.辽宁省海洋环境监测总站,辽宁 大连 116020)

0 引言

海岸带是位于陆地与海洋过渡区域的狭长带状区域,既包含受陆地影响的海洋,也包含受海洋影响的陆地,可从狭义和广义两个角度解释。狭义的海岸带是指海洋向陆地的过渡地带,广义的是指以海岸线为基准向海陆两个方向辐射的广阔地带。充分利用现代先进成熟的航空摄影测量、高分辨率卫星遥感、无人机正射影像获取等遥感和地理信息手段快速获取海岸带信息,实现海岸带典型目标地物的人机交互式提取,并对其变化情况进行统计、分析和评价,对于研究海岸带生态系统结构功能、促进海岸带经济社会生态的协调发展具有十分重要的现实作用。

国内外诸多学者从海岸带地理空间位置角度分别对近岸陆域、潮间带滩涂、近岸海域、海岸线开展了大量的变化监测研究工作。美国国家航空航天局(National Aeronautics and Space Administration,NASA)的Hilbert[1]使用三个时相的Landsat数据,采用监督和非监督分类法对墨西哥北部海岸带进行了近岸陆地土地利用变化监测分析;Thu等[2]利用地形图和SPOT影像监测了越南Tra Vinh省潮间带上对虾养殖圈和红树林的分布及面积变化情况,并分析了养殖业迅速发展对海岸带生态造成的影像;Teodoro等[3]对葡萄牙近岸海域的总悬浮物质浓度进行了量化分析,利用TERRA/ASTER的多波段遥感数据和实测数据进行相关性分析;Tigny等[4]利用1977—2000年的卫星数据分析了意大利塞丁尼亚西海岸海岸线的变迁情况,预测了未来岸线演化趋势。国内欧维新等[5]分析了盐城海岸带土地利用及其变化对土壤环境、水环境以及生物多样性的生态效应;韩倩倩等[6]利用覆盖全国滨海的Landsat TM/OLI卫星影像,目视解译1995年和2015年潮间带开发的土地利用类型;王林等[7]通过2012—2014年间江苏近岸海域实测遥感反射率、悬浮泥沙浓度及“环境一号”卫星CCD数据,建立了该近岸海域悬浮泥沙遥感反演模型;孙孟昊等[8]通过潮汐校正模型对修正归一化水体指数提取的青岛长时间序列海岸线进行了潮位校正。但上述海岸带提取方法尚处在人工目视解译和基于光谱自动分类阶段,单纯采用光谱特征而忽略其纹理特征、几何特征导致分类精度不高,造成“椒盐”及错分现象。本研究采用面向对象的多尺度分割(multiresolution segmentation,MS)技术,通过局部方差变化率峰值定义海岸带面向对象的最优分割尺度,使用随机森林分类器提取盘锦市1990、2002、2013、2018年四个时相的海岸带土地利用类型,借助数字岸线分析(digital shoreline analysis system,DSAS)工具结合GIS空间分析技术系统研究28年来盘锦岸线时空变迁情况和岸带土地利用动态演化特征,为盘锦市全面转型、向海发展提供有效的决策支持。

1 研究区概况及数据源

1.1 研究区概况

盘锦地处辽宁省辽西中部,辽河三角洲中心地带,位于40°39′N~41°27′N、121°25′E~122°31′E之间,下辖兴隆台区、双台子区、辽东湾新区、辽河口生态经济区、盘山县和大洼县。海岸带上蕴藏着丰富的渔业资源、湿地资源、旅游资源、油气资源和港口资源。天然海岸类型为淤泥质海岸,后经港口和新城建设,多为人工港口海岸和围填海岸类型。盘锦作为我国老牌的石油、石化工业基地,现正处于“向海发展、全面转型、建设滨海新盘锦”的关键时期,东部在辽东湾新区建设前曾有过上万亩的养殖圈,由于港城建设需求,如今都已退出。西部沿海正在开展“退养还滩”湿地修复工作,以期达到新形势下保护湿地资源环境,恢复滩涂湿地自然生态和改善滩涂湿地生态环境的目的。选用1990、2002、2013、2018年四期影像依据:1990—2002年期间,盘锦大规模兴起围海养殖热潮,主要发生在海岸带的淤泥质滩涂和浅水海域,2002—2013年又掀起港口围海造地与临港工业城镇建设热潮,目的是向海拓展生产和生活空间,2018年国家实施最严格的填海管控措施,除国家重大战略外,政府不再受理新增围填海项目审批,盘锦大规模造地活动结束。四期影像能够鲜明呈现出人类活动对海岸带留下的“烙印”。

根据盘锦海岸带的开发强度,本研究将盘锦海岸带划分为四个重点研究区域,包括辽河口、临港工业区、盘锦港区和辽滨主城区。其中辽河口区内有辽宁辽河口国家级自然保护区;临港工业区以海洋装备制造、石油精细化工、综合工业和科技产业四大支柱产业为主体;盘锦港区是以发展大型临港产业为依托,重点发展油品、液体散货、粮食、集装箱等货物运输;辽滨主城区是市政府、新区管委会和大学城文体中心所在地。研究范围参照《辽宁海岸带保护和利用规划》(辽政发〔2013〕28号)规划文本内容:海岸带范围包括海岸线向陆域延伸10 km、向海域延伸约22 km,本研究中盘锦海岸带范围是提取1990年盘锦海岸线向陆域作10 km的缓冲区外边线、盘锦市海洋功能区划中海域外边界线和盘锦市陆域行政区界线“三线”所围成的区域(图1)。全文针对该区域,建立了岸线与土地类别遥感影像解译标志。

图1 盘锦海岸带研究区范围

1.2 数据源及预处理

本研究选用1990—2018年间的Landsat遥感影像作为数据源。年份对应传感器类型分别为:1990年TM影像、2002年ETM+影像、2013年OLI影像和2018年OLI影像(表1)。四期的影像数据主要用来进行面向对象海岸线提取、岸线年变化速率研究、海岸面积变化监测和面向对象土地利用类型的变化监测。本研究还搜集了1∶5万地形图,比例尺精度为5 m,主要用于TM、ETM+和OLI影像的几何精校正和岸线精度评价,购置高分一号影像用于面向对象地物类别分类精度验证参考。

表1 遥感数据及所处的潮位信息

首先,进行辐射定标、FLAASH大气校正和几何配准,配准误差在一个像素之内,将不同传感器的多光谱和与之对应的全色波段进行波段融合;其次,进行最优分割尺度获取,计算影像多尺度分割后局部方差变化率,绘制变化率曲线,曲线峰值确定最优分割尺度;然后,采用随机森林分类器提取四个时相土地利用类型,获取海陆分界线,利用潮位改正的原理[9],结合当地验潮站,对淤泥质岸段进行潮位改正,完成最终海岸线的提取;最后,分类后处理,分析盘锦海岸段土地类别时空演变特征和驱动力。

2 研究方法

2.1 海岸线提取与变化检测

图像分割是面向对象分类技术最为基础和重要的问题,尺度直接决定着分类后的精度。通过识别像元的相似度,合并相邻的像元为一个对象,其目的是找到一个尺度,确保合并后的对象之间异质性最大、对象内部同质性最大[10]。

执行多尺度分割前提是确定影像分割的形状和紧致度参数,即最佳同质性组合参数。本研究采用固定单一参数法,先将分割尺度假定为100,来寻找同质性参数组合。实验设计如下:排除最值情况,将形状参数设为(0.4,0.5,0.6,0.7,0.8),紧致度因子设为(0.3,0.4,0.5,0.6,0.7,0.8)时,参数配对30组,用四期影像分别参与30组分割实验。在影像中均匀布设“纯净”地物样本,统计不同组合参数下分割后地物过拟合和欠分割样本数,计算多边形与实际地物重叠度(重叠面积占实际地物面积比例),对分割过于破碎、分割不足、边界重叠度低的组合参数进行排除,直至得到四期影像最佳同质性组合参数:①Wshape=0.8,Wcompact=0.6,1990年;②Wshape=0.4,Wcompact=0.5,2002年;③Wshape=0.8,Wcompact=0.8,2013年;④Wshape=0.8,Wcompact=0.5,2018年。

图2 不同分割尺度下的图层局部方差变化率曲线

本研究选出较为明显的三处局部方差变化率峰值,作为对应的最佳尺度。①组对应最佳尺度为35、50、118;②组对应尺度为49、85、91;③组对应尺度为34、56、114;④组对应尺度为39、69、104。分割结果显示,当尺度参数小于90时,所得地物对象较为破碎。鉴于水域、沼泽和农田属于区域内主要分布地物,应采用较大尺度分割,避免内部单元分割过于破碎。最终确定四期影像提取地物的最佳分割尺度为118、91、114和104(图3)。

图3 研究区最优分割尺度

通过上述方法采用随机森林分类结果提取水陆分界线,即卫星过顶时的瞬时水边线。然而盘锦地势平缓,除人工岸线受潮汐影响较小外,淤泥质岸线的微小水位差距会对海岸线造成较大的偏差,文献[8]给出了水边线经过潮位改正得到最终海岸线方法的详细介绍。本研究利用基于ArcGIS平台开发的DSAS功能模块,计算四期海岸线的距离变化量和年变化速率[12],其中,累积变化量(shoreline change envelope,SCE)反映每个断面上最远基线和最近基线的岸线间距离,净变化量(net shoreline movement,NSM)计算每个断面上最老和最年轻的岸线间距离,端点变化率(end point rate,EPR)是用海岸线移动距离除以最远和最近年份海岸线之间经过的时间,线性回归率(linear regression rate,LRR)是根据最小二乘法拟合多时相海岸线的变化速率。设置回归线的目的是使残差平方和(由每个断面相交点与回归线的偏移距离平方和与残差平方和决定)最小化。

2.2 海岸带地物提取与变化检测

海岸带遥感动态监测就是从不同时相的遥感影像中,定量地分析和确定海岸带地类变化的特征与过程。它涉及到变化的类别、分布范围与变化量,即需要确定变化前后的地物类别、界线及增减数量,能提供地物的空间分布及其变化的定性和定量信息。本研究采用随机森林(random forest,RF)分类器对海岸带地类分类后进行比较达到动态监测的目的。核心思想是以多棵决策树为基础的集成分类器,通过采取多个不同的训练样本子集来加大分类模型之间的相异性,从而提高该模型的泛化能力以及预测能力[13-16]。分类后,结合高精度高分一号融合后影像为基准进行验证分类后实际类别,得到分类后的Kappa系数和总体精度,采用聚类技术,对分类图像进一步完善。技术流程如图4所示。

图4 技术流程

3 数据结果处理与分析

3.1 海岸线数据处理与分析

岸线监测分析中,首先要确定基线,基线个数视海岸的形态、结构、功能而定,基线可以向陆或向海一侧,前提是不同时期岸线在基线同一侧。确定基线目的是:从基线向岸线一侧作长度为搜索半径断面线,确保断面线与各时期岸线相交,通过交点至基线的距离结合岸线日期来获得岸线变化时空特征。本研究统一标尺长度为15 m,地理坐标系采用CGCS2000坐标系,投影采用3度分带高斯克吕格坐标系,带号41 N,潮位校正采用当地平均大潮高潮线。最终盘锦各时相海岸线的提取结果[17-22]如图5所示。辽河口向海侧布设基线两段,向陆侧布设三段,横断面搜索半径为3~12 km。辽东湾新区(包含临港工业区、盘锦港区和辽滨主城区)向海向陆各设置基线一段,横断面搜索半径为1.5~12 km,断面线的空间间隔为100 m。基线布设和断面线生成结果如图6所示。

图5 1990—2018盘锦海岸线提取结果

图6 基线布设和断面线生成

28年来,自然岸线减少28.44 km,人工岸线增加143.31 km(含人工岛)。辽河口岸线增长速度为2.85 km/年,年平均变化率为52 m/年,年变迁最大距离为10 314 m,位于三角洲水库管理所南侧向海侧。临港工业区岸线增长速度为0.78 km/年,年平均变化率为248 m/年,年变迁最大距离为9 607 m,位于临港西大堤向海外缘线处。盘锦港区岸线增长速度为0.39 km/年,年平均变化率为264 m/年,年变迁最大距离为9 795 m,位于荣兴港区一突堤码头向海外缘线处。辽滨主城区岸线增长速度为1.09 km/年,年平均变化率为86 m/年,年变迁最大距离为 8 180 m,位于人工岛斜坡护岸处。1990—2002年,自然岸线改变主要满足农渔业和盐田工业的发展。2002—2013年,随着辽东湾新区沿海大规模填海造地工程的拉开序幕,区域内的养殖和盐业逐渐退出。2013—2018年,盘锦海岸带活动呈现开发与保护并举格局,辽河口自然岸线较2002年恢复7.63 km,岸线附近集中连片分布的养殖围堰通过“退养还滩”的生态整治修复措施恢复滩涂湿地原貌。辽东湾新区造地工程结束,养殖和盐田围堰消失,工业岸线、港口岸线和城镇建设岸线分别为35.78、14.89、50.94 km,新区最终轮廓线形成。

3.2 海岸带土地利用的时空变化

前期多尺度分割结果产生的对象斑块是地物分类的基础。为便于对比研究,将盘锦海岸带划分为六个土地利用类别:城乡建设用地、农田、滩涂及开垦未利用地、盐田养殖围堰、水域和芦苇沼泽地。在不同类别对象斑块上选择一定数量样本,按照特征贡献率大小,选择适当数量的光谱、纹理以及几何特征对样本对象进行训练[23]。在随机森林分类器中,由于研究区内的水域、芦苇沼泽地和农田占比较高,光谱与周围地物差异明显且同一类别纹理较为均匀,因此样本光谱、几何和指数等特征贡献率要高于其他特征。例如,本研究2002年ETM+影像样本训练九个特征贡献率大小依次是:亮度(brightness)为0.87、紧致度(compactness)为0.76、归一化建筑指数(NDBI)为0.76、中红外第二波段像元亮度均值(mean SWIR2)为0.73、密度(density)为0.72、中红外第一波段像元亮度均值(mean SWIR1)为0.70、所有波段亮度最大差分(max.diff.)为0.68、蓝色波段亮度平均值(mean B)为0.66、归一化植被指数(NDVI)为0.66。

随机森林重要参数参考文献[24]。实验结果表明,当决策树的数量为100时,就可以获得很高分类精度,随着树的数量大幅度增加,分类错误率均保持在1%以内,袋外误差收敛一个极限值。本研究进一步证实,以2002年影像417个训练样本为例,当决策树数量大于150时,RF袋外数据总体精度(overall accuracy,OA)达到93.52%以上,随着树数量增加,OOB总体精度逐渐收敛一个极限值94.72%。顾海燕等[25]实验得出,在特征数量保持常量5时,随着树的数量的增加,误差变小,当树的数量为200时,误差达到最小,大于200时,误差差别很小,趋于稳定,计算时间随着树的数量增加而增加。考虑到运算效率与分类精度平衡,本研究实验设计如下:决策树设置范围为(150,200,250),特征数分别为7、8、9时,参数配对9组,通过样本精度验证来寻找参数最佳组合。最终将随机森林中决策树的数量定为200,特征数量按照特征贡献率大小,选取前9个特征作为样本特征。分类结果如图7所示。

图7 分类结果

研究区内海岸线向海的自然滩涂、河流的河心滩和蛤蜊岗滩涂受潮汐作用明显,不同时期影像分类后面积波动较大,本研究仅考虑岸线向陆土地利用类别。结果表明,1990—2002年间,围海养殖、围海晒盐、开垦农田和渔港码头建设等人类活动大量占用潮间带和陆地湿地资源,海岸线向海推进面积为98.08 km2,其中盐田养殖围堰面积增加68.87 km2,农田面积增加77.38 km2,芦苇沼泽减少了35.13 km2。2008年,随着盘锦船舶工业基地海山引堤项目完工,盘锦港多用途码头后方堆场建设打响了港口大规模围填海造地工程的“第一枪”,2002—2013年,岸线继续向海推进67.88 km2,不包含三个人工岛形成的15.85 km2,这一时期人类活动占用了大片的自然滩涂、盐田坑塘养殖池及宜港资源。滩涂及开垦未利用地增加67.88 km2,其中大部分属于填海新形成未利用地,盐田养殖围堰面积减少22.54 km2。2013—2018年,在新一轮的发展中,盘锦市沿岸经济产业结构发生了改变,港口、临港工业、沿海城镇建设等新兴产业正逐步替代传统养殖产业,辽东湾新区的发展已初具规模,辽河口东部传统养殖区已逐步退出,近岸产业由渔业养殖向城镇建设方向发展。这一时期岸线向海推进面积15.64 km2,盐田养殖围堰面积减少15.38 km2,城乡建设用地面积增加46.87 km2,“造地”运动基本结束。

对分类结果进行变化对比发现,1990—2018年,辽河口陆域面积增速为3.57 km2/a,变化剧烈,有农田增加76.50 km2和滩涂湿地减少65.34 km2;临港工业区陆域面积增速为1.57 km2/a,填海新增工业建设用地25.93 km2、新增开垦未利用地15.74 km2和填海形成积水面积2.05 km2,填海土地利用率为59.08%;盘锦港区陆域面积增速为0.95 km2/a,填海新增港口建设用地13.78 km2、新增开垦未利用6.11 km2和填海形成积水面积6.58 km2,填海土地利用率为51.96%;辽滨主城区陆域面积增速为0.97 km2/年,填海新增城镇建设用地9.47 km2、新增开垦未利用15.15 km2和填海形成水域面积2.30 km2(含积水与过水通道),填海土地利用率为34.85%。

3.3 精度验证

本研究采用缓冲区分析法进行岸线精度验证。方法如下[26]:对已有2002年岸线建立以一个像素为半径的缓冲区,计算提取同期岸线在缓冲区内的长度,记为匹配长度TL,其他为不匹配长度FL;再建立提取岸线的缓冲区,同样计算参考岸线落入缓冲区内的长度TN和不匹配长度FN。通过以上数据可以得到定量评价岸线提取的三个指标:准确度指标A、完整度指标I和总体指标F。

参考高分一号影像,采用分层抽样的原则抽取一部分作为训练样本,剩下一部分建立验证样本,例如本研究2002年ETM+影像验证样本需结合地物类别的复杂程度,均匀布设整个研究区内,验证样本数量包含:城乡建设用地55个、农田31个、滩涂及开垦未利用地51个、盐田养殖围堰58个、水域35个和芦苇沼泽地46个,见图8(a)。利用混淆矩阵对分类结果进行评价,通过计算每一种类别的样本总数、错分及漏分的样本数量确定分类结果的准确性和可靠性。本研究通过分类结果的混淆矩阵提取两类指标进行精度评价:总体精度和Kappa系数。如图8(b)所示,传统光谱分类结果“椒盐效应”明显,农田易错分到芦苇沼泽地类,水域跟盐田养殖围堰易混淆,总体精度为73.12%,Kappa系数为0.695 3,精度均低于本研究分类结果。

图8 验证样本和传统光谱分类结果

表2 2002年岸线精度验证计算结果

表3 分类精度验证计算结果

2018年分类精度低于其他年份的原因是填海过程吹填未达设计标高,导致盘锦港和人工岛内有大量积水存在,逐渐形成的人工滩涂与自然滩涂在光谱和纹理特征上类似,选取样本难以区分滩涂与填海未利用地。在同样决策树数量和样本特征数情况下,2002年分类用时却最短,表明随机森林图像分类参数选择和运算效率的平衡仍是难点,后续研究可以在这个问题上进行扩展,进一步提升随机森林分类精度。

4 结束语

海岸带的遥感监测是遥感领域一个重要的研究方向,准确的海岸带地类分类对摸清国家海域资源状况及海域使用情况具有极其重要的意义。本研究通过局部方差变化率峰值定义对象提取的最优分割尺度,通过最优分割尺度、最佳特征空间、最适随机森林模型决策树的棵数,得到最优随机森林分类模型算法,并采用该模型对盘锦市1990、2002、2013、2018年四个时相海岸带土地利用类别进行分类,有效提高海岸带遥感监测的精度。进而使用分类后结果对四个重点研究区进行海岸线变迁和土地利用的演变驱动力分析,总结盘锦海岸带28年间巨大变化的主因是资源枯竭型城市向海发展、全面转型、以港强市的政策导向作用。

随机森林分类算法具备复杂地物分类的能力,对于噪声和存在缺损值的数据具有良好的鲁棒性,兼具较快的学习速度,对多维特征空间数据重要性进行度量,依据特征贡献率进行最优特征筛选从而达到对高维特征空间进行降维的目的,相较当前流行的分类算法具有较高的准确性和稳健性。本研究仍存在一定的局限:多尺度分割是面向对象影像分类的基础,本研究的局部方差变化率仅是最优尺度获取中的一个解决方案,如何高效智能选择最优分割尺度并保证尺度运算效率与分类精度达到理想平衡是个难题;随机森林图像分类决策树数量、特征数量和运算效率的平衡问题[27]。后续研究可以在这些难题上进行扩展,进一步提升随机森林分类方法的适应性。

猜你喜欢
海岸带海岸线盘锦
基于陆海统筹的海岸带空间功能分区——以宁波市为例
我国海岸带城市化系统耦合协调时空动态特征——以东海海岸带城市为例
基于砂质海岸带海水入侵模型试验分析研究
海岸带弹性初探
徒步拍摄英国海岸线
徒步拍摄英国海岸线
下一站,盘锦
徒步拍摄英国海岸线
盘锦举办“一带一路”沿线国家留学生交流活动
徒步拍摄英国海岸线