郑 浩,陈星彤,宋利杰,3,樊继好,杨晓芜,宋敬茹,宋唐雷,刘明月,2,3,4,5
(1.华北理工大学 矿业工程学院,河北 唐山 063210;2.唐山市资源与环境遥感重点实验室,河北 唐山 063210;3.高分辨率对地观测系统河北唐山数据应用中心,河北 唐山 063210;4.河北省矿区生态修复产业技术研究院,河北 唐山 063210;5.河北省矿业开发与安全技术重点实验室,河北 唐山 063210;6.航天万源云数据河北有限公司,河北 唐山 063300)
由于全球化,生物入侵已成为严重的全球环境问题[1]。互花米草(Spartina alterniflora)是禾本科、米草属多年生草本植物,原产于北美大西洋沿岸和墨西哥湾。因其高耐盐性、高繁殖能力和高生长性能而作为生态工程物种于1979年引入我国,经过40多年的人工种植和自然扩散,已广泛分布于中国沿海的大部分潮间带滩涂[2]。江苏具有亚洲大陆东缘面积最大的淤泥质海岸,孕育着具有国际重要影响的滨海湿地生态系统并维持丰富的生物多样性,已形成全国最为典型的互花米草盐沼湿地。在促淤造陆、保滩护岸等方面起到一定的作用的同时也带来了较为严重的生态后果[3]。例如:破坏原有滩涂植被群落结构,甚至形成单一优势种,改变底栖动物群落结构,影响水禽栖息及觅食,导致生态系统的退化,引起航道阻塞及排水不畅,并妨碍旅游业的发展及影响水产养殖[4]。因此,发展可操作性强的方法,快速、准确、实时监测滨海湿地的入侵物种互花米草的空间分布,对沿海生态系统的管理至关重要。
互花米草群落多位于恶劣和潮汐淹没的环境中,可达性差。传统野外调查费时费力且精度有限,遥感监测已成为互花米草信息提取的一种高效且成本低廉的方法[5]。多源遥感数据已应用于入侵物种互花米草的信息提取[6]。Liu等基于2014-2016年Landsat影像提取了中国大陆沿海互花米草分布[1]。张华兵等基于1997-2014年4个时期的Landsat影像提取了江苏盐城滨海湿地互花米草[7]。刘瑞清等利用Sentinel-2影像提取了盐城滨海湿地2018年互花米草分布信息[8]。但复杂滨海湿地背景下,互花米草与原生植物常具有相似的光谱特征,利用不同植物生长期在植被指数和生物量等方面的差异,选取关键时间窗口,可有效提高互花米草分类精度。但光学遥感影像易受云雨干扰,不足以在时间窗口内形成足够的有效影像。雷达数据不受云雨天气影响,可以作为光学数据的补充,且已有研究表明雷达数据和光学数据的融合在复杂的湿地植物群落中表现出良好的分类性能[9]。时间序列的Sentinel-1雷达数据和Sentinel-2光学数据往往需要占用大量的存储空间。本地计算机难以高效率的处理密集时序或多模态特征融合数据,而利用云计算平台,如GEE、PIE等可实现重复性任务(例如图像采集、校准和处理)的自动化处理,从而减少影像处理时间,并可有效改善大区域互花米草信息提取的效率和精度[10]。孟祥珍等人基于GEE平台利用Landsat影像获取了长三角湿地的互花米草分布[11]。
简单非迭代聚类(SNIC)算法广泛应用于开发在空间集群中聚合相似像素的分割步骤中[12]。Mahdianpari等人基于SNIC+RF算法利用Sentinel-1和Sentinel-2遥感数据制作了加拿大湿地清单[13]。Xiong等人通过利用支持向量机(SVM)和RF分类器集成SNIC算法提取了非洲大陆农田分布信息[14]。Ghorbanian等人基于Sentinel-1和Sentinel-2遥感数据,集成SNIC和RF算法实现伊朗土地利用分类,可有效改善单一利用RF算法所产生的“椒盐现象”[15]。
综上所述,GEE云平台在入侵物种监测中具有明显的优势,但已有研究大多仅使用单一光学遥感数据往往难以满足地物类型复杂的滨海湿地中互花米草信息提取的需求。本文以盐城湿地珍禽国家级自然保护区核心区(简称“盐城湿地”)为例,基于GEE云平台综合利用Sentinel-1雷达和Sentinel-2光学数据,构建光谱特征、雷达特征、植被指数、水体指数、纹理特征以及地形特征集合,对比RF算法和SNIC+RF集成算法在滨海湿地复杂景观中提取入侵物种互花米草的性能,为滨海湿地的生态修复评估提供决策支持和科学参考。
研究区位于盐城湿地珍禽国家级自然保护区核心区(33°25′0″—33°39′04″N,120°26′40″—120°40′40″E),如图1所示。滨海湿地总面积约为191.00 km2,湿地景观类型复杂。该区地处亚热带向暖温带过渡地带,属典型的亚热带气候,降雨和太阳辐射能丰富,年平均气温在13.7—14.8℃之间,年降水量为900—1100mm。由于适宜的水文和气候条件,滩涂湿地发育了多种湿地生态类型[16]。湿地植被丰富,滩涂植被演替完整;从陆地到海洋的景观类型主要分为芦苇、碱蓬、互花米草、河流、坑塘和滩涂。
图1 研究区概况
(1)Sentinel-1雷达数据
Sentinel-1是一颗SAR卫星,它以6天的时间分辨率在全天候条件下获取双极化C波段数据。Sentinel-1雷达数据集源自GEE云平台中提供的Level-1 GRD干涉宽幅(IW)产品,已经Sentinel-1 Toolbox进行热噪声去除、辐射校准和地形校正等预处理。筛选研究区范围内2021年9-11月的VV和VH极化后向散射值(dB),并求取月度均值,按照研究区边界进行裁剪。
(2)Sentinel-2光学数据
Sentinel-2卫星包括13个多光谱波段。其中有4个10m分辨率波段、6个20m波段和3个60m波段,轨道宽度为290km。Sentinel 2 TOA反射率数据集源自GEE云平台提供的Sentinel-2 L2A产品,该产品经过了辐射定标、地形矫正和大气校正等预处理。为了避免原生植物与互花米草光谱混淆,筛选植被间物候差异明显的10-11月影像,通过云掩膜(QA60波段中Bit10和Bit11均为0的值)去除云覆盖区域,以合成无云的高质量影像。
(3)地形数据
ALOS全球数字表面模型(DSM)是在高级陆地观测卫星(ALOS)上使用全色立体测绘遥感仪器(PRISM)收集的图像生成的全球数据集,本研究调用GEE平台ALOS DSM:Global 30m数据产品,将其重采样至10m,并计算坡度。
(4)样本数据
综合文献资料、野外调查数据以及2021年9-11月Google Earth等高分辨率影像进行目视判读,共获取了737个样本点。其中包括168个互花米草样本点、90个碱蓬样本点、187个芦苇样本点、72个河流/坑塘样本点、126个海面样本点和94个滩涂样本点。将样本点随机分成3份,分别用于RF算法训练(306个)、RF算法模型参数优化(131个)以及分类结果验证(300个)。
特征变量的选择是遥感分类的重要步骤,科学利用多种特征变量构建,可以有效提高遥感分类的精度[17]。本文选取雷达特征、光谱特征、纹理特征、植被指数、水体指数、红边指数和地形数据构建特征集合,详细描述了各种特征及其表达方式,如表1所示。
表1 分类特征集合
RF是一种非参数分类器,它采用bootstrap聚合技术将各种独立随机决策树的分类结果结合起来,预测类标签。这些随机决策树中的每一个都由训练样本的子集(称为袋内样本)进行训练,并使用剩余样本(称为袋外样本)进行内部交叉验证。之后,将结果整合以产生最终的分类结果。
RF分类器已被证明在入侵物种互花米草提取中具有很高的潜力[8]。本研究基于GEE云平台实现互花米草的RF分类。由多源数据构建的特征集合输入到RF分类器中,使用一半的参考样本来训练RF分类器。RF分类器中影响最为显著的参数为树木的个数和每棵树的节点数,本文分别设置为100和输入特征数量的平方根,如图2所示。
分割是信息提取的重要步骤,直接影响分类精度,将影像中相似的像素划分为互不重叠的小区域。本研究基于GEE中的SNIC算法对研究区Sentinel-2影像进行分割以获取影像对象。SNIC算法主要参数包括:“compactness”影响簇的形状,值越大,簇越紧凑;“connectivity”定义了合并相邻集群的邻接类型,通常为4或8;“neighborhood Size”避免瓦片边界伪影。而超像素种子“seeds”影响簇的大小,可通过测试不同的种子间距(5、10、15、20、25和30),并结合研究区互花米草与其他植被可分离性进行选取,对比结果如图3所示。本文参数设置如下:“compactness”=0、“connectivity”=8、“neighborhood Size”=128、“seeds”=15。
图3 SNIC最优分割尺度
在SNIC分割的基础上,将各斑块内部基于像素的分类结果利用绝对多数投票法(Majority voting)移除斑块单元内的误分类像素,创建基于对象的分类,使其结果有效避免“椒盐现象”,并具有良好的整体性。
基于野外调查验证点利用混淆矩阵对研究区分类结果进行精度评价。计算总体精度(OA)、生产者精度(PA)、用户精度(UA)和kappa系数。OA是测试数据被分类器正确分类的百分比。PA是从生产者的角度来看的准确度,它是正确特征在分类图像中正确显示的频率。UA是地图上分类的类别出现在地面上的概率。Kappa系数表示地面真实数据和预测值之间的一致性程度。
采用RF中Gini系数对盐城湿地分类中的特征变量进行重要性分析,如图4所示。结果表明,光谱特征B2和B3以及B12、雷达特征VV_Nov和VH_Sep以及VV_Oct、植被指数RVI和DVI、红边指数NDVIre2和NDre1是重要性排名前十的特征变量,在盐城湿地互花米草提取中起到重要作用。特别是光谱特征和雷达特征显著高于其他特征子集,排名靠前的特征数量也最多,这是因为10-11月份入侵植物和原生植物物候信息差异显著,互花米草群落处于成熟期或衰老初期,而芦苇和碱蓬群落已进入衰老后期或休眠期,植被群落光谱特征和后向散射系数差异显著,有利于互花米草信息的识别。表明时序雷达数据与光谱数据融合显著提高湿地地物类型的区分能力。植被指数中重要性较高的为RVI,其次是DVI,而非使用最为普遍的NDVI。考虑到滨海湿地的特点,RVI和DVI能够提高植物群落间的光谱差异,有利于互花米草的提取。红边指数在分类中具有显著作用,重要性排名均较为靠前,其原因是红边区域窄波段的设计有助于精确捕获植物的光谱红边特征,利于区分达到最大生长季的植物。纹理特征的重要性排名靠后,表明基于10m分辨率的遥感影像计算的纹理特征对于互花米草群落与原生植物群落区分贡献度较小。此外,坡度特征在盐城湿地分类中重要性大于高程,对于分类结果贡献较大。
图4 特征变量对RF算法绘制盐城湿地分类图的重要性
基于RF和SNIC+RF算法分别获得的盐城湿地分类效果如图5所示。两者分类结果中互花米草空间分布格局基本一致,但SNIC+RF算法结果中像椒盐噪声较少,湿地地物类型斑块更为完整。与RF分类算法相比,SNIC+RF算法可以更准确地将互花米草群落与碱蓬和芦苇群落区分开,特别是更为准确地绘制了沿岸分布的互花米草条带,并且入侵芦苇群落内部的互花米草提取精度更高,较少被错分为芦苇,盐城湿地内部的互花米草条带与碱蓬条带以及滩涂条带边界更加清晰明确。此外,时序雷达特征的加入,在提高互花米草分类精度的同时,会导致滩涂与海面邻接处被错分为河流。
图5 2021年盐城湿地分类效果图
采用混淆矩阵分别对两种算法所得分类结果进行评价,如表2表3所示。精度验证结果显示:两种分类方法对盐城湿地进行分类的总体精度均大于90%,Kappa系数远高于0.8,且互花米草分类精度均高于90%。RF分类结果中,互花米草的56个验证样本中仅有4个被错分为芦苇,1个样本被错分碱蓬。互花米草的用户精度和生产者精度分别达到了91.07%和98.08%。混淆原因之一是因互花米草入侵而景观破碎化程度高且盐沼植被交错分布,10m分辨率影像对于区分互花米草和原生植物易存在混合像元。此外,由于植物群落受生长环境不同影响,同一植被群落可能会表现出不同的生长状态,9-11月份部分芦苇群落像元呈现出与互花米草相似的光谱特征。而SNIC+RF分类结果中,互花米草的56个验证样本中,仅有2个被分为芦苇。互花米草的用户精度和生产者精度分别达到了92.86%和98.11%,相较于RF算法,该算法减少了互花米草与原生植物的错分,提高了互花米草提取精度。但低密度覆盖的互花米草条带边缘部分滩涂像元被分类为互花米草。说明该方法可以将互花米草群落与碱蓬及芦苇群落较好地区分,但同样会存在一些过拟合问题。综合两种分类方法来看,SNIC+RF算法互花米草生产者精度和用户精度最高,有效减少了互花米草的错分现象。
表2 RF算法分类精度评价
表3 SNIC+RF算法分类精度评价
本研究基于GEE云平台融合多源遥感数据构建雷达特征、光谱特征、纹理特征、植被指数、水体指数、红边指数以及地形特征集合,基于像元的RF算法分类和面向对象的SNIC+RF算法分类,分别提取了盐城湿地珍禽国家级自然保护区核心区互花米草分布信息,并分析互花米草提取的特征重要性以及分类精度。结果表明:(1)雷达特征、光谱特征、植被指数和红边指数在滨海互花米草信息提取中贡献度较大;(2)SNIC+RF算法相较于RF算法显著提高了互花米草斑块的完整性,降低了原生植物群落中互花米草错分像元的产生,提高了分类精度,互花米草群落的生产者精度和用户精度均高于92%;(3)相比于传统的影像下载与处理流程,基于GEE云平台构建分类算法实现互花米草信息提取,对本地电脑硬件要求降低,显著提高了数据分析和处理的效率,为实现入侵物种互花米草的监测提供了便利。