谢锦莹 丁丽霞 王志辉 刘丽娟
(1. 浙江农林大学省部共建亚热带森林培育国家重点实验室 杭州 311300; 2. 浙江省森林生态系统碳循环与固碳减排重点实验室 杭州 311300; 3. 浙江农林大学环境与资源学院 杭州 311300; 4. 浙江远卓科技有限公司 杭州 310012)
湿地被誉为“地球之肾”,与森林、海洋一起并称为全球三大生态系统,在世界各地分布广泛,不仅可为人类提供大量食物、原料和水资源,而且在维持生态平衡、保持生物多样性和珍稀物种资源以及涵养水源、蓄洪防旱、解除污染、调节气候、补充地下水、控制土壤侵蚀等方面均起到重要作用(Corcoranetal., 2013)。当前,湿地的研究焦点主要在生态环境退化和可持续发展上,开展湿地时空变化监测研究,对湿地资源科学利用与合理开发具有重要意义,可为生态环境与经济社会的协调发展提供科学参考(祁增营等, 2012)。湿地植被多样性是湿地生态环境的重要因素,滨海湿地植被是滨海湿地生态系统的主要组成部分,植被演替是滨海湿地形成和演变的重要标志,监测滨海湿地植被,对于认识滨海湿地的演变机制和趋势意义重大(郑云云等, 2013)。
近年来,遥感技术在湿地植被监测方面发挥了非常大的促进作用,国内外的监测研究大多使用中等分辨率的TM/ETM+遥感影像或高分辨率的航拍影像、QuickBird、WorldViewⅡ、RSAT-2、SAR影像等,采用的分类方法包括最大似然法、支持向量机、人机交互目视解译、分层分类法、BP神经网络以及面向对象分类等(周禹, 2017; 周在明等, 2016; 和晓风等, 2015; Boonetal., 2017; Pengeretal., 2007; Raoetal., 1999)。随着机器学习新算法不断涌现,对影像处理效果日益增强,许多学者也尝试利用机器学习算法进行遥感数据处理,其中全卷积神经网络(fully convolutional networks,FCN)(Shelhameretal., 2017)以其自动提取特征能力强、人工干预少且不受影像输入大小限制等优异特性受到广泛关注。目前,已有不少学者将该方法用于高分辨率遥感影像处理,并得到了不错的分类效果,但研究区均是小面积区域,且分类对象多为城市地表覆盖,或只对某一种地物进行分类提取,对象具有类别边界清晰、地物混杂现象少等特点(汤浩等, 2016; Sherrah , 2016; Piramanayagametal., 2016; Fuetal., 2017; Lietal., 2017; Bittneretal., 2017; 方旭等, 2018; Sunetal., 2018; 徐逸之等, 2018)。而滨海湿地植被丰富多样,植物混杂生长现象普遍,空间边界交错,这些都会给遥感影像自动分类增加难度,全卷积神经网络提取滨海湿地植被效果如何尚不清楚。
全卷积神经网络是一种端对端的网络模型,可直接得到单个像元的分类结果(Shelhameretal., 2017),但会造成结果缺乏空间一致性,存在椒盐现象; 而面向对象分类方法能够有效克服该问题,优化基于像元的分类结果(张猛等, 2017)。鉴于此,本研究提出一种基于FCN与面向对象的滨海湿地植被分类方法,以期提高滨海湿地植被监测效果。
研究区位于浙江省慈溪市西北部杭州湾南岸地区,30°16′—30°21′N,121°4′—121°10′E,面积约10 000 hm2。该区具有明显的海岸带土地覆盖特点,自海岸线向内陆依次顺序分布有浅海→光滩→海三棱藨草(Scirpusmariqueter)→互花米草(Spartinaalterniflora)→养殖塘、芦苇(Phragmitescommunis)、南方碱蓬(Suaedaaustralis)→耕地、不透水地表。海三棱藨草生于潮间带湿地,互花米草生于潮间带,耐盐耐淹,芦苇生于江河湖泽、池塘沟渠沿岸和低湿地,常连片生长,南方碱蓬生于海滩沙地、盐田堤埂等处。根据土地覆盖特点和滨海植被分类需要,将研究区土地覆盖分为13类,即水体、光滩、海三棱藨草、互花米草、芦苇、南方碱蓬、不透水地表、耕地、裸露地表、睡莲(Nymphaeatetragona)、树木、大棚和其他,其中睡莲生在沟渠、河塘中,树木泛指行道树、人工乔木等高大乔木、灌木等,一些杂草和阴影则归于其他类。
1.2.1 遥感数据 遥感数据为2013年9月的QuickBird影像,空间分辨率0.6 m,影像大小16 426×17 059像元。在ENVI 5.1软件中,对遥感数据进行辐射定标和大气校正,并运用Gram-Schmidt方法融合影像,提高数据分辨率。最佳指数法(Chavezetal., 1982)用于影像波段组合评价分析,最终确定4、3、2波段为最优组合,该波段组合可将地物光谱差异通过影像色彩差异得到最佳呈现。如图1所示,芦苇在影像上表现出成片分布、纹理细腻平滑、红色的特征,互花米草在影像上表现出团簇分布、亮红色的特征,海三棱藨草在影像上表现出成片分布、暗红色的特征,而睡莲在图像上则表现出亮粉红色的特征。
1.2.2 样本数据 样本数据经地面调查获得一部分,样点分布如图1中圆点所示。由于滩涂考察环境恶劣,实地获得样本有限,为补充样本,本研究结合地物的影像特征、地理位置特征等建立目视判读标志,根据各类地物的影像特征选定训练样本。
为满足FCN模型训练要求,需标注样本以获得样本标签图。观察影像发现,各类地物的边界和形状特征均可在100×100窗口下体现,因此本研究以100×100窗口对影像进行裁剪,将目视判读结果以灰度图模式保存成样本标签图。
图1 QuickBird遥感影像以及样点分布
样本选取完成后对其进行翻转、旋转等操作,以增加样本数量,选取10%作为测试样本,最终获得训练样本4 904对、测试样本544对。
本研究采用2种方案: 1) 基于FCN对影像进行分类,得到结果后进行精度检验; 2) 将FCN与面向对象分割方法相结合对影像进行分类,得到结果后进行精度检验。同时,比较分析2种方案的分类结果。试验流程如图2所示。
图2 试验流程
Shelhamer等(2017)对比分析以AlexNet(Krizhevskyetal., 2012)、VGGNet16(Simonyanetal., 2014)、GoogleNet(Szegedyetal., 2015)为基础网络的FCN在同一数据集上的分类结果,得出VGGNet16表现最优; Simonyan等(2014)比较不同数量卷积层的VGG网络分类结果,认为网络深度增加有利于提高分类精度。基于以上2点,本研究确定采用以VGGNet19为基础网络的FCN开展分类试验。
FCN主要包括卷积层、池化层和上采样层(Shelhameretal., 2017)。卷积层由多个特征面组成,每个特征面由多个神经元组成,用于对输入影像进行特征提取,层的每个特征都接收来自前一层一个局部接受域的一组特性输入,后面通常会加一个激活函数,给网络增加一些非线性因素,以更好地解决复杂问题。池化层跟在卷积层后面,起到二次提取特征的作用,通过池化可降低卷积层输出的特征向量,减少计算量,减小模型复杂度,同时改善结果,防止过拟合出现。上采样(up sampling)是FCN的一大特点,也可称为反卷积(deconvolution),反卷积与卷积类似,都是相乘相加运算,不过卷积是多对一,而反卷积是一对多。
FCN网络结构包含16层卷积核均为3×3的卷积层和5层池化层,每层卷积层后的激活函数均为ReLU函数,池化层窗口大小均为2×2,且步长为2。前4个池化层采用平均池化,最后1层池化层采用最大池化。后接3层卷积层,同样以ReLU函数激活,再接1层反卷积层对其特征影像进行上采样恢复至输入影像大小。随着网络层次加深,获取的特征更加抽象,而浅层网络获得的信息较丰富,因此将不同层次上的结果进行融合即可以获取更多信息。最后将pool 5、pool 4、pool 3的结果都进行上采样,将三者叠加对其进行上采样输出,提升结果精度。模型结构示意如图3所示。
图3 模型结构示意
由于该网络采用多层3×3的卷积层堆叠,而3×3是最小的能够捕获上、下、左、右和中心概念的尺寸,2层3×3的卷积层堆叠相当于1层5×5的滤波器,因此,多层3×3的卷积层比1层具有大尺寸滤波器的卷积层具有更多的非线性,同时参数更少(Simonyanetal., 2014)。此外,卷积层次越多,网络结构越深,影像的细节信息能得到更好的提取,但也会造成网络的计算量十分庞大。
面向对象处理的最小单元不再是像元,而是含有更多语义信息的多个相邻像元组成的影像对象,其更多的是利用对象的几何信息以及影像对象之间的语义信息、纹理信息和拓扑关系,而不仅仅是单个对象的光谱信息(张春晓等, 2010),故可以提高影像信息的利用以及分类结果的精度,消除椒盐现象。多尺度分割是面向对象影像分析中常用的分割方法,对于不同地物适合的分割尺度不同(王露, 2014),因此对于最优尺度的选择需要进行一定的评价。
本研究多尺度分割在易康软件中完成,由于光谱在植被信息提取中较为重要,而对紧致度和平滑度不敏感,因此确定形状颜色权重参数分别为0.1、0.9,紧致度和平滑度均为0.5。分割尺度以10为步长,在[20, 200]范围内进行多次分割,最终采用平均全局评分指数法(Johnsonetal., 2011)进行最优尺度选择,确定为170。
将获得的样本数据集输入到FCN模型中进行训练,本研究网络学习率(learning rate)设为1e-4,模型学习完成后对影像进行预测。上述操作使用Tensorflow框架实现。
FCN是一种基于像元的机器学习方法,结果中有出现椒盐现象的可能。对原始影像以170尺度分割后将结果导出,在Arcmap10.2软件中根据导出结果对FCN学习得到的影像进行对象边界约束,划分出具有空间邻近性的同质区域,消除结果中的混杂像元。
FCN训练损失曲线如图4所示,当训练到30 000步左右时,损失曲线趋于平稳,表明模型已经收敛,此时训练可以结束。
分类结果如图5所示。图6为选取2种方案部分结果进行比较,从二者对比中可看出,经FCN学习得到的影像存在椒盐现象,而结合面向对象方法后该现象被消除。
图4 FCN训练损失曲线
图5 试验结果
图6 2种方案部分结果对比
本研究基于混淆矩阵和Kappa系数检验结果,如表1、2所示。采用选取随机点目视检验方式验证分类精度,避开有云区域,每种地类至少创建30个随机点,该步骤在Arcmap中完成。
结合表1、2数据,2种方案分类效果均很好。由表1可知,仅使用FCN方法的分类结果中,624个真实像元里,分类正确的有589个,分类错误的有35个,总体精度为94.39%,Kappa系数为0.939 2。由表2可知,结合面向对象分割后的分类结果中,615个真实像元里,分类正确的有600个,分类错误的仅为15个,总体精度为97.56%,Kappa系数为0.973 6,较方案一分别提高了3.17%和0.034 4,说明2种方法结合应用后的总体分类效果有所改善。
由表1中用户精度可知,芦苇的错分误差较大。单一查看芦苇数据,48个真实参考像元里,41个分类正确,有3个错分为树木,2个错分为南方碱蓬和1个错分为海三棱藨草。错分的主要原因是沿海地区芦苇零零散散,且与其他湿地植被交错分布,存在植被混杂生长现象,不同植被之间边界特征不明显,从而影响FCN精确提取芦苇边界。分析芦苇与树木的错分现象,二者在4、3、2波段组合上均显示为红色,而不同植物的表型存在特征差异,芦苇纹理细腻平滑,树木则大多数呈现出颗粒状特征,但是部分区域树的分布密集,树冠影像纹理也较为平滑,从而在模型训练中与芦苇产生混淆。图6d、e、f为芦苇的部分结果比较,在图6d中可以清晰看出芦苇纹理细腻平滑的特点,而图6e中体现不同地物的交界处即混合像元,由于没有清晰的纹理特征导致分类情况较为复杂,但与图6d比较,图6f中结合面向对象分割后的边界情况明显得到优化,芦苇分类边界更加清晰明确。
互花米草的用户精度为90%,主要错分为海三棱藨草。由于互花米草与海三棱藨草的分布区域交接重合,从而导致2类植被之间存在混合像元产生错分。
南方碱蓬的用户精度很高,只有极少部分错分为芦苇和海三棱藨草。南方碱蓬主要生长在沿海沙地、盐田和田埂等,明显区别于睡莲和树木,因此南方碱蓬与睡莲和树木之间不存在错分。此现象也可从图6g、h、i的对比中体现,观察图6h,单一使用FCN处理后的影像比较粗糙,存在椒盐现象,而经过面向对象分割处理后的图6i则显得十分平滑,南方碱蓬的分类结果边界清晰,结合原图比较,可以看出经面向对象分割处理后的分类结果更好。
海三棱藨草分布较广且成片,其影像信息特征呈暗红色,其他植被类型的影像信息特征明显区别于暗红色,所以极少有错分,但是某些生长茂盛区域的影像特征与芦苇相似,且在靠近陆地的海岸带与芦苇交错分布生长,边界信息较为模糊,而FCN是一种基于像元的分类方法,像元之间相互独立,因此相邻像元的分类结果可能不一致,导致部分海三棱藨草仍错分为芦苇。结合面向对象处理后,能有效克服同物异谱或同谱异物带来的影响,弥补基于像元分类的缺陷,消除椒盐现象,提高分类精度。
表1 方案一混淆矩阵①
表2 方案二混淆矩阵
睡莲的用户精度为100%,这是因为睡莲在影像上呈现独特的亮粉红色,且其分布区域大多为沟渠、河塘,纹理特征和边界信息都很突显,图6m、n和o的对比说明该点。
从表1 的制图精度分析可得,原图上各实际典型湿地植被类型漏分较少,表明FCN对于本研究影像的分类具有很好的效果。
结合表1、2与分类结果影像分析得出,仅使用FCN的分类错误大多出现在地物边界的混合像元区域,而结合面向对象分割后,通过各对象边界对像元进行边界约束,将基于像元分类转变为基于对象分类,可优化分类效果。
本研究采用的FCN基于VGGNet19结构,卷积层数量多,网络层次深,能够提取较精细的纹理,如地物的边、角、轮廓特征,有利于滨海湿地植被的精细分类;但该网络也存在一定缺陷,即得到单个像元分类结果的同时会产生椒盐现象。结合面向对象分割后,将原本基于像元转变为基于对象,对同类地物进行边界约束,加入了地物的空间分布相关性,可弥补FCN基于像元分类的缺陷,减少混杂像元的数量,从而降低细小特征的干扰,有效提高分类精度。
FCN结合面向对象方法对于边界清晰且光谱和纹理与其他类差别较大的地物提取精度较高,如本研究中的睡莲。结合面向对象方法后对于植被类型间,即使光谱和纹理特征存在相似性,分布区域边界模糊,提取精度也较高。但由于环境、区域因素的限制,实地采样方面有所欠缺,无法保证获取百分百正确的地面真实样本数据,从而产生一些误差。另外,本研究所用模型参数固定,若要进一步提高该方法的分类精度,下一步可考虑对模型参数进行适当调整,以得到更加合适的网络模型。
本研究基于FCN与面向对象相结合的方法从高分辨率遥感影像中提取滨海湿地植被,结果表明,仅使用FCN的分类效果不错,可在复杂的滨海湿地环境下精细提取植被,典型滨海湿地植被分类精度达85%以上; 但作为一种基于像元的分类方法,其结果中存在少量椒盐现象。结合面向对象分割后,能够有效消除椒盐现象,优化基于像元的分类效果,总体精度得到提升,典型滨海湿地植被提取精度均达90%以上。基于FCN与面向对象相结合的方法不仅适用于滨海湿地植被的精细分类,同时也可为环境复杂条件下的植被精细分类提供经验,值得在植被高分辨率遥感影像精细分类方面推广和运用。