基于深度学习的海岛区域分割和海岸线提取*

2022-01-18 09:36张永林谢荣安
地矿测绘 2021年4期
关键词:边界标签面积

明 生,张永林,谢荣安

(1.广东省地质测绘院,广东 广州 510880;2.广东省测绘产品质量监督检验中心,广东 广州 510075)

0 引言

淇澳岛位于广东省珠江入海口处,其面积的变化是珠江上游乃至整个地区环境变化的晴雨表。入海口是大陆河流流向海洋的终点,是河流、大陆和海洋物质交换,相互作用和相互影响最大的位置。其上游的河流中的冲击物,对位于入海口附近的岛屿的面积和大小影响很大。淇澳岛位于广东省珠江入海口处的西侧,其面积和范围的微小变化足以反映珠江上游及该地区的生态环境、气候变化等情况。然而,目前对淇澳岛的研究仅限于岛上生态的研究。比如:江睿等[1]研究了淇澳岛红树林湿地沉积物碳、氮分布情况;张坚强等[2]研究了淇澳岛次生植被特征及物种多样性情况;马姣娇等[3]基于地学信息图谱对淇澳岛土地利用格局进行了分析;田广红等[4]对淇澳岛肉实树群落及其物种多样性特征进行研究;李亚芳[5]对淇澳岛3类湿地软体动物群落生态学及分类学研究,等等。这些工作都是对淇澳岛上的某种生态进行研究,而对淇澳岛的岸线变化和区域面积没有涉及。另外,当前在互联网上查到的淇澳岛的面积仅限于某一年份的数据,由于实地测量人力成本昂贵和基于人工方法提取遥感影像繁琐和自动化程度不高的原因,从而缺失对该岛屿连续年份面积的测量数据。因此,本文基于Landsat-8公开遥感数据,采用最新的人工智能算法模型LaeNet[6],对淇澳岛从2013至2020近8年来的遥感影像进行区域分割和边界提取,从而计算统计出该岛屿的面积变化情况,对研究岛屿及区域生态环境、气候变化提供数据支持。为实现其他区域的岛屿海岸线变化监测、区域大小监控提供方法和思路,对岛屿和其相关海域的科学管理、海岸带资源与环境保护研究、可持续开发和利用决策都具有一定的参考作用。

1 研究区概况和数据来源

淇澳岛位于广东省珠江入海口西侧伶仃洋上,邻虎门,隶属于珠海市。地理位置为:东经 113°36′至113°39′,北纬 22°23′至22°27′。该地区属于南亚热带季风气候,年平均温为 22.4 ℃,年均日照为907.4 h,年均降水为964.4 mm,85.6% 集中在4月至9月份。潮汐属不正规半日潮,水质较清洁,海水盐度年平均值18.2‰,土壤属于滨海盐渍草甸沼泽土。区域位置见图1。

图1 淇澳岛区域位置图Fig.1 Administrative region of Qi’ao Island

本文从USGS网站上(https://glovis.usgs.gov),下载1景包含该地区的无云且清晰的Landsat-8影像,日期为2020年2月18日,其宽是7 531像素,高是7 691像素,如图2所示。

图2 淇澳岛所在的Landsat-8影像Fig.2 Landsat-8 image of Qi’ao Island

本文选择2-6波段作为研究数据,其原始参数如表1所示。

表1 Landsat-8传感器的主要参数Tab.1 Main parameters of landsat-8 sensor

2 研究方法

利用深度学习模型的一般流程为数据准备、标签制作、模型训练和模型应用4个步骤。工作流程如图3所示。

图3 深度学习模型的工作流程图Fig.3 Work flow of deep learning model

2.1 训练数据集

将下载的2至6波段的Landsat-8影像分别进行大气校正,将数据从16 bit转换成8 bit,分辨率为96 dpi。因为近红外波段能够吸收水体(包括海水)的大部分能量,容易将水体与陆地区域分割开。因此,利用该特性,选用该景影像的近红外波段采用单个波段阈值法对该景影像进行水陆分离。在本实验中发现阈值较难选择,阈值选取过大,影像中边界处的陆地信息较多;阈值选取过小,边界处的海水信息又会漏掉。经过反复实验,选取该影像的水陆分离恰当的阈值,获得水陆分离后的二值影像。由于该地区为珠江入海口,航运较发达,水面上有大量的运输船,也被分离成陆地。因此,手工采用影像处理工具去除船体等噪声,最终制作完成高质量的水陆分离结果影像,用作训练数据的区域标签影像。在此基础上,采用OpenCV库中的Canndy边界提取算法,对水陆分离结果影像进行边界提取,生成对应的边界标签影像。为了适应深度学习模型LaeNet影像512像素×512像素输入尺寸的要求,需要将转换后的影像和对应的二值化标签影像进行进一步切分。在本文中,只采用1景遥感影像作为训练数据,为了进一步增广数据集,在切分过程中采用重叠度为300像素。最终,生成324个子块影像和相对应的区域标签和边界标签数据集。

2.2 LaeNet模型训练

目前,人工智能领域的深度学习模型[7]已广泛应用于地球科学领域[8],然而大多模型训练需要大量的带标签的训练数据。基于Landsat-8遥感影像数据,制作影像分割和边界提取标签工作量较大,因此本文选用轻量级的深度学习影像分割和边界提取模型LaeNet,只在1景Landsat-8遥感影像生成的324个子影像数据集上进行训练。在LaeNet模型中,语义特征提取部分采用2层3×3 SAME类型的卷积核,其通道数为64、步长为1、激活函数为ReLU;区域分割部分采用1个3×3 SAME类型,并且步长为1卷积核,但是通道数为1,激活函数为Sigmoid,损失函数采用二值交叉熵函数;边界提取部分采用各个深度学习框架都支持的maxpoling提取区域的空间梯度,则影像的区域与该区域的空间梯度的差值即为影像中水陆边界,为了使用整个模型能够进行反向传播训练,激活函数采用Leaky ReLU,其损失函数采用平均绝对误差函数。

在LaeNet模型训练阶段,为了尽可能多利用已制作的训练数据集应用于模型训练,将324个子影像中的300个作为训练子集,其余24个作为验证子集。同时,采用翻转、旋转、扭曲、随机裁剪等策略对训练子集进行增广。在英伟达GeForce 1080支持下的操作系统Ubuntu 16.04平台上的Keras框架下训练该模型。整个网络模型的参数随机初始化,批次大小设置为4。模型的优化算法选择ADAM算子,初始学习率设为0.001,在学习率的衰减策略中,衰减因子设置为0.7。直到学习率衰减为10-5,或迭代epoch达到50次结束模型训练。至此,训练获得性能最好的模型,其验证精度为0.99,影像分割交并比为0.98,最后,将模型文件命名为LaeNet.h5。

3 数据处理

为了获得淇澳岛近几年的面积变化情况,在USGS网站上分别下载2020年前7年每年1景无云、清晰遥感影像为原始数据。首先采用大气校正、波段16位转8位,将波段2至波段6的影像分割成512×512大小的子影像块。其次,分别应用LaeNet模型对这7景子影像进行水陆区域分割和边界提取。然后,将水陆区域分割和边界提取的子影像分别拼接成为整体的区域分割影像和边界提取影像。最后,将这7景的结果影像加上2020年的区域标签影像和边界标签影像,按照淇澳岛范围大小裁剪成淇澳岛的区域结果影像和边界提取影像,如表2所示。

表2 淇澳岛2013-2020年区域分割和边界提取结果Tab.2 Area segmentation and shoreline extraction results of Qi’ao Island from 2013 to 2020

岛屿的面积其中一个计算方法可以通过直接统计遥感影像中的有效值像元个数分辨率,其计算公式为:

(1)

4 结果分析

对边界提取影像进行分析可以得出,淇澳岛北面岸线在2014年、2019年和2020年表现相对平直,说明变化相对较小。根据淇澳岛水陆区域分割影像结果,分别统计出该岛屿连续8年的陆地像素个数。然后,根据Landsat-8分辨率,按式(1)分别计算出该岛屿连续8年的陆地面积,其结果如图4所示。

图4 淇澳岛连续8年面积统计情况Fig.4 Annual areas of Qi’ao Island for past 8 years

从图中可以看出,除2014年10月15日面积较大外,淇澳岛陆地面积每年变化幅度较小。分析原因,这是由于淇澳岛东侧海湾多为沙岸、泥沙底,西北两侧海湾多为淤积泥滩,水较浅,低潮干出,同时受海浪潮冲积影响较大。

5 结束语

淇澳岛位于珠江入海口处,其面积的变化情况是上游大陆架环境变化的重要指示器。因此,有效地提取出淇澳岛的岸线和面积大小非常重要。在本文中,选用Landsat-8遥感影像作为基础数据,结合轻量级的深度学习LaeNet模型,不需要大量的训练数据和传统繁琐的手工边界提取,训练该模型。按照LaeNet模型的训练数据集制作方案、训练策略和应用方法,获得了淇澳岛连续8年的岸线和面积大小。实验结果表明,该轻量级的LaeNet模型,在手工制作的1景包含淇澳岛的遥感影像作为训练数据情况下,实现了对8景包含淇澳岛的遥感影像的区域分割和边界提取,能够快速、便捷、实时获取岛屿变化情况,实现高效、准确、及时的数据支持。该方法可为其他区域的岛屿区域分割和边界提取提供思路,具有一定的参考作用。

猜你喜欢
边界标签面积
怎样围面积最大
最大的面积
拓展阅读的边界
巧用面积法解几何题
意大利边界穿越之家
论中立的帮助行为之可罚边界
无惧标签 Alfa Romeo Giulia 200HP
巧用面积求坐标
不害怕撕掉标签的人,都活出了真正的漂亮
标签化伤害了谁