云计算与深度学习协同的深圳市1986—2020年城市扩张分析

2022-09-10 13:53罗新周翔胡忠文杨超邬国锋

遥感信息 2022年3期

罗新，周翔，胡忠文，杨超，邬国锋

(1.自然资源部大湾区地理环境监测重点实验室，深圳 518060；2.深圳大学生命科学与海洋学院，深圳 518060；3.深圳大学土木与交通工程学院，深圳 518060；4. 深圳大学建筑与城市规划学院，深圳 518060)

0 引言

不透水面是指人工制造的水不能渗透的地表，如沥青路面、停车场和屋顶等[1]。作为反映城市化进程和城市生态环境的主要指标，不透水面的遥感监测越来越受到重视，已成为遥感信息提取中的一个研究热点[2-4]。利用遥感提取不透水面的方法主要可以分为3类：光谱混合分析法[5]、指数法[6]和经典机器学习分类法[7]。具体而言，在光谱混合分析方法方面，Wu[8]利用光谱混合分析法，以V-I-S(vegetation-impervious-soil)模型为基础，基于Landsat ETM+影像对美国俄亥俄州哥伦布市的城市用地进行分类。Deng等[9]提出一种应用于城市不透水面区分的指数BCI，该指数在[0，1]区间，接近1代表不透水面，接近0代表裸土。机器学习方法方面，Marir等[10]提出了一种模块化的支持向量机方法并将其应用于城市不透水面的高精度提取。Li等[11]提出一种贝叶斯网络并应用于城市不透水面的自动提取。Du等[12]则提出一种改进的随机森林方法，实现了城市不透水面的高精度遥感提取。

近年来，深度卷积神经网络在图像处理领域取得了巨大突破[13]，如Krizhevsky等[14]使用ReLU激活函数解决了网络较深时梯度弥散问题；Simonyan等[15]提出卷积块的概念，通过设计卷积块使网络具有更大感受野同时减少了网络参数；Szegedy等[16]引入Inception概念，采用并行的方式构造深度卷积神经网络，以此提高了计算效率；He等[17]则提出ResNet深度残差网络。由于深度卷积神经网络能够实现对影像深层次空间场景特征的学习理解，该方法在城市不透水面的遥感识别和提取等方面也展示出了巨大的应用潜力[18-20]。Huang等[21]提出一种半迁移深度卷积神经网络，通过将卷积神经网络与基于街区数据的骨架分解方法相结合，保证了遥感影像上卷积处理过程中城市不透水面在空间格局上的完整性；Zhang等[22]则提出了一种基于对象的卷积神经网络方法，实现了城市不透水面中居民区、商业区以及高速公路地表要素的精细提取。深度学习算法在智能化方面展示出了显著优于传统机器学习算法的性能；然而，其严重依赖于高性能计算机图形处理器和标注数据集，这在一定程度上制约了其在遥感信息提取中的应用。此外，传统基于本地服务器进行城市不透水面提取往往会遇到海量数据管理及处理负担大、计算资源不足、模型训练数据集不充分等问题。当前，用于提供海量卫星遥感数据的Earth Engine云服务平台已广泛应用于遥感信息提取中[23-25]，国产遥感数据云平台PIE-Engine目前也在开发完善中。提供计算资源是这些云平台的重要属性，为遥感信息智能提取提供了条件。本研究工作主要为提出一种协同云计算平台与深度学习算法的遥感信息提取框架,并应用于深圳市长时序城市不透水面提取和扩张分析，本文的主要内容如下：1)构建云平台下遥感信息智能提取统一框架，实现基于云平台遥感信息的智能提取；2)结合云平台遥感影像数据资源和计算资源，采用深度U型卷积神经网络结构构建一种全自动城市不透水面提取方法，利用该方法实现深圳市1986—2020年逐年不透水面信息的智能化遥感提取；3)对深圳市特区建立以来的不透水面扩张进行分析，并总结近35年来深圳市快速城市发展背景下不透水面扩张的时空特征。

1 云平台遥感信息智能提取统一框架构建

本研究充分利用当前遥感数据产品和深度学习数据处理算法，结合云计算平台资源，提出一种云平台下遥感信息智能化提取统一框架。该框架(图1)主要分为4个部分：深度学习模型构建、深度学习模型云平台部署、基于高质量遥感产品的模型训练、基于云平台的遥感信息自动提取。

2 研究方法

基于提出的云平台下遥感信息智能提取统一框架，在云平台海量遥感影像数据和丰富计算资源支持下，以深圳市1986—2020年长时间序列不透水面提取为例，开展了云平台下遥感信息提取应用研究。具体而言，利用已有高质量遥感不透水面数据产品对所构建深度卷积神经网络模型进行训练，将充分训练所得模型迁移，用于深圳市长时序遥感影像并进行不透水面信息的自动提取，最终获得深圳市1986—2020年地表不透水面信息高精度提取结果(图2)。

2.1 云计算平台

本研究主要依托谷歌云平台，具体包括：1)Earth Engine云平台，该平台用于训练及预测数据的筛选及预处理；2)AI云平台，该平台用于部署深度学习模型以及配置计算资源从而满足深度学习模型高性能计算需求，采用12 GB显存的Tesla K80显卡；3)云存储，该工具为云端不同平台间数据交互所用。本文具体涉及云存储为7个GB。

2.2 Landsat影像数据及预处理

本研究所用数据具体包括Landsat 5、Landsat 7、Landsat 8地表反射率遥感影像。为了获得研究区域内无云干扰影像，首先获取同一年中所有影像，进而利用CFMask算法[26]对影像进行云掩膜处理，并逐像元选取同一年按时间排列下像元值中位数，以此生成以年为单位的无云Landsat影像。

2.3 MSMT-RF不透水面遥感产品

MSMT-RF不透水面遥感产品是结合了时间序列Landsat 8影像、时间序列Sentinel-1影像以及SRTM-ASTER DEM、MODIS EVI影像、VIIRS夜光影像等数据，采用随机森林算法获得的一套2015期高质量全球不透水面遥感产品[27]。本研究选取2015期MSMT-RF不透水面遥感产品作为Landsat影像不透水面的标注数据，利用其对所构建深度卷积神经网络进行训练。MSMT-RF为全球尺度的不透水面遥感产品，由于本文研究区域为中国深圳市(图3)，仅选取包含该区域的单幅(幅号：E110N30)产品进行深度学习模型的训练与评估。

2.4 U型深度卷积神经网络构建及模型训练

本文根据经典的U型网络设计[28]构建U型卷积神经网络并部署于云平台进行深圳市的不透水面自动提取。所构建的U型网络由编码部分和解码部分组成，其中编码部分和解码部分各含有6个编码和解码模块。每个编码模块产生的特征与对应解码模块获得的特征进行叠加并用于后续的特征解码。每个编码模块和解码模块由卷积模块或反卷积模块构成，而卷积模块和反卷积模块由卷积运算、批标准化、ReLU激活函数构成，具体网络结构如图4所示，其中，Conv2D-B为卷积块；DeConv2D-B为反卷积块；Encoder-B为编码块；Decoder-B为解码块。选择该模型的主要原因是该模型为一个轻量级模型，在参数量小的情况下仍然能够保持较高的性能。

基于随机获取的模型训练区域和评估区域选取数量相同的2015年Landsat 7和Landsat 8影像用于模型训练和评估。总计获得6 000个影像场景用于模型训练，1 800个影像场景用于模型评估。模型训练采用后向传播算法，选取Adam算法[29]进行模型优化，其中，权重延迟β1=0.9，β2=0.999。选用交叉熵函数计算模型损失，训练过程中首先设置较大学习率0.001对模型训练50次，然后设置较小学习率0.000 2对模型训练50次，最终使得模型收敛于较小的损失值。

2.5 云平台下不透水面遥感提取及时序滤波后处理

本研究通过Earth Engine云平台收集1986—2020年深圳市范围Landsat遥感影像，通过对影像进行必要预处理，如去云处理、缺失条带去除、多时相影像自动补全等，获得深圳市1986—2020年逐年无云遥感影像。基于云平台将所构建且充分训练的U型网络应用于深圳市Landsat影像的自动不透水面提取。为了进一步抑制不透水层的误提取和漏提取，遵循已有研究成果的假设，认为在所研究时间序列下透水层向不透水面的转变为一不可逆过程，本研究设计了一种基于最大类间方法时间序列不透水面分类结果时间滤波后处理方法。首先，对每个像元的地表覆盖属性(透水层和不透水面)进行编码，透水层编码为0，不透水面编码为1。之后，沿着时间序列对每个时间点的地表覆盖属性进行搜索，将每一个时间点作为分割阈值，即将搜索时间点看作透水层向不透水面的转换节点，计算前后两个时间区间内地表覆盖编码值的最大类间方差(图5)。具体而言，分别求出时间节点前后时间区间内编码均值u0和u1，令时间节点前的时序数占总时序数的比例为W0，时间节点后时序数占总时序数的比例为W1，则满足的条件如式(1)所示。

W0+W1=1

(1)

可求得时序数编码值总体平均值为(式(2))

u=W0×u0+W1×u1

(2)

由于在城市扩张过程中地表覆盖一般由透水层变为不透水面，本研究考虑方差的方向性，定义前后时序区间编码值的类间方差如式(3)所示。

η=W0×u-u0×(u-u0)+W1×u-u1×(u-u1)

(3)

由公式推导，类间方差的计算最终可简化为式(4)。

η=W0×W1×u-u1×(u-u1)

(4)

针对每一个时间点t，将其看作是透水层向不透水面的转换节点，可计算获得相对应的类间方差值。其中，类间方差最大值对应的时间节点为最终获得的透水面向不透水面的转换节点，表达如式(5)所示。

t=argmax(η)

(5)

3 结果与分析

3.1 深圳市1986—2020年不透水面提取精度分析

本文选取4个年份(1990、2000、2010、2020年)提取结果进行定量精度分析。地表真实类型由结合对应年份的高分辨率遥感影像人工识别所得。基于量化精度分析，本文所选4个年份不透水面提取结果的全局精度均高于91%(表1)，其中最高的2020年提取结果全局精度为97.12%。4个年份提取结果的平均全局精度为94.93%，略低于用于模型训练的MSMT-RF不透水面数据集全局精度95.1%。与同类型数据产品相比，其精度高于Gong等的GAIA[30]、Chen等的GlobeLand 30[31]不透水面产品。通过对比发现，MSMT-RF和GAIA产品精度较高，主要原因在于这两套数据集皆是基于多源遥感数据获得的，本研究所用数据仅为光学遥感影像数据，该类数据的历史资料可追溯到20世纪80年，因此本文所提方法在长时间序列不透水面提取方面具有更大的应用潜力。将所得地表制图结果与国际上两套同类地表覆盖产品进行对比分析(图6)，本文所提全自动方法所获得结果总体上与Gong等及Chen等产品的精度相当。通过图7所示的精细对比分析，Gong等的分类结果更为破碎，这在一定程度上使得分类结果更加精细，但另一方面，也破坏了地表覆盖景观的空间连续性。Chen等的不透水面分类结果保持了较高的景观空间连续性，这主要是由于Chen等采用了面向对象的方法进行地表覆盖制图。通过分析图7(e)～图7(j)可知，无论是Gong等的GAIA产品还是Chen等的GloeLand30产品都出现了在沿海区域不透水面的大量漏提取情况。该区域为近年来填海造陆所得，通过对比分析也反映出已有数据产品对于沿海城市填海造陆区域的忽略，这在一定程度上影响了沿海城市不透水面相关的应用分析。

表1 精度定量评估结果

3.2 深圳市1986—2020城市扩张过程分析

利用本文所提方法对1986—2020年深圳市不透水面信息进行逐年提取。基于时间序列提取结果，统计了各个年份深圳市不透水面的面积，进一步分析了其演变的时空格局。结果表明，整个研究期内，深圳市不透水面持续快速扩张，呈现出一定的阶段性与显著的区域性特征，具体为以下几点。

1)1986—1995年。深圳经济特区初建，社会经济发展对工业、居住、交通等建设用地的需求旺盛，导致该时期区域建设用地迅猛扩张，由于初建时期深圳经济特区的范围仅限于毗邻中国香港地区的罗湖、福田、南山等关内地区，因而该时期新增不透水面主要集中于这些区域。

2)1995—2000年。由于《基本农田保护条例》等政策法规的颁布实施，全国范围的农业用地开发建设受到一定程度的约束和限制，导致该时期深圳市建设用地的扩张速率有所放缓，新增不透水面仍然集中在关内地区。

3)2000—2005年。随着土地开发管控的松绑以及社会经济发展的加速，该时期深圳市建设用地扩展速率显著加快。由于关内地区发展空间趋于饱和，不透水面的增长热点转移到关外地区。与此同时，深圳开始“向海要地”，通过围垦西部珠江口和西南部南山半岛滩涂，拓宽了城市的发展空间。

4)2005年以后。深圳整个市域的发展空间均趋于饱和，该时期区域建设用地的扩张速率再次放缓，不透水面的增长热点完全转移到关外地区，同时填海造陆的规模也显著扩大。

4 结束语

为适应海量遥感数据处理及应用需求，本文充分结合云计算平台和深度学习技术，构建了云平台下遥感信息智能提取统一框架，并基于所构建方法框架实现了深圳市近35年不透水面信息的逐年提取。通过定量精度分析，本文获得了平均精度为94.93%的不透水面提取结果。通过与国际上同类地表覆盖产品的对比分析，本文提出的全自动方法获得的不透水面提取结果不亚于已有不透水面遥感产品。基于深圳市1986—2020年逐年不透水面信息提取结果，本文分析了深圳市近35年城市扩张的时空特征。结果表明，近35年深圳城市不透水面持续快速扩张，时间上呈现“快速扩张-扩张放缓-加速扩张-趋于饱和”的阶段性特征，主要受不同时期经济社会发展状况和宏观土地政策影响；空间格局上，深圳不透水面的增长热点实现了从毗邻中国香港地区的罗湖、福田、南山等关内地区向宝安、龙华、龙岗等关外地区的转移，且在2000年后开始大规模围垦西部珠江口和西南部南山半岛的滩涂，以此拓宽城市发展空间。