基于U-Net 模型的土地利用快速分类提取方法研究

2022-01-12 05:23黄丽虹

南方自然资源 2021年12期

● 黄丽虹，何晶

（广西自然资源调查监测院，广西南宁 530200）

随着遥感对地观测技术的快速发展和无人机的普及，亚米级、厘米级的高分辨率遥感影像不断被获取，这为地表信息变化的快速发现提供了精确的数据来源。随之而来的是高分辨率遥感影像以每日TB 级的数据量持续增加，已经远超传统人工处理的能力。但高分辨率遥感影像分类中存在特征选择困难和空间信息缺乏等问题，传统依靠光谱信息的遥感解译方法很难满足当前的分类需求，使得面向高分辨率遥感影像的快速解译方法的研发日益紧迫。

近年来，以深度学习为代表的土地利用快速分类提取成为研究者的关注方向，在高分辨率影像分类的应用中取得了一定的成果[1]。但是，传统的卷积神经网络具有存储开销大、计算效率低等不足，通常只能提取一些局部的特征，分类性能受到一定限制[2]。

U-Net 模型是在FCN 基础上进行的延伸，相较于CNN、FCN、SegNet 等网络层数更深，有利于获得更多、更深层次的影像特征，加上其具有反复卷积以及融合低层次与高层次特征图的跳跃连接结构，可以更好地保持影像特征在经过多次卷积和池化后的原有特征[3]。随着遥感技术和地球观测技术的不断发展，航空和卫星图像数据急剧增加，影像分辨率不断提升，超高分辨率遥感影像占比越来越大，数据处理的数量和难度也逐渐增大[4]。高分辨率遥感影像在提高质量的同时，其类内差异大、光谱信息相对欠缺的特点也对高效、准确地进行遥感影像分类提出新的挑战[5]。目前U-Net 模型在遥感影像分类、医学等方面具有突出的表现，研究小组使用GF-2 号卫星遥感影像，基于U-Net 模型对广西南宁市隆安县那桐镇进行地表覆盖自动提取与分类实验。研究区地处桂西南岩溶山地，两面高山环绕，中部沿右江河谷较低，呈北西至南东方向弧峰残丘带状平原，同时兼具广西典型的丘陵地和喀斯特地貌。

1 提取实验与分析

研究小组基于U-Net 模型对高分辨率遥感影像分类方法进行试验，具体作业流程如图1 所示。

图1 土地利用快速分类检测作业流程图

1.1 影像预处理

研究小组采用1 m 分辨率高分二号卫星（GF-2）遥感影像进行实验。GF-2 是我国自主研制的首颗空间分辨率优于1 m 的民用光学遥感卫星，搭载有2 台高分辨率1 m 全色、4 m 多光谱相机，具有亚米级空间分辨率、高定位精度和快速姿态机动能力等特点。使用GF-2 卫星影像，经过融合、裁剪等操作后，得到一景待分类影像。

1.2 构建样本库

深度学习遥感影像解译的基础是训练样本库，深度学习的含义实质上就是让深度神经网络对大量样本的深层特征进行学习后，使其掌握泛化能力强的语义特征，从而具备影像语义分割能力。因此，构建包含大量、高精度的样本数据的样本库是取得理想分类结果的基础。

（1）建立土地利用分类矢量及栅格图层。研究小组根据土地调查的常用分类，将土地利用类型分为水系、林地、居民地、耕地等4 类，以这个分类为基础，对处理好的GF-2 影像进行矢量数据采集，共采集了覆盖面积为4 km×4 km 的矢量数据（见图2）。

图2 影像及土地利用分类矢量图层图

（2）制作标签。利用ArcGIS 的转换工具将土地利用分类矢量图层转换成栅格，按照水系、林地、居民地、耕地等不同类型给栅格属性赋予不同的数值（见图3）。

图3 标签数据图

（3）滑动窗口裁剪影像。采用滑动窗口选取按照从左到右、从上到下的顺序以固定间隔对影像及对应的标签进行裁剪，裁剪出尺寸为256×256像素的影像块和标签栅格文件，作为训练样本输入U-Net 模型中。

（4）数据增强。深度学习算法中参与的样本数据越多，算法越有效。数据增强是一种增加样本库数量的方式，可通过旋转变换、仿射变换、色彩变换、尺度变换等方法对分割切片影像样本和标签样本进行样本扩充与数据增强。研究小组基于OpenCV 库二次开发，实现样本图片水平翻转、垂直翻转和扭曲翻转，经过数据增强后，样本数量达到1 204 个。

1.3 网络模型训练过程

训练模型部署在Windows10 操作系统下，显卡为NVIDIA GeForce RTX 2060。模型相关参数设置如下：批大小（Batch_Size）=4，初始学习率（Learning_Rate ）=1e-4，训练模型的迭代总轮数（Epochs）=300，分类数目（ClassNum）=5（背景值作为一个类型）。

2 实验结果分析

2.1 基于U-Net 模型的土地利用快速分类

研究小组根据训练得到的模型对另一影像进行分类测试（见图4），测试结果显示，基于U-Net网络训练得出的模型可以较好地从影像上区分出水体、耕地、林地和居民地。

图4 土地利用分类结果图

研究小组采用地面真实感兴趣区进行混淆矩阵分析，输入数据为分类结果、验证样本，其中，水系验证样本10 个、林地验证样本11 个、居民地验证样本9 个、耕地验证样本20 个。经过验证后，土地利用数据分类精度达到85.70%。

2.2 基于ENVI 的监督分类结果

遥感影像分类是利用计算机对遥感影像中各类地物光谱信息（灰度值）和空间信息进行分析，选择特征，将图像中每个像元按照某种规则或算法划分为不同的类别，然后获得遥感影像中与实际地物的对应信息，从而实现遥感影像的分类。

目前，在传统的高分辨率遥感影像分类方法中，最常用的是面向对象分类法和机器学习算法。面向对象分类方法常见的有基于ENVI 软件进行监督分类，但是此方法需要人工参与分割参数选择和对象特征选取，过程耗时、耗力；采用机器学习方法不需要人工介入，但是机器学习中的浅层结构模型难以得到更好的分类结果。深度学习（如U-Net 模型）是近几年图像识别领域的一门新兴技术，它能够进行深层次自主学习并进行准确的分类。

鉴于可比性，此次研究使用ENVI 进行同一个区域测试数据，新建耕地、居民地和林地3 个图层作为感兴趣区并进行分类。从实验结果看，ENVI 结果精度分析后，土地利用数据分类精度达到83.63%，而基于U-Net 的深度学习的土地利用数据分类精度达到85.70%。由此可知，相较于使用ENVI 分类方法，深度学习的土地利用数据分类准确率更高。

3 技术探讨

基于U-Net 模型的土地利用快速分类提取方法具有以下几个优势：一是作业流程中应用协调，保障数据操作合理；二是采用合理样本库，数据使用快捷方便；三是操作简单易懂，容易理解；四是数据之间无缝转换，损失较小；五是无需授权，即可对平台进行操作；六是与保密制度相结合，保证数据安全，提高管理效率。

技术难点：一是分类结果仍存在细小的错分区域，且地物的边界经过U-Net 模型上下采样后较平滑，需要通过图像后处理的方式，如全连接CRFs 等，对图斑分割的边界进行优化，进一步提高分类精度；二是训练模型采用了波段数有限的高分辨率遥感影像，但是U-Net 模型能够学习到的光谱信息特征有限，因此有必要考虑添加多源数据；三是需要采集大量的样本数据，且精度达到一定的标准，便于进行分类。

4 结语

高分辨率遥感影像包含高质量地表覆盖信息，如何高效准确地实现高分辨率遥感影像的地表覆盖分类是急需解决的问题。研究小组提出了利用U-Net 模型对高分辨率遥感影像进行快速分类的初步设想，经过实验验证，U-Net 模型能够较为准确地提取出耕地、水体、居民地和林地等重点地物，可以实现较准确的土地利用分类识别，可大大提高影像判读和数据采集的作业效率。这一方法对解决广西地区由于地物复杂、图斑破碎等因素导致的自然资源要素自动提取困难有很好的借鉴意义。