基于高光谱遥感影像土地利用分类算法与尺度的研究

2024-05-03 05:41鑫,陈
信息记录材料 2024年3期
关键词:土地利用光谱像素

王 鑫,陈 琴

(三和数码测绘地理信息技术有限公司 甘肃 天水 741000)

0 引言

随着人口的增长和经济的发展,土地利用的合理规划和管理变得越来越重要。卫星遥感影像在土地利用分类中的应用越来越广泛,成为了一种重要的土地资源监测和管理手段。土地利用分类的目的是将土地利用类型划分为不同的类别,以便于制定相应的管理和规划措施。尺度是土地利用分类中一个重要的因素。尺度越大,土地利用类型的信息越模糊,分类精度越低。因此,在土地利用分类中,如何选择适当的尺度对于获得高精度的分类结果至关重要。

高光谱遥感影像土地利用分类的研究面临着复杂的非线性数据结构、有限训练样本下的维数灾难以及光谱混合等挑战[1-2]。此外,高光谱遥感影像给影像的精确分类带来了新的挑战。第一个挑战是严重的光谱变异性和空间异质性,一些基于光谱信息的分类方法会在分类结果中造成严重的椒盐噪声[3]。另一个挑战是地物空间尺度的巨大差异。因此,在面向对象的分类中,选择合适的分割尺度具有挑战性。因此,需要光谱-空间融合分类器,它可以同时考虑精细的光谱属性信息和空间几何信息。

传统的高光谱空间分类方法可以通过引入空间信息来减少分类图的椒盐噪声。这些方法基于两个主要策略。第一种策略是级联每个像素的空间特征和光谱信息作为分类器的输入,其中空间特征包括纹理、形状和对象特征。第二种策略是引入空间上下文信息来提高像素分类精度,这可以被认为是一种基于后处理的分类方法。使用该策略的典型方法是基于马尔可夫随机场的方法、基于条件随机场(conditional random field, CRF)的方法和扩展形态学。尽管前面提到的高光谱遥感影像分类方法的有效性已被证明,但它们非常依赖基于领域知识和专家经验的手工特征[4]。此外,使用手工特征作为输入的传统分类器,例如支持向量机(support vector machine, SVM)、多元线性回归(multiple linear regression, MLR)和随机森林(random forest, RF),可以被视为浅层网络,这限制了挖掘的潜力、高级语义特征和复杂场景分类方法。

深层卷积神经网络具有强大的特征学习能力,可以自动挖掘深层次的空间特征,以广泛应用于遥感影像地物分类中。空间取块机制只能利用局部空间信息,造成分类结果中存在严重错分的孤立区域。为克服上述问题,本文提出联合条件随机场模型和卷积神经网络的遥感影像分类方法,通过条件随机场模型整合全局上下文信息缓解高光谱影像的空谱异质性。

1 联合条件随机场模型和卷积神经网络的全局土地分类框架

1.1 卷积神经网络分类基准模型

本文采用的卷积神经网络示意图如图1 所示。为防止输入特征的空间尺度下降过快,在构建卷积神经网络时未采用池化操作。卷积层和池化层逐层提取深层次的空间特征,全连接层进一步整合全局特征,最后全连接层输出的高层语义信息通过分类器进行分类。

图1 基准卷积神经网络高光谱分类示意图

1.2 条件随机场模型

条件随机场模型是Lafferty 提出的经典概率判别模型,其最初是用来标记序列化文本数据的统计模型。如图2 所示。

图2 条件随机场模型示意图

在二维图像的处理中,CRF 通过概率图模型中相邻像素之间的边连接关系来考虑像素之间的空间交互作用,进而整合空间的上下文信息。在给定的定量观测变量条件下,其直接对最大后验概率建模,具有更灵活的上下文信息建模能力。因此,CRF 模型广泛应用于遥感图像分类等任务中。

1.3 CRFCNN 模型结构

本文提出联合条件随机场和卷积神经网络(conditional random field convolutional neural networks,CRFCNN)的全局融合分类框架。如图3 所示。基于选取的三维空间块,本文首先构建了一个深层卷积神经网络提取局部的深层次的空间特征,然后利用马氏距离约束的CRF 模型进一步整合空间上下文信息减少分类图中的鼓励区域。同时引入CRF 模型减弱空间块尺寸对分类精度的影响。最后为缓解深层卷积神经网络海量参数和高光谱影像分类中训练样本受限之间的矛盾,采用4 种虚拟样本增强策略。

图3 联合条件随机场和卷积神经网络地物分类框架

2 实验与分析

2.1 实验数据集

本文采用开源数据集WHU-Hi-LongKou。数据采集地点为湖北省龙口镇典型的简单农业场景,采集时间为2018 年7 月17 日,数据采集期间天气晴朗无风,气温约为36 ℃,空气相对湿度约为65%。采集平台为大疆M600pro无人机搭载的Nano-Hyperspec-VNIR 成像光谱仪,飞行高度约为500 m,空间分辨率为0.463 m,影像尺寸为550×400 像素,在400~1 000 nm 范围内有170 个波段。

2.2 实验参数设置

2.2.1 训练样本设置

标注的每个类别,随机选择100 个标记像素作为训练集用于模型训练,其余像素作为测试集,用于精度测试,详细的训练样本如表1 所示。WHU-Hi-LongKou 数据中训练样本占标记像素的0.44%。

表1 训练样本和测试样本划分

2.2.2 模型参数设置

CRFCNN 分类框架中输入模型的空间尺寸块为9×9,数据增强策略20 次,参数值根据计算资源和分类准确性的经验值确定。卷积神经网络分为4 个卷积核尺寸为3×3,步长为1 的卷积层和两个卷积核数量分别为128 和64 的全连接层构成,模型训练中,初始学习率为0.01,衰减率为2e-4,采用Adam 进行优化,batch 数量设置为50,训练epoch为150。

2.3 CRFCNN 与现有方法对比试验

视觉表现是评价分类方法非常重要的一个方面,图4展示了CRFCNN 和对比方法(SVM、FNEA-OO、SVRFMC和基准CNN)在WHU-Hi-LongKou 数据中的分类结果。

图4 WHU-Hi-LongKou 数据分类结果

从分类图中可以看出,由于不同作物之间光谱信息较为相似,仅使用光谱信息的SVM 分类结果中出现明显的错分椒盐噪声现象。此外由于地块边缘农作物较为稀疏,部分区域被误分为杂草和道路。相比于SVM 分类结果,估计空间邻域信息的方法(FNEA-OO、SVRFMC 和基准CNN)显示出优异的视觉效果。FNEA-OO 分类结果相比于SVM 更为平滑,但由于道路、房屋和杂草的最佳分割尺度低于作物和水体的分割尺度,导致这3 类地物存在明显的错分现象。SVRFMC 方法充分利用空间上下文信息,分类图中的椒盐噪声得到极大缓解。然而由于SVM 分类器提供的一元势能准确性较低,导致阔叶大豆、窄叶大豆和棉花之间存在一些错分。基准CNN 方法只能利用局部空间信息,在训练过程中很容易陷入局部最优,导致分类图中存在大量错分的孤立区域。CRFCNN 方法在CNN 基础上融合空间上下文信息取得了最优的目视效果,分类结果中错分的孤立区域显著降低。

定量评价可以准确评估分类算法的性能,其中测试样本是通过野外实地勘察获取的,通常不包括不确定类别像素。表2 中列出了CRFCNN 和对比方法的分类精度。分类精度和视觉表现类似,FNEA-OO、SVRFMC、CNN 和CRFCNN 分类方法的OA 比SVM 分别提升了4.53%,4.31%,3.24%和4.58%,其中CRFCNN 方法取得了最高的分类精度。除阔叶大豆外,CRFCNN 分类结果中其他作物的分类准确率均在99%以上。因此实验结果证明CRFCNN 方法在WHU-Hi-LongKou 数据地物分类中具有优异的性能。

表2 WHU-Hi-LongKou 数据分类精度

3 结语

本文提出了联合条件随机场和卷积神经网络的分类框架CRFCNN,针对高分辨率影像的特点,引入条件随机场模型整合上下文信息,极大改善分类结果中错分的鼓励区域,在高光谱影像的实验中表现出优良的性能。但是本文的研究也存在着一些不足。例如,样本的数量较少,无法衡量长时序高光谱影像地物分类的精度。对于土地利用的划分存在着地域性,限制了其在广域范围内发挥作用。

猜你喜欢
土地利用光谱像素
赵运哲作品
基于三维Saab变换的高光谱图像压缩方法
像素前线之“幻影”2000
“像素”仙人掌
土地利用生态系统服务研究进展及启示
高像素不是全部
滨海县土地利用挖潜方向在哪里
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究
铽(Ⅲ)与PvdA作用的光谱研究