遥感影像动态变化监测关键技术探讨

2021-09-12 10:44:03文金花李靖霞
防护林科技 2021年2期
关键词:遥感影像

文金花 李靖霞

摘 要 随着遥感影像数据的广泛应用,遥感影像数据更新频率越来越快,如何快速发现影像中地物变化成为一项重要的工作。由于数据量大,人工判读方法不能满足工作需要。文章陈述了变化检测的总体流程、SLIC超像素分割算法和随机森林分类方法,通过遥感影像变化动态检测工具开发,输入两期遥感影像可自动识别并标注变化区域,同时输出变化区域地类的变化过程,实现重点区域的重点监控,准确快速发现地类的变化,从而全面了解地表自然地物的变化过程。遥感影像分割尺度和质量及选择的分类算法,对地类识别起决定性作用。

关键词 遥感影像;超像素分割;随机;森林分类;动态检测

中图分类号:S771.8       文献标识码:A   doi:10.13601/j.issn.1005-5215.2021.02.026

遥感动态监测是从同一地区在不同时间或不同条件的遥感图像中,识别和量化地表变化的类型、空间分布情况和变化量[1]。地表变化分为2种:转化是土地从一种土地覆盖类型向另一种类型转化,也称为“绝对变化”;改变是土地覆盖类型的内部条件(结构和功能)发生变化,也称“相对变化”。

本文通过遥感影像变化动态检测工具开发,实现了重点区域的重点监控,准确快速发现地类的变化,从而全面了解地表自然地物的变化过程。

1 遥感动态监测过程

遥感动态监测过程分为数据预处理、变化信息检测和变化信息提取三步。数据预处理就是排除图像因以下因素产生的差异信息:传感器类型的差异、采集日期和时间的差异、图像像元单位的差异、像素分辨率的差异、大气条件的差异和图像配准的精度。变化信息检测首先使用基于超像素分割的随机森林分类法来对两期影像进行分类,再对分类结果进行比较[2]。变化信息提取通过比较结果进行统计分析。

为了获取多时相遥感影像的变化分布和变化过程,采取基于超像素的分类方法,主要步骤如下:

(1)对2个不同时相的卫星数据做SLIC超像素分割,获得超像素分割结果;

(2)对生成的超像素提取特征,提取的特征分为两大类,分别为光谱特征和纹理特征;

(3)根据历史标记数据训练得到随机森林分类模型;

(4)根据超像素的特征对超像素进行随机森林分类,分别获得2个时相的分类结果;

(5)将2个时相的分类结果进行叠加,获得最终的变化检测结果。

本方案的优点在于:(1)使用的SLIC超像素分割算法效率高;(2)与基于像素的分类方法相比,基于超像素的分类可以大大减少分类时间;(3)與基于对象的分类方法相比,不需要大量的试验分割参数,基本没有欠分割现象,减少了因为欠分割导致的误分类;(4)基于分类的变化检测可以准确地检测出不同时相地类的变化过程,有利于后续的利用。技术路线如图1所示。

2 SLIC超像素分割

SLIC算法实质上是根据相似度将像素聚合为一个个超像素,这是一个聚类的过程,也正是SLIC算法的核心。SLIC算法对像素的聚类过程和K-Means算法很相像。K-Means是一种常用的聚类算法,算法以样本到聚类中心的距离来判定对象间的相似性[3]。K-Means算法的主要流程有:

(1)初始化K个聚类中心;

(2)计算样本到每个聚类中心的距离,并根据距离的大小将样本归类到最近的聚类之中;

(3)通过重新计算特征值更新聚类中心;

(4)迭代(2)(3),当满足给定条件时算法结束。

SLIC算法的聚类过程与K-Means算法的不同点在于,SLIC算法采用的是局部性的K-Means算法,在有限的区域内进行对象搜索和聚类。

如图2所示,标准的K-Means算法会搜索图像中的所有像素,并计算每个像素到每个聚类中心的距离,这大大增加了算法的计算量。由于像素灰度具有局部相似性,在一个限定范围内的像素更可能属于同一个超像素集群;而空间距离很远的像素属于同一个集群的可能性很低。基于这一点,SLIC修改了聚类的搜索范围,如图3所示,搜索范围从整幅图像限定到了超像素本身大小S的2倍区域 (2S) 内,这一改变在不降低分割准确性的基础上大大提高了算法的运行速度和效率。

SLIC算法的运算流程主要分为以下8个步骤:

(1)初始化超像素个数k和紧致度m,这两个参数由人为手动输入。m的大小将影响颜色差异和空间差异在像素相似性计算上的权重,算法作者指出m取10时可以取得不错的分割效果,在实验时一般都默认设定为10。

(2)获取图像和像素信息。

(3)将图像转换到Lab颜色空间,保存每个像素的空间信息和颜色信息。

(4)根据输入的超像素个数计算超像素大小和种子点的间距,并初始化种子点,初始时种子点为均匀分布。此时有些种子点可能会处于图像的边缘,为了避免其对后续处理的干扰需要将种子点向以它为中心的3×3范围内梯度最小的位置移动。将移动后的种子点作为聚类的中心。

(5)使用局部K均值算法进行聚类,以生成超像素。在进行局部K均值聚类时需要计算局部区域像素到聚类中心的距离。

(6)对聚类中像素的每一维特征的计算均值,将其作为该聚类中心点的特征值,并更新聚类的中心点。

(7)迭代上述(5)(6)的过程。算法作者指出迭代 10次可以得到比较好的效果,因此迭代次数默认设为10。

(8)对图像进行后续处理,包括将独立像素点划分到最邻近的超像素等。

3 随机森林分类

随机森林算法是一种基于集成学习思想的机器学习算法,传统的机器学习分类算法大多是单分类器模型,如支持向量机算法,随着数据量的急速增长和多样化,这种传统的单分类器算法就面临着性能瓶颈的问题[4]。因此通过组合或者聚集多个分类器来提高分类的准确率,这种方法即为机器学习中的集成学习方法。

决策树是一种业界和学界广泛使用的机器学习算法。决策树比较适合对离散型的数据进行分类,算法思想简单、方便使用并且运行高效,但是决策树在处理不完整数据时容易出现过度分割或者过度拟合的问题,导致最终的分类结果不佳[5]。因此,单单使用决策树算法来解决分类问题具有很大的局限性。

对决策树进行组合需要使用集成学习的方法。最初集成学习的提出就是为了解决决策系统准确率低下的问题,如今集成学习已经能够解决机器学习的大多数问题[6]。图4展示了集成学习的基本模型,首先是从样本集中选取采样集提供给多个弱个体学习器进行训练;每个弱个体学习器产生不同的学习结果;最后对多个学习结果进行组合,从而构成一个强学习器。

随机森林选用决策树作为基础的个体学习器,通过集成方式来构建强学习器。图5展示了随机森林算法的分类模型。

D是样本集,经过随机化选择生成n个训练样本集D1-Dn,每个训练样本集经过一棵决策树的学习和训练分别得到一个分类器;进行分类时,每棵决策树将得到一个分类结果;经过投票得到最优的分类结果。

在进行随机化选择时,随机森林采取有放回的方式来选取样本。令原始样本集D中样本的个数为N,那么在构造每个训练集(子树)时,随机森林将对原始样本集进行N次有放回的随机选取,最终每个训练集中样本的个数也为N,这种随机采样的方式也叫作bootstrap sample。因为是有放回的随机选取,所以必然存在有的训练集不包含所有样本,有的训练集包含多个同一样本的情况。之所以这样做是因为随机森林算法希望每个子树都与其他子树存在差别,那么各个子树将产生不同的分类结果,综合这些分类结果得到的最终结果也就更加具有可靠性,使得算法具有更强的预测能力。

每个决策树都会产生一个分类结果,对分类结果的综合处理直接关系到最终结果的准确性。随机森林采用了“投票”的方式,以简单的多数投票法决定最终的结果。即每个决策树对最终结果都具有一票的投票权,如果某一个分类结果的得票数最多,那么这一结果即成为算法的最终分类结果,

用于训练和分类的特征是多维的,包含多个分量,随机森林算法在进行训练的过程中可以对特征分量的重要性进行计算和评价,由此可以判断出哪一个特征分量对分类更加重要以及分类结果对哪一个特征分量更敏感。特征的计算一般来说是一个非常费时的过程,去掉重要性低的特征分量对提高算法的效率非常重要,因此随机森林算法的这一特性对于特征的选择也提供了很大的帮助[7]。

随机森林算法可概括为划分训练样本、训练决策树和分类3个过程,具体流程如下:

(1)对于每棵决策树,使用bootstrap方法从原始样本集中进行N次有放回的采样,选取N个样本作为训练集,其中N为原始样本集的大小(样本的个数);

(2)重复步骤(1),构建出m个训练集,m由人为指定,每一个训练集用于生成一棵决策树;

(3)对于每一个训练集,从全部n个特征分量中随机选取一部分(一般为log2n)作为一个特征子集,再从这个特征子集中选择一个最优的特征分量作为决策树节点分裂的依据;

(4)判断是否达到构建决策树的终止条件,否则

重复步骤(3),则可完成一棵决策树的生成;

(5)重复步骤(3)(4),生成m棵决策树;

(6)每棵决策树对待分类样本进行分类,得到分类结果集合;

(7)统计所有的分类结果,采用多数投票的方法得到一个票数最多的分类结果,作為最终的分类结果。

从上述流程可以看出,每棵决策树的构建是可以并行进行的,对原始样本集的随机选取以及每棵决策树的分类决策也是可以并行进行的,因此可以使用并行处理的方式和技术(如CPU多线程和GPU并行计算)来对随机森林算法的大部分流程进行加速,使得算法的效率和可扩展性都得到极大的提高。目前已有部分学者对这一方向进行研究,如使用GPU并行技术——CUDA 对随机森林算法的训练和分类进行加速。由于随机森林算法在分类上的优异表现,其已应用于多个领域,在遥感影像的分类上也取得了很好的成果。

4 小结

遥感影像变化动态检测是一项计算量比较大的工作,对采用的技术路线要求较高。本文在研究黄河流域地表覆盖变化研究过程中,利用SLI超像素分割和随机森林分类的方法建立了动态检测系统,能够很好地检测出地表变化,达到了预期目的。

参考文献:

[1] 凌成星, 张怀清, 鞠洪波. 湿地资源遥感动态监测和管理应用综述 [J].安徽农业科学, 2012, 40(28): 14111-14115

[2] 周维才, 陈永富. 湿地资源遥感变化监测方法[J]. 世界林业研究, 2007, 20(2): 45-49

[3] 栗小东, 过仲阳, 朱燕玲, 等. 结合GIS数据的神经网络湿地遥感分类方法:以上海崇明岛东滩湿地为例[J]. 华东师范大学学报:自然科学版, 2010(4): 26-34

[4] 于新洋, 赵庚星, 常春艳, 等. 随机森林遥感信息提取研究进展及应用展望[J].遥感信息, 2019, 34(2): 8-14

[5] 巴桑, 刘志红, 张正健, 等. 决策树在遥感影像分类中的应用[J]. 高原山地气象研究, 2011, 31(2): 31- 34

[6] 邹文涛, 张怀清, 鞠洪波, 等. 基于决策树的高寒湿地类型遥感分类方法研究[J]. 林业科学研究, 2011 (4): 464-469

[7] 穆亚南, 丁丽霞, 李楠, 等. 基于面向对象和随机森林模型的杭州湾滨海湿地植被信息提取[J]. 浙江农林大学学报, 2018, 35(6): 1088-1097

猜你喜欢
遥感影像
一种基于遥感的快速提取建筑物高度的方法
探讨航测遥感内业数据处理关键技术
基于遥感影像的不同植被指数比较研究
高分遥感卫星影像的预处理技术
遥感影像资料在海图制图中的应用研究
航海(2016年6期)2017-01-09 11:28:24
遥感数字图像处理课程实验综述
科技视界(2016年13期)2016-06-13 12:01:14
卧龙湖湿地遥感调查和演变分析
高分遥感影像中道路信息提取方法综述
基于LSB 的遥感影像数字水印的实现
遥感影像分类方法的研究