遥感影像数据分类的不确定性分析及其处理方法综述

2021-12-29 03:55:16陈焕南林红燕邢海花
现代计算机 2021年31期
关键词:不确定性分类图像

陈焕南,林红燕,邢海花

(1.海南经贸职业技术学院工商管理学院,海口 571127;2.海南师范大学信息科学技术学院,海口 571158)

关键字:遥感影像;不确定性;分类;模糊集

0 引言

遥感技术和信息技术的飞速发展,为我们提供了丰富的遥感数据源,这些高分辨率、高光谱的遥感影像数据为遥感定量化、实用化及产业化,为自然资源调查、环境监测、灾害防治和全球变化等提供了丰富的资料[1]。而遥感影像分类是遥感应用中的关键技术,如专题信息提取、专题制图、动态变化监测、遥感数据库的建立等都应用到遥感影像分类[2],可以说分类精准度直接影响遥感技术应用的发展。但由于自然环境的复杂性、遥感影像数据获取及其处理方法的局限性等原因,遥感数据分类过程中不确定性不可避免。因此,遥感数据的不确定性已经引起了国内外学者的广泛重视。Gahegan等[3]提出空间信息不确定框架,从数值、空间、时间、一致性和完备性等方面描述遥感数据的不确定性。承继成[4]分析了遥感过程中的不确定模型、度量、尺度效应、传递、可视化、定量分析及其减少不确定性的方法等。葛咏等[5-6]提出结合遥感机理模型和数据分析的不确定性数据处理方式,并对遥感信息和空间分析过程及结果的不确定性进行可视化表达。Lan等[7]从形式化描述和综合评价两个方面提出了一种不确定性表示方法。Rocchini等[8]对生态系统遥感制图中的不确定性进行了综述。

提高地物分类精度一直是遥感影像处理与应用研究的热点之一,但遥感影像数据固有的不确定性及现有数据处理与分类方法的局限性,显著影响到遥感影像分类结果的精准度,制约了遥感技术更广泛的应用。如何科学地表达这些不确定性信息,设计合理的遥感影像数据分类算法,是提高遥感影像分类精准度的关键。本文分析了遥感影像数据固有的不确定性,从遥感数据的获取、处理、转换和传播等方面分析遥感影像分类中的不确定性因素,并对遥感影像数据不确定性的处理方法进行归纳。旨在为后续研究有效的遥感影像数据表达方式和分类方法,以及提高遥感影像分类精度和自动化程度提供参考。

1 遥感影像数据分类中的不确定性分析

在遥感影像数据分类过程中,从数据转换、分析与处理、分类算法选取、分类后处理,到最终的精度评价等各个环节都不可避免地会引入不同程度与类别的不确定性。而遥感目标类别的多样性、干扰因素的复杂性、特征信息的可变性也给遥感影像分类带来极大的挑战[4]。如何了解这些不确定性的本质,并科学地表达和处理其中包含的不确定性,是提高遥感影像分类精准度的关键。

1.1 遥感影像数据固有的不确定性

遥感科学技术的理论基础是建立在地物波普特征上的,由于自然环境及其与遥感波谱相互作用的复杂性,且遥感影像数据在将连续的光谱信息用离散点的灰度值表示只是近似表示,这就不可避免地损失信息,这就是遥感影像数据固有的不确定性。主要表现在以下两个方面:

1.1.1 “同物异谱,异物同谱”现象

地物的电磁波谱特征由其物质成分和结构决定,同类地物在相同的条件下(纹理、地形、光照及植被覆盖等),应具有相同或相似的光谱信息特征,而不同类型地物其光谱信息特征不同[9]。然而同类地物的成分、成像条件和所处的环境不同(如湿度、风化程度、生长阶段等),其波普特征也会发生变化,造成同物异谱现象,如作物的不同长势和干旱地区稀疏的植被等造成了植被类中不同样本的差异。而不同类型地物的波普集成带之间也可能出现重叠现象,造成了异物同谱现象。例如,浑浊的水体和潮湿的土壤在某些波段上表现为混叠现象[10],特征向量之间的差异不明显,甚至模糊混叠,造成地物类别的模糊不确定性。

“同类地物具有不同的灰度值”和“不同类型地物具有相同或相似的灰度值”现象普遍存在,也是造成遥感影像分类和解译不确定性的重要原因。可以借助地物的纹理特征、空间分布特征来加以区分以减少分类或解译的不确定性。

1.1.2 混合像元

像元是传感器地面扫描采样的最小单位,是遥感数字化图像的基本单元。由于空间分辨率的原因,一个像元内可能存在多种不同类型的地物,主要出现在土地覆盖复杂、不同地物类别的交界区域。对于空间分辨率比较低的遥感影像数据,混合像元问题比较突出,而混合像元的存在严重影响着遥感影像地物分类精度。可以通过使用高分辨率的遥感影像减少混合像元,通过了解相关地物的空间分布规律,以减少分类中的不确定性。

1.2 遥感影像数据获取过程的不确定性

从客观世界三维地理空间获取二维遥感影像数据的过程,这一映射过程本身就存在信息缺失。此外,遥感信息传输的各个环节都会在不同程度上受到太阳入射角、遥感传感器姿态、地球自转、地形起伏以及大气作用等客观因素的影响(如图1所示),遥感数据存在一定程度的几何及辐射失真。地球表面的物体普遍存在季节性差异,且不同时期的传感器成像条件不同,会导致在不同时期的影像中同种地物的光谱信息会有所不同。因此,遥感数据在刻画真实的地表环境时存在一定的不确定性。

图1 数据获取阶段的不确定性[11]

传感器系统的特性深刻地影响着遥感图像质量和遥感信息的不确定性。遥感数据的辐射分辨率、空间和时间分辨率,遥感影像数据的信噪比都受到传感器物理参数的影响。而传感器系统的稳定性亦受到飞行速度、卫星平台的稳定性、自然条件等因素的影响。因此,传感器系统会造成遥感影像数据的不确定性。

1.3 遥感影像数据处理的不确定性

几何校正和辐射校正是两种基本的遥感数据预处理方法,能够有效降低数据获取阶段的不确定性。由于受到大气条件、地表地形、太阳辐射等因素的影响导致接收的信号不能准确反映地表物理特征,辐射校正的目的是消除交杂在遥感图像所记录的辐射亮度上的各种干扰,以正确反映目标物的反射和辐射特性。而由于遥感器自身和成像条件等因素的影响,造成所获取的遥感图像存在几何变形,几何校正是为了使遥感图像上记录的地物辐射量和地面真实目标一一对应。几何校正一般是基于遥感器物理和概念模型,且基于地面控制点辅助下完成,而模型和地面控制点的误差都会给几何校正带来一定程度的不确定性。遥感数据提供商会在提供数据之前,先根据传感器参数和大气参数对由传感器内部因素及大气状况引起的辐射畸变进行校正,用户只需对多时期遥感影像做相对辐射校正和几何配准。辐射和几何校正后遥感图像数据也不能始终和地面实况完全一致,因此,所残余的光谱和几何误差亦带来遥感影像数据的不确定性。此外,影像融合、影像增强或特征提取、数模转换等处理过程都会产生误差,从而造成一定的不确定性。

1.4 遥感影像数据转换和传播过程中的不确定性

无论是从矢量数据到栅格数据还是从栅格到矢量的转换,在投影变换过程、数据的网络传输过程中都会产生新的不确定性。遥感影像数字化即用传感器对地面扫描成像,将地面真实场景反射的电磁波信息生成连续的模拟图像,然后再将模拟图像离散化为数字图像。把模拟图像离散化成数字矩阵的过程中,也就是把连续的地磁辐射能量用有限的离散数字值来表示,即用灰度值来表示。因此遥感数据只是近似表示,不可避免的造成数据丢失,必然产生不确定性。

另外,传感器接收到的电磁波是微弱的物理量,需放大或增益。而在放大或增益过程中可能是线性,也可能是非线性的。因此得到的模拟图像只是地物的相对近似,亦会造成不确定性。遥感数据的投影变换过程,传输过程中信息的衰减和增益、压缩和解压缩等,都会造成误差传播和累积。因此,在遥感数据的转换和传播过程中不确定性不可避免,并影响后续的分析和应用。

1.5 遥感影像数据分类中的不确定性

遥感影像数据自动分类就是通过计算机按照一定的准则将遥感图像中的各个像元依据某些特征划分为不同的类别,赋予不同的类别标签[9]。为了从遥感影像中获取有效的地表覆盖信息,学者们针对不同类型的遥感影像设计了多种遥感影像分类算法,如人工神经网络、支持向量机、最大似然分类、K-Means聚类、模糊C均值聚类等,以及一系列的改进算法。此外,出现了面向对象的高分辨率遥感图像分类方法[12],基于稀疏表示[13]、集成学习方法[14]、深度学习[15]等高光谱遥感图像的分类新方法。无论使用基于光谱的还是面向对象的分类方法,当连续的光谱信息转换为一组离散的类别时,所使用的遥感数据处理和图像分类方法将涉及信息的丢失,这导致遥感数据分类过程存在不确定性[16]。分类过程中存在的不确定性主要包括:①分类模型及参数选择的不确定性。②样本及特征选择的不确定性。③分类精确性评估的不确定性。

近年来,越来越多的学者开始关注遥感图像分类的可靠性问题。1984年Wilson和Granlund就建议考虑不确定性对整个图像处理流程的影响[17]。Giacco等研究了具有纹理特征的多光谱遥感数据分类问题,重点分析了生成的土地覆盖图过程中的不确定性[18]。Shi等提出了评价土地覆盖产品可靠性的验证方案,包括结果可靠性和过程可靠性评价[19]。Feizizadeh提出了一种将模糊综合评判和Dempster-Shafer理论相结合的方法,应用于基于对象的图像分类中的空间不确定性分析和精度评估[20]。2018年,Wang等针对高分辨率遥感图像像素级的不确定性和分类决策导致分类精度下降的问题,提出了一种基于区间二型模糊隶属度函数的高分辨率遥感图像有监督分类方法[21]。同年,Jiang等引入三角形模糊集建模来描述对象的特征,并针对高分辨率遥感聚类问题,提出了一种基于三角模糊集建模和单模糊器的区间二型模糊聚类增强算法[22]。2019年,Zhang等指出定量描述和研究遥感图像固有的不确定性对实现可靠的遥感图像分类至关重要,并提出一种遥感影像不确定性的定量描述方法[23]。2019年,Xing等针对遥感影像中复杂的空间相关性及同类地物异质性所造成的地物类别不确定性,提出一种结合邻域信息的区间二型模糊隶属函数构建方法[24]。Xu等针对遥感图像的不确定性和问题的病态性,传统的无监督分类算法很难建立准确的分类模型,提出一种基于半监督自适应区间二型模糊C均值算法(SS-AIT2FCM)[25]。

2 遥感影像数据不确定性处理方法

目前,对于遥感数据不确定性的分析处理方法亦沿用着一般的不确定性分析理论,主要有:模糊集理论、多元统计分析、粗糙集理论、信息熵、回归分析、敏感性分析、灰色系统理论、贝叶斯估计等。

2.1 模糊集理论

实际应用中经常会涉及到模糊不确定、不精确或不完整的数据,处理这种模糊不确定性数据通常使用模糊集理论。例如,农作物的不同长势和干旱地区稀疏的植被等造成植被类中不同样本的差异,浑浊的水体和潮湿的土壤在某些波段上表现为混叠现象等[11],此类遥感影像数据导致遥感影像分类等处理面临着模糊不确定性。基于模糊集合理论的模糊C-均值聚类算法(fuzzy c-mean clustering,FCM),已经广泛应用于遥感影像地物分类和目标分割等分析处理[26-27],具有较好的鲁棒性。二型模糊集合适用于描述数据的多重不确定性,为了更好地刻画和控制遥感影像数据分类中的高阶不确定性,学者将二型模糊集合引入遥感影像数据不确定性描述及遥感土地覆盖分类[28-29]。

2.2 多元统计分析

多元统计分析研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性。多种遥感数据处理及专题信息提取都是以多元统计分析为基础展开的,其基本原理是将遥感数字图像中像元值视为具有统计分布特征的随机变量,并从统计分析的角度进行各种图像预处理、变换、增强及图像分类处理。遥感数据的基本统计特征包括单波段遥感数据的均值、众数、标准差等基本统计量,以及多波段遥感数据的协方差、相关系数,包括图形方式的直方图、散点图等统计特征。均值、中值、众数这三个统计量物理意义相近,代表了图像中地物的平均辐射强度或代表图像中分布最广的地物的辐射特性。标准差在数学意义上反映了图像中像元值的总体离散程度,其物理意义是反映了图像中各类地物之间的辐射特性差异。所以,遥感影像数据的基本统计特征分析在遥感图像不确定性处理中占有重要的地位,对遥感影像数据专题信息提取至关重要[30-31]。

2.3 粗糙集理论

粗糙集是波兰理工大学Z.pawlak教授提出用来研究不完整数据,不精确知识的表达、学习、归纳等的一套理论。粗糙集理论除了能对不精确、不完整的各种不完备信息进行表达和分析之外,还可以对这些数据进行推理,从这些不确定性数据中发现隐含的知识,并揭示其潜在的规律。粗糙集作为一种处理模糊和不确定性问题的数学工具和知识获取的智能手段,已广泛应用于模式识别、图像处理和数据分析等诸多研究领域,在遥感影像分类、特征选择等方面也取得了较好效果[32-33]。

2.4 信息熵

熵在概率论中用作描述随机试验的不确定性程度的度量标志。信息论之父香农于1948年发表论文A Mathematical Theory of Communication,指出:任何信息都存在冗余,冗余大小与信息中每个符号(数字、字母或单词)的出现概率或者说不确定性有关。香农提出“信息熵”的概念,解决了对信息的量化度量问题。在遥感影象处理中,信息熵是遥感数据不确定性的度量方法之一,被用作同一类地物的影象亮度值的分散程度和均匀程度的度量。目前,信息熵被广泛应用于遥感影像分类的不确定性度量[34-35]。

2.5 回归分析

回归分析是研究因变量对自变量之间相关关系的一种统计分析方法,目的是通过自变量来估计或预测因变量的值。回归分析是一种常用的遥感信息建模方法,在遥感影像处理中经常需要根据遥感影像特征参数与地面物体或特征的相关性进行数学建模,如几何光学模型、辐射传输模型、土地利用变化模型并进行相关分析[36-37]。

2.6 敏感性分析

敏感性分析方法可以用于定性或定量地评价模型输入、模型参数对模型输出的重要性程度,是模型输入选择和模型参数校正的有用工具。其核心目的是通过对模型参数进行分析,确定模型各参数对输出结果影响的大小,分析哪些参数最容易引起模型不确定性,在模型参数选择和校正过程中重点考虑那些对输出结果影响大的参数。通常应用于遥感数学模型的不确定性分析,有效筛选出遥感图像中对分类贡献较大的特征波段等[38-39]。

3 结语

遥感影像数据的不确定性及现有处理方法的局限性,显著影响到遥感影像分类结果的精准度,制约了遥感更广泛的应用。在遥感影像数据处理的各个环节都存在着不同程度不同类型的不确定性,如何科学地表达这些不确定性信息,并对其不确定性进行有效的定量评估,从而尽量避免或减少数据的不确定性对遥感影像分类的影响是一个十分重要的课题。本文分析了遥感影像数据固有的不确定性,从遥感数据的获取、处理、转换、传播等方面分析遥感影像分类中的不确定性因素,并对遥感影像数据不确定性的处理方法进行归纳。为后续研究有效的遥感影像数据不确定性建模和分类方法,以提高遥感影像分类自动化程度和可靠性提供有效的参考。

猜你喜欢
不确定性分类图像
改进的LapSRN遥感图像超分辨重建
法律的两种不确定性
法律方法(2022年2期)2022-10-20 06:41:56
分类算一算
有趣的图像诗
英镑或继续面临不确定性风险
中国外汇(2019年7期)2019-07-13 05:45:04
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
具有不可测动态不确定性非线性系统的控制
遥感图像几何纠正中GCP选取