面向HY-1C卫星CZI陆地遥感图像的云检测方法研究

2023-02-26 07:42杨彬郭金源何鹏叶小敏刘建强
遥感学报 2023年1期
关键词:训练样本像素点反射率

杨彬,郭金源,何鹏,叶小敏,刘建强

1.湖南大学 电气与信息工程学院, 长沙 410082;

2.南华大学 机械工程学院, 衡阳 421001;

3.国家卫星海洋应用中心, 北京 100081;

4.自然资源部空间海洋遥感与应用重点实验室, 北京 100081

1 引 言

海洋一号C 卫星(HY-1C)于2018年9月7日成功发射。作为中国首颗海洋水色业务卫星,HY-1C 能满足海洋水色水温、海洋灾害与陆地环境监测需求,同时可服务于自然资源调查、环境生态、应急减灾、气象、农业和水利等行业(刘建强 等,2020)。HY-1C 上搭载了海岸带成像仪CZI(Coast Zone Imager)、水色水温扫描仪COCTS(Chinese Ocean Color and Temperature Scanner)等多套载荷,于2019年6月开始业务化运行。相关数据已经成功应用于多个行业,包括海面溢油识别(沈亚峰 等,2020)、冬小麦和红树林等的识别(王利民 等,2019;梁超 等,2020)、以及湖水浊度监测(周屈 等,2020)。

地球表面被大量的云覆盖。相关研究表明,云的平均覆盖度高达68%(Stubenrauch 等,2013; 王宇瑶 等,2022)。云覆盖影响地表信息获取。特别是对于HY-1C CZI这种大幅宽(>950 km)传感器,其获取的数据很少有无云的情况。云检测已经成为这类遥感图像预处理的必要步骤(Cheng 等,2022)。如果这些云不能被高精度识别并剔除,将极大影响HY-1C CZI数据的后续应用。

在过去10年中,针对MODIS、 Landsat、Sentinel、GF等传感器,科研人员提出了不同的云检测算法(Mahajan 和Fataniya,2019;隋淞蔓 等,2022)。总体来看,这些算法可以分为监督类与非监督类两类。监督类方法是指根据已知云与非云样本,选择特征参数及决策规则,建立判别函数对遥感图像进行云与非云区域的识别(Luo 等,2020)。如Deng等(2019)利用多张云影像的Gabor特征训练以实现云与冰雪的区分;Xie 等(2017)利用云的多级别特征,实现薄云和厚云的检测。随着深度学习技术的发展,云的深度特征提取和判别网络设计也可通过神经网络实现,如DeepLabv3+(彭龙康 等,2021),U-Net(徐少壮和钟来星,2021),RDA-Net(张晨 等,2021)等。这类算法的总体精度较高,常可以达到90%以上,但是其对于训练样本的要求高,训练样本的质量一定程度上决定了算法精度。庞大规模的训练样本的标注费时费力,而且较大的模型部署困难,这一定程度上限制了监督类算法的业务化应用能力。

非监督类方法则无需预先已知样本,即可依据一定规则实现云与非云区域的识别(Guo 等,2022)。在这类方法中,一般会对光谱和结构等特征采用聚类技术(张波 等,2021),实现云与非云区域的自动提取,如K 均值聚类等;也会通过构建物理模型分析云与非云地表之间的空—谱特征差异来实现云检测,如针对Landsat 数据的Fmask算法(Zhu 等,2015)、针对GF 数据的MFC 算法(Li 等,2017)等。相比于监督类技术,非监督类的云检测技术应用更直观,对计算和存储要求较低,常被用于云产品生成算法中(Zhu 等,2015)。

在非监督类方法中,Zhu 等(2015)依据云在不同波段的光谱特性,利用阈值实现云、冰雪和其他地物类别的区分(Zhu 等,2015)。Zhang 和Xiao(2014)利用细节差异实现云的逐步提取(Zhang 和Xiao,2014)。An 和Shi(2015)通过场景学习技术,将真彩色图像转换为显著性图,并通过改进Otsu 阈值实现云的精确提取(An 和Shi,2015)。以上算法,要么使用超过4个波段的信息,如Landsat 的7 个波段信息(其中热红外信息实现云与冰雪的分离),要么仅使用RGB 信息(对于高浑浊水体、建筑物效果不佳)。一些多光谱传感器,如GF-1、HY-1C等,只含有4个波段,即蓝、绿、红、近红外波段。现有算法无法直接应用于4波段遥感图像的云检测。如何在没有热红外信息的情况下有效区分云与冰雪,以及如何有效利用近红外波段信息,是这类4波段图像云检测的重要问题。Li 等(2017)利用光谱、纹理和几何信息,实现了4波段高分数据的云检测。但是该方法涉及了大量阈值,无法直接应用于HY-1C CZI 遥感图像云检测。另外,上述方法大多按照逐步处理的过程实现云与非云区域的识别,处理流程复杂且容易误差累积。Kang 等(2019)提出了一种基于分类技术的云与非云区域识别方法,被证明优于现有的非监督类方法。该方法的优势在于精确的训练样本提取以及样本特征描述。但是,该方法仅适用于RGB 图像。针对4 通道HY-1C CZI 图像,如何高精度提取训练样本以及利用可见光—近红外信息精确描述其特征是提高云检测精度的关键。

基于此,本文提出了一种针对HY-1C CZI 遥感图像的非监督云检测方法,以用于云检测的业务化运行。该方法包含训练样本选择、特征提取、分类和后处理这4 个过程。该方法的独特之处在于既能自动提取区分云与其他地物的训练样本,又能有效利用近红外信息。通过对植被、土壤、湿地和冰雪场景这4 个典型场景的验证分析,以证明该方法的有效性。

2 数据获取

本文使用的遥感图像是HY-1C CZI 获取的多光谱数据,其4 个波段的波谱范围分别为蓝(0.42—0.50 μm)、绿(0.52—0.60 μm)、红(0.61—0.69 μm)、近红外(0.76—0.89 μm)。数据可在中国海洋卫星数据服务系统(https://osdds.nsoas.org.cn/#/[2022-05-13])下载。HY-1C 于2018年9月7日发射,运行于782 km 高度的太阳同步回归轨道,降交点地方时为每日上午10:30±30 min;其数据兼顾了海洋水色、陆地生态和极地冰川的要求,具有中等分辨率(约50 m)、大幅宽(>950 km)、高重访周期(单颗卫星覆盖周期为3 d)的特点,可为水体—陆地交互作用区域提供监测,对重点河流港口的悬浮泥沙、冰、赤潮和陆地生态环境等监测和预警具有重要作用(臧金霞 等,2022; 刘锦超 等,2022)。

CZI 数据分为L1A、 L1B、 L1C、 L2A、 L2B和L2C 等6 级。其中L1A 是经过几何校正后的原始数据,L1B 是经过辐射定标后的辐亮度数据(HDF5 格式),L1C 也是辐射定标后的辐亮度数据(TIF 格式),L2A 是经过大气校正后的基础产品数据,L2B 是标准产品数据,L2C 是试验产品数据。本文选用L1C(TIF 格式)数据用于遥感图像云检测研究。在L1C 级数据中,每个数据值代表了CZI 测量的该点的天顶辐亮度(mW/(cm2·um·sr))。为了方便后续植被指数的计算,本文将天顶辐亮度转化为天顶反射率,每个点的天顶反射率R可以计算为:

式中,I为天顶辐亮度,E为大气层外太阳辐照度,θs为太阳天顶角。需要注意的是,L1C 数据中不包含太阳辐照度和太阳天顶角信息,而L2B 数据中包含该信息,因此,本文使用与L1C 数据对应的L2B数据用于天顶反射率R的计算。

为更好地评估本文提出的HY-1C CZI 数据遥感图像云检测方法,选取4个典型陆地场景,即植被、土壤、湿地和冰雪场景进行验证。在这些场景下,云和背景的差异各不相同。图1所示即为本文使用的4个场景的RGB真彩色图像。

图1 植被、土壤、湿地和冰雪场景真彩色图Fig.1 Images of vegetation,soil,wetland,and snow scenes

3 研究方法

3.1 研究技术路线

本文的算法流程如图2 所示。该算法包含4 个主要步骤,即训练样本自动选择、特征提取、支持向量机分类以及后处理4 个过程。其中,训练样本提取与特征提取并行执行,通过提取的训练样本及其对应的特征训练SVM;利用训练的SVM 预测云检测初步结果,并后处理获得最终HY-1C CZI 陆地遥感图像云检测结果。下面将具体介绍这4个步骤。

图2 云检测数据处理算法流程Fig.2 Flowchart of the algorithm proposed in this paper for cloud detection

3.2 训练样本自动提取

训练样本可用于分类器训练,以实现未知像素点的预测(云与非云)(汪杰君 等,2021)。与人工标注不同的是,本文使用的训练样本可以通过多重判断自动获取。该方法旨在尽可能去除非云样本干扰,如冰雪、高亮地表建筑和浑浊水体等,以提高训练样本精度和后续云检测精度。图3 所示即为本文提出的训练样本自动提取流程图。用该流程,可将输入图像划分为云样本区域、非云样本区域和其他区域,其中云样本区域与非云样本区域分别作为正负样本用于后面的SVM 训练。整体来看,可以分为暗通道反射率判断,NDVI 判断和Whiteness 判断3 个步骤。

图3 训练样本提取流程图Fig.3 Flowchart for selecting training samples

(1)暗通道反射率判断。暗通道图像最早被用于图像去雾(He 等,2011),后面逐渐被用于真彩色图像的云检测研究中(Kang 等,2019;Ping 等,2020)。为将暗通道扩展适用于本文研究的HY-1C CZI 的4 个波段图像,近红外波段信息也被充分利用,用于暗通道图像的计算,其暗通道被重新定义为

式中,RB,RG,RR,RNIR分别表示蓝、绿、红和近红外波段的反射率。RDC表示该4 个波段图像的暗通道图像。也就是说,暗通道图像每个点的值为该点在4个波段反射率的最小值(He 等,2011)。

云在可见光和近红外的反射率较高,而自然地物在该光谱范围内,很少有反射率均高的情况(冰雪除外)。因此,在暗通道反射率图像中,云具有较高的反射率,而非云区域则具有较低的反射率。为了提取出这部分具有较高反射率的暗通道像素,本文采用改进Otsu 方法实现云与背景的区分(Otsu,1979;段潘 等,2022)。在传统的Otsu 方法中,假设图像中存在两种类别,通过计算阈值使得类间的方差最大。Otsu 阈值T的获得可通过优化如下方程获得:

通过传统Otsu 方法获取的阈值T,会存在阈值偏移问题,即当场景较亮时,计算获得的阈值T较大,导致相对较暗的云无法识别;反之,当场景较暗时,计算获得的阈值T较小,导致相对较亮的地面物体被识别为云。通过对500 幅云图像的统计分析(Zhang 和Xiao,2014)发现,超过95%的云的像素值不会低于100。基于此,考虑暗通道反射率的取值范围为0—1,本文首先将暗通道反射率线性拉伸为0—255,以实现式(3)计算。最终获得的阈值T'为

线性拉伸后的暗通道反射率与T'比较,若大于T',则为潜在的云区域,若小于T',则为潜在的非云区域。需要注意的是,若线性拉伸后的暗通道反射率很小,如小于T'·70%,则其为云的概率极低,可直接划为非云区域。若拉伸后的暗通道反射率在T'·70% 与T'之间,则将其划为潜在非云区域。需要注意的是,在本判断中,可以容忍一定高亮物体判别为云,因此将阈值的上限设定为150,后续的判定方法可进一步去除。

(2)NDVI 判断。有些水体由于浑浊度较高,或者镜面反射等原因,其在可见光的表现与薄云类似,无法直接区分(如图1 中的湿地场景)。但是,二者在近红外波段却有较大差异。水在近红外具有很低的反射率,而云在近红外却有较高的反射率。因此可采用归一化植被指数NDVI(Normalized Difference Vegetation Index)剔除这部分水体。NDVI定义为

即近红外与红光波段的反射率差值除以二者的和值。由于云在近红外、红光波段都具有较高的反射率,因此云的NDVI 值一般较小(Zhai 等,2018)。

借鉴Landsat 云检测研究,水体的NDVI 值一般小于0.1 而云的NDVI 值一般大于0.1(Zhu 和Woodcock,2012)。基于此,本文设定0.1为NDVI的阈值用于区分薄云和浑浊水体。即当某像素的NDVI<0.1 时,被划分为水体,当NDVI>0.1 时,被划分为潜在云区域。

(3)Whiteness 判断。Whiteness 是白度指数(Gomez-Chova 等,2007),用W表示。其主要是针对3 个波段真彩色图像,为了使其适用于HY-1C CZI 数据,本文对其进行了扩展:

式中,i= 1,2,3,4 分别表示CZI 的蓝、绿、红和近红外4 个波段序号。由于云在4 个波段的反射率差异较小,因此用各波段反射率与平均值的差值的绝对值来判断4 个波段反射率的差异。若某区域内各波段差值较小,则该区域内W值平滑,细节信息少;反之,若某区域内各波段差值较大,则该区域内W值变化大,细节信息多(Zhu 等,2015)。

研究发现,云区域内的反射率相对较为光滑,而非云区域内(如自然地物和冰雪)的反射率差异较大,因而在Whiteness 指数图像上,云区域内的细节信息较少,而非云区域内的细节信息较多。可采用Whiteness 指数作为云与非云样本的提取,去除冰雪对于样本提取的影响。基于此,本文使用多尺度边缘保持分解方法MED(Multiscale Edge-preserving Decompositions)(Farbman 等,2008)获取Whiteness 指数图像在不同尺度上的细节信息D,即:

进一步,本文采用Otsu 方法将上述细节信息D二值化,只有二值化后值为1 的区域,才被认定为细节信息,这部分像素点被划分为非云样本,而二值化后值为0 的区域,被认定为非细节区域,这部分像素点被划分为云样本区域(Kang 等,2019)。相较于暗通道细节信息提取,利用Whiteness 提取的细节信息具有更高的稳定性(详见结果部分)。

通过上述暗通道反射率判断、NDVI 判断和Whiteness 判断的逐步细化,提取高精度的云与非云样本。需要注意的是,通过该方法提取的云样本区域与非云样本区域分别作为正负样本用于后面的SVM 分类训练。训练之后,这些样本将不再参与云检测任务。但在分类之前,还需对每个样本进行特征表征。下面,本文将详细介绍如何提取每个像素点的特征。

3.3 特征提取与支持向量机分类

特征提取是对每个像素进行表征的数学手段。但是并非所有特征都可用于云识别(Yao 等,2020)。合理的特征提取算法能最大程度上反映云的特殊性,在该特征维度上,云与非云像素点的特征值差异最大(An 和Shi ,2015)。而支持向量机分类是比较成熟的机器学习方法,故将该分类的简单描述与特征提取合并。本文选取使云与非云区域的差异最大化的4 种特征:反射率特征、光谱指数特征、纹理特征和结构特征,以表征每个像素点的空—谱信息。

(1)反射率特征。反射率特征是最直接的云检测特征。云在蓝、绿、红、近红外通道都具有较高的反射率。一般情况下,若某个测量点的4个通道都有较高的反射率,那么该点具有较高的概率为云(Zhai 等,2018)。令每个像素点的反射率特征为FR,则FR表示为

需要注意的是,除了HY-1C CZI 的4 个波段反射率(蓝、绿、红和近红外波段)以外,本文还将暗通道反射率作为反射率特征之一。图1所示为4 种典型场景的RGB 图像。为了更好展示反射率特征,图4 所示为4 种典型场景的近红外和暗通道图像。

图4 4种典型场景的近红外和暗通道图像Fig.4 Near infrared and dark images of the four scenes

(2)光谱指数特征。光谱指数也是云检测的有效特征之一(Choi 等,2022)。在本文中,每个像素点的光谱指数FI表示为

NDVI 和W常用于多波段遥感图像的云检测,如Landsat 和GF 系列卫星(Zhu 和Woodcock,2012;Li 等,2017)。本文也使用这两个指数来描述像素点的光谱指数特征。图5 所示即为4 种典型场景的NDVI和W图。

图5 4种典型场景的NDVI和白度指数图像Fig.5 NDVI and whiteness of the four scenes

(3)纹理特征。纹理特征描述了像素点与像素点之间的空间关系,这种关系可以用于云检测(Kang 等,2019)。与反射率特征和光谱指数特征不同的是,反射率特征和光谱指数特征只考虑单个像素点的信息,而纹理特征包含了像素点与邻近像素点的相关信息。云覆盖的区域内的像素点之间差异较小,相对于其他地物,具有更平滑的特点。Gabor 特征是一种可以用来描述图像纹理信息的特征,Gabor 滤波器的频率和方向与人类的视觉系统类似,特别适合于纹理表示与判别(An 和Shi,2015;Deng 等,2019; 李军军 等,2020)。在空间域,一个二维的Gabor滤波器是一个正弦平面波和高斯核函数的乘积。前者是调谐函数,后者是窗口函数。Gabor滤波器的定义如下:

式中,

式(11)—(13)中,g表示Gabor 滤波器,λ为使用的正弦函数的波长,θ表示其方向,σ是高斯函数的方差。在本文中,λ取值为[0.5,1,2],θ取值为[0°,45°,90°,135°],σ取值为[1,2,3]。因此,对于每个二维输入图像,可以获得共36 个二维纹理特征矩阵。该特征矩阵描述了不同滤波情况下的图像纹理特征。图6 所示即为λ取值为1,θ取值为90°,σ取值为[1,3]时4 种典型场景的纹理特征图。

图6 4种典型场景的Gabor特征,其中λ = 1,θ = 90°,σ = 1和3Fig.6 Gabor features of the four scenes,for which.λ = 1,θ = 90°,σ = 1 and 3

(4)结构特征。与纹理特征相比,结构特征是一种更高级别的图像特征,它类似于人类视觉感知的初级知识,提供了图像内容的重要信息(Xu 等,2012)。由于云内部的结构信息比非云区域的结构信息要少,因此结构信息对于云检测具有重要作用。对于输入图像I,其结构特征S可以表示为

式中,ε是一个小常数,N为图像数,λ为平衡值。Φx,Φy(i),Ψx(i)和Ψy(i)表示为窗口R(i)内的绝对空间差异,定义为

式中,gi,j为权值函数,其可以计算为

通过优化式(14)即可获得图像的结构特征。在本文中,平衡值λ设定为[0.005,0.010,0.015,0.020]。图7 所示即为λ设定0.005 和0.015 时4 种典型场景的结构特征图。

图7 4种典型场景的结构特征,其中λ = 0.005和0.015Fig.7 Structural features of the four scenes,for which.λ = 0.005 and 0.015

(5)特征归一化。在上述反射率、光谱指数、纹理和结构特征获取之后,为了降低不同特征值取值范围对云检测结果的影响,将各维特征归一化(Lin 等,2015),即:

式中,F'和F是归一化后和归一化前的特征,Fmax和Fmin为该维特征的最大值和最小值。

利用上述反射率特征、光谱指数特征、纹理特征和结构特征,可获得CZI场景中每个像素点的空—谱特征信息,结合3.2 节中自动提取的云与非云训练样本,即可训练支持向量机SVM(Support Vector Machine)分类器。通过该分类器,实现CZI 场景中的初级云检测。本文使用的SVM 是台湾大学林智仁教授开发的libsvm 软件包,该软件包可在(https://www.csie.ntu.edu.tw/~cjlin/libsvm/[2022-05-13])免费下载。训练过程中,使用径向基核函数RBF(Radial Basis Function)和五重交叉验证法。

3.4 云检测后处理

经过上述SVM 识别的云主要是场景中云的核心区域,对于边缘、孔洞等问题无法有效解决(Kang 等,2019)。获取的识别结果常出现边缘不清晰、云区域中存在未被识别的噪声点以及非云区域中被识别的云噪声点等情况。基于此,本文通过导向滤波、孔洞填充以及几何判别进一步提高云检测精度。

(1)导向滤波。导向滤波是一种边缘保持,噪声去除的方法,被广泛运用于图像处理中(Zhang和Xiao,2014;Kang 等,2019)。导向滤波包含输入图像I、引导图像G、和经过滤波后得到输出图像Q。导向滤波的一个重要假设是输出图像Q和引导图像G在滤波窗口ωk上存在局部线性关系,即:

以保证在一个局部区域里,如引导图像G有一个边缘时,输出图像Q也保持边缘不变,因为对于相邻的像素点,存在∇Q=αk∇G。上式中的αk和βk为

式中,μk和δ2k分别是引导图像在窗口ωk内的均值和方差。|ω|是窗口ωk内的像素个数。是输入图像I在窗口ωk内的均值。最后,通过导向滤波后的输出图像可表示为

式中,和分别表示所有包含像素i的窗口的αk和βk的值的均值。在本文中,导向滤波的窗口大小设置为10,ε设置为10-4。

(2)孔洞填充。经过导向滤波后,可能会存在一个较大的云区域中,有较小的无云区域(即存在小的孔洞)。为了去除这部分孔洞的影响,本文将像素数小于50 的孔洞进行填充。若存在像素数大于50 的孔洞,则认为该部分为无云区域,不予填充。

(3)几何判断。自然界中的云形状一般较为规律,不会出现复杂的形状,或者是长条形的形状。如果检测出来的结果中存在长条形或者复杂的形状,则可能是冰雪、水陆岸线、道路等,应予以剔除。本文采用分型维度指数FRAC(Fractal dimension index)和长宽比LWR(Length to width ratio)判别。其中,某个区域的长宽尤其外接最小椭圆的长轴和短轴表示。则,

如果几何形状较为简单,则FRAC 的值接近1,如果几何形状非常复杂,则FRAC 的值接近2。如果几何形状狭长,则LWR 的值较大。参考Li 等(2017)对GF 数据的分析,本文将FRAC的阈值设定为1.5,LWR 的阈值设定为4.5(Li 等,2017)。

3.5 精度评价

本文采用在云检测中最常用的错误率ER(Error rate)指标对云检测结果精度评价。其定义为

式中,TN是场景图像的像素总数,CN是将云像素识别为非云像素的像素数,NC是将非云像素识别为云像素的像素数。

4 云检测结果

为了验证本文提出云检测算法的有效性,其检测结果与目前最为常用的非监督云检测算法对比(Kang 等,2019)。这些对比算法包括K 均值、ChanVese、PRS(Zhang 和Xiao,2014)和暗通道算法(Kang 等,2019)。其中,K 均值算法主要通过聚类将遥感图像分为云和非云两类;ChanVese通过图像分割实现云与非云的分类;PRS 算法则通过逐步细化的方案(包括二值化、细节提取和导向滤波)实现云检测;暗通道法则利用暗通道信息提取云的细节信息实现云检测。

4.1 定性评价

图8所示为各算法的云检测结果图,其中白色部分表示算法检测到的云区域,黑色部分表示非云区域。最左侧为HY-1C 遥感图像的真彩色图,最右侧为人工标注的云区域。从图8 可以看出,K 均值方法将遥感图像聚类为云与非云两类,该方法只利用了遥感图像的反射率信息,像素点反射率较高的点都会被划分为云这一类:对于植被和土壤场景,会存在零散的误检测的云区域,而对于湿地和冰雪场景,由于水体的浑浊度较高以及冰雪的反射率较高,都会被划分为云区域,精度较低;ChanVese 方法相较于K 均值方法,零散点较小,但是也会存在K 均值方法类似的错误分类高亮的水体和冰雪的情况;PRS 算法则在逐步细化的过程中,会删除较多云区域,该算法较少地将非云区域识别为云区域,但是会将一部分云区域识别为非云区域,造成了较低的精度;暗通道算法在植被、土壤和冰雪场景具有较好的识别结果,但是对于湿地场景却无法给出云检测结果,这主要是由于湿地场景的云在暗通道上存在较多细节,这部分细节导致无法有效提取云样本,进而无法实现云识别;本文提出的算法,由于综合考虑了光谱、指数、纹理和结构特征,采用的训练样本提取方法能较精确提取训练样本,因而给出了最好的云检测结果。对比人工标注的云分布真实图,本文算法的云检测结果具有较好一致性。

图8 云检测结果对比Fig.8 Comparison of cloud detection results obtained from different algorithms

4.2 定量评价

云检测算法在植被、土壤、湿地和冰雪的错误率如表1 所示。可以看出,K 均值和ChanVese算法在这些场景的错误率相对较高;PRS 算法在植被和土壤场景的错误率会更高,但是在湿地和冰雪的错误率会降低;暗通道算法在植被、土壤和冰雪场景的错误率比较低,但是在湿地场景却没有检测出云;本文提出的算法,在各个场景都具有最低的错误率。特别是对于湿地场景,浑浊水体所占像素数比例相对较高,错误率降低明显。证明了本文算法对于HY-1C 遥感数据云检测的有效性。

表1 HY-1C卫星CZI图像数据云检测算法精度Table 1 Accuracy of cloud detection for CZI images of HY-1C satellite

4.3 白度指数影响评价

本文使用白度指数作为遥感图像细节信息提取数据源,并通过逐步细化过程精确提取云/非云样本。为了定量评价白度指数对于云检测的效果,本文对比不使用白度指数和使用白度指数(即本文算法)两种情况下的云检测错误率。云检测结果如表2所示。可以看出,白度指数的引入降低了云检测的错误率,证明了白度指数对于云检测的有效性。

表2 不使用/使用白度指数下的云检测错误率Table 2 Error rate of cloud detection with/without sample selection using whiteness

4.4 后处理精度评价

本文在获取初步云检测结果后,对其进行了导向滤波、孔洞填充以及几何判别的后处理。为评价后处理对于云检测精度提升效果,本文分别计算不进行后处理、仅进行导向滤波、仅进行孔洞填充、仅进行几何判别和进行这3 种后处理方式的错误率,结果如表3 所示。

表3 不同后处理方法下HY-1C卫星CZI图像数据的云检测精度Table 3 Error rate of cloud detection with different postprocessing methods

从表3 可以看出,相较于表1 中的各方法的错误率,在不进行后处理的情况下,本文提出的算法相较于K 均值、ChanVese、PRS 和暗通道算法,仍具有较高精度。当引入导向滤波、孔洞填充和几何判别因素后,云检测精度进一步提升。特别是导向滤波的引入,可较大程度提升检测精度。孔洞填充和几何判别对精度提升的作用因场景而异。对于薄云和厚云交替复杂共存的场景(如土壤场景),孔洞填充能提升薄云的检测精度。对于地表有复杂形状或长条形干扰物的场景(如冰雪场景),几何判定能提升云的检测精度。这证明了引入后处理对于HY-1C 遥感数据云检测的有效性,对于云检测业务化运行具有积极作用。

5 结 论

本文围绕HY-1C CZI 遥感数据,设计了一套非监督云检测算法。该方法包含训练样本选择、特征提取、SVM分类和后处理4个过程。利用暗通道反射率、归一化植被指数和白度指数自动生成训练样本,通过提取遥感图像的反射率、光谱指数、纹理和结构特征,基于上述训练样本和特征,利用SVM 实现云/非云区域的分类,并采用导向滤波、孔洞填充和几何判断进一步后处理结果,实现HY-1C 遥感数据的云检测。该方法最大的优势在于:(1)无需人工标注即可自动提取高精度云与非云样本,提高了算法的应用能力;(2)充分利用近红外波段信息降低浑浊水体、冰雪等干扰物对云检测影响,提高了算法的检测精度。为验证本文算法的有效性,在4 种典型场景(植被、土壤、湿地和冰雪场景)进行测试和分析。结果表明:从定性结果来看,相较于K 均值、ChanVese、PRS 和暗通道算法,本文云检测结果与人工标注的云分布真实图具有较好的一致性;从定量结果来看,本文提出的算法在植被、土壤、湿地、冰雪的错误率分别为0.027、0.064、0.026 和0.049,相比暗通道算法在各个场景错误率分别可以降低0.024、0.061、0.13 和0.003。综合以上分析,无论定性与定量结果,本文算法都表现出最好的性能。下一步研究将重点关注该算法在更多场景下的适用性测试,以及提取更能体现云与其他目标差异性的判别性深度特征,以进一步提升该算法对于HY-1C 云检测的能力。

猜你喜欢
训练样本像素点反射率
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
基于局部相似性的特征匹配筛选算法
人工智能
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
宽带光谱成像系统最优训练样本选择方法研究