统一样本云检测技术在GF-6 WFV上的改进与应用

2022-05-12 07:41隋淞蔓夹尚丰胡学谦
遥感学报 2022年4期
关键词:反射率晴空光谱

隋淞蔓,夹尚丰,胡学谦

山东科技大学测绘与空间信息学院,青岛 266590

1 引 言

高分六号卫星是国家高分辨率重大专项卫星,其上搭载了2 m 全色/8 m 多光谱高分辨率相机(PMS)和16 m 多光谱中分辨率宽幅相机(WFV)(黄建文等,2021)。高分六号卫星相比之前高分系列卫星增加了紫谱段(0.40—0.45 μm)、黄谱段(0.59—0.63 μm)、红边谱段1(0.69—0.73 μm)和红边谱段2(0.73—0.77 μm)4 个特殊波段(张磊等,2019),具有高分辨率和宽覆盖相结合的特点(郑利娟,2017)。

云遮挡是光学遥感影像中的常见现象,云层的存在使得工作者获得的地物信息减少,降低影像的质量(李彬等,2017),已经成为制约光学遥感对地观测能力的主要影响因素(Carslaw,2002;Goodwin 等,2013;Hagolle 等, 2010;Kazantzidis等,2011,2012;Li 等,2011)。因此,准确快速地实现GF-6 WFV 卫星数据云检测对其图像的高效应用具有重要的意义。

卫星传感器的数量逐渐增多,卫星影像的数量也随之增加,大量的数据需要自动化的方法来对图像进行预处理。神经网络(刘成林和吴炳方,2004;Dan 和Morrow,1998;Karlsso,1989;Clark,1999;Walder 和Maclaren,2000)具有从示例中学习并概括新数据的能力,由于其固有的高并行性,非常适合执行实时决策和处理任务。学习算法、网络架构、输入和训练集的选择对于神经网络模型的准确性和可靠性起主导作用。以往的深度学习云检测算法(Ball 等,2017;陈洋等,2018;邱梦等,2018;裴亮等,2019;么嘉棋等,2019)通常受样本选择精度、样本数量和样本的代表性等多个因素的限制,其推广应用面临较大困难。为了提高神经网络方法在云检测中的利用效率,Sun 等(2020)提出了统一样本支持的深度学习云检测算法,基于光谱像元库模拟出不同传感器的表观反射率数据,对模拟的数据进行深度学习,实现了Landsat 8 OLI、NPP VIIRS 和Terra MODIS 等传感器较高精度的云检测。由于Landsat 8 OLI等传感器波谱范围宽,易获取详细的地物信息(Woodcock 和Strahler,1987;Chander 等,2009;Lee等,2004),从而实现较高精度的云识别。然而,GF-6 WFV的波长范围集中在0.4—0.89 μm,在有限的波长范围内,现有的高光谱数据库模拟的多光谱云和晴空像元(陈震霆等,2018),难以体现云和晴空像元的光谱差异(吕明明等,2016),出现亮地表(陈曦东等,2019;Braaten等,2015)误判现象。本文根据GF-6 WFV卫星数据特点,在原有模拟数据的基础上增加了GF-6 WFV 数据的典型亮地表像元,弥补地物特征提取的不足。实验结果表明,该方法能有效提高原算法在GF-6 WFV数据上的云检测精度。

2 统一样本云检测算法介绍

统一样本数据支持的深度学习云检测算法基于AVIRIS 像元库模拟出待测传感器云和晴空像元的表观反射率,用于不同传感器的云检测。其主要的工作内容包括以下4部分。

(1)建立统一样本像元库。通过目视解译的方法在AVIRIS 高光谱数据上采集云和晴空像元样本。为了使选取的样本具有代表性,在多幅不同地区、不同时段的AVIRIS 图像上进行样本采集。选取足够数量不同类型的云像元样本:厚云、碎云、薄云、云边缘。同时还考虑了不同地表类型对云像元反射率的影响,选取了5 类晴空像元样本:植被、水体、城镇、云阴影以及其他。为了使所选样本尽可能的全面,像元库建立时,不仅云和下垫面的类型要考虑全面,像元数量也要足够多。经统计,最终共选取了398 块区域的305485 个云像元和370 块区域的461829 个晴空像元样本(Sun等,2020)。

(2)多光谱数据模拟。多光谱数据模拟是基于高光谱AVIRIS 数据来模拟的。AVIRIS 数据共有224 个波段,波长范围为0.2—2.4 um(范潇,2011),光谱间隔为10 nm,具有作为数据模拟数据源的高光谱特性。数据模拟的本质是对高光谱数据波段加权合成进而模拟出相对应波段的多光谱数据的表观反射率。数据模拟多光谱数据的原理见式(1)(Sun等,2020):

式中,待模拟的多光谱数据波谱范围内高光谱传感器的通道数为NHSI,待模拟的多光谱传感器的通道数目为NMSI,多光谱数据对应波段的表观反射率为LMSIi,AVIRIS数据对应波段的表观反射率为LHSIi,ρ(λi,j)是AVIRIS 一个波段的中心波长处对应的多光谱传感器的波谱响应值,AVIRIS 数据单波段宽度为Δj。

(3)BP 深度学习云检测模型。该算法在keras的基础上,以theano为计算背景,构造了一个用于云检测的三层BP 神经网络。高军等(2018)表明,一个三层的神经网络可以逼近从n维到m维的任意连续函数。将模拟的多光谱数据像元各波段的表观反射率作为输入向量,利用神经网络的归纳能力学习云检测规则。随机选取了输入样本数据中的20%作为验证数据,进行交叉验证,从而选取最佳的神经元数量。在训练神经网络过程中,momentum 设置为0.9,dropout 值设置为0.5,batch值设置为128,当迭代次数大于1000 或训练误差低于0.01时,则停止训练(Sun等,2020)。

本文在Sun 等(2020)基于AVIRIS 高光谱数据选取的样本的基础上,结合GF-6 WFV 数据波谱范围较窄的特点,在GF-6 WFV 数据上选取了裸地、建筑、雪等,共392469 个高亮地表样本。图1是提取的部分高亮地表样本,图1(a)是GF-6 WFV 标准假彩色(通道组合为RGB432)影像,图1(b)是从图1(a)样本影像中选取的典型样本像元的表观反射率曲线。

图1 典型亮地表样本及表观反射率曲线图Fig.1 Typical bright surface samples and apparent reflectance curves

(4)精度验证。为了定量验证算法的精度,通过遥感目视解译的方法对云检测结果进行精度验证。以人工标注的云区作为参考真值,将算法的云检测结果与参考真值进行逐像素的比较。通过构建误差矩阵的方式,计算并验证所提算法云检结果的精度。同时引入总体精度(HOA)、云像元正确率(CRA)、云像元漏判率(CRM)、晴空像元漏判率(SRM)和晴空像元正确率(SRA)5 个指标来评价该算法的准确性和不确定性。其中,TP 是验证影像中为云,算法也识别为云的像元;FP 是验证影像中是晴空,算法识别为云的像元;FN 是验证影像中为云,算法识别为晴空的像元;TN 是验证影像中是晴空,算法也识别为晴空的像元。

上述5个精度计算指标的公式如下:

3 统一样本云检测算法改进及在GF-6 WFV数据上的应用

基于统一样本的深度学习云检测算法能快速地获取高质量样本,用于不同卫星数据的云检测。由于GF-6 WFV数据光谱范围较窄,缺少1.38 μm、1.65 μm 以及热红外波段等云敏感波段,在高反射率地区的云识别精度较低。基于统一样本像元库模拟出的云及晴空像元数据对云与亮地表识别能力较弱,无法实现该类型卫星稳定、高精度的云识别。针对这一问题,本文选取了GF-6 WFV 数据典型亮地表结合模拟出的多光谱数据生成云检测模型,进行云检测实验。

3.1 选取典型亮地表样本

基于统一样本像元库模拟的多光谱像元库是深度学习重要的输入数据,本文在原有模拟像元库的基础上,增加了GF-6 WFV 数据上的高亮地表样本。GF-6 WFV 数据的波段覆盖范围小,不同地物在不同波段的辐射能量有差别,受波段范围限制,无法获取地物充足的波段特征信息,会造成较明显的漏分和误分现象。为了提高亮地表类型区域云检测精度,通过目视解译的方法,将从GF-6 WFV 影像中提取了裸地、建筑、雪等高反射率样本像元加入到像元库中,共选取了392469 个高亮地表样本。表1是提取的部分高亮地表样本,示例一列是GF-6 WFV 标准假彩色影像,总像元数一列是该类型样本选取的总数量。

表1 选取的典型亮地表样本Table 1 Selected typical bright surface samples

3.2 多光谱数据云和晴空像元库的模拟

多光谱数据的红、绿、蓝、近红外波段覆盖了AVIRIS 数据多个连续窄波段,因此可以用AVIRIS 数据来模拟GF-6 WFV 多光谱数据。图2为GF-6 WFV 数据与AVIRIS 数据在部分波段上的光谱响应函数对比。图2中的(a)、(b)、(c)、(d)分别是GF-6 WFV Band1 (450—520 nm)、Band2 (520—590 nm)、Band3 (630—690 nm)、Band4(770—890 nm)与AVIRIS 数据波谱响应函数对比图。图3为基于AVIRIS 数据模拟出的GF-6 WFV 部分云和晴空样本,子图分别为厚云、薄云、碎云及植被、水体和人工地表的标准假彩色图像。

图2 AVIRIS与GF-6 WFV数据各波段波谱响应函数对比Fig.2 Comparison of AVIRIS and GF-6 WFV data spectral response curves

图3 模拟出的GF-6 WFV云和晴空样本Fig.3 Simulated GF-6 WFV cloud and clear sky samples

本文的数据模拟是在AVIRIS 数据云和晴空像元库的基础上,辅以AVIRIS 数据的波段宽度以及待模拟光学传感器的波谱响应函数数据,利用式(1)进行数据模拟运算,进而模拟出GF-6 WFV 数据的云像元和晴空像元每个波段的表观反射率数据。最后,将增加了GF-6 WFV 亮地表的样本库输入到BP 神经网络中,用训练出的云检测模型对GF-6 WFV 数据进行云检测。结果表明,加入亮地表后的算法能实现GF-6 WFV 数据较高精度的云检测。

4 结果与讨论

本文选取2018-07—2018-12 不同地区不同时相含有不同地表类型的GF-6 WFV影像,其中夏季10幅,秋季6幅,冬季8幅,共24幅GF-6 WFV 遥感影像进行云检测实验,以验证改进后统一样本像元库支持的云检测算法的适用性。用于实验数据的下垫面包括水体、城镇、裸地、植被、雪等典型地表,云识别的类型有厚云、薄云和碎云等。不同季节地表反射率存在差异,说明本文算法在不同时相影像上也有较好的适用性。图4所示为不同类型云的检测结果。每一组图从左至右依次为GF-6 WFV 数据标准假彩色合成影像,原统一样本数据支持的云检测算法和加入亮地表样本算法的云检测结果。其中,图4(a)、(b)分别为植被和裸地上空的厚云检测结果,图4(c)、(d)分别为植被和裸地上空的薄云检测结果,图4(e)、(f)分别为裸地和植被上空的碎云检测结果。从图4中可以看出,改进后统一样本数据支持的云检测算法在GF-6 WFV 数据上的应用,对比原算法在GF-6 WFV 数据上的应用效果明显。云边缘清晰,在植被和裸地上空的厚云、薄云和碎云都有较好的识别效果,有效减少了高亮地表的误判提高了云检测精度。

图4 不同类型云的识别结果Fig.4 Recognition results for different types of clouds

通过目视解译,从高分辨率AVIRIS 遥感影像中人工选取了32 景不同时相、不同地表类型上空的厚云、薄云、碎云及云边缘区域不同类型的云像元和晴空像元。尤其是薄云的选择,要考虑不同的下垫面对云的反射率的影响,对植被、水体、城镇、裸地上空的云都有选取。针对GF-6 WFV数据特点,再手动从GF-6 WFV 影像中选取难识别的薄云和亮地表样本。加入到样本库中,将样本的表观反射率值作为特征向量,输入到BP 网络中,云样本标签值设为1,非云样本标签值设为0,利用BP 神经网络的自学能力、自我纠错能力及泛化能力,使其自行调整各层网络之间的权重,去除输入数据中错误部分,发掘云和非云像元各波段表观反射率数据的隐藏关系,生成更加合理的云检测结果。最后,将GF-6 WFV 影像输入到神经网络中进行逐像素分类。

对于厚云和碎云地区,传感器接收到的能量主要来自于云层对太阳波谱的反射,散射和吸收较少,因此,不同的下垫面对厚云和碎云反射率的影响较小。本文算法通过BP 神经网络对厚云、碎云和薄云以及不同地表类型样本的深度学习,对影像进行逐像素分类,厚云和碎云的识别效果较好。传感器接收的薄云区域的能量主要来自云层和地表两部分的贡献,不同类型下垫面对薄云反射率影响较大,尤其是高亮地表区域。图5(a)为图4(c)中薄云和地物表观反射率曲线,薄云的表观反射率高于裸地和植被;图5(b)为图4(d)中薄云和地物表观反射率曲线,薄云的表观反射率总体高于裸地、山地和植被。因此,对于裸地、山地、植被和较低反射率人工建筑区域上空的薄云,本文的算法可以识别出来。如图6所示,这种极薄的云,可以清楚地看到下垫面,它所反映的信息大部分来自于下垫面的表观反射率,模型会将其识别为非云,出现漏识别现象。

图5 薄云与地物表观反射率曲线对比Fig.5 Apparent reflectance curves of thin clouds and ground objects

图6 薄云识别结果Fig.6 Thin cloud identification results

图7所示是在建筑、裸地和植被为背景地物上空的云检测结果。左侧是GF-6 WFV 数据标准假彩色影像,中间是统一样本数据支持的云检测算法在GF-6 WFV 数据上的云检测结果,右侧是加入GF-6 WFV 影像中亮地表像元后的云检测结果。可以看出,在以亮地表为背景上空的云,仅依靠模拟得到的云和晴空像云数据,很难将云与亮地表区分,使云边界模糊。加入了亮地表像元样本后生成的云检测模型,能较好的识别云与高亮地表,减少误判,从而提高了云检测的准确性。

图7 高反射率地表上空的云检测结果Fig.7 Cloud detection results over high reflectivity surface

图8是该算法在不同影像上的云检测结果。左侧是GF-6 WFV 标准假彩色图像,中间是统一样本数据支持的云检测算法在GF-6 WFV 数据上的云检测结果,右侧是加入GF-6 WFV 影像中亮地表像元后的云检测结果。从图8中可以看出,加入了亮地表像元的算法,在植被、建筑、水体和裸地等不同地表上空云的整体识别效果较好,且云边界清晰。尤其是在亮地表上空的云,检测结果有明显的改善。

图8 不同影像中的云检测结果Fig.8 Cloud detection results in different images

图9是该算法在有雪的影像中的检测结果。图9(a)是GF-6 WFV 标准假彩色图像,图9(b)是统一样本数据支持的云检测算法在GF-6 WFV数据上的检测结果,图9(c)是加入GF-6 WFV影像中亮地表像元后的检测结果。可以看出加入亮地表样本的算法明显减少亮地表区域的误判,但由于雪跟云的反射率接近,未结合形状和纹理等特征,难以将二者区分开。

图9 有雪影像中的云检测结果Fig.9 Cloud detection results in snow images

由于GF-6 WFV 数据图幅过大,从选择的影像中抽取了有代表性的800×800的子区域影像进行云像元人工标注。表2为图4中不同类型云的云检测结果精度评价:

从表2可以看出,加入了亮地表像元生成的云检测模型,对GF-6 WFV 数据进行云检测,云检测结果整体精度较高。对厚云和碎云整体识别效果较好,对于高反射率地表上空的薄云存在误判的情况。云像元平均正确率达到0.884,云像元的漏判率在0.188 以下,云像元平均漏判率为0.119,平均总体精度为0.962。

表2 云检测结果精度评价Table 2 Accuracy evaluation of cloud detection results

除了上述像素精度验证之外,还分别计算原算法与本文算法在植被、水体和亮地表上空的云像元正确率(CRA)、云像元漏判率(CRM)、晴空像元漏判率(SRM)和晴空像元正确率(SRA)4 个指标。表3显示了不同土地类型下两种算法的评估指标。定量分析表明,本文云检测方法比原统一样本算法在不同地表类型上空的云检测结果更准确。对于高亮地表区域,原统一样本算法在不同地表类型上空的云像元平均正确率为0.718,误判现象比较明显,云像元漏判率为0.282;而加入高亮地表样本的云检测算法能较准确地识别出高亮区域上空的云,高亮地区云像元正确率为0.874。与高亮地区的评价结果类似,在植被和水体上空,本文算法的云像元总体精度都比原统一样本云检测算法要高。综上,本文改进的统一样本云检测算法在检测不同下垫面的云时表现出令人满意的结果。该方法具有较低的误判率和较高的准确性。

表3 不同地表类型上空云检测结果精度评价Table 3 Accuracy evaluation of cloud detection results for different surface types

5 结 论

传统的云检测方法大多是基于光谱成分的分析,只能用于特定的传感器。基于统一样本数据的深度学习云检测算法充分利用了传感器的光谱特性和像素间的空间关系。基于BP 神经网络,利用云与晴空像素的光谱反射差异,实现了基于统一样本像元库数据的多传感器云检测。为了提高统一样本支持的云检测算法的适用性,本文将该算法应用到高分辨率窄波段的GF-6 WFV 数据上,由于其波谱范围较窄,模拟出的云和晴空像元库对光谱差异信息的挖掘能力有限,因此加入了GF-6 WFV 数据的典型亮地表样本像元,利用BP神经网络较强的自主学习能力对云和非云进行逐像素的分类,弥补了GF-6 WFV 云敏感波段的缺失。

结果表明,加入了亮地表的算法在GF-6 WFV数据的云识别中能取得较好的识别效果。与原统一样本数据支持的云检测算法相比,能明显改善在植被、裸地和城镇等高亮地表上空的误判现象,在植被、水体、裸地及建筑等多种地表类型上空,厚云、碎云和薄云的识别效果整体较好,尤其是提高了GF-6 WFV 数据在高亮地表上空的云检测精度。但由于GF-6 WFV 数据缺少1.38 um 附近的卷云识别通道,对高亮地表上空薄卷云识别,会出现遗漏识别的现象。此外,由于没有结合云的纹理特征和形状特征,致使云和雪的识别受到一定的限制,影响云检测精度。

猜你喜欢
反射率晴空光谱
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
车灯反射腔真空镀铝反射率研究
郭守敬望远镜获取光谱数破千万
WATING FOR THE SUNSET
夏雨
浅析光谱技术在200 nm以上和以下尺度范围内的不同
显微光度计在偏光显微镜鉴定不透明金属矿物的应用
高光谱遥感数据下城市植被碳汇的研究
分步催化制备纳米SiO2减反射膜的性质与结构研究
Morning