基于最优特征集的HY-1C 卫星海岸带成像仪影像海冰分类方法研究

2022-06-18 01:23臧金霞刘建强殷晓斌曾韬周磊
海洋学报 2022年5期
关键词:海冰波段纹理

臧金霞,刘建强,殷晓斌,曾韬,周磊

(1.航天宏图信息技术股份有限公司,北京 100195;2.国家卫星海洋应用中心,北京 100081)

1 引言

海冰一般是指由海水直接冻结而成的咸水冰,是极地海域和某些高纬度地区最突出的海洋灾害[1]。我国渤海北部海域纬度较高,每年的11 月末至翌年3 月初出现海冰,主要为一年冰。海冰的冻结和漂移对海上生产、航运及油气勘探等都有不同程度的影响。近几十年来的几次严重冰情甚至造成了海冰灾害[2],尤其在辽东湾海域,由于纬度高且受到冬季西北风的影响,最易结冰。海冰监测成为海情监测的重点业务。海冰分类是海冰监测的前提,海冰密集度、海冰面积、海冰最大边缘线等信息都是由海冰分类识别衍生而来[3]。

目前,卫星遥感技术是海冰监测的主要技术手段,相比目测法、器测法等传统监测方法,利用卫星遥感影像可实现实时、快速、大面积地海冰监测[4]。合成孔径雷达(Synthetic Aperture Radar,SAR)卫星数据是常见的海冰监测遥感数据,国内外学者基于SAR 卫星数据开展了大量的海冰分类方法研究[4-9]。光学影像虽然易受云雾影响,但其价格低廉,大部分能够免费获取,时间分辨率高,也成为海冰监测主要技术手段。目前,国内外光学卫星海冰监测研究多集中在低空间分辨率卫星遥感数据,如MODIS 数据、AVHRR 数据等[10-12]。这些数据覆盖范围广,重访周期短,可实现大范围实时海冰监测,但其空间分辨率较低,因此海冰分类精度不高。中高分辨率光学卫星数据具有较高的空间分辨率,在海冰类型判读等方面具有独特优势,可进行精细化海冰分类。王姝力等[13]基于Landsat-8 和Sentinel-1A 数据对渤海湾进行海冰分类,对比分析了两种数据分别利用不同分类算法分类得到的海冰分类精度。张晰等[14]对Landsat-8 和GF-1 卫星的海冰探测能力进行对比分析,发现在冰水区分能力方面GF-1 数据优于Landsat-8 数据,在海冰类型识别方面,Landsat-8 数据优于GF-1 数据。Barbieux等[15]对Landsat-8数据的红、近红外和短波红外波段进行波段组合,构建了冰湖指数(Icy Lakes Index),有效实现了冰水分离。王志勇等[16]利用Sentinel-2、Landsat-8、Landsat-7 中高分辨率影像对辽东湾海冰进行监测,利用归一化水指数(NDWI)实现冰水分离,并进行海冰厚度反演和海冰分类研究。以上研究工作虽利用中高分辨率光学数据开展海冰监测研究,但仅利用其光谱信息,对中高分辨率光学数据的纹理信息未有效利用。

为发挥中高分辨率光学遥感影像纹理信息在海冰分类中的作用,本文以辽东湾海域为研究区,基于海洋一号C(HY-1C)卫星海岸带成像仪(Coastal Zone Imager,CZI)数据开展海冰分类研究。首先提取其光谱信息和纹理信息,然后进行特征提取与筛选,构建最优特征集,最后将最优特征集输入到支持向量机(Support Vector Machine,SVM)分类器中进行海冰分类,比较分析多特征海冰分类与单一特征海冰分类结果精度的差异。利用海冰分类结果进一步估算海冰总面积与各海冰类型面积。

2 数据和方法

2.1 研究区域和数据

2.1.1 研究区

选择辽东湾海域作为研究区,研究区域如图1 所示。渤海是北半球纬度最低的大面积结冰海域,由于辽河、黄河等沿海大陆河流的淡水注入,使渤海含盐量较低;另一方面随河流带来的泥沙不断沉积,改变海底和海岸的地貌,造成渤海变浅,使渤海水温极易受陆地气温影响[17]。这些情况都有利于冬季渤海海冰的生成。渤海是典型的一年冰海区,每年11 月末到翌年3 月初总会出现不同程度的结冰现象[18]。辽东湾位于渤海北部,纬度最高,是渤海海冰灾害最严重的区域。

图1 辽东湾地理位置Fig.1 Geographical location of Liaodong Bay

2.1.2 数据

本文所用数据为海洋一号C 卫星海岸带成像仪数据,数据下载地址为https://osdds.nsoas.org.cn/#/。其空间分辨率为50 m,幅宽为1 000 km,设置有蓝、绿、红、近红外4 个波段,具体信息见表1。选取2020 年12 月19 日、2021 年1 月10 日和2021 年1 月16 日共3 期数据,如图2 所示。这3 个时期的海冰面积随着气温下降不断增加,由初冰期向盛冰期过渡,海冰类型有所变化。

图2 辽东湾海域HY-1C 卫星海岸带成像仪遥感影像(均为3/2/1 波段真彩色合成)Fig.2 HY-1C satellite coastal zone imager remote sensing images of Liaodong Bay (true color synthesis from band 3/2/1)

表1 HY-1C 卫星海岸带成像仪数据信息表Table 1 Data information of HY-1C satellite coastal zone imager

2.2 研究方法

本文的总体技术流程如图3 所示。首先进行海冰类型划分与数据预处理,对预处理后的CZI 影像提取光谱特征和纹理特征;然后进行特征选择,得到最优特征集;最后基于最优特征集进行SVM 海冰分类,对分类结果进行对比验证分析。

图3 海冰分类技术流程Fig.3 The flow of sea ice classification

2.2.1 海冰类型划分

国际气象组织(World Meteorological Organization,WMO)对海冰类型的划分标准是根据两极和高纬度区域的海冰情况定义的,包括多种方式,如海冰生长过程、海冰形态、海冰表面特征、海冰运动状态等[17]。结合海冰划分标准,根据遥感影像上的海冰表征和海冰生长过程,经专家解译,本文将实验海域冰水覆盖类型分为5 类:固定冰、白冰、灰(白)冰、初生冰、海水。各海冰类型的特征见表2 。图4 展示了HY-1C CZI 遥感影像中4 种海冰类型的表征。由于海冰形成初期不会形成白冰类型,在进行分类时,将初冰期影像中白冰类型去除,分为固定冰、灰(白)冰、初生冰、海水4 类。

表2 海冰类型特征描述Table 2 The description of sea ice type characteristics

图4 海冰类型示意图(以海岸带成像仪影像3/2/1 波段组合展示)Fig.4 The image of sea ice type (displayed in band 3/2/1 combination of coastal zone imager images)

2.2.2 数据预处理

本文利用PIE-Basic 软件进行预处理,主要包括图像裁剪、图像配准、海陆掩膜等。为减少数据运算量,对影像进行裁剪,裁剪出辽东湾海域影像;对多时相影像进行图像配准,以2021 年1 月16 日CZI 影像为基准,对2020 年12 月19 日和2021 年1 月10 日的两景影像进行配准,各选取约500 个配准点,XY 误差小于1 m;利用海陆掩膜矢量文件对影像进行海陆掩膜处理,去除陆地对海冰提取的影响。

2.2.3 特征提取与选择

图像分类的关键是图像特征提取,常用的特征包括光谱特征、纹理特征、形状特征等。研究表明多特征组合后的分类精度高于单一特征,但特征过多可能会造成信息冗余,降低分类精度[19]。因此需要进行特征选择,去除冗余信息。本文提取了HY-1C 卫星CZI 影像的光谱特征和纹理特征,对多特征进行特征选择,得到最优特征集。

光学影像光谱特征丰富,在冰水识别方面,由于海冰反射率比水体反射率高,本文利用水体指数区分海水与海冰。2012 年,Haq 等[20]提出了NDWIH指数,通过实验得出该指数比NDWI 更适用于冰水识别,因此选择NDWIH作为光谱特征之一。张晰等[14]分别对GF1 和Landsat8 影像波段计算得到多种光谱特征,其中GF1 影像的B_G、B_R、G_R等光谱特征对海冰分类的效果较好。考虑到HY-1C CZI 波段设置与GF1卫星波段设置相似,本文提取了CZI 影像的B_G、B_R、G_R 3 个光谱特征以及张晰等[14]提取的其他光谱特征。通过对比分析发现B_G、B_R、G_R 3 个光谱特征海冰分类效果较好。本文选用的4 个光谱特征的计算公式见表3。

表3 光谱特征参数定义公式表Table 3 Definition formula of spectral features

纹理特征分析是目标识别、图像分割和图像分类中的重要方法[21]。在遥感影像中,海冰类型是粗糙、不规则的,海水相对光滑均匀,因此纹理特征特别适用于海冰类型识别。本文利用灰度共生矩阵方法(GLCM)进行纹理特征提取。GLCM 是一种通过研究灰度的空间相关特性来描述纹理的常用方法,它描述了成对像素的灰度组合分布[22]。利用GLCM 方法对HY-1C 影像的蓝、绿、红、近红外4 个波段分别进行纹理特征提取。经过多次实验,纹理特征计算参数设置为:滑动窗口为3×3,步长为1,方向为45°,灰度级为64。每个波段提取的纹理特征包括:均值、方差、熵、对比度、二阶矩、同质性、相关性、相异性,共得到32 个纹理特征。过多的特征会引起冗余,影响计算效率,降低分类精度[23],因此需要进行特征选择以降低特征维数,提高计算效率,改善分类效果。本文利用基于距离可分性的特征选择判据[24],特征选择的原则是,使各类地物类间离散度较大而类内离散度较小。

定义类间离散度Sb、类内离散度Sw和判别数J,一般J值越大,携带信息量越丰富。其中:

式中,σ为样本方差;ui为第i类的均值;u为总体均值。

为进一步验证特征选择结果,利用LDA(Linear Discriminant Analysis)算法判断4 个波段纹理特征的分类准确度[25]。LDA 算法是在计算出类内离散度Sw和类间离散度Sb的基础上,进一步计算出最佳投影方向 ω,将多维特征投影到一个方向上,可直观看出分类的效果。

当投影为最佳投影时,满足:

定义拉格朗日函数L(ω,λ),λ为拉格朗日乘子,

对 ω求导并令偏导数为0 可得到,最佳投影方向由对应特征值的特征向量 (φ1,φ2,···,φn)组成,可表示为

2.2.4 海冰分类

选择SVM 分类方法进行海冰分类,SVM 分类是定义在特征空间上的能够使间隔最大的线性分类器,通过核函数转化为求解凸二次规划问题,其通过类别边缘的训练样本,即支持向量,寻找两类间最优的分类超平面[26]。在非线性变换空间,通过最小化分类器的泛化误差和采用基于核函数的公式化,来计算两类间的线性判别函数。相比神经网络等分类方法,其具有样本小、泛化能力强、计算复杂度适中、结构设计简单等优点,是海冰分类识别领域广泛使用的一种分类方法。SVM 分类中,核函数选择至关重要,常用的核函数有线性核函数、多项式核函数、Sigmoid 核函数、径向基核函数。

线性核函数为

多项式核函数为

Sigmoid 核函数为

径向基核函数为

式中,b,v,c,γ为核函数参数。

本文选择径向基核函数(式(10)),径向基核函数是SVM 海冰分类中的常用核函数。核函数 γ参数设置为0.25,惩罚参数设置为100。

SVM 属于监督分类,选取训练样本是监督分类必不可少的环节。本文利用PIE-Basic 软件,以专家解译图为参考,在待分类的每景影像中各均匀选取约120 个训练样本,50 个验证样本。

3 实验结果与分析

3.1 特征选择结果分析

由于2021 年1 月16 日处于盛冰期,已出现白冰类型,特征选择以2021 年1 月16 日数据为例进行展示。经过波段运算提取出的NDWIH、B_G、G_R、B_R 共4 个光谱特征如图5 所示。为直观判断4 种光谱特征对5 种海冰类型的区分度,基于选取的训练样本,以光谱特征值为横轴,分类类型为竖轴作散点图,如图6 所示。从图6 可看出,4 种光谱特征中,海水和固定冰光谱特征值差异最大,初生冰与固定冰、白冰之间的光谱特征值差异也较大,能够较好区分。但海水与初生冰光谱特征值重叠较多,固定冰、白冰与灰(白)冰之间光谱特征值重叠也较多,因此仅依据光谱特征值难以有效区分5 种分类类型。

图5 光谱特征Fig.5 Spectral features

图6 4 种光谱特征的类别散点图Fig.6 Category scatter diagram of four spectral features

利用GLCM 方法提取了CZI 影像4 个波段的共32 个纹理特征,为减少信息冗余,需进行特征选择。经过计算,得到4 个波段共32 个纹理特征的J值,如表4 所示。

表4 各波段纹理特征J 值信息表Table 4 The J values of texture features of each band

整体来看,波段1 的J值普遍较高,其中均值、同质性、熵、二阶矩4 个纹理特征J值最高,按J值大小排列依次为均值、熵、二阶矩、同质性。利用LDA 算法将4 个波段中J值最高的4 个纹理特征(均值、同质性、熵、二阶矩)分别进行分类投影,如图7所示。

从图7 中可看出,4 个波段的纹理特征均能将5 种类型区分开。5 种类型中,4 个波段的白冰分类效果均较差,波段2、波段3 和波段4 的固定冰分类效果较差,波段1 中的固定冰分类效果较好。总体来看,J值最高的4 个纹理特征可实现海冰分类。综合分析5 种类型的分类效果,波段1 的分类结果优于其他波段分类结果,与J值分析结果相符。因此,选择波段1 的4 个纹理特征(图8)。

图7 基于纹理特征的LDA 算法分类投影Fig.7 The classified projection images of LDA algorithm based on texture features

图8 特征选择后的纹理特征Fig.8 Texture features after feature selection

将NDWIH、B_G、B_R、G_R 4 个光谱特征与均值、同质性、熵、二阶矩4 个纹理特征进行组合,得到最优特征集。

3.2 海冰分类结果分析

基于提取的最优特征集进行SVM 海冰分类实验,将2021 年1 月16 日的CZI 影像分为固定冰、白冰、灰(白)冰、初生冰、海水共5 种类型。为验证不同特征对分类精度的影响,分别开展基于光谱特征和纹理特征的海冰分类实验,与基于最优特征集的海冰分类结果进行对比分析,分类结果如图9 所示。

采用主观和客观评价标准进行结果评价。主观评价为目视对分类结果进行评价;客观评价为利用分类评价指标评价分类精度。图9d 为海冰类型解译图,与图9d 对比来看,3 种分类结果均能将海冰类型大致区分开,但具体到某一类海冰类型,3 种分类结果的精度不同。在基于光谱特征的SVM 海冰分类图像中(图9a),沿岸区域的初生冰被错分类为灰(白)冰,且固定冰和白冰之间出现混淆,部分白冰错分类为固定冰;在基于纹理特征的SVM 海冰分类图像中(图9b),海水和初生冰出现一定程度混淆,固定冰和白冰也不能较好区分,部分白冰误分类为固定冰。在基于最优特征集的SVM 分类结果中,5 种分类类型均得到较好区分;相比基于光谱特征或者纹理特征的分类结果,白冰和固定冰的区分效果有明显改善,说明光谱特征和纹理特征之间具有较好的互补性,改善了海冰类型提取精度。以图9d 海冰类型解译图为参考,选取验证样本,采用混淆矩阵方法进行客观评价,分类结果精度见表5。

图9 2021 年1 月16 日HY-1C 卫星CZI 遥感影像辽东湾海冰分类Fig.9 Sea ice classification of Liaodong Bay from HY-1C satellite CZI remote sensing images on January 16,2021

由表5 可知,本文提出的基于最优特征集的SVM海冰分类总体精度和kappa 系数最高,总体精度为84.89%,kappa 系数为0.80。其次为基于光谱特征的SVM 海冰分类,总体精度为74.58%,kappa 系数为0.66。基于纹理特征的SVM 海冰分类总体精度和kappa 系数最低,总体精度为73.41%,kappa 系数为0.65。通过特征选择得到的最优特征集包含光谱和纹理两种特征,最大程度保留了分类有效信息,同时降低了特征冗余,特征之间实现互补,提高了分类精度。在海冰类型方面,3 种分类方法中,白冰的生产者精度均较低,固定冰的用户精度较低,主要是由于白冰与固定冰的特征相近,导致部分白冰被分类为固定冰,这与主观评价的结论一致。基于光谱特征或纹理特征的分类方法中,初生冰的生产者精度较低,结合主观评价结果,发现在基于光谱特征的分类结果中,沿岸部分的初生冰被误分为灰(白)冰,基于纹理特征的分类结果中,部分初生冰被误分为海水。

表5 2021 年1 月16 日HY-1C 卫星CZI 影像海冰分类精度评价Table 5 Sea ice classification accuracy evaluation of HY-1C satellite CZI images on January 16,2021

为验证本文方法的有效性,排除单景影像的偶然因素影响,分别对2020 年12 月19 日和2021 年1 月10 日的HY-1C CZI 遥感影像进行海冰分类。结合两个时期的影像表征,考虑到形成白冰的几率较小,因此海冰分类类型分为固定冰、灰(白)冰、初生冰、海水4 种类型。分类结果如图10 所示。

图10 2020 年12 月19 日(a)和2021 年1 月10 日(b)HY-1C 卫星CZI 遥感影像辽东湾海冰分类Fig.10 Sea ice classification of Liaodong Bay from HY-1C satellite CZI remote sensing images on December 19,2020 (a) and January 10,2021 (b)

总体来看,2021 年1 月10 日的海冰面积相较2020 年12 月19 日大幅增加。2020 年12 月19 日的海冰类型中初生冰面积较大,2021 年1 月10 日海冰类型中灰(白)冰海冰类型占比最大。由于1 月份气温降低,海水大面积冻结,形成大面积的灰(白)冰类型。从分类图中可看出,海冰类型中灰(白)冰与固定冰之间存在一定程度地混淆。利用混淆矩阵客观评价分类精度,精度评价见表6。

由表6可知,2020年12月19日遥感影像分类总体精度为93.67%,kappa系数为0.89,2021年1 月10 日遥感影像海冰分类总体精度为91.75%,kappa系数为0.88。分类精度均较高,能够达到一般海冰分类精度要求,进一步验证了本文方法的有效性。对比3 个时期的海冰分类精度,发现精度从高至低依次为:2020 年12 月19 日、2021 年1 月10 日、2021 年1 月16 日。随着气温降低,海冰类型增加白冰类型,易误分类海冰类型所占比例增大,分类精度逐渐降低。

表6 2020 年12 月19 日和2021 年1 月10 日HY-1C 卫星CZI 遥感影像海冰分类精度评价Table 6 Sea ice classification accuracy evaluation of HY-1C satellite CZI images on December 19,2020 and January 10,2021

利用海冰分类结果估算3 个时期的海冰总面积与各海冰类型面积,计算公式为:海冰面积=海冰像元数×2 500/1 000 000,海冰面积单位为平方千米。为直观对比3 个时期的海冰面积和类型变化,做海冰面积变化折线图与海冰类型柱状图,如图11 所示。从图11a 中可得到3 个时期的海冰面积逐渐增大,分别为2 635.14 km2、10 674.27 km2、11 998.98 km2,国家卫星海洋应用中心通报的3 个日期的海冰面积分别为2 365 km2、10 987 km2、12 078 km2,对比发现本文提取的海冰面积较为准确。从海冰类型来看,2021 年1 月16 日的固定冰、白冰、灰(白)冰3 种类型面积大于另外两个日期的面积;2021 年1 月10 日的初生冰面积最大,说明随着气温降低,此阶段海水结冰迅速,出现大量初生冰;到2021 年1 月16 日,大量初生冰转为灰(白)冰、白冰或者固定冰,从而初生冰面积减少,其他海冰类型面积增加。

图11 3 个时期海冰面积变化折线图(a)与海冰类型柱状图(b)Fig.11 The line chart of sea ice area change (a) and the histogram of sea ice types (b) in three periods

4 结论

本文基于HY-1C CZI 影像,提出了一种有效的海冰分类方法。该方法通过提取HY-1C CZI 影像的光谱特征和纹理特征,对多特征进行特征选择,得到最优特征集,基于最优特征集开展SVM 海冰分类研究。主要结论如下:

(1)在特征提取与选择方面,选择NDWIH、B_G、B_R、G_R 4 个光谱特征与均值、同质性、熵、二阶矩4 个纹理特征组成最优特征集,既保留了分类有效信息,实现信息互补,又降低了信息冗余。

(2)在海冰分类方面,本文提出的基于最优特征集的分类方法优于仅基于光谱特征或纹理特征的分类方法。利用本文方法的3 期HY-1C CZI 遥感影像分类精度均在80%以上。对海冰分类图进一步估算得到海冰总面积,与国家卫星海洋应用中心通报的海冰面积相差较小,进一步验证了本文方法的有效性。

综上所述,本文提出的基于最优特征集的SVM海冰分类方法是有效的,同时证明了HY-1C CZI 数据在海冰分类应用中的可行性,但在特征提取方面,本文仅应用了光谱和纹理特征,更多的特征提取方法有待进一步研究。

猜你喜欢
海冰波段纹理
最佳波段组合的典型地物信息提取
近三十年以来热带大西洋增温对南极西部冬季海冰变化的影响
基于BM3D的复杂纹理区域图像去噪
南极海冰融化致帝企鹅减少
使用纹理叠加添加艺术画特效
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
TEXTURE ON TEXTURE质地上的纹理
L波段kw级固态功放测试技术
基于SIFT-SVM的北冰洋海冰识别研究