孔圆圆
(哈尔滨师范大学,黑龙江哈尔滨 150025)
湿地通常是指表面非常潮湿或经常被水饱和的区域,通常由植物、动物、微生物和环境组成。湿地内部结构的空间分布格局对湿地生态系统的稳定性十分重要。近年来,东北地区的湿地存在退化现象,准确获得湿地中各种组成部分的生长和分布情况,对调节气候、维持生态系统的平衡等发挥重要作用。
湿地包含多种多样的地物,相邻地物之间具有高度的光谱相似性。准确区分复杂地物类型成为湿地土地覆盖分类的难题。相较于传统的光谱影像,高光谱图像可以同时获得地面的光谱信息和二维空间信息,具有高光谱分辨率,含有丰富的光谱信息,具有图谱合一、数据量大和隐含特征信息丰富等特点,增强了对地物目标的探测能力,能为湿地分类提供很好的数据源。随着高光谱数据的发展,高光谱图像已经成为遥感技术领域的热点研究方向,其中高光谱数据的分析和处理方法也在不断改进,可以细分为端元解混、异常检测、图像增强和图像分类等[1-3]。其中一个重要的方面是高光谱图像的分类,即根据高光谱图像中的信息为图像中每一个像元赋予类别标签,分类的精度和分类效果的准确度与后续的实际应用联系更为密切。传统的图像分类可以分为基于光谱特征的、基于空间特征的和基于空谱联合特征的3种分类方法。基于光谱特征的遥感图像分类方法,主要有主成分分析(Principal Component Analysis,PCA)、最小噪声分离(Minimum Noise Fraction Rotation,MNF)、独立主成分分析(Independent Component Analysis,ICA)等,这种利用特征提取的方法简单直观,且最大限度地保留了原始光谱数据的光谱信息,同时重要信息的丢失与畸变现象也存在。经过相关学者的算法改进,目前较好的分类器主要有逻辑回归(Logistic Regreesion)、支持向量机(Support vector machines,SVM)、随机森林(Randomm Forest,RF)、稀疏表达和K近邻等。基于空间特征的遥感图像分类,主要是利用中心像素与其上下文之间的关系,并综合应用到高光谱图像分类中,常见的空间特征提取方法有灰度共生矩阵、小波变化和局部二值模式等。该方法能有效获取地物类型的位置、结构等空间信息,但缺点是忽略了高光谱图像的光谱维度信息,分类效果并不理想。基于统计特性的传统分类方法有监督分类和非监督分类2种,两者的区别在于是否有已知类别的训练样本。其中监督分类有最大似然法(Maximum Likelihood,ML)、决策树(Decision Tree)、随机森林和支持向量机等,要先选取适当的已知地物类别的训练样本,让分类系统对其特征进行学习,受方法或数据精度的制约,在具体的分类应用中提高高光谱数据的精度仍有很大的挑战。非监督方法如k-均值分类是典型的聚类方法。在高光谱遥感影像下,应用这些浅层的机器学习分类模型进行湿地遥感的分类难以挖掘出高光谱图像深层的信息,而采用深层结构的深度学习模型能够充分利用光谱间的空间信息,如目前图像识别中主流的技术深度学习能更好地分析和处理光谱间和空间分布的复杂的高光谱图像[4]。国内外已有学者将深度学习应用在遥感图像的分类和识别中[5-6],但是很少有人研究深度学习方法在沼泽湿地分类中的性能和效果。基于深度学习的高光谱图像分类方法众多,但是仍面临着众多挑战:异物同谱、同物异谱、波段间信息的冗余和维数灾难等,这些都影响高光谱图像分类的精度。
鉴于此,本文以OHS 高光谱遥感影像洪河国家级自然保护区为研究对象,选择深度学习的SegNet网络模型和随机森林算法对高光谱遥感影像进行分类,并对比分析分类结果和分类精度,为沼泽湿地遥感的植被监测和生态保护提供参考。
洪河国家级自然保护区位于黑龙江省三江平原东北部的抚远县与同江市的交界地带,是一块能够全面反映三江平原湿地全貌的内陆湿地和水域湿地生态系统类型的自然保护区。保护区面积250.9 km2,地理坐标(47°42'~47°52')N,(133°42'~133°46')E。属于温带大陆性季风气候,年平均气温1.6~1.9 ℃,年均降水量为500~700 mm,年蒸发量为542~580 mm。全长25.7 km 的浓江河从保护区北部穿过,构成洪河国家自然保护区北侧的自然边界;此外还有从南向北汇入浓江河的沃绿蓝河,总长7 km,是该保护区的核心水源。该地地貌单一,地势平坦,平均海拔高度58 m,相对高差约3 m,由西南向东北倾斜,使得区内河汊、泡沼、蝶形及线性洼地遍布,各类低洼湿地沼泽遍布,构成了丰富多变的北方水生、陆生和湿生生态系统[7-8]。
ENVI Deep Learning Module 是基于深度学习框架(TensorFlow)开发的遥感图像分类工具,基于图像的空间和光谱特性识别图像中的特征,通过一组标记的像素数据作为样本对深度学习的Seg-Net 网络模型进行训练,用训练好的模型在其他图像中找到更多具有相同特征的像素,以进行特定目标的分类[9]。深度学习模型的基本流程如图1所示。
图1 深度学习模型的基本流程
由于研究区较大,选取子区域进行标签的制作,子区域应包含待分类图像中的所有样本,训练样本应尽可能选取全面覆盖多种地物类型,保证训练样本纯度的同时,尽可能多地选取样本。深度学习模型的训练是重要流程,经过多次训练调整参数,最终选取模糊距离(Blur Distance)最大值为2,最小值为1,类别的权重(Class Weight)最大值为0.70,最小值为0.25以及训练的权重(Loss Weight)大小为0.6。选取泛化能力最强的训练模型作为深度学习分类提取的模型。
随机森林算法是由多棵决策树组成的一种快速准确的集成学习算法。主要分类过程:从训练数据集中随机抽取部分数据作为子训练集,每棵决策树通过学习子训练集中不同地类的特征,预测当前数据的类别,综合所有的预测结果,输出票数最多的结果作为当前数据最终预测结果。随机森林模型示意如图2所示。
图2 随机森林模型示意
选择混淆矩阵的评价方法对分类结果进行精度计算。将每个预测像元的位置和分类与原始图像中的训练样本进行精度对比,选取总体精度(OA)、Kappa 系数、制图精度(PA)和用户精度(UA),作为定量化试验结果的评价指标,评估确保所选分类方法结果的可靠性和准确性。
本研究在Windonws10(Intel/AMD64 位)操作系统内完成,NVIDIAGPU 驱动程序版本:Windows461.33 版本,具有高级矢量拓展(AVX)指令集的CPU,具有CUDAComputeCapabitlity 版本5-8.6 的NVIDIA显卡具体环境为硬盘。
珠海一号卫星是由珠海欧比特宇航科技股份有限公司发射并运营的商业卫星,由34颗遥感微纳卫星组成整个星座,包括10颗OHS高光谱卫星、2颗OUS高分光学卫星、10颗OVS视频卫星、2颗SAR雷达卫星和8颗OIS红外卫星。其中OHS卫星均采用堆扫成像的方式,单次成像范围在150 km×400(km/min),空间分辨率为10 m,光谱分辨率为2.5 nm,轨道高度500 km,信噪比25~40 Db,波段范围在400~1 000 nm,共有32个波段。
本文选取2021 年9 月份(植物成熟期)成像的OHS 高光谱影像L1B 级数据(下载地址为欧比特遥感数据服务平台https://www.obtdata.com),为了保持时间一致性并减少分类结果中土地覆盖类型变化的负面影响,尽可能选择接近的采集时间影像进行拼接,并结合精度较高的Landsat8 遥感影像进行精度分析。
获取的L1B 级标准数据,是经过辐射校正后的标准产品。在执行所提出的方法之前,一些数据预处理步骤是必不可少的,包括波段组合、辐射定标、大气校正、正射校正、图像镶嵌及裁剪。首先,对影像进行波段组合,增加定标系数等字段信息,识别RPC 信息。其次,用ENVI5.6 辐射定标将遥感影像的DN值转化为有物理意义的大气表观辐射亮度值,消除遥感影像中由大气散射所造成的辐射误差;用FLASH 模块对辐射定标后的影像进行加光谱响应函数大气校正,反演地物真实的反射率;与同时期的Landsat8OLI影像进行正射校正,改善明显的几何畸变,纠正误差在0.5 个像元以内。最后,将三景影像进行镶嵌拼接,将洪河湿地矢量边界作为ROI 对影像进行裁剪。
综合考虑高光谱影像的光谱特征和研究区野外实地调查的结果,并参考《湿地公约》中的湿地分类准则,将研究区划分为7 种地物类型,分别为水稻田、旱地、水域、林地、灌草、浅水草本沼泽和深水草本沼泽。洪河保护区沼泽湿地土地利用分类体系及影像特征如表1所示。
表1 洪河保护区沼泽湿地土地利用分类体系及影像特征
根据表1的分类体系选取合适的训练样本进行湿地分类,为了确保湿地植被分类的准确性,选取的训练样本的质量要有一定的标准,应尽可能地选取代表性强的纯净像元。通过对谷歌地球目视解译和实地考察调研,在OHS高光谱数据上选取感兴趣区提取训练样本。基于OHS 影像提取的洪河保护区典型地物分类光谱曲线如图3 所示,建立的洪河保护区典型地物的端元光谱曲线,以此标准进行湿地分类训练。
图3 基于OHS影像的洪河保护区典型地物分类光谱曲线
通过对比随机森林分类算法和深度学习模型进行高光谱洪河自然保护区沼泽湿地分类研究结果,发现基于深度学习的分类中的深水沼泽、乔木植被、水稻田的分类结果更接近湿地考察的真实地物情况,针对高光谱影像的同物异谱现象也得到了明显改善,挖掘了高光谱里更多的光谱信息,实现了湿地的有效真实分类。
基于随机森林和深度学习模型算法的分类精度如表2所示。由表2可知,基于深度学习的SegNet网络分类总体精度比传统的随机森林机器学习算法的总体精度提高了约0.066;深度学习的分类kappa系数(0.873)明显优于传统的随机森林机器学习算法(0.787)。因此,深度学习的SegNet 网络分类降低了基于像素分类过程中的错选概率,有效改善了分类效果,提高了湿地的分类精度,更适合湿地的分类研究。
表2 2种分类方法的分类精度
本文基于深度学习的SegNet网络模型应用于高光谱的沼泽湿地分类,将分类结果与传统的机器学习算法RF的分类结果进行精度对比,定量化地验证了深度学习的SegNet网络模型在高光谱沼泽湿地遥感信息提取分类中的可行性。研究得出以下结论。
(1)基于深度学习的SegNet 网络模型高光谱淡水沼泽湿地分类。该方法能够挖掘出高光谱影像深层次的信息,充分利用光谱信息,有效区分浅水沼泽和深水沼泽。
(2)与传统的机器学习算法RF 相比,基于深度学习的SegNet 网络模型分类结果的制图效果更好,水稻田、旱地和乔木植被等制图精度和用户精度均在90%以上,总体精度达到0.903,其分类精度明显优于随机森林算法。