赵国兵 程吉 李洋 谢文瀚 邓立¤
1.四川省国土科学技术研究院(四川省卫星应用中心),四川成都
2.自然资源部耕地资源调查监测与保护利用重点实验室,四川成都
3.中国石油大学(华东)海洋与空间信息学院,山东青岛
4.青岛海洋科学与技术试点国家实验室海洋矿产资源评价与探测技术功能实验室,山东青岛
不透水面是指阻止水分下渗到土壤的城市人工地面,是城市的重要特征地物。城市不透水面面积的变化能够从一定程度反映城市化的进程和经济的发展水平[1]。当前,不透水面信息的提取,通常以遥感技术手段选取平原地区城市进行观测,却很少在西部低山丘陵区城市开展。究其原因,低山丘陵区城市复杂多变的地形使得单一数据源无法很好地满足提取精度的需要,同时,丘陵气候多云雨问题也限制了不透水面提取的精度。因此,采用多源数据对丘陵城市不透水面开展提取研究,已成为当前热点。
我国高分辨率对地观测系统重大专项(简称高分专项)自2006 年建设以来,已发射多颗搭载不同类型传感器的卫星,为行业应用提供高质量高分辨率遥感卫星影像[2]。其中,高分1号卫星提供的高分辨率光学影像能够为丘陵地区不透水面提取提供丰富的光谱信息;高分3号雷达卫星能全天时全天候成像,其全极化精细条带模式可以提供丰富的极化信息与空间几何结构信息,能与光学影像形成互补。
四川盆地地形主要以低山丘陵为主,是人口和经济的密集地区。本文以四川盆地低山丘陵区城市泸州市为例,以高分1 号光学遥感影像和高分3号全极化雷达影像相融合的方式,进行不透水面提取研究,以期能够满足四川盆地内低山丘陵区城市发展监测、自然生态保护以及国土资源管理对不透水面基础信息的需求。
如图1所示,泸州市位于四川盆地南缘,东与重庆市接壤,南与贵州省连界,西与云南省和四川省宜宾市、自贡市相连,北接四川省内江市和重庆市,处于川东南平行褶皱岭谷区南端与大娄山的结合部,四川盆地南缘向云贵高原的过渡地带,兼有盆中丘陵和盆周山地的地貌类型,低山丘陵占市域面积的80%。
图1 试验区地理位置
高分1号是高分专项中的首发星,搭载有多光谱相机和全色多高光谱相机,其中,全色多光谱相机包含4个可见光波段和1 个全色波段,可见光波段分辨率为8 m,全色波段分辨率则为2 m,重访周期为4 d。高分1 号同时拥有高空间分辨率、多光谱与高时间分辨率,能为不透水面提取提供丰富的光谱信息和空间信息[3]。本文使用高分1号C卫星数据,选用了2021年9月21日的PMS数据,通过对原始多光谱和全色数据进行辐射校正、大气校正和几何校正,然后再将校正后的多光谱数据和全色数据进行融合,得到空间分辨率为2 m 的蓝、绿、红和近红外波段。高分1号卫星详细参数如表1所示。
高分3 号是中国首颗空间分辨率达到1 m 的C 波段合成孔径雷达卫星(SAR),不仅涵盖了传统的条带、扫描成像模式,还拥有聚束、条带、扫描、波浪、全球观测、高低入射角等多种成像模式,弥补了我国民用高分辨率SAR 卫星的空白。同时,高分3 号提供多种极化方式,包括单极化、双极化和全极化,能为地物识别提供丰富的极化信息[4]。高分3 号卫星详细参数如表2 所示。对于高分3 号,本文采用了2021 年9 月18 日成像的QPSI 数据,做了辐射定标、RPC 几何校正、Lee 滤波、相干矩阵提取和H-A-Alpha 极化分解。为和光学影像融合匹配,最后将处理得到的高分3 号影像重采样到2 m,并与高分1 号影像进行空间配准。
表1 高分1号卫星详细参数
表2 高分3号卫星详细参数
对于高分辨率的光学影像,为充分利用其光谱信息和空间信息,除光谱波段外,还计算了纹理特征。灰度共生矩阵(GLCM)是一种常用的纹理特征计算方法,该方法从统计的角度描述图像的纹理,描述了像元间的空间相关特性[5]。通过对可见光进行主成分分析,对包含信息最多的第一主成分分量进行GLCM纹理特征提取,计算得 到 均 值 (Mean)、 方 差 (Variance)、 同 质 性(Homogeneity)、 对 比 度 (Contrast)、 相 异 性(Dissimilarity)、 熵 (Entropy)、 二 阶 矩 (Second moment)和相关性(Correlation)。试验区影像部分纹理特征如图2所示,显然,不同的纹理信息充分体现了该区域的空间结构特征。
图2 高分1号影像的GLCM纹理特征
对于极化SAR 影像,首先得到散射矩阵S,在对散射矩阵进行相干分解,得到相干矩阵T,矩阵T 的主对角线元素对应着不同的散射机制,第一个主对角线元素T11对应着表面散射,第二个主对角线元素T22 对应着二次散射,第三个主对角线元素T33 对应着体散射[6]。采用相干矩阵的主对角线元素可以为区分不透水面和其他地物提供有用的极化信息。此外,由于丘陵城市场景中,目标往往复杂多样,散射特性变化性强,本文还进行了非相干目标分解获取极化分解分量。Cloude 于1997 年提出的H-A-Alpha 分解方法物理意义明确、简单易用,是经典的极化分解方法之一[7]。本文采用该方法,得到散射熵(H)、散射角(Alpha)和各向异性(A)。图3 展示了提取的极化SAR特征,可以看出,极化SAR特征提供了不同于光学影像的信息,尤其是协方差矩阵的主对角线元素,能够有效增强不透水面,抑制其余地物如水体、裸土等,有效提高不透水面的可识别性。
图3 高分3号的特征提取
综上,对于低山丘陵城市场景,为利用高分辨率光学影像的光谱信息,选择了高分1 号的全部可见光波段;此外,选择了基于光学影像计算的纹理特征为不透水面分类提供空间信息;对于SAR 数据,则充分利用其散射极化信息,对光学影像进行补充,不仅增强了算法对低山丘陵城市中大量存在的裸土与亮不透水面的识别能力,也提供了更多城市几何结构特征。最终,本文选择了光学和雷达影像共18个特征组成特征集,如表3所示。
数据融合包括3 个层次,即像素层、特征层和决策层。像素层是以单个像素为单位做融合,得到融合图像后再分类,因此,要求极其严格的配准,但SAR 影像存在大量的斑点噪声,会极大降低像素层的融合精度。决策层虽然对图像配准的要求不高,但是如何构建合适的决策机制需要大量的探索。特征层对不同的数据源提取特征,再对特征进行堆叠以及后续处理,对图像配准的要求不如像素层严格,计算复杂度低于决策层,通过不同的特征能充分利用不同数据源的信息,是光学和SAR的极佳融合方式[8]。因此,本文选择特征级的融合方式,将提取的光学和SAR 特征堆叠形成特征向量,输入分类器,得到四类地物的分类结果,即不透水面、植被、水体和裸土。最后将所有不透水面类别合并,得到最终的不透水面提取图。
表3 特征提取
对于分类器,采用了支持向量机(SVM)。SVM 是通过寻找一个最大分割超平面来区分各个类别,其原理简单易懂,计算方便且分类精度较高,是常用的机器学习分类算法之一。此外,SVM 还引进了核函数,使得复杂的非线性分类问题也得到了很好的解决[9]。本文采用的是成对分类(pairwise classification)的策略进行SVM 多分类,核函数选择了高斯核函数。
在样本的选择上,遵循随机、分布均匀、尽量包含每类地物中不同类型对象的原则,选择了13 427个样本,其中,包含8 907 个训练样本和4 520 个测试样本,具体信息如表4所示。
表4 样本选择
为全面反应采取融合算法的提取效果,选择混淆矩阵及其衍生指标总体精度(OA)、Kappa 系数、用户精度(UA)、制图精度(PA)、漏分误差(CE)和错分误差进行精度评定。OA、Kappa 系数、UA、PA、OE 和CE 的计算公式分别为[10]:
其中,N 为观察样本总量,K 为类别个数,Xii为混淆矩阵第i 个主对角线样本数,表示第i 类中被正确分类的像元个数;Xi+为第i 行的观察样本总和,X+i为第i 列的观察样本总和。OA 反映总测试样本中分类正确的比例,但只考虑了混淆矩阵中的主对角线元素,Kappa系数则还考虑了混淆矩阵的非主对角线元素。UA 反映在分类结果图中某类被正确识别的精度,PA 则反映在实际影像中,某类得到正确识别的比例。CE 表示分类结果图中被分为某一类地物实际上有多少应该是别的类别,OE 则反映实际的某一类地物有多少被错误地分到其它类别。
在低山丘陵城市,地形复杂、地物分布较杂,植被、裸土、水体大量分布,且大量裸土与不透水面相邻,给不透水面提取造成极大的困难,通过融合使用高分辨率光学和SAR 影像特征,能够较好地提取出丘陵城市的不透水面。由图4和图5可以看出,在该试验区内,各类别基本分类正确,虽然还有部分细节存在误差,但对于大范围城市不透水面制图已基本满足使用需求,不透水面主要位于试验区西南和南部地区,与试验区真实影像的不透水面覆盖相吻合。
试验结果的混淆矩阵和其余精度评价指标分别如表5和表6 所示。从混淆矩阵中可以看出,试验总体精度达83.23%,Kappa 系数达0.77,总体满足大范围低山丘陵城市不透水面提取精度。易与不透水面产生混淆的主要是裸土,这是由于丘陵城市中裸土分布范围广、面积较大,且大量与不透水面相邻所造成的。低山丘陵城市由于受地形限制,城市化水平稍逊于平原城市,因此,城市边缘地区建筑物大多矮小,其散射回波有限,若周围裸土较粗糙,在SAR 影像上的灰度差异较小,很难改善光学影像已经存在的不透水面和裸土的光谱混淆,并且,由于低山丘陵高差起伏,SAR 影像存在叠掩、顶底位移等,使得山脊部分呈现高亮,与不透水面的高亮特征类似。其次,易与不透水面产生混淆的是水体。在试验结果中,大部分阴影都得到了正确的分类,但仍然有部分新建高楼阴影投射面积极大,光谱信息严重缺失,部分阴影被错误识别为水体。
图4 分类结果图
图5 不同地物分类概率图
表5 混淆矩阵
表6 精度评价指标
本文以高分1 号光学影像和高分3 号全极化雷达影像为基础数据源,通过特征提取,挖掘不同数据源的信息,在特征层进行数据融合,以经典机器学习算法SVM 为技术支撑,得到大范围丘陵城市的不透水面制图,总体精度达83.23%,Kappa 系数达0.77,基本能够满足低山丘陵城市在相关应用及监管中的不透水面制图需求。但是,该算法仍然存在部分细节处的混淆,主要是裸土与亮不透水面、水体与阴影不透水面混淆引起的。接下来,可探索雷达数据在光学阴影的特征,以进一步提高不透水面提取精度,但也需要同时考虑到雷达影像自身存在的雷达阴影、叠掩以及顶底位移等几何问题。