陈 成,卢 刚,石晓峰
(1.江苏省测绘工程院,江苏 南京 210013)
资源三号测绘卫星是目前国内领先的高分辨率测绘与资源遥感卫星,它搭载了1台地面分辨率2.1 m的高分辨率正视全色相机,1组地面分辨率3.5 m的前后视立体全色相机以及1台地面分辨率5.8 m的正视多光谱相机[1],可以快速获取全球高分辨率立体遥感影像以及多光谱遥感影像。
遥感分类是应用高分辨率遥感影像开展资源调查的主要途径之一。常见的遥感分类方法普遍依据数理统计学理论,其假定遥感数据正态分布且概率密度函数可知,这在实际中很少满足[3]。支持向量机(SVM)[4]适于高维特征、小样本与不确定性问题,应用支持向量机进行遥感影像分类是近年来的研究热点。Zhu等使用SVM对ASTER影像进行分类,得出满意的分类结果[5]。田源将支持向量机和最大似然法分类结果对比,SVM在样本数目很少的情况下表现出出色的学习能力[6]。陈波采用一种结合纹理的支持向量机遥感分类方法对Landsat7 ETM遥感影像进行纹理特征提取,构建了结合纹理的SVM分类模型[7]。Foody等将SVM算法用于航空多光谱数据的分类,并与决策判别(DA)、DT、NN进行对比[8]。谭琨等建立了一个基于支持向量机和多变量分析的高光谱分类器[9]。本文研究了运用支持向量机方法对资源三号测绘卫星多光谱数据进行分类。
宜兴市地处长三角地区,城市化水平较高,用地类型多样且较破碎。采用传统陆地资源卫星进行分类,对于破碎地物提取效果较差,分类精度不高。资源三号测绘卫星全色与多光谱数据分辨率较以往有较大提高,可以更加准确地分辨地表细节,且影像动态范围由以往的8 bit提高到16 bit,地物光谱信息更加丰富,可以更准确地分辨地物细节信息。本文选取宜兴市区面积约140 km2多光谱遥感影像数据作为典型研究区。遥感影像数据获取时间为2012年4月,植被处于高速生长期,植物光谱信息较为明显,适宜于影像分类研究。影像几何精纠正数据源选择14.25 m分辨率GeoCover全球拼接融合遥感影像与30 m分辨率GDEM高程数据。
根据影像反映的用地信息与典型区实际情况,将该区域土地分类分为耕地、林地、水域、居民地及建设用地、未利用土地5类。
1.2.1 二类分类的SVM
对于二类分类问题,假设在d维特征空间有包含N个元素的特征向量xiRd(i=1,2,…,N),对应每个向量xi有类别yi{+1,-1}。当第二类问题是线性可分时,SVM尝试找到一个分类超平面将二类问题分开。这一分类超平面可表示为:
式中,w=(w1,w2,…,wN)表示垂直于超平面的向量;bRd表示偏移量。寻找最优超平面可以通过解算下面的最优化问题得到:
式中,ai为拉格朗日乘子,当ai非0时,对应的训练样本称为支持向量(SV);K为核函数,用于解决非线性问题的分类;C为惩罚系数,用于控制训练过程中的误差[10]。
1.2.2 多类分类的SVM
原始SVM只能处理二类分类问题,在解决多类分类问题时需要将其扩展。一般有2种途径:一是将多个分类面的参数求解合并到一个最优化问题当中,通过求解该最优化问题,一次性地实现多类分类,即“一对多”策略;二是通过某种方式构造一系列的二类分类器将它们组合在一起从而实现多类分类,即“一对一”策略。目前,“一对一”策略解算次数较少,结构简单、容易训练且收敛速度快,但二类问题的划分可能会造成二类分类样本数量的不平衡,从而影响最终精度;“一对多”策略所需解算次数较多,可获得更高的分类精度,但是当类别数较大时,可能会产生潜在的精度问题。由于本研究分类类别相对较少,故选用“一对多”策略。
1.3.1 数据预处理
首先进行资源三号测绘卫星数据的几何精纠正,以该区域GeoCover全球拼接融合遥感影像与30 m分辨率GDEM高程数据为基准,运用二次多项式纠正法,在遥感影像上均匀选取18个控制点,影像纠正算法总RMSE为0.59。图像重采样采用最邻近像元法,保证影像光谱信息的准确真实。随后,在影像上提取约140 km2典型区影像。图1和图2分别为实验区真彩色合成影像和假彩色合成影像,真彩色合成影像色彩真实、地物信息丰富,假彩色合成影像的植被信息较为发达。
图1 实验区真彩色合成影像图
图2 实验区假彩色合成影像图
1.3.2 样本采集
通过目视解译,结合1∶10 000地形图数据等辅助数据,进行训练样本和检验样本提取。采集数量相近的训练样本与检验样本,且各类样本在研究区均匀分布,如表1所示。对于样本可分离性进行检验,发现居民地及建设用地与未利用土地间光谱较为相似,可分离性仅为1.61。分析研究区地物分布发现,该区域道路多为水泥路面,光谱较为类似,因此将这2类合并为1类,即居民地与建设用地。
表1 训练样本与检验样本采集表
1.3.3 分类流程
在样本数据准备完成后,将样本数据输入向量机进行分类,同时应用ENVI软件内置的最大似然法和最小距离法进行分类,并对比分类结果。
首先应用SVM分类法进行地物分类,如图3所示。
图3 实验区SVM分类结果
从图3可以看出,各类用地基本上均已准确区分。但仍存在一些问题:首先是建筑物阴影与水体间光谱信息近似,有一些建筑物阴影被错划为水体;其次是部分耕地被错分为林地。应用混淆矩阵法进行精度评价(见表2),总精度为97.76%,Kappa精度为0.968 7。
表2 各土地利用类型分类精度/%
应用2种常见的遥感影像监督分类方法——最大似然法与最小距离法进行遥感影像分类,如图4。
图4 最大似然法与最小距离法分类结果
对比2幅分类结果影像发现,这2种分类方法虽然可以大致反映各类地物的总体分布趋势,但各有不足。最大似然法对于植被分类较为敏感,可以准确地对耕地与园地进行分类,而对林地识别能力稍差,不能区分建筑物阴影与水体,对于居民地及建设用地的分类基本准确;最小距离法对林地分类效果较好,对于水体则效果较差,且将部分植被误分为建筑用地,导致居民地及建设用地面积过大。2种分类结果的精度评价如表3所示。
表3 各分类方法总体精度对比表
本文以江苏省宜兴市140 km2典型区多光谱遥感影像数据作为数据源,运用SVM分类法进行分类实验,同时采用最大似然法和最小距离法进行分类对比。结果表明,SVM分类法可以有效地进行地物分类,效果优于传统遥感分类方法,可以满足土地分类应用的需要。其分类总精度为97.76%,Kappa精度为0.968 7;资源三号测绘卫星影像适用于遥感地物分类调查,具有很高的实用价值。
本文仅用资源三号多光谱数据进行分类研究,在下一步工作中应考虑引入高分辨率全色影像数据、立体像对数据进行分类,同时结合影像增强与融合等方法进行辅助分类,从而提高分类精度,消除误差。
[1]唐新明,张过,祝小勇,等. 资源三号测绘卫星三线阵成像几何模型构建与精度初步验证[J]. 测绘学报,2012,41(2) :191-198
[2]国家测绘地理信息局卫星测绘应用中心. 应用领域展望[EB/OL].http://sasmac.sbsm.gov.cn/article/yyzw/200912/20091200059262.shtml,2009
[3]骆成凤. 中国土地覆盖分类与变化监测遥感研究[D]. 北京:中国科学院遥感应用研究所,2005
[4]Cortes C, Vapnik V. Support-Vector Networks [J].Machine Learning,1995,20(3):273-297
[5]Zhu G B, Blumberg D G. Classification Using ASTER Data and SVM Algorithms; The Case Study of Beer Sheva, Israel[J].Remote Sensing of Environment, 2002, 80(2): 233-240
[6]田源,塔西甫拉提·特依拜,丁建丽,等.基于支持向量机的土地覆被遥感分类[J].资源科学,2008(8):1 268-1 274
[7]陈波,张友静,陈亮.结合纹理的SVM遥感影像分类研究[J].测绘工程,2007(5):23-27
[8]FoodyGM, MathurA. A Relative Evaluation of Multiclass Image Classification by Support Vector Machines[J].IEEE Transactionson Geoscience and Remote Sensing, 2004, 42(6): 1 335-1 343
[9]谭琨,杜培军,王小美.基于支持向量机和多变量分析的高光谱遥感数据分类[J].测绘通报,2009(11):37-40
[10]张睿,马建文.支持向量机在遥感数据分类中的应用新进展[J].地球科学进展,2009(5):555-562