金鹏飞 汤瑜瑜 危峻
摘 要: 针对宽波段成像光谱仪数据为中等空间分辨率、谱段多的特点,提出一种结合双子支持向量机(TSVM)和纹理特征的WIS遥感影像快速分类方法。选用经过几何校正的二级数据产品,进行大气校正、反射率计算等预处理后,裁切出500×500大小的影像作为实验对象。选择以相关性分析的方法获取特征波段。为解决狭小水体混合像元难以区分的问题,选择计算NDWI指数,然后提取其纹理特征。最后,基于TSVM和传统SVM进行分类实验,样本训练及预测的时间分别为14.27 s,26.41 s,得到的总体分类精度分别为87.861 3%,87.659 0%。结果表明,基于TSVM和纹理特征的分类算法不仅训练速度快,而且具有良好的泛化能力。宽波段成像光谱仪数据在中等尺度的土地覆盖分类中具有极大的应用价值。
关键词: 遥感影像; 快速分类; TSVM; 宽波段成像光谱仪; 纹理特征提取; 结果分析
中图分类号: TN911.73?34; TP751 文献标识码: A 文章编号: 1004?373X(2020)02?0001?04
WIS remote sensing image classification method based on TSVM and texture features
JIN Pengfei1,2, TANG Yuyu2, WEI Jun2
Abstract: As for the characteristics of medium spatial resolution and multi spectral coverage of broadband imaging spectrometer data, a WIS remote sensing image fast classification method in combination with the twin support vector machine (TSVM) and texture features is proposed. The secondary data products with geometric correction are selected to perform the pre?processing such as atmospheric correction and reflectance calculation, after which the image of the 500×500 size are cut out as the experimental objects. The feature band is obtained by means of the correlation analysis method. The NDWI index is calculated, and then the texture features are extracted to solve the indistinguishable problem of the mixed water pixels in the narrow water. The classification experimen based on TSVM and traditional SVM is carried out, the sample training and prediction time is 14.27 s, 26.41 s, respectively, and the overall classification accuracy is 87.861 3%, 87.659 0%. The results show that the classification algorithm based on TSVM and texture features not has fast training speed, but has good generalization ability. The broadband imaging spectrometer data has great application value in medium?scale land cover classification.
Keywords: remote?sensing image; fast classification; TSVM; broadband imaging spectrometer; feature extraction detection; results analysis
非平行支持向量机作为支持向量机的延伸,近些年受到广泛关注。与传统SVM算法最大的不同在于,非平行支持向量机针对每一类别构造相应的支持超平面。让每一个超平面更“接近”于相应的类别,而不限定超平面是否平行和间隔大小[1]。因此,对于某些数据而言,比如交叉型数据,非平行支持向量机具有更好的分类效果。同时在计算速度方面,非平行支持向量机具有绝对的优势。非平行支持向量机中影响程度较大的两种类型分别是广义特征值支持向量机(Generalized Eigenvalue Proximal SVM,GEPSVM)和双子支持向量机(Twin Support Vector Machine,TSVM)。GEPSVM是非平行支持向量机的首个模型,是Mangasarian等人在2006年提出的[2]。双子支持向量机具有和GEPSVM较为相似的非平行特性,但在超平面和类别的距离处理方面,有着不同的取舍。实验结果证明,TSVM具有较小的训练规模和良好的泛化能力[3]。
虽然非平行支持向量机具有更好的性能,已经成为支持向量机研究的新热点,但其应用研究却相对较少。在国内外,非支持向量机的研究较多的还是理论和模型构建,以双子支持向量机和广义特征值支持向量机的变体以及结合其他优化算法的研究为主[4]。尽管如此,在遥感方面也已经有少部分的应用[5?6]。胡根生等人利用最小二乘法的双子支持向量机(LS?WTSVM)和灰度共生矩阵进行云层的检测分类,结果得出Kappa系数为0.897 2,优于其他方法[7]。王立国等人将双子支持向量机与K?means结合,通过非监督分类方法减小训练样本规模,进行高光谱遥感图像的半监督分类实验[8]。在农业遥感方面,还有结合HJ卫星数据和LS?WTSVM进行小麦蚜虫的监测,实验结果比传统SVM高9%左右。
随着遥感技术的发展以及应用精度的日益提高,遥感影像分类不在仅仅依靠光谱特征。纹理特征的利用极大提高了分类精度。针对WIS影像中狭小水体混合像元现象严重的情况,选择归一化水体指数NDWI图像作为纹理特征提取的原始图像。这样可以极大缩小计算量,在有效区分出水体的同时,也增加了房屋、农田等其他地物类型的纹理特征。因此,该结合TSVM和纹理特征的分类算法较适合WIS多光谱遥感影像的快速分类。
1 双子支持向量机的原理
分类问题中,传统支持向量机最为重要的思想就是“最大间隔”原则,以一对平行超平面去划分不同的类别。其基本约束和目标函数可表示为:
[minω,b12∥ω∥2s.t. yi(ωTxi+b)≥1, i=1,2,…,m] (1)
而双子支持向量机目的在于寻找一对非平行的拟合超平面,如下:
[f1(x)=ωT1x+b1=0f2(x)=ωT2x+b2=0] (2)
希望每个超平面分别拟合一类样本点以寻找相同类别之间的相似性,同时希望非本类别样本点远离本类拟合超平面。双子支持向量机不同于GEPSVM的特点在于,放宽对于负类样本的“远离原则”,限制条件为负类样本处于正类超平面平行偏离一个单位的超平面[ωT1x+b1=-1]的一侧即可。同样,对于正类样本的要求与之相似。新的样本点的预测分类取决于其离哪个超平面更加接近。因此,TSVM算法可以简化为求解以下两个优化问题:
[minω1,b1,ξ212ω1x1+e1b12+c1eT2ξ2s.t. -(ω1x2+e2b1)+ξ2≥e2,ξ2≥0] (3)
[minω2,b2,ξ112ω2x2+e2b22+c2eT1ξ1s.t. (ω2x1+e1b2)+ξ1≥e1,ξ1≥0] (4)
式中:[c1>0]和[c2>0]为调节参数;[e1]和[e2]表示分量为1的列向量;[ξ1∈Rm1]和[ξ2∈Rm2]为松弛向量,其几何意义十分明了,即用一对非平行超平面尽量去拟合相应类别。新的样本点的预测函数为:
[Classi=argmini=1,2|ωTix+bi|∥ωi∥] (5)
根据理论计算,传统SVM算法的复杂度为[m3],[m]为样本规模。TSVM算法由于是处理两个接近原来样本规模一半的问题,所以复杂度为[2×m23=m34]。因此,在相同核方法和优化条件下,TSVM的处理速度接近SVM的4倍。
2 数据与方法
2.1 数据介绍
宽波段成像光谱仪是装载在“天宫二号”空间站上的新一代对地光学观测综合遥感器,主要为满足高性能海洋海岸带的水色水温监测需求而研制,同时兼顾陆地和大气探测。仪器包括14个在轨可编程的可见近红外(谱段范围为0.40~1.04 μm)光谱通道、2个短波红外通道(谱段范围为1.232~1.252 μm和1.630~1.654 μm)和2个热红外通道(谱段范围为8.125~8.825 μm和8.925~9.275 μm),3个谱段星下点的空间分辨率分别为100 m,200 m和400 m。本文选用的实验数据为南京地区500×500的遥感影像,区域概况如图1所示。由于数据属于中等分辨率,混合像元较多,目视解译选取训练样本困难。最终确定实验区域有六类地物类型,分别是:水体、林地、绿地、裸土、一类建筑、二类建筑(高反射),每类训练样本为1 500个。
2.2 方法流程
本文仅利用可见光近红外14个波段的数据进行分类实验。同时,原始数据为经过几何校正的二级辐亮度数据产品,由于大气校正精度对分类实验的影响不大,采用暗像元法进行大气校正,然后根据头文件中的太阳高度角以及每个波段的太阳辐照度,计算出地物反射率。根据计算出的NDWI(如式(6)所示,近红外为波段4,绿色为波段10),结合灰度共生矩阵提取其纹理特征。其基本原理是计算灰度图像各个灰度值之间在指定方向和距离上出现的次数,从而生成灰度共生矩阵,然后利用灰度矩阵计算出不同的二阶统计特征值,以此作为纹理测度。根据对比分析,以下四种纹理测度的区分度较好:协方差(Variance)、反差(Contrast)、熵(Entropy)、角二阶矩(Angular Second Moment,ASM)。
[NDWI=Green-NIRGreen+NIR] (6)
雖然可见光近红外范围内具有精细的光谱数据,给地物参数反演带来极大的便利,但对于地物分类来说,也是极大的数据冗余。根据波段间相关性分析,选取相关性小的4个波段(Band1,Band8,Band10,Band13)来分类,既可以减少数据量,又可以得出相对较好的效果[9]。结合选取出的4个纹理特征图像,一共8个特征组成新的图像作为分类输入特征。
实验数据预处理、相关性分析以及纹理特征的提取是基于ENVI 5.3软件上实现的。为比较两种支持向量机的训练速度,传统SVM与TSVM的分类均是基于Matlab 2014实现的,其中传统SVM使用了LibSVM库[10]。为了控制变量,TSVM与传统SVM分类时均采用“一对一”的分类模式。实验所用计算机的处理器为Intel i7?6700,3.40 GHz,内存为32 GB,系统为Windows 10专业版。
图2为分类实验的具体流程图。
3 结果分析
从图3可以发现,NDWI可以有效地提取出狭小水体,但不足的是受周围像元干扰,无法选取阈值。因此,在不干扰其他地物区分的基础上,选取4种区分度比较大的纹理特征,得到水体目标的空间信息。最终以相关性分析筛选出的第1,8,10,13波段加上4个纹理特征作为分类的输入图像。与不加纹理特征的原始图像的分类对比如图4所示。经过对比,狭小水体的分类效果大大提高,建筑、绿地、裸土范围内夹杂的狭小河流都得到区分;农田、建筑等其他地物的分类效果仅稍微有所变化,主要表现为城区部分绿地等混杂像元得以撇除。相对于图4i),纹理特征丰富了图4h)中的地物覆盖类型。
TSVM与SVM最大的不同在于,构建两个非平行的超平面,而不是一对最大间隔的平行超平面。这意味着,从一个较大的训练规模变成两个较小的规模,理论上来说速度变成4倍。但对于实际分类来说,速度的提升远没有4倍之多。在同样“一对一”的分类模式以及基于径向基核函数的分类情况下,每类训练样本选取个数为1 500个,基于SVM的分类时间为26.41 s ,基于TSVM的分类时间为14.27 s。原因在于,SVM实验使用的是LibSVM库,代码的优化提升了速度。对于分类精度,无论基于纹理特征还是原始图像,TSVM与SVM的效果相差不多。结合纹理特征的TSVM分类精度为87.861 3%,Kappa系数为0.854 3;结合纹理特征的传统SVM的分类精度为87.659 0%,Kappa系数为0.851 9;单纯基于TSVM的分类精度为81.088 6%,Kappa系数为0.773 2。混淆矩阵如表2所示。因此,结合纹理特征和TSVM的分类算法不仅时间将近缩短[12],而且在分类精度上提高了6.8%左右。最终,基于TSVM和纹理特征的总体分类效果如图5所示。
4 结 论
针对“天宫二号”宽波段成像光谱仪遥感影像分类中狭小水体难以区分的问题,本文提出一种结合双子支持向量机和纹理特征的快速分类方法。通过相关性分析减少特征波段,加上TSVM算法大大提升样本训练速度,从而提升总体分类速度。结合NDWI图像的纹理特征,很好地提升了分类精度。对于空间分辨率较低的多光谱遥感影像的分类具有较高的适用价值。不足的是,TSVM算法的遥感影像多分类应用还不够成熟,需要更多的优化算法,进一步提升分类速度和鲁棒性。同时针对不同影像的不同特点,结合其他地物参数的应用是下一步研究的重点。
致谢:感谢载人航天工程提供“天宫二号”宽波段成像仪数据产品。
注:本文通讯作者为汤瑜瑜。
参考文献
[1] 邵元海,杨凯莉,刘明增,等.从支持向量机到非平行支持向量机[J].运筹学学报,2018,22(2):55?65.
[2] MANGASARIAN O L, WILD E W. Multisurface proximal support vector machine classification via generalized eigenvalues [J]. IEEE transactions on pattern analysis and machine intelligence, 2006, 28(1): 69?74.
[3] LIU Z, ZHU L. A novel remote sensing image classification algorithm based on multi?feature optimization and TWSVM [C]// 9th International Conference on Digital Image Processing. Hongkong, China: SPIE, 2017: 12?17.
[4] KHEMCHANDANI R, CHANDRA S. Twin support vector mach?
ines for pattern classification [M]// NEOGY S K, BAPAT R B, DAS A K, et al. Mathematical programming and game theory for decision making. Singapore: World Scientific, 2007: 147?152.
[5] TASKIN G. A comprehensive analysis of twin support vector machines in remote sensing image classification [C]// 2015 23nd Signal Processing and Communications Applications Conference. Malatya: IEEE, 2015: 2427?2429.
[6] KUCUK C, TORUN Y, KAYA G T, et al. Remote sensing image classification by non?parallel SVMS [C]// 2014 IEEE Geoscience and Remote Sensing Symposium. Quebec: IEEE, 2014: 1269?1272.
[7] 胡根生,陈长春,张学敏,等.LS?WTSVM的遥感多光谱影像云检测[J].安徽大学学报(自然科学版),2014(1):53?60.
[8] 王立国,杜心平.K均值聚类和孪生支持向量机相结合的高光谱图像半监督分类[J].应用科技,2017(3):12?18.
[9] KAYA G T, TORUN Y, KUCUK C. Recursive feature selection based on non?parallel SVMs and its application to hyperspectral image classification [C]// 2014 IEEE International Geoscience and Remote Sensing Symposium. Quebec: IEEE, 2014: 3558?3561.
[10] CHANG C C, CHIH J. LIBSVM: A library for support vector machines [J]. ACM transactions on intelligent systems and technology, 2011, 2(3): 21?27.
作者简介:金鹏飞(1994—),男,博士研究生,研究方向为遥感及成像光谱技术。
汤瑜瑜(1981—),女,副研究员,主要从事空间遥感及模拟技术方面的研究工作。