田 淞, 宋建社, 张雄美, 任伟龙
(1. 第二炮兵工程大学七系, 陕西 西安 710025;
2. 重庆通信学院二系, 重庆 400035)
KM-SVM法的SAR图像无监督变化检测
田淞1,2, 宋建社1, 张雄美1, 任伟龙1
(1. 第二炮兵工程大学七系, 陕西 西安 710025;
2. 重庆通信学院二系, 重庆 400035)
摘要:针对合成孔径雷达(synthetic aperture radar, SAR)图像变化检测获得有标记样本的数量十分有限且困难,传统方法检测率低等问题,提出了一种基于原始特征空间的K均值和支持向量机(K-means and support vector machine, KM-SVM)法SAR图像无监督变化检测。首先,不需要任何先验信息的条件下,利用K-means聚类方法获取差异图像的分类阈值;其次,利用阈值,引入偏移量,自动选取伪训练集和无标签集,并用伪训练集定义SVM的初始决策超平面;最后,用基于统计特征的半监督学习算法和支持向量机相结合对图像进行变化类与非变化类的分类。实验结果表明:该算法优于基于混合高斯分布模型的KI法和基于广义高斯分布模型的KI法,能保持较好的分类、泛化能力和较稳定的检测精度。这些结果表明了文中方法的有效性。
关键词:合成孔径雷达图像; 变化检测; 半监督学习; K-均值聚类; 支持向量机
0引言
变化检测是指给定同一地区或同一目标在不同时间获得的配准后的遥感图像,采用图像处理的方法检测出该地区(或目标)地物的变化情况,通过对不同时相遥感图像的综合分析获取变化信息,是实现遥感监测的重要手段。合成孔径雷达(synthetic aperture radar,SAR)因具有全天候、全天时、宽幅成像、多极化、可变观测角、穿透能力强和高分辨率等特点,SAR图像变化检测已成为当前遥感监测的前沿技术之一。目前,SAR图像变化检测技术已广泛应用于自然灾害监测、植被和森林变化、地面目标监视[1-7]等领域。
SAR图像变化检测的典型方法有:比较后分类,分类后比较和联合分类,其中比较后分类方法具有简单、直观、易于理解等优点被广泛关注,如基于混合高斯分布模型的EM法[8]、基于混合高斯分布模型的KI法(KI threshold selection criterion based on Gaussian model, GM-KI)、基于广义高斯分布模型的EM法[9]、基于广义高斯分布模型的KI法(KI threshold selection criterion based on general Gaussian model, GGM-KI)[10]、基于广义Gamma模型的KI法[11],还有采用瑞利-高斯模型[12]、非高斯分布模型[13]方法等。这些方法通常需要假定差异图像上变化类与无变化类灰度值的统计分布模型,统计分布不同,选取的阈值也就不同。当假设的统计分布模型能恰当的反映SAR图像不同类别分布时,这些方法就能有效提取出变化信息;当图像不同类别差异较小或图像受噪声影响严重,使这些先验信息不恰当时,这些方法通常难以获得满意的效果,特别是当变化类和无变化类的灰度值分布是相互交叠时,基本不能实现变化信息的有效获取。
基于上述分析,提出了K均值和支持向量机(K-mean and support vector machine, KM-SVM)法的SAR图像无监督变化检测方法。该方法利用K-means聚类算法获取差异图像在原始特征空间上的伪训练集和无标签集;在此基础上,利用伪训练集和无标签集数据信息共同训练SVM[14-15]后,用SVM完成变化检测,无需任何先验信息实现最优变化检测的目的。
1基于KM-SVM的SAR图像变化检测方法
设I1和I2分别为t1,t2时刻,同一区域,经配准后的SAR图像,大小均为P×Q。分别对图像I1和I2进行预处理,预处理包括对SAR图像的辐射、几何定标等处理。ωu,ωc分别为图像像素无变化类和变化类集合,即Ω={ωu,ωc}。算法分为3步:①对数比值差异图构造;②K-means聚类算法获取伪训练集和无标签集;③使用混合样本训练SVM,利用无标签集样本信息,得到一个泛化性能更好的分类器。
1.1对数比值差异图构造
差异图构造应使Ω中的2类差异增强,便于检测分类。SAR图像中存在相干斑噪(specklenoise,SN),它是由SAR的工作机制造成的,为了减低其对后续处理的影响。本文采用对数比值算子构造差异图像XDI,即
(1)
采用对数比值算子构造差异图有3个主要优点:一是比值差异图像的分布仅与图像I1和I2强度的相对变化有关,与像素强度的大小无关。无论区域内像素的强度强或弱,变化检测的尺度是相同的;二是比值算子具有更强的鲁棒性。因为SAR成像过程中产生的乘性辐射误差,能够在重复轨道成像中精确重现,比值算子可以消去这种误差。三是对比值算子取对数,可以减小比值差异图像的波动范围,便于变化检测处理。
1.2伪训练集和无标签集的生成
在SAR图像变化检测过程中,先验信息的获取是困难的;另外由于相干斑噪的影响,获得的先验信息存在较大误差,而聚类分析是一种无监督方法,不需要任何先验信息。K-means是一种简单、常用的聚类方法。首先选择2个样本作为初始聚类中心,按照聚类域中所有样本到聚类中心的距离平方和最小的原则,使其他样本向各个中心聚集,然后判断分类是否合理,不合理则继续迭代,直到聚类中心不再发生改变为止。得到2个聚类中心值{k1,k2},从而获得阈值T(即T=[max{k1,k2}+min{k1,k2}]/2)。T是无变化类ωu和变化类ωc的粗分类阈值,靠近阈值T附近的像素处在2种类别的临界状态,受到误差影响,一般分类精度较低,直接分类效果较差。但阈值T是正确定义伪训练集Xp的一个参考点,如图1所示,首先把不确定其标签的区域定义为无标签集Xu,有
(2)
同时,具有高概率属于ωu和ωc的样本定义为伪训练集Xp,有
(3)
式中,ε是用于确定伪训练集和无标签集的边界调整系数。ε值越大,Xp中样本数量越少,可靠性越高;反之,则Xp中样本数量越多,可靠性越低。ε的设置应保证Xp中样本获得正确标签的概率较高。伪训练集中无变化类和变化类标签分配如下:
(4)
一般情况下,ε的取值根据差异图像的灰度值范围确定。也可以定义更为复杂的ε取值方法,但考虑到计算复杂度和对最终变化检测结果影响,根据经验一般取ε=0.5。
图1 伪训练集和无标签集生成示意图
1.3SVM的半监督学习分类检测
这一部分的主要思想是在多时相SAR图像的原始特征空间中定义决策函数,把无变化类和变化类样本精确分类。伪训练集样本的选取是基于平衡折中方法,不能完整表述无变化类和变化类的统计特征,因此利用无标签样本信息可以进一步提高SVM的分类和泛化能力[16]。
核函数选择——在支持向量机中核函数起着非常重要的作用,它能够解决非线性问题和维数灾难问题。核函数的作用是代替高维特征空间中的内积运算,从而避免复杂的高维运算。统计学习理论指出,只要对称函数K(x,y)满足Mercer条件就能作为核函数[17]。当缺乏先验信息或先验信息不可靠时,最好的方法是选用球面核[18],即高斯径向基函数核:
初始化—利用标准SVM作为代价函数和伪训练集Xp(包含伪变化类数据和伪无变化类数据)获得初始分类超平面。
(5)
式中,C1是正则化参数;φ(·)是非线性映射函数;n表示伪训练样本数量;为处理不可分样本,引入伪训练样本的松弛变量ξp;根据标准SVM的符号要求,ωu和ωc的类标签分别用“-1”和“+1”表示,即yp∈{ωu,ωc}≡{-1,+1}。
半监督学习—无标签集样本通过半监督学习后,SVM使用伪训练集和无标签集组成的混合样本进行训练,得到一个分类和泛化性能更好的分类器。文中采用的半监督学习SVM是利用无标签样本的均值特征,替代估计每一个无标签样本标签,得到最优分类超平面。
半监督SVM的优化问题[19]为
(6)
式中,ξp和ξu为伪训练样本和无标签样本的松弛变量,以及相应的惩罚系数C1和C2;n表示伪训练样本数量;m表示参与训练的无标签样本数量。为了构造无标签集Xu中的2类样本均值统计特征,则
(7)
(8)
即
(9)
因此,式(7)和式(6)是等价的。由于
(10)
得
(11)
(12)
(13)
式中,α=[α1,…,αN,αN+1,αN+2]T为Lagrange乘子,y=[y1,…,yN,1,-1]T为类标签集,Kij=(φi)T(φj)为核函数,其中非线性映射函数为
使用交替优化算法求解式(13),得到最终分类超平面。
2实验结果及分析
为了验证上述算法的有效性,进行了相关实验,这里给出2组实验,验证本文算法的有效性。
2.1数据描述
实验1的SAR图像如图2所示。变化检测原始图像分别为1997年5月和8月加拿大渥太华地区的Radarsat-1SAR影像,如图2(a)和2(b)所示。图像尺寸均为350×290,灰度级为256,配准误差为1.5个像素左右。前后两时相的变化信息主要是因为5月雨季来临,洪水淹没了部分陆地所致。图2(c)为变化检测参考图,图中的白色像素表示两时相间发生变化的区域,像素个数为16 049。
图2 渥太华地区水灾SAR图像
实验2的SAR 图像如图3所示。变化检测原始图像是分别在1999年4月和5月瑞士Bern城市ERS-2的SAR图像。前一时相的SAR图像是在水灾发生前获取的,如图3(a)所示;后一时相的SAR图像是在水灾发生后获得的,图像中阴暗部分为洪水淹没区域,如图3(b)所示。图像大小均为 301×301像素,灰度级为256。图3(c)为变化检测参考图,图中白色像素表示两时相间发生变化区域,像素个数为1 155。
其中支持向量机优化后的参数选择为C1=100,C2=0.1,高斯核宽度2σ2∈(0.1,1)。
图3 Bern城市水灾SAR图像
2.2实验结果
实验 1对数比算子生成的差异图XDI,max(XDI)为4.060 4,min(XDI)为0。根据K-means聚类得到的阈值T=1.104 7,取ε为0.5,按照规则伪训练集Xp中xp≤0.552 35属于无变化类ωu共71 457个样本,xp≥1.657 05属于变化类ωc共8 784个样本,无标签集Xu样本为21 259个。SVM是小样本情况下的机器学习,其分类超平面仅与支持向量有关,因此对伪训练集和无标签集重采样,测试KM-SVM方法的分类和泛化能力,以及利用无标签样本的开放式半监督学习能力。在学习过程中充分利用样本均值统计特征,提高学习效率;并与GM-KI和GGM-KI法的检测结果进行比较,如表1和图4所示。
表1 渥太华地区水灾图像变化检测结果分析
图4 渥太华地区变化检测结果
实验 2对数比算子生成的差异图XDI,max(XDI)为5.347 1,min(XDI)为0。根据K-means聚类得到的阈值T=1.649 1,取ε为0.5,按照规则伪训练集Xp中xp≤0.824 55属于无变化类ωu共87 239个样本,xp≥2.473 65属于变化类ωc共624个样本,无标签集Xu样本为2 738个。实验结果如表2和图5所示。
表2 Bern城市水灾图像变化检测结果分析
图5 Bern城市变化检测结果
2.3实验分析
利用典型变化检测算法,包括GGM-KI算法和GM-KI算法,与KM-SVM算法相比较,表1和表2分别给出检测结果。从表中数据可以得出以下几点结论。
(1) GGM-KI算法要优于GM-KI算法,这是因为广义高斯统计分布模型的适用范围更广。
(2) 对于GGM-KI算法和GM-KI算法,表1和图4显示的变化检测结果较好,而表2和图5的结果相对较差,是因为GGM和GM模型与渥太华数据集数据模型更匹配。充分说明基于统计分布模型的检测算法结果受统计分布模型选择的影响较大。
(3) KM-SVM算法得到更优的结果,并且检测结果相对稳定,这是因为KM-SVM算法不需要模型选择,并且SVM支持非线性分类,对于不同类别相互交叠的情况,也有较好的分类能力。
(4) 在2组实验中,KM-SVM算法的检测精度分别提高了8%和13%,是因为利用了无标签集的数据信息,能够进一步优化分类决策超平面。
(5) 在运算时间上,KM-SVM算法明显比GGM-KI算法和GM-KI算法要长,主要是半监督学习过程运算量较大,时间耗费较多。
3结论
本文提出的KM-SVM法的SAR图像变化检测,通过半监督学习,提取无标签数据信息,可以获得较稳定、较好的变化检测结果,不会随着SAR图像数据源的变化而出现较大波动。该方法是一种无监督的方法,首先用K-means算法对对数比值差异图进行聚类,得到粗分类的阈值,对该阈值加上松弛量将像素点分成有标签的伪训练样本和无标签样本;然后,联合利用伪训练样本和无标签样本训练SVM,此时,是用无标签样本均值特征来修正由伪训练样本训练得到的初始分类面,得到更优的分类超平面,以提升检测效果。实验结果证明,该方法可行、有效。下一步工作是利用图像空间上下文信息进一步提高变化检测精度。
参考文献:
[1] Bouaraba A, Younsi A, Belhadj A A, et al. Robust techniques for coherent change detection using cosmo-skymed SAR images[J].ProgressinElectromagneticsResearchM, 2012, 22:219-232.
[2] Lincy P, Dr Ramamoorthy P. Synthetic aperture radar image change detection using fuzzy C-means clustering algorithm[J].InternationalJournalofAdvancedResearchinComputerandCommunicationEngineering, 2013, 2(3):1374-1379.
[3] Meghana P M K, Ravikumar A V. Robust technique for change detection in multitemporal synthetic aperture radar images[J].InternationalJournalofScientific&EngineeringResearch, 2013, 4(7):2228-2235.
[4] Radke R J, Andra S, Al-Kofahi O, et al. image change detection algorithms:a systematic survey[J].IEEETrans.onImageProcessing, 2005, 14(3):294-307.
[5] Fransson J E S, Walter F, Blennow K, et al. Detection of storm-damaged forested areas using airborne CARABAS-II VHF SAR image data[J].IEEETrans.onGeoscienceandRemoteSensing, 2002, 40(10):2170-2175.
[6] Bovolo F, Marin C, Bruzzone L. A hierarchical approach to change detection in very high resolution SAR images for surveillance applications[J].IEEETrans.onGeoscienceandRemoteSensing,2013,51(4):2042-2054.
[7] Huang S Q, Liu D Z, Hu M X, et al. Multi-temporal SAR image change detection technique based on wavelet transform[J].ActaGeodaeticaetCartographicaSinica, 2010, 39(2):180-186.(黄世奇, 刘代志, 胡明星,等. 基于小波变换的多时相SAR图像变化检测技术[J].测绘学报, 2010, 39(2):180-186.)
[8] Bruzzone L, Fernandez P D. Automatic analysis of the difference image for unsupervised change detection[J].IEEETrans.onGeoscienceandRemoteSensing, 2000, 38(3):1171-1182.
[9] Bazi Y, Bruzzone L, Melgani F. Image thresholding based on the EM algorithm and the generalized distribution[J].PatternRecognition, 2007, 40(2):619-634.
[10] Hu Z L. An unsupervised change detection approach based on KI dual thresholds under the generalized Gauss model assumption in SAR images[J].ActaGeodaeticaetCartographicaSinica, 2013, 42(1):116-122.(胡召玲.广义高斯模型及KI双阈值法的SAR图像非监督变化检测[J].测绘学报,2013,42(1):116-122.)
[11] Gao C S, Zhang H, Wang C, et al. SAR change detection based on generalized Gamma distribution divergence and auto-threshold segmentation[J].JournalofRemoteSensing, 2010, 14(4):718-724.(高丛珊, 张红, 王超,等.广义Gamma模型及自适应KI阈值分割的SAR图像变化检测[J]., 遥感学报, 2010, 14(4):718-724.)
[12] Wang G T, Wang Y L, Jiao L C. Adaptive spatial neighborhood analysis and rayleigh-Gaussian distribution fitting for change detection in multi-temporal remote sensing images[J].JournalofRemoteSensing, 2009, 13(4):639-646.
[13] Moser G, Serpico S B. Generalized minimum-error thresholding for unsupervised change detection from SAR amplitude imagery[J].IEEETrans.onGeoscienceandRemoteSensing, 2006, 44(10):2972-2983.
[14] Zhang Y Y, Liu M H, Han T. Elevator-waiting people counting system based on mean shift segmentation and SVM classification[J].OpticsandPrecisionEngineering, 2013, 21(4):1079-1085.(张宇洋,刘满华,韩韬. 基于Mean Shift图像分割和支持向量机判决的候梯人数视觉检测系统[J].光学精密工程, 2013, 21(4):1079-1085.)
[15] Zhou Z H . Disagreement-based semi-supervised learning[J].ActaAutomaticaSinica, 2013, 39(11):1871-1878.(周志华. 基于分歧的半监督学习[J].自动化学报,2013,39(11):1871-1878.)
[16] Bruzzone L, Chi M, Marconcini M. A novel transductive SVM for semisupervised classification of remote-sensing images[J].IEEETrans.onGeoscienceandRemoteSensing, 2006, 44(11):3363-3373.
[17] Burges C J. A tutorial on support vector machines for pattern recognition[J].KnowledgeDiscoveryandDataMining, 1998, 2(2):121-167.
[18] Chapelle O, Vapnik V, Bousquet O, et al. Choosing multiple parameters for support vector machines[J].MachineLearning, 2002, 46(1):131-159.
[19] Bovolo F, Bruzzone L, Marconcini M. A novel approach to unsupervised change detection based on a semisupervised SVM and a similarity measure[J].IEEETrans.onGeoscienceandRemoteSensing, 2008, 46(7):2070-2082.
[20] Li Y F, Tsang I W, Kwok J T, et al. Tighter and convex maximum margin clustering[C]∥Proc.ofthe12thInternationalConferenceonArtificialIntelligenceandStatistics, 2009:344-351.
田淞(1975-),男,讲师,博士研究生,主要研究方向为遥感图像处理、模式识别。
E-mail:cqtianyi423@sina.com
宋建社(1954-),男,教授,博士研究生导师,主要研究方向为合成孔径雷达信号处理、图像处理、信息建模和系统工程。
E-mail:songjshe@126.com
张雄美(1983-),女,讲师,博士,主要研究方向为遥感图像处理。
E-mail:zxw.ok@163.com
任伟龙(1988-),男,博士研究生,主要研究方向为合成孔径雷达图像处理。
E-mail:renweilong350@163.com
网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20141121.0934.007.html
KM-SVM approach to unsupervised change detection in SAR images
TIAN Song1,2, SONG Jian-she1, ZHANG Xiong-mei1, REN Wei-long1
(1. 7thDepartment,SecondArtilleryEngineeringUniversity,Xi’an710025,China;
2. 2ndDepartment,ChongqingCommunicationInstitute,Chongqing400035,China)
Abstract:It is difficult to obtain training data in practical synthetic aperture radar (SAR)image change detection tasks, and the detection rates of classical methods are low. A K-means and support vector machine (KM-SVM) approach, which aims at extracting the change information in the original feature space without any training data, is proposed. First, the threshold of difference images is selected by the K-means clustering method. Second, an offset should be obtained for deriving an unlabeled set and a pseudo-training set that is necessary for initializing a binary support vector machine (SVM) classifier. Finally, according to a semi-supervised learning algorithm based on statistical characteristics, the SVM performs change detection by considering unlabeled data in definition of the decision boundary between unchanged and changed pixels. Experiment results show that, the proposed approach achieves better performance, higher generalization ability and more stable change detection precision, than the classical GM-KI, GGM-KI methods. These results prove the efficiency of the proposed approach.
Keywords:synthetic aperture radar (SAR)images; change detection; semi-supervised learning; K-means; support vector machine (SVM)
作者简介:
中图分类号:TP 751
文献标志码:ADOI:10.3969/j.issn.1001-506X.2015.05.10
基金项目:国家自然科学基金(61072141,61132008)资助课题
收稿日期:2014-05-04;修回日期:2014-10-23;网络优先出版日期:2014-11-21。