基于非正定OCSVM的高光谱影像地物异常检测

2016-04-09 08:15秦进春余旭初
测绘工程 2016年4期
关键词:支持向量机

秦进春,余旭初,张 丽,孙 笛

(1.西安测绘研究所,陕西 西安 710054;2.地理信息工程国家重点实验室,陕西 西安 710054;3.信息工程大学,河南 郑州 450001)



基于非正定OCSVM的高光谱影像地物异常检测

秦进春1,2,余旭初3,张丽1,2,孙笛1,2

(1.西安测绘研究所,陕西 西安 710054;2.地理信息工程国家重点实验室,陕西 西安 710054;3.信息工程大学,河南 郑州 450001)

摘要:针对基于高斯径向基核函数的OCSVM等异常检测算法,对地物光谱变异极为敏感,导致算法异常检测性能不稳定的问题,根据光谱角度余弦测度对光谱形状相似性的描述不受地物光谱辐射强度变异影响的特性,将具有非正定核特性的光谱角度余弦核测度引入非正定SVM算法中,提出一种基于非正定OCSVM的高光谱影像地物异常检测算法。利用四组模拟数据进行目标异常检测实验,结果表明,该算法能够有效检测出高光谱影像数据中的目标地物,检测精度提升明显。

关键词:高光谱影像;光谱角度余弦核测度;支持向量机;非正定单类支持向量机;异常检测

高光谱遥感与合成孔径雷达、激光测距一起被誉为最具发展潜力的新型遥感数据获取技术,其进步之处就在于获取地物连续光谱影像的同时,将目标的辐射光谱信息与空间图像信息有机结合在一起[1]。通过挖掘高光谱影像数据信息进行目标检测正成为遥感数据应用领域的研究热点之一。根据目标光谱信息挖掘程度的不同,目标检测主要分为异常检测和光谱匹配检测两大类[2]。

异常检测方法是面向原始高光谱数据进行操作的,不需要待检测目标的光谱先验知识[3],因此得到快速发展。RX检测[4]是异常检测算法的典型代表,其可很好地解决多元正态分布假设下异常目标的判断问题。但是地物的复杂多样性,使高光谱影像很有可能不满足高斯分布的假设,此外高光谱影像数据具有特征维数高、特征相关性强以及非线性可分的特点,在上述因素共同作用下,导致RX异常检测结果通常具有较高的虚警率。

单类(One-class SVM,OCSVM)是SVM的一种分支算法[5],目前已经在包括高光谱影像的异常检测[6]和地物识别[7]在内的多个领域中[8-9]得到应用。文献[6]提出基于OCSVM原理的高光谱影像异常检测算法,该算法通过核函数隐式映射的方式处理非线性可分的高光谱影像数据,与RX等异常检测算法相比,即使数据不满足高斯分布假设也能有效控制异常检测虚警率。

但是OCSVM异常检测算法也有其固有的局限性,其采用的高斯径向基正定核函数的基础是两个向量之间的欧氏距离,对于同类地物的两条光谱向量而言,度量精度受向量强度变化影响较大,对光照、地形、分布等环境因素的变化非常敏感。针对此局限,将光谱角度余弦核测度[10]引入到非正定SVM中,设计出基于非正定核OCSVM原理的高光谱影像异常检测算法。

1基于非正定OCSVM的地物检测

正定OCSVM主要有两种技术实现途径,即基于超平面的OCSVM算法和采用支持向量数据描述的SVDD算法[11]。两种技术途径的出发点虽然不同,但是两种算法都遵循结构风险最小化原则,并且使用满足Mercer条件的正定核函数将数据隐式映射到高维特征空间中来处理非线性可分问题。要将基于超平面的OCSVM算法在非正定核函数条件下进行推广,就需要研究有别于正定核函数处理的方法。

1.1光谱角度余弦核测度

光谱角度余弦测度对光谱形状相似性的描述使其不受辐射强度变异的影响,因此,本文采用文献[10]提出的光谱角度余弦核测度代替RBF,该测度仿照RBF的形式,但却是以光谱角度余弦作为基础,其表达式为

(1)

式中:Cij是由式(2)计算得到,要求初始设置参数θ>0,计算结果kc满足核函数非负性和对称性的特性。

(2)

为了验证式(1)的非正定性可以用反例法证明,即利用模拟器随机得到100个具有30维的数据向量,并且假设θ=1,根据式(1)可以计算出向量的Gram矩阵。对Gram矩阵进行特征分解,将得到的特征值从小到大排列,可得到其前70个小于0的特征值所构成的特征值曲线,从图1曲线分析可知光谱角度余弦核测度是不满足mercer条件的非正定核。

图1 光谱角度余弦核Gram矩阵特征值曲线

1.2非正定OCSVM算法

(3)

以核矩阵K的非半正定相似矩阵KO代替核矩阵K参与计算,借鉴答解非正定SVM分类问题的思路,NPD-OCSVM目标函数模型为

(4)

求解式(4)中内侧的最小化问题,得到优化后的核矩阵K*的显示表达式为

(5)

将式(5)引入式(4)变形计算得到一个关于α的凸优化目标函数,

(6)

参考文献[6]采用处理非正定SVM目标函数的优化算法来处理NPD-OCSVM目标函数的优化问题。文献[12]提出两种数值优化方法,分别是投影梯度法与解析中心割平面法,相比而言投影梯度法的计算效率较高,考虑到异常检测对时效性的要求,本文在对式(6)进行二次平滑的基础上,选用投影梯度法对目标函数进行优化。

1.3光谱角度余弦核参数设置

与高斯核宽σ类似,通过改变光谱角度余弦核的参数θ的大小,起到控制支持向量数量的效果。

1)设置一组θ的预选值,记为θ={θ1,θ2,…,θn}。

2)对于待检测的高光谱影像数据集HSI,从中选择K组样本,每组样本都由随机选择的M个样本构成。

3)以θ的第i个元素θi作为光谱角度余弦核的参数,基于NPD-OCSVM的方法采用每组随机选择的样本进行训练,记录每组样本中支持向量的个数nSVs={nSVs1,nSVs2,…,nSVsk},并按照式(7)计算支持向量比例的均值。

(7)

4)重复步骤3)使θ中的每个元素都得到利用,并得到一组支持向量比例的均值,记为p={p1,p2,…,pn}。

5)按照式(8)从θ中选择合适的值:

(8)

2实验

基于NPD-OCSVM的异常检测算法根据待检测目标的尺寸与影像的空间分辨率,选择合适的空心窗口内外尺寸,在确定合适的光谱角度余弦核参数θ后,逐像素对影像进行异常检测。由于缺乏地面实测数据的支持,真实影像中的目标与背景属性信息都难以确定,不利于算法的定量评价。因此,利用真实高光谱影像样本构建4组模拟数据,其中两组为多光谱模拟数据,同时采用多/高光谱数据进行对比实验,是为了验证特征维数和特征间相关性的增加对检测结果的影响。

2.1实验数据

第一组真实影像由AVIRIS成像光谱仪获取,影像区域为美国佛罗里达州肯尼迪空间中心(Kennedy Space Center,KSC),获取时间为1996年3月23日,影像样本信息如表1所示。有效数据共计155个波段,根据信噪比大小确定5~97和105~131波段范围内的120个波段。

第二组真实影像由Hyperion成像光谱仪获取,影像区域为南非博茨瓦纳(Botswana)某三角洲地区,获取时间为2001-05-31,影像样本信息如表2所示。原始数据共计242个波段,根据信噪比大小确定10~55、82~97、102~119、134~164、187~220波段范围内的145个波段。

表1 KSC影像样本信息

表2 Botswana影像样本信息

图2 模拟影像目标分布示意

两组模拟高光谱影像数据分别由KSC和Botswana影像的样本构成,大小都为200×200像元。第一组模拟高光谱影像数据(记为KSC_Hyper)的背景由KSC影像的第1~12类样本随机排列构成,目标构成方法则从第13类样本中随机选择100个像元并随机填充至25个2×2像元大小的目标位置,如图2所示。第二组模拟高光谱影像数据(记为Botswana_Hyper)的构成方法与之类似,只是其背景是由Botswana影像的第2~14类样本构成,目标则是由第1类样本构成。

两组模拟多光谱影像数据则是分别通过对两组模拟高光谱影像数据的等间隔波段选择得到的10个波段数据构成。第一组模拟多光谱影像数据从KSC_Hyper中得到,记为KSC_Multi,第二组模拟多光谱影像数据从Botswana_Hyper中得到,记为Botswana_Multi。

2.2实验结果

使用NPD-OCSVM、SVDD和RX三种异常检测算法分别对上述模拟数据进行异常检测,高光谱影像模拟数据目标异常检测结果的ROC曲线如图3所示,多光谱影像模拟数据目标异常检测结果的ROC曲线如图4所示。异常检测算法运行时间如表3所示(时间保留小数点后两位)。

图3 两组高光谱影像数据异常检测结果ROC曲线

图4 两组多光谱影像数据异常检测结果ROC曲线

数据名 算法名 Botswana_HyperBotswana_MultiKSC_HyperKSC_MultiRX143.761.12133.431.03SVDD213.2112.83199.7111.04NPD-OCSVM674.88103.43643.5899.58

2.3实验分析

通过观察图4和图5所示的ROC曲线可知,NPD-OCSVM和SVDD这2类非线性检测算法的精度要明显优于RX算法,而NPD-OCSVM与SVDD相比也具有精度上的优势,并且这种优势在对高光谱数据的处理中更加明显。从表3中发现,NPD-OCSVM的训练效率较低,主要原因在算法结构和算法实现上,首先,本文中NPD-OCSVM算法是基于Matlab框架实现的,相比于利用C代码进行性能优化的SVDD算法有一定的不足;其次,NPD-OCSVM算法核矩阵构建、优化的计算复杂度较高,也在一定程度上限制了算法的运行效率。利用4组模拟数据进行实验验证,但是NPD-OCSVM算法本质上是核方法,核函数特性稳定,能够适应多波段影像复杂目标异常检测任务。

3结束语

本文结合文献分析正定核OCSVM在实际应用中的局限和不足,将光谱角度余弦核测度引入到非正定SVM中,并推广形成一种非正定OCSVM算法,在此基础上提出基于非正定OCSVM的目标异常检测算法,详细分析算法流程。同时设定4组模拟数据进行目标异常检测实验,通过与RX和正定核OCSVM算法运行结果进行对比分析可见,基于非正定OCSVM的高光谱影像目标异常检测算法是有效的,能够提高目标异常检测精度。

[1]杨国鹏,余旭初.高光谱遥感影像的广义判别分析特征提取[J].测绘科学技术学报,2007,24(2):101-105.

[2]范金华,陈锻生.高光谱图像目标检测研究进展[J].微型机与应用,2015(16):8-10.

[3]MANOLAKIS D.Taxonomy of detection algorithms for hyperspectral imaging applications[J].Optical Engineering,2005,44(6):1-11.

[4]REED I S,YU X.Adaptive multiple-band CFAR detection of an optical pattern with unknown spectral distribution[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1990,38(10):1760-1770.

[5]高燕,周成虎,苏奋振.基于OLI影像多参数设置的SVM分类研究[J].测绘工程,2014,23(6):1-5.

[6]BANERJEE A,BURLINA P,DIEHL C.A support vector method for anomaly detection in hyperspectral imagery[M].IEEE Transactions on Geoscience and Remote Sensing,2006,44(8):2282-2291.

[7]陈伟,余旭初,张鹏强等.基于一类支持向量机的高光谱影像地物识别[J].计算机应用,2011,31(8):2092-2096.

[8]JIN H L,LIU Q S,LU H Q, et al.Face detection using one-class SVM in color images[C].Proceddings of the 7th International Conference on Signal Processing.Beijing:Publishing House of Electronics Industry,2004:1431-1434.

[9]LI K L,HUANG H K,TIAN S F,et al.Improving one-class SVM for anomaly detection[C].Proceedings of the Second International Conference on Machine Learning and Cybernetics.Xi’an:Xi’an Jiao Tong University Press,2003:3077-3081.

[10] 陈伟,余旭初,张刚,等.基于新型相似性测度的高光谱影像地物检测[J].测绘科学技术学报,2012,29(1):42-46.

[11] SCHÖLKOPF B,PLATT J C,SHAWE-TAYLOR,et al.Estimating the support of a high-dimensional distribution[M].Microsoft Research Corporation,1999a.

[12] LUSS R,D’ASPREMONT A.Support vector machine classification with indefinite kernels[M].Advances in Neural Information Processing Systems.Cambridge:MIT Press,2008:953-960.

[责任编辑:李铭娜]

Anomaly detection based on indefinite OCSVM method in hyperspectral imagery

QIN Jinchun1,2,YU Xuchu3,ZHANG Li1,2,SUN Di1,2

(1.Xian Research Institute of Surveying and Mapping,Xian 710054,China;2.State Key Laboratory of Geo-information Engineering,Xian 710054,China;3.Information Engineering University,Zhengzhou 450001,China)

Abstract:The anomaly detection performance of OCSVM based on Gaussian Radial Basis Function (RBF) is sensitive to the spectral variation coming from radiation intensity variation.As the description of spectral shape similarity based on spectral Angel Cosine Measure is not affected by the variation of spectral radiation intensity,a non-positive definite kernel named as spectral Angel Cosine Kernel Measure is proposed,and applied to anomaly detection based on an indefinite SVM method in hyperspectral imagery.The experiments are carried on with four groups of simulated hyperspectral image.Experimental results have shown that this method can effectively detect the target in hyperspectral image data and the accuracy of detection is improved significantly.

Key words:hyperspectral image;spectral angel cosine kernel measure;support vector machine;indefinite one-class SVM;anomaly detection

中图分类号:TP391.413

文献标识码:A

文章编号:1006-7949(2016)04-0037-05

作者简介:秦进春(1989—),男,硕士.

基金项目:国家自然科学基金资助项目(41201477)

收稿日期:2015-08-29

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究