基于SAM与SVM的高光谱遥感蚀变信息提取

2013-07-19 08:44阎继宁周可法王金林王珊珊汪玮李东
计算机工程与应用 2013年19期
关键词:白云母高岭石波谱

阎继宁,周可法,王金林,王珊珊,汪玮,李东

1.中国科学院新疆生态与地理研究所新疆矿产资源研究中心,乌鲁木齐 830011

2.中国科学院新疆生态与地理研究所荒漠与绿洲生态国家重点实验室,乌鲁木齐 830011

3.中国科学院大学,北京 100049

基于SAM与SVM的高光谱遥感蚀变信息提取

阎继宁1,2,3,周可法1,2,王金林1,王珊珊1,汪玮1,李东1,2,3

1.中国科学院新疆生态与地理研究所新疆矿产资源研究中心,乌鲁木齐 830011

2.中国科学院新疆生态与地理研究所荒漠与绿洲生态国家重点实验室,乌鲁木齐 830011

3.中国科学院大学,北京 100049

1 引言

高光谱遥感技术是20世纪80年代遥感领域的最大成就之一,它在空间对地观测的同时获取众多连续波段的地物光谱图像,达到从空间直接识别地球表面物体的目的,因此高光谱遥感器一般又被称为成像光谱仪。与传统的多光谱扫描仪相比,成像光谱仪能够得到上百个波段的连续图像,且每个图像像元都可以提取一条光谱曲线[1]。这种“图谱合一”的特点,要求人们从光谱维去理解地物在空间维的变换,对二维空间图像的处理与分析需要转化成对每个像元所提取出的光谱曲线的处理与分析[2]。

蚀变矿物是围岩蚀变的产物,而围岩蚀变是热液矿床成矿作用发生的重要标志之一。围岩蚀变范围比矿体的范围大一至几十倍,近矿围岩蚀变形成的蚀变岩石与围岩的种类、结构、颜色等方面都有明显差异,这些差异决定了岩石反射光谱特征的差异,并在特定的光谱波段形成了蚀变岩石的特征光谱。应用遥感技术通过在卫星图像上识别特征光谱,提取围岩蚀变特征,是找矿的有效方法。

目前,常用的高光谱遥感矿化蚀变信息提取方法主要有光谱吸收指数(Spectral Absorption Index,SAI)、光谱特征拟合(Spectral Feature Fitting,SFF)、光谱角匹配技术(Spectral Angle Mapper,SAM)等[3-5]。其中,光谱角匹配技术是基于光谱维曲线相似性的一种度量方法,它通过计算波谱矢量之间的夹角来判断它们之间的相似性。夹角越小,说明两者的相似性越大。光谱角匹配技术识别能力强,并可以减弱光照和地形的影响,在地质填图中应用广泛[6]。但是,光谱角的大小只跟两个比较的光谱矢量方向有关,与其辐射亮度无关,当两种物质的波谱矢量方向相似而辐射亮度大小有差别时,区分效果较差。因此,本文提出SAM和SVM相结合的综合分类方法,使用美国内华达州Cuprite铜矿区的AVIRIS高光谱数据结合美国地质勘查波谱库(usgs_min.sli)进行实验,结果表明,该综合方法可以有效区分波谱矢量方向相似而大小差别的两种物质,有效避免信息的误提取。

2 光谱角匹配技术

SAM是一个基于自身的波谱分类方法,它是用n维角度将像元与参照波谱匹配,当模式类的分布呈扇状分布时,定义两矢量之间的广义夹角余弦为相似函数,即为应用较为广泛的广义夹角匹配模型。将像元n个波段的光谱响应作为n维空间中的矢量,则可以通过计算它与最终光谱单元之间的夹角来表征其匹配程度:夹角越小,表明其越相似(图1)。两矢量广义夹角余弦为:

图1 光谱角匹配技术二维示意图

则:

式中,n为波段数,X=(x1,x2,…,xn),Y=(y1,y2,…,yn)分别表示两个光谱向量在n波段上的响应值,α为光谱角。

最终光谱单元可从光谱库中得到,也可以直接从图像中通过选择训练区抽取出来。光谱夹角填图技术是把实测的(或收集的)端元曲线与影像的各个像元曲线进行对比,通过误差大小得到每个像元与纯净端元的距离,进行目标地物识别。其中,光谱单元之间的广义夹角阈值的选择要靠人为确定,阈值取得过大或过小,都会错分或漏分目标地物[7]。

3 支持向量机

支持向量机是一种基于统计学习理论的机器学习算法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的性能,并且具有强大的泛化能力[8]。其核心思想是以结构风险最小化为归纳原则,将数据映射到高维特征空间,在高维特征空间中构造具有低VC维的最优分类超平面作为判决面,使得线性可分的两类数据的间隔最大。对于特征空间非线性可分的情况,则通过核函数映射把数据非线性映射到高维特征空间,在高维特征空间中构造最优分类超平面[9]。

3.1 线性支持向量机

设线性可分样本集为(xi,yi),i=1,2,…,n,x∈Rd,y∈{+1,-1}是类别标号。d维空间中的线性判别函数:g(x)=wx+b,分类面方程可表示为:wx+b=0。

可以对它进行归一化,使得所有样本都满足|g(x)|≥1,即离分类面最近的样本满足|g(x)|=1,这样分类间隔就等于。因此,要求分类间隔最大,就是要求|w|(或|w|2)最小;而要求分类面对所有样本正确分类,就是要求满足:

因此,满足上述条件且使|w|(或|w|2)最小的分类面就是最优分类面(图2)。过两类样本中离分类面最近的点,且平行于最优分类面的超平面H1、H2上的训练样本,就是使上式等号成立的样本,称做支持向量。

图2 线性可分情况下的最优分类面

于是,求最优分类面问题可以转化为如下的约束优化问题:

这是一个二次凸规划问题,由于目标函数和约束条件都是凸的,根据最优化理论,这一问题存在唯一全局最小解。

应用Lagrange乘子法并满足KKT(Karush-Kuhn-Tucher)条件:

最后可得到解上述问题的最优分类函数为:

其中,sgn()为符号函数,a*、b*为确定最优划分超平面的参数,(xi·x)为两个向量的点积。由式(5)可知,非支持向量对应的ai都为0,因此式(6)求和实际只对少数支持向量进行。

3.2 非线性支持向量机

在线性不可分的情况下,可以在条件yi[wxi+b]-1≥0中增加一个松弛项ξi≥0成为[10]:

图3 线性不可分情况下的广义最优分类面

3.3 核函数

通过上面讨论,可以得出:最优分类函数(式(6))只包含待分类样本与训练样本中的支持向量的内积运算。可见,要解决一个特征空间中的最优线性分类问题,只需知道这个空间中的内积运算即可。对非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面。

根据泛函的有关理论,只要一种核函数K(xi,xj)满足Mercer条件,它就对应某一变换空间中的内积。因此,在最优分类面中采用适当的内积函数K(xi,xj)就可以实现某一非线性变换后非线性分类,而计算复杂度却没有增加。

常用的核函数有:

(1)线性核函数(linear kernel),k(x,xi)=(x·xi)。

(2)多项式核函数(polynomial kernel),k(x,xi)= (s(x·xi)+c)d,其中s、c、d为参数。显然,线性核函数可以看做多项式核函数的一种特殊情况。

(3)径向基核函数(Radical Basic Function,RBF),k(x,xi)=e-γ|x-xi|2,其中γ为参数。

(4)Sigmoid核函数(Sigmoid tanh),k(x,xi)=tanh(s(x·xi)+c),其中,s、c为参数。

4 实验与分析

4.1 实验数据

使用美国内华达州Cuprite铜矿区的AVIRIS(Airborne Visible Infrared Imaging Spectrometer,机载可见光/红外成像光谱仪)高光谱数据(图4),结合美国地质勘察波谱库(usgs_min.sli)进行实验。AVIRIS可提供光谱分辨率10 nm,地面像元分辨率20 m,光谱范围0.2~2.4µm的摆扫成像。

图4 美国内华达州Cuprite铜矿区的AVIRIS高光谱数据

Cuprite矿区被95号公路分成东西两个南北向拉长的蚀变区。东边区域主要出露岩层有第三系火山岩和第四系冲积岩,而西边区域主要出露层有寒武纪变质沉积岩、第三系火山岩和第四系冲积岩。经过Ashley和Abrams等人的填图结果可知此区域的蚀变主要可分为硅化带、蛋白石化带和泥化带。硅化区主要蚀变矿物为大量的石英以及部分方解石,少量的明矾石和高岭石;蛋白石化带分布广泛,主要是蛋白石和一定数量的明矾石和高岭石;泥化带主要有高岭石、蒙脱石和少量蛋白石。除上面提到的矿物外,在蛋白石化带和泥化带中还有低于5%的赤铁矿。实验区岩石出露良好,矿种组合多样,加上气候干燥,交通便利,从20世纪70年代起就成为地质研究的重要实验区[6,11]。

Clark和Swayze开发了最为典型的高光谱信息提取软件Tricorder,主要采用波形匹配和全波段谱形的最小二乘拟合方法进行矿物识别。其结果都经过了X-射线衍射分析等技术和野外检查进行了验证,准确性较高,可作为地面实况对比分析的基础[6]。Clark和Swayze的填图结果如图5所示[11]。

4.2 实验算法流程

基于SAM与SVM的高光谱遥感蚀变信息提取流程,如图6所示,主要分为3个步骤:光谱端元鉴别;蚀变信息提取;整体分类精度评估。

图5 Clark和Swayze对Cuprite矿区填图结果

图6 算法流程图

光谱端元鉴别主要是通过最大噪声分离变换,纯净像元指数等图像增强处理提取光谱端元;蚀变信息提取包括SAM蚀变信息提取,SVM再分类以及相应的精度评估;整体分类精度评估,即是对基于SAM与SVM高光谱遥感蚀变信息提取精度进行整体评价与分析。

4.3 实验结果

4.3.1 光谱端元鉴别

遥感器所获得的地面辐照度信息是以像元为单位记录,它是像元对应的地表物质光谱信号的综合。图像中的每个像元所对应的地表,往往包含不同的地表覆盖类型,它们有着不同的光谱响应特征[12]。因此,在蚀变信息提取之前,本文使用波谱“沙漏”向导对混合像元进行分解,在AVIRIS遥感数据上发现和绘制地物端元,分离出混合像元和极值像元,处理过程如下:

鉴于高光谱数据波段相关性强、数据冗余的特点,首先进行最大噪声分离变换(Maximum Noise Fraction transformation,MNF),实现降维与去噪作用,寻找影像的本征维数;其次,执行纯净像元指数算法(Pixel Purity Index,PPI)。PPI算法的实质是把端元往给定的投影线上投影,查看端元的投影次数,端元一般位于影像云点比较远的位置,从而端元投影的次数就比较多,也即处于凸多面体顶点的投影次数最多,而处于凸面体内部的端元投影次数较少[13]。最后,利用ENVI的N维可视化器(N-Dimensional Visualizer),在N维空间中选择所需的端元或通过PPI设定阈值来选定极值像元,用其来代表端元波谱。利用ENVI的波谱分析工具,选择SAM方法,对端元波谱与USGS标准光谱库进行对比分析。参照Clark和Swayze在Cuprite矿区的填图结果,同时考虑到USGS标准光谱库中缺少硅土(Silica)光谱曲线,且各类明矾石(Alunite)光谱差异性较小,因此最后确定的光谱端元鉴别结果为高岭石(Kaolinite)、白云母(Muscovite)、明矾石(Alunite)、地开石(Dickite)、水铵长石(Buddingtonite)5类。蚀变信息的提取目标也只针对这5类地物,如图7所示。

图7 SAM光谱端元鉴别结果

4.3.2 SAM蚀变信息提取

选择USGS标准光谱库中的高岭石(Kaolinite)、白云母(Muscovite)、明矾石(Alunite)、地开石(Dickite)、水铵长石(Buddingtonite)光谱曲线作为参考光谱,设定光谱夹角经验阈值0.10,选择SAM算法对经过混合像元分解后的影像进行光谱角匹配。由图7可以看出,Cuprite铜矿区相似矿物中比较典型的就是高岭石和白云母。这两种物质在2.2µm附近都有较强的吸收峰,且波谱矢量方向相似,只是辐射亮度大小不同。因此,仅仅采用基于波谱矢量方向的SAM分类方法无法将两种物质精确区分开来,最终确定的分类结果如图8所示。

选取高岭石(Kaolinite)、白云母(Muscovite)、明矾石(Alunite)、水铵长石(Buddingtonite)、地开石(Dickite)5类感兴趣区域作为SAM蚀变信息提取精度验证样本(表1),分别统计各类地物的像元数并计算用户精度及漏分误差(表2)。所谓用户精度是指从分类结果(如分类产生的类型图)中任取一个随机样本,其所具有的类型与地面实际类型相同的条件概率[14]。

图8 SAM蚀变信息提取结果(α=0.10)

表1 蚀变信息提取精度验证样本

表2 SAM分类像元统计

通过对比观察图5、图8及表2可以看出,仅仅依靠SAM光谱匹配方法,白云母仅有6个像素被提取出来,大部分被错分为高岭石,漏分误差高达99.50%,部分非高岭石物质也被错分为高岭石,这与Clark和Swayze在此地区的填图结果存在较大差别。因此,本文通过构建掩膜,分离出SAM光谱匹配结果的高岭石、白云母信息,采用SVM方法对其进行二次分类。

4.3.3 SVM再分类

参照Clark和Swayze在Cuprite矿区的填图结果,在掩膜之后的影像上选取高岭石(Kaolinite)、白云母(Muscovite),以及其他3类感兴趣区域,作为训练样本构建SVM分类器进行有监督的分类(表3)。

构建SVM分类器过程中,核函数的选取与惩罚函数C及核参数σ的取值对分类精度影响较大。鉴于RBF核函数分类能力不低于高阶多项式核函数和Sigmoid核函数的特点[15],本文选取的映射函数为径向基核函数(RBF),因此需要确定的参数为核参数σ和惩罚因子C。核参数σ主要影响SVM中样本数据在高维特征空间中分布的复杂程度,而惩罚因子C调节SVM经验风险和置信范围的比例,实现经验风险和推广能力的折衷[16]。

表3 SVM再分类训练样本

选取表1的高岭石(Kaolinite)、白云母(Muscovite)验证样本进行SVM分类精度评估。采用Hsu等提出的网格搜索法[17]并结合分类精度评估结果进行参数寻优,以确定C和σ的取值,如表4所示。

由表4可以看出,从C=100开始所有的识别精度是不变的,这对SVM来说是没有意义的。因此,最后确定C=100,σ=0.01为最佳参数。此时的总体分类精度是81.588 6%,Kappa系数为0.707 5。将SVM再分类的高岭石(Kaolinite)、白云母(Muscovite)与SAM提取的明矾石(Alunite)、地开石(Dickite)、水铵长石(Buddingtonite)合并,得到最终分类效果如图9所示。

图9 SVM二次分类效果图(C=100,σ=0.01)

由图9可以看出,大量的高岭石、明矾石(图9:Alunite;图5:Alunite#1,Alunite#2,Alunite#3)主要分布在95号公路东西两侧;大量的白云母(Muscovite)和少量的地开石(Dickite)分布在公路西侧;少量的水铵长石(Buddingtonite)夹杂着分布在公路两侧的明矾石中间。这与Clark和Swayze的填图结果(图5)基本一致。

表4 SVM参数寻优及分类精度评估

4.3.4 整体分类精度评估

选取SVM再分类的高岭石(Kaolinite)、白云母(Muscovite),并与SAM提取的明矾石(Alunite)、地开石(Dickite)、水铵长石(Buddingtonite)合并,选取表1全部的验证样本进行整体分类精度评估(表5)。可得整体分类精度为78.172 6%,Kappa系数为0.712 5。可以看出,经过SAM、SVM综合分类模型所得结果较SAM蚀变信息提取总体分类精度和Kappa系数均有较大提高。较SVM高岭石(Kaolinite)、白云母(Muscovite)单独再分类总体精度低,这是由于其他3种矿物分类精度误差传递所致,而高岭石(Kaolinite)、白云母(Muscovite)用户精度均有较大提高,说明综合分类模型对于相似矿物的区分效果良好;Kappa系数较SVM再分类稍高,说明SAM、SVM综合分类模型所得各类地物整体一致性较好。

表5 SAM、SVM综合分类模型整体精度评估表

5 结论

光谱角匹配技术通过计算参考光谱与待分类地物光谱之间的夹角大小进行地物分类,但是当两种矿物的波谱矢量方向相似时,仅仅依靠SAM方法并不能有效区分,需要借助其他方法进行地物二次分类。本文通过分析SAM算法仅考虑波谱矢量方向,忽略辐射亮度大小的缺点,提出SAM与SVM相结合的综合蚀变信息提取模型,利用支持向量机对光谱角匹配技术不能有效区分的相似矿物进行二次分类,选用网格搜索法并结合分类精度评估进行参数寻优。从分类结果看,该模型提取的蚀变信息分类精度为78.172 6%,Kappa系数为0.712 5,效果较好。本文模型有效避免了波谱矢量方向相似,辐射亮度大小存在差异的两种物质的错分现象,对于解决相似性矿物的精确分类具有普适性意义。但是,本文在利用SAM算法进行地物光谱匹配时,波谱角阈值的选择是通过经验值确定的,具有一定的盲目性。因此,如何更为合理地确定SAM算法的波谱角阈值,是今后有待解决的重点问题。

[1]童庆禧,张兵,郑兰芬.高光谱遥感——原理、技术与应用[M].北京:高等教育出版社,2006:15-20.

[2]张兵.时空信息辅助下的高光谱数据挖掘[D].北京:中国科学院研究生院,2002.

[3]王晋年,郑兰芬,童庆禧.成像光谱图像光谱吸收鉴别模型与矿物填图研究[J].环境遥感,1996,11(1):20-31.

[4]Clark R N,Swayze G,Gorelick G.Proceedings of the Third AirborneVisible/InfraredImagingSpectrometer(AVIRIS)Workshop[M].[S.l.]:JPL Publication,1991.

[5]Kruse F A,Lefkoff A B,Bordman J W.The Spectral Image Processing System(SIPS)—interactive visualization and analysis of imaging spectrometer data[J].Remote Sensing of Environment,1993,44(2/3):145-163.

[6]何中海,何斌斌.基于权重光谱角制图的高光谱矿物填图方法[J].光谱学与光谱分析,2011,31(8):2200-2204.

[7]王正海,张红军.SAM和决策树结合的Hyperion数据分类方法[J].武汉科技大学学报:自然科学版,2006,29(5):478-481.

[8]傅文杰,洪金益,朱谷昌.基于SVM遥感矿化蚀变信息提取研究[J].国土资源遥感,2006,18(2):16-19.

[9]杨国鹏,余旭初,刘伟,等.基于支持向量机的高光谱影像分类研究[J].计算机工程与设计,2008,29(8):2029-2031.

[10]刘鹏,曾吴.感兴趣区域遥感图像分类与支持向量机应用研究[J].计算机工程与应用,2009,45(6):243-245.

[11]Clark R N,Swayze G A,Livo K E,et al.Imaging spectroscopy:Earth and planetary remote sensing with the USGS Tetracorderandexpertsystems[J].JournalofGeophysical Research,2003,108(12):5131-5144.

[12]杨强,张志,覃志豪,等.基于aster数据的混合像元分解技术在水质监测与评价中的应用[J].遥感信息,2011(2):20-25.

[13]王杰,杨辽,沈金祥,等.两种基于空间与光谱相结合的TM影像端元提取算法[J].光谱学与光谱分析,2011,31(5):1286-1290.

[14]赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2005:207.

[15]张楠楠.基于遥感与GIS的蚀变信息提取技术及成矿预测研究[D].乌鲁木齐:中国科学院研究生院新疆生态与地理研究所,2010.

[16]安吉尧,欧志芳.结合SVM和Gabor参数优化的车辆检测[J].计算机工程与应用,2011,47(36):203-207.

[17]Hsu C W,Chang C C,Lin C J.A particular guide to support vector classification[D].Taiwan,China:National Taiwan University,2003.

YAN Jining1,2,3,ZHOU Kefa1,2,WANG Jinlin1,WANG Shanshan1,WANG Wei1,LI Dong1,2,3

1.Xinjiang Research Center for Mineral Resources,Xinjiang Institute of Ecology and Geography,Chinese Academy of Sciences, Urumqi 830011,China
2.State Key Laboratory of Desert and Oasis Ecology,Xinjiang Institute of Ecology and Geography,Chinese Academy of Sciences, Urumqi 830011,China
3.University of Chinese Academy of Sciences,Beijing 100049,China

With the development of hyper-spectral remote sensing technology,the level of quantitative remote sensing technology has improved.Aiming at the hyper-spectral image cube,the understanding and data processing in image spatial dimension must be changed to that completed in the spectral dimension.Therefore,an image classification model combined with SAM(Spectral Angle Mapper)and SVM(Support Vector Machine)is introduced,and extracts alteration information in the spectral dimension. In view of the SAM algorithm considering only the spectrum direction,ignoring radiance size,the second classification is made for the SAM results using SVM algorithm and the best parameter is sought using grid search method combined with the classification accuracy assessment.The results of AVIRIS hyper-spectral data show that the classification precision of alteration information reaches 78.172 6%,and a Kappa coefficient of 0.712 5.This model is convenient calculation,and has some practical meaning in solving spectral dimension terrain classification and similar mineral alteration information extraction.

Spectral Angle Mapper(SAM);Support Vector Machine(SVM);hyper-spectral;alteration information extraction; similar mineral

高光谱遥感技术的发展,提高了遥感技术的定量化水平,要求人们从光谱维去理解地物在空间维的变换。提出了一种光谱角匹配技术(Spectral Angle Mapper,SAM)与支持向量机(Support Vector Machine,SVM)相结合的高光谱遥感蚀变信息提取模型,在光谱维提取地表的蚀变信息。鉴于SAM算法仅考虑波谱矢量方向,忽略辐射亮度大小的缺点,利用SVM算法对SAM的提取结果进行二次分类,利用网格搜索法并结合分类精度评估进行参数寻优。通过AVIRIS高光谱数据实验证明,提取的蚀变信息分类精度为78.172 6%,Kappa系数为0.712 5。该模型计算方便,对于解决光谱维的地物分类及相似矿物的蚀变信息提取具有一定的实际意义。

光谱角匹配技术;支持向量机;高光谱;蚀变信息提取;相似矿物

A

TP79

10.3778/j.issn.1002-8331.1301-0067

YAN Jining,ZHOU Kefa,WANG Jinlin,et al.Extraction of hyper-spectral remote sensing alteration information based on SAM and SVM.Computer Engineering and Applications,2013,49(19):141-146.

新疆科技厅科技基础条件平台建设项目(No.PT1217);国家自然科学基金(No.U1129302);国家科技支撑计划(No.2011BAB06B08-01);“西部之光”人才培养计划(No.XBBS201107,No.XBBS201203);新疆科技厅青年基金(No.2011211B48)。

阎继宁(1986—),男,硕士研究生,主要研究方向:遥感数字图像处理;周可法(1972—),男,博士,研究员,主要研究方向:3S技术及应用;王金林,博士,助理研究员;王珊珊,博士,助理研究员;汪玮,助理研究员;李东,硕士研究生。E-mail:zhoukf@ms.xjb.ac.cn

2013-01-08

2013-04-27

1002-8331(2013)19-0141-06

CNKI出版日期:2013-05-21http://www.cnki.net/kcms/detail/11.2127.TP.20130521.1030.015.html

猜你喜欢
白云母高岭石波谱
油酸钠体系中硫化钠与白云母的作用机理
二氧化碳在高岭石孔隙中吸附的分子模拟
内蒙高岭石烧结性能与应用试验
有机白云母的制备与表征
琥珀酸美托洛尔的核磁共振波谱研究
美国波谱通讯系统公司
十二胺体系下六偏磷酸钠对白云母可浮性的影响
高岭石电子结构的密度泛函理论研究
波谱法在覆铜板及印制电路板研究中的应用
精神分裂症磁共振波谱分析研究进展