基于核PCA方法的高分辨率遥感图像自动解译

2011-01-05 07:56刘世英杨金中茅晟懿
自然资源遥感 2011年3期
关键词:高分辨率后处理矩阵

张 微,张 伟,刘世英,杨金中,茅晟懿

基于核PCA方法的高分辨率遥感图像自动解译

张 微1,张 伟2,刘世英3,杨金中1,茅晟懿4

(1.中国国土资源航空物探遥感中心,北京 100083;2.四川省地质调查院,成都 610081;3.青海省地质调查院,西宁 810012;4.中国科学院广州地球化学研究所,广州 510640)

针对基于像元的高分辨率遥感图像自动解译存在的缺点,提出一种分三步走的高分辨率遥感图像自动解译技术流程:首先采用核PCA进行特征提取,然后采用支持向量机(Support Vector Machine,SVM)进行分类,最后采用择多滤波器进行分类后处理。通过对覆盖西藏山南地区的IKONOS图像的解译实验表明,本文方法能够有效地实现遥感图像自动解译,其结果与人工目视解译图基本一致,取得了理想的效果。

IKONOS;核PCA;支持向量机;分类后处理

0 引言

遥感技术具有大尺度、不受自然条件(如地形)和交通条件限制等优势,在区域地质调查中发挥着越来越重要的作用。多光谱遥感数据是传统的遥感地质应用的数据源,其中,中低光谱分辨率图像(如Landsat MSS、SPOT或ASTER)主要用于较大区域尺度下的地质构造与地形地貌解译[1-3];最近发展起来的高分辨率遥感图像(如IKONOS、QuickBird或WorldView-2)为地质信息解译提供了新的数据源,具有更丰富的信息表达,已在地质领域进行了应用[4-9],但仍主要是对图像的人工目视解译。人工目视解译虽然可以获得较好的分类结果,但工作量大,效率低,具有主观性强和非定量等缺陷[10]。传统的针对中低分辨率图像开发的基于像元的分类技术,仅利用单个像元的光谱特征进行分类,而没有顾及高分辨率遥感图像中丰富的空间结构和纹理信息,会导致分类结果存在严重的类内噪声。由于高分辨率遥感图像存在类内混合像元及大量阴影,使得从光谱波段有限的高分辨率图像中获取准确的类别信息变得困难[11,12]。针对基于像元的高分辨率遥感图像分类存在的缺陷,科研人员已研发了基于对象的分类技术,即以光谱、纹理、形状和尺度等对象特征为基础的区域合并分割技术[13]。这种基于对象的分类技术已被成功地应用于多个高分辨率遥感应用领域,但是该类方法需要更多的前处理和后处理,且在分类规则制定方面也需较多的人工干预。

1 核PCA特征提取

由于遥感图像的不同波段之间往往存在着很高的相关性,PCA变换的目的就是把原来多波段图像中的有用信息集中到数目尽可能少的新的主成分图像中,并使这些主成分图像之间互不相关,从而大大减少总数据量并使图像信息得到增强[14]。PCA是地质信息提取中的常用方法,通过对原始样本的协方差矩阵进行分解,选取前n个最大特征值所对应的特征向量组成最优投影矩阵;再通过将样本数据在最优投影矩阵上投影而映射到主成分特征空间中。该方法已被广泛应用于多光谱/高光谱数据的降维处理和信息增强[15,16]。Crosta 等[17]和 Rabelo于1993年就提出了基于PCA方法的Crosta技术,用于TM图像对褐铁矿和粘土蚀变制图,此后被广泛用于地质信息增强[18-20]。Almeida - Filho[21]则于2002年提出对Landsat ETM+的6个波段进行PCA变换后可区分粘土矿和含铁矿物。

PCA变换首先根据原始图像数据矩阵X求出它的协方差矩阵S,即

随后求出矩阵S的特征值λ和特征向量,并组成变换矩阵T。解算特征方程(λI-S)U=0即可求出协方差矩阵 S的各个特征值 λj(j=1,2,…,m),将其按λ1≥λ2≥…≥λm排列,求得各特征值对应的单位特征向量(经归一化)Uj:Uj=[u1j,u2j,…,umj]T。U矩阵的转置矩阵即为所求的PCA变换的变换矩阵T。将T代入,得到PCA变换的具体表达式,即

可以看出,PCA方法是对特征的线性分解,它不适用于揭示遥感图像中隐含的非线性混合的地质信息。

基于核函数的主分量分析(核PCA)是国际上新提出的一种特征提取算法,是利用核技巧对PCA的一种非线性推广。对于服从任意分布的观测数据,核PCA首先利用一个非线性映射函数将观测数据从输入空间映射到特征空间中,使得映射数据近似高斯分布;然后对映射数据进行PCA变换。核PCA可以表达图像像元间的高阶关系,提取图像的非线性特征;同时提供一组相互独立的主成分信息,能比较好地在高维空间将非线性问题转化成线性问题,并回避了求取非线性映射的复杂性。

核函数是满足Mercer条件的任意对称函数,常用的核函数有:①齐次多项式核 k(xi,xj)=(xigxj)d;②非齐次多项式核 k(xi,xj)=(xigxj+1)d;③径向基核(高斯核)k(xi,xj)=exp(-γ‖xixj‖)2,γ >0,常用 γ =1/2σ2;④双曲正切函数k(xi,xj)=tanh(kxigxj+c)。

在核PCA中,首次采用非线性的映射将原始空间转化为高维空间,即

对于控制室设置有流量计算机的计量系统应根据涡轮流量计的检定结果,及时修改计算机中设置的仪表系数,确保工况流量传输的准确。要根据现场工艺情况以及仪表性能,正确选择小流量切除的工况点,对于具有压力、温度传输故障自动补偿功能的流量计算机要根据工况设置压力、温度的预设值,同时要合理选取压力、温度、流量的上下限报警点,以确保流量计算机的正常运行。

式中,k为核函数。

随后采用传统的PCA计算高维空间的协方差矩阵,最后得到核主成分。

2 SVM分类

基于核函数的PCA处理是一种非线性特征提取方法,随后采用分类方法对这些特征进行监督分类。在分类中采用核函数的非线性映射的思想是最近发展起来的SVM方法。SVM技术基于统计学习理论,该理论早在20世纪60年代中期就已经由Vapnik等人提出并开始研究,20世纪90年代中期,统计学习理论逐渐发展成熟,并形成了一个较完整的理论体系。SVM利用了最大间隔超平面、Mercer核、凸二次规划、稀疏解和松弛变量等多项技术。在遥感应用领域中的研究表明,SVM能比最大似然分类、神经网络等传统分类方法获得更高的分类精度[22-27]。

SVM是由线性可分情况下的最优分类面发展而来的,所谓最优分类面就是要求分类面不但能将两个类别正确分开,而且使分类间隔最大。设分类面的方程为x·w+b=0,使得对线性可分的样本集(xi,yi)(i=1,…,n;x∈Rd;y∈{+1,-1})满足

yi[(w·xi)+b]-1≥0,i=1,2,…,n (4)此时分类间隔ρ=2/‖w‖,使间隔最大等价于使‖w‖/2最小。

对于非线性问题,与核PCA的处理方法一致,只需将输入向量映射到一个更高维的特征空间,然后再构造最优分类超平面。不必知道具体的映射函数 ф(xi)的表达式,若 K(xi,xj)=ф(xi)·ф(xj),则称K(xi,xj)为内核函数。

3 分类后处理

如前所述,在基于像元的遥感图像分类中,由于混合像元的存在以及分类算法是针对每个像元单独进行的,在分类结果图像中会出现同类地物中夹杂着零散分布的异类地物的不一致现象,表现为类别噪声[14],这一现象在高分辨率遥感自动分类中更为明显。为了解决这种不符合实际情况、也不满足分类要求的问题,可通过平滑后处理来减少或消除类别噪声的影响。

一种常用的平滑后处理方法是择多滤波。在这种滤波中,一个移动的窗口通过分类后的数据集,并且确定这个窗口中的优势类别。如果这个窗口中的中心像元的类别不属于该窗口的优势类别,就将该像元的类别替换成优势类别;如果在窗口中没有优势类别,则中心像元的类别不会发生变化。平滑处理中滤波窗口大小的选择应依据需求进行调整,总体而言,对于原本比较细小的地物用小窗口,窗口太大会消除细小地物;对于原本块体比较大的地物用大的窗口,可以使边界更加明显。已有研究表明,采用Landsat TM进行黄土高原土地利用信息分类时,选用28像元×28像元大小的窗口较为适宜[28];采用SPOT 5进行水土保持信息分类时,选用6像元×6像元大小的窗口为最佳[29]。

4 IKONOS自动解译实验

4.1 IKONOS 数据概况

IKONOS卫星于1999年发射,是世界上第一颗提供高分辨率卫星图像的商业遥感卫星,轨道设计高度为682 km,可采集1 m分辨率全色(0.45~0.90 μm)和 4 m 分辨率多光谱(蓝波段:0.45 ~053 μm,绿波段:0.52 ~0.61 μm,红波段:0.64 ~0.72 μm,近红外波段:0.77 ~0.88 μm)卫星图像。由于该卫星可选择探测纬度和倾斜度,因此可获取指定地点的图像。该卫星能够在与地面垂直方向到倾斜45°方向上收集数据,角度变化可以沿着与轨道相交的方向进行,也可以沿着轨道运行方向实现,因而能够提供横向和纵向的立体像对。IKONOS图像已应用于众多领域(如城市规划、土地利用调查等),在地质领域已用于滑坡等地质灾害监测、矿产资源调查和矿山环境动态监测等工作。

4.2 研究区地质背景

研究区位于冈瓦纳北缘晚古生代—中生代冈底斯—喜马拉雅构造区的冈底斯—拉萨陆块,以白垩系和三叠系构成本区地层的主体,岩性以碎屑岩、碳酸盐岩沉积为主,局部为火山岩建造,中心部位则为始新世花岗闪长岩及花岗斑岩,总体呈近东西向展布,主要为燕山晚期至喜山期的中酸性侵入岩与火山岩;第三系则以碎屑岩、湖相碳酸盐岩和膏盐沉积为主;第四系为冲—洪积、湖积松散砂卵石层。区内断裂多呈东西向展布,地层的分布严格受构造的控制,具有明显的分区性和继承性。部分地区的地层由于受到活动断裂的破坏而失去了应有的连续性(图1)。

图1 研究区地质图Fig.1 Geological map of the study area

4.3 图像处理与人工目视解译

本次研究使用的IKONOS卫星图像数据的获取时间为2010年1月29日。该图像在整个覆盖区范围内无云覆盖,影像清晰,信息丰富,质量较高(图2)。图像经过了辐射校正和高精度正射纠正处理。

图2 研究区IKONOS图像Fig.2 IKONOS image of the study area

本文选择研究区中的一处实验区(图2中红色方框内)进行自动解译实验(图3)。

图3 实验区域Fig.3 Study region

从人工目视解译图(图3(b))中可以看出,主要有3类地质体——南部的雅鲁藏布江(遥感影像呈暗蓝色,解译图为浅蓝色),中偏南部的第四系冲积物Qal4(遥感影像呈浅灰色,解译图为浅黄色),中部及北部的下白垩统比马组(K1b)石英砂岩和砂屑灰岩等(遥感影像呈灰棕色,解译图为绿色)。3类地质体在解译图上界线明显、光滑,但在IKONOS图像上,除水体外,界线并不明显,尤其是在比马组地层因受到道路、干枯河道及阴影的切割而显得支离破碎。其中,道路色调与第四纪冲积物的色调非常相似,而阴影色调与水体一致,上述现象均容易在不同地物信息自动提取中产生混淆。

4.4 自动解译

4.4.1 PCA 与核 PCA 变换

首先对IKONOS卫星图像进行PCA和核PCA变换,分别得到其特征空间的图像(图4)。

图4 PCA((a)~(c))与核PCA((d)~(f))结果比较Fig.4 Comparison of PCA((a)~(c))and Kernel PCA((d)~(f))

从图4中可以看出,PCA与核PCA的结果比较类似,均能对目标地物进行信息增强。图4(a)和(d)分别是PCA和核PCA对水体(红色)增强的效果,除了东北部细长的山体阴影之外,其他地物均有较好的区分度;与图4(a)相比,图4(d)在非水体区域的颜色更加一致,隐蔽了大量不需增强的细节。比较图4(b)和(e)可以发现,核PCA的结果具有多方面优势:①第四系冲积物的增强效果相对较好,没有与道路(图4(b)中部红色的线性体)混淆;②水体识别更加准确,不受河流含沙量的影响,而PCA的结果(图4(b))中东南部的水体与第四系冲积物存在着混淆。最后一个特征波段(图4(c)和(f))也显示出核PCA方法具有更好区分能力,不同地物类型区分相对明显,同时相应地压制了干扰信息。

以上结果表明,区分遥感图像中的地物,仅采用PCA这类线性变换的方式尚不足以适用于原本是非线性混合的光谱信息,而采用具有非线性分解能力的核PCA更为合适。

核PCA方法非线性特性的优势不仅体现在特征增强上,也体现在分类中。如前所述,很多研究均表明了基于核方法的SVM比传统的分类方法分类精度更高。本文采用SVM方法对核PCA的结果进行自动解译。

4.4.2 基于核PCA的SVM分类

SVM是一种监督分类方法。很多文献指出,训练样本的选择在监督分类中非常重要,训练样本不同,分类结果就会出现极大的差异。因此在工作区仔细选择各类训练场地、正确选取有代表性的训练样本是分类能否取得良好效果的一个关键性问题。用于监督分类的训练场地应该是光谱特征比较均一的地区,一般在图像显示中根据均一的色调估计只有一类地物,而且一类地物的训练场地可选取一块以上[14]。但是在覆盖实验区的IKONOS图像中,除对水体区域可以提取色调均一的训练样本之外,对其他区域均难以提取理想的训练样本。为了体现方法的鲁棒性和减少人为干预,本文以人工目视解译的结果(图3(b))为参考,在水体、Qal4和K1b区域内各随机选择100个点作为训练样本。

SVM的分类结果见图5,由图5(a)可以看出,许多明显的干扰信息(如道路等)得到了去除,基本区分出了待自动解译的3类地物,但水体和山体阴影仍然存在混淆;另外在图的左上角出现的Qal4与人工目视解译图也不一致,但从图像上看可能是综合制图导致的差异。后处理的工作就是进一步对分类结果进行综合制图,并对阴影线性体进行去除。由采用择多滤波器后处理的结果(图5(b))可以看出,3类待解译地物的分界非常明显,与作为参考的人工目视解译图基本一致,且与客观事实更为接近。

图5 SVM分类与分类后处理结果对比Fig.5 Comparison of SVM classification with and without post-classification

5 结论

(1)地表地质信息类型多样,空间分布复杂,具有因混合像元导致的非线性特征。本文采用核PCA方法,通过将特征空间映射到高维核空间,可以更加准确地表达图像像元间的高阶关系,从而提取出图像的非线性特征,同时提供一组相互独立的主成分。

(2)通过对西藏山南地区IKONOS图像的分类实验表明,与PCA相比,核PCA具有更好的地物区分和增强能力;在此基础上进行的SVM分类和择多滤波器后处理,可以获得与人工目视解译相一致的结果。

(3)本文提出的基于核PCA方法的高分辨率遥感图像自动解译流程,为采用高分辨率遥感图像(如 IKONOS、QuickBird、WorldView -2等)进行地质信息提取提供参考,可大大地减少人工目视解译的工作量,提高解译效率。

致谢:在研究过程中,中国国土资源航空物探遥感中心方洪宾教授、杨清华教授和赵福岳教授,青海省地质调查院孙延贵教授,四川省地质调查院尹显科教授等专家均给予了热情指导,并提出了许多宝贵意见和建议,在此一并表示感谢。

[1] 朱亮璞.遥感地质学[M].北京:地质出版社,1994:168-176.

[2] Gupta R P.Remote Sensing Geology,2nd Edition[M].Berlin:Springer- Verlag,Heidelberg,New York,2003:655 -661.

[3] Wlkerr T.A Remote Sensing Study of Active Folding and Faulting in Southern Kerman province,S E Iran[J].Journal of Structural Geology,2006(28):654 -668.

[4] Metternicht G,Hurni L,Gogu R.Remote Sensing of Landslides:An Analysis of the Potential Contribution to Geo-spatial Systems for Hazard Assessment in Mountainous Environments[J].Remote Sensing of Environment,2005,98(2/3):284 - 303.

[5] 王瑜玲,刘少峰,李 婧,等.基于高分辨率卫星遥感数据的稀土矿开采状况及地质灾害调查研究[J].江西有色金属,2006,20(1):10-14.

[6] Lin A,Nishikawa M.Coseismic Lateral Offsets of Surface Rupture Zone Produced by the 2001 M - w 7.8 Kunlun Earthquake,Tibet from the IKONOS and QuickBird Imagery[J].International Journal of Remote Sensing,2007,28(11):2431 -2445.

[7] 张自力,秦其明,曹 宝,等.高分辨率遥感影像在岩墙地质体信息提取中的应用[J].地理与地理信息科学,2007,23(3):15-18.

[8] 满 旺.高分辨率遥感铀矿地质勘查技术体系研究[J].厦门理工学院学报,2009,17(3):33 -36.

[9] 王治华,徐起徳,徐 斌.岩门村滑坡高分辨率遥感调查与机制分析[J].岩石力学与工程学报,2009,28(9):1810 -1818.

[10]仇江啸,王效科.基于高分辨率遥感影像的面向对象城市土地覆被分类比较研究[J].遥感技术与应用,2010,25(5):653-661.

[11] Laliberte A S,Rango A,Havstad K M,et al.Object- oriented Image Analysis for Mapping Shrub Encroachment from 1937 to 2003 in Southern New Mexico[J].Remote Sensing of Environment,2004,93(1/2):198 -210.

[12]陈 杰,邓 敏,肖鹏峰,等.基于分水岭变换与空间聚类的高分辨率遥感影像面向对象分类[J].遥感技术与应用,2010,25(5):597-603.

[13] Baatz M,Shape A.Multiresolution Segmentation:An Optimization Approach for High Quality Multi-scale Image Segmentation[C]//Strobl J,Baschke T,Griesebner G.Angewandte Geographische Informationsverarbeitung XII,Wichmann - Verlag:Heidelberg,2000:12 -23.

[14]章孝灿,黄智才,赵元洪.遥感数字图像处理[M].杭州:浙江大学出版社,1997.

[15] Zhao G,Maclean A L.A Comparison of Canonical Discriminant Analysis and Principal Component Analysis for Spectral Transformation[J].Phtotogrammetric Engineering & Remote Senisng,2000,66(7):841 -847.

[16] Mitternicht G I,Zinck J A.Remote Sensing of Soil Salinity:Potentials and Constraints[J].Remote Sensing of Environment,2003,85(1):1 -20.

[17] Crosta A P,Sabine C,Taranik J V.Hydrothermal Alteration Mapping at Bodie,California,Using AVIRIS Hyperspectral Data[J].Remote Sensing of Environment,1998,65(1):309 - 319.

[18] Ruiz- Armenta J R,Prol- Ledesma R M.Techniques for Enhancing the Spectral Response of Hydrothermal Alteration Minerals in Thematic Mapper Images of Central Mexico[J].International Journal of Remote Sensing,1998,19(10):1981 -2000.

[19] Tangestani M H,Moore F.Iron Oxide and Hydroxyl Enhancement Using the Crosta Method:A Case Study from the Zagros Belt,Fars Province,Iran[J].International Journal of Applied Earth Observation and Geoinformation,2000,2(1):140 -146.

[20] Carranza E J M,Hale M.Mineral Imaging with Landsat Thematic Mapper Data for Hydrothermal Alteration Mapping in Heavily Vegetated Terrane[J].International Journal of Remote Sensing,2002,23(22):4827 -4852.

[21] Almeida-Filho R.Remote Detection of Hydrocarbon Microseepage Areas in the Serra do Tona Region,Tucano Basin,Brazil[J].Canadian Journal of Remote Sensing,2002,28(2):750 -757.

[22] Huang C,Davis L S,Townshend J R G.An Assessment of Support Vector Machines for Land Cover Classification[J].International Journal of Remote Sensing,2002,23(4):725 -749.

[23] Zhu G,Blumberg D G.Classification Using ASTER Data and SVM Algorithms:The Case Study of Beer Sheva,Israel[J].Remote Sensing of Environment,2002,80:233 -240.

[24] Foody G M,Mathur A.A Rrelative Evaluation of Multiclass Iimage Classification by Support Vector Machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(6):1335 -1343.

[25] Pal M,Mather P M.Support Vector Classification in Rremote Sensing[J].International Journal of Remote Sensing,2005,26(6):1007-1011.

[26] Oommen T,Misra D,Twarakavi N K C,et al.An Objective Analysis of Support Vector Machine Based Classification for Remote Sensing[J].Mathematical Geosciences,2008,40:409 -422.

[27] Yu L,Porwal A,Holden E J,et al.Towards Automatic Lithological Classification from Remote Sensing Data Using Support Vector Machines[C]//In,EGU2010.Vienna,Austria:2010.

[28]汤国安,张友顺,刘咏梅.遥感数字图像处理[M].北京:科学出版社,2004:274.

[29]王冬梅,吴 卿,王西林,等.应用高分辨率卫星影像提取水土保持措施信息的分类后处理技术研究[J].中国水土保持,2006(5):42-43.

Automatic Interpretation of High Resolution Remotely Sensed Images by Using Kernel Method

ZHANG Wei1,ZHANG Wei2,LIU Shi-ying3,YANG Jin -zhong1,MAO Sheng-yi4
(1.China Aero Geophysical Survey & Remote Sensing Center for Land and Resources,Beijing 100083,China;2.Institute of Geological Survey of Sichuan Province,Chengdu 610081,China;3.Institute of Geological Survey of Qinghai Province,Xining 810012,China;4.Guangzhou Institute of Geochemistry,Chinese Academy of Science,Guangzhou 510640,China)

To tackle the limitation of conventional pixel-based classification methods,this paper proposes a new approach composed of three steps,namely kernel principal component analysis(KPCA)based feature extraction,support vector machine(SVM)classification and majority filtering post-classification.An experiment with an IKONOS image covering a study area in Tibet indicates the effectiveness of this approach.The resultant image from this automatic method shows a pattern very similar to the pattern of the reference map interpreted manually.

IKONOS;Kernel PCA;SVM;Post-classification

TP 751.1

A

1001-070X(2011)03-0082-06

2010-12-16;

2011-02-22

中国地质调查局地质调查项目“青藏铁路沿线矿产资源遥感调查”(编号:1212010781043)资助。

张 微(1980-),男,蒙古族,博士,高级工程师,主要从事遥感技术在矿产资源调查及新构造运动方面的研究,已发表论文50余篇。

(责任编辑:刘心季)

猜你喜欢
高分辨率后处理矩阵
果树防冻措施及冻后处理
高分辨率合成孔径雷达图像解译系统
乏燃料后处理的大厂梦
初等行变换与初等列变换并用求逆矩阵
乏燃料后处理困局
矩阵
矩阵
矩阵
高分辨率对地观测系统
基于Curvelet-Wavelet变换高分辨率遥感图像降噪