黎良财 张晓丽 郭 航
(省部共建森林培育与保护教育部重点实验室(北京林业大学),北京,100083)
基于SVM方法的SPOT-5影像植被分类1)
黎良财 张晓丽 郭 航
(省部共建森林培育与保护教育部重点实验室(北京林业大学),北京,100083)
运用SPOT-5全色和多光谱影像,采用支持向量机(SVM)法对森林植被进行分类研究,探讨了SVM法的分类能力以及纹理信息在森林植被分类中的影响。结果表明:Gram-Schmidt光谱锐化法是北京山区SPOT-5影像最佳的融合方法;SVM法在高分辨率影像森林植被分类中精度较高,不同核函数对分类精度的影响不显著;基于灰度共生矩阵产生的纹理信息能够提高SVM法的分类精度,3×3窗口是提高分类精度的最佳纹理窗口。
影像融合;Gram-Schmidt光谱锐化法;灰度共生矩阵;支持向量机;植被分类
森林植被被公认为是反映生态环境变化的重要而又敏感的指示器,其中植被类型是研究森林状况和动态变化规律的基础。遥感技术具有的宏观、动态、可重复和成本低等诸多优点满足了森林植被分类在时间和空间上的需要,己成为研究植被现状与时空变化的理想手段。许多研究者提出了各种方案改进植被分类精度:一些学者[1-6]在分类时引入植被指数来改善植被分类精度;一些学者[7-16]综合利用多时相、多源数据辅助分类,获得了较高的分类精度;还有一些学者[17-21]采用BP神经网络智能分类技术得到了较好的分类结果。而对于高分辨率影像,引入纹理信息参与植被分类值得探讨。
本研究以北京市西北部八达岭林场为试验区,选用SPOT-5影像,先期对影像进行校正、融合等预处理,再通过灰度共生矩阵构造派生纹理信息,采用支持向量机(SVM)法综合多光谱信息和纹理信息进行小区域植被分类,能够将针叶林、阔叶林、灌木林较好地分开。
本研究以八达岭林场为对象,该林场位于北京市西北部延庆县境内,在延庆和昌平两县交界处的万里长城主要关口——居庸关和八达岭之间,是首都生态系统的重要组成部分和重要的生态屏障。林场西高东低,沟谷纵横,最高海拔1 238 m,最低海拔450 m。属暖温带半湿润大陆性季风气候,年均温11.8 ℃,年均无霜期190 d,年均降水量644 mm。土壤地带性上处于暖温带半湿润地区的褐土带,原生植被类型是暖温带落叶阔叶林和温性针叶林,由于修筑长城,历代多次用兵,使原有森林环境逐渐向干旱草原发展。20世纪50年代建场以来,逐年营造的人工林,现已大部分郁闭成林,树种主要有油松、侧柏、华北落叶松、椴树、元宝枫、榆树、山杏、刺槐、黄栌等,现有森林覆盖率已达到60.7%[22]。
数据来源:选用SPOT-5(2004年5月23日)2.5 m全色和10 m多光谱影像(参数见表1),辅以林场1∶10 000地形图,1∶10 000数字高程模型(DEM)、八达岭林场边界矢量图层。
正射校正:研究区为多山地区,地形起伏较大,常规的几何校正方法难以消除地形因素对影像变形的影响,因此,必须结合数字高程模型(DEM)数据对影像进行正射校正。ENVI4.8版本正射校正模块中嵌入了SPOT-5轨道物理模型,能够生产高精度的正射影像。该模型自动读取DEM信息以及卫星传感器的状态参数,这些参数存贮在元数据中。校正所用基准面为Krasovsky,投影为Gauss_Kruger,坐标系为Beijing1954。首先校正SPOT-5全色影像,然后以其为参照校正多光谱影像。校正时控制点应先在影像4个角上选取,然后均匀加密,数量为15个,检查点选取5个;采用二次多项式方法进行影像配准,双线性内插法重采样,配准误差控制在1个像素内。
表1 卫星数据参数
试验区裁剪:为获得准确的研究区范围,用北京市八达岭林场矢量图层做掩膜,裁剪正射校正后影像,生成研究区影像(范围见图1)。
图1 试验区位置和SPOT-5影像
影像融合:遥感图像融合是在计算机系统的支持下,采用一定的方法将多源遥感图像所包含的优势信息或互补信息有效地结合起来,用来获取对同一场景中事物或目标更客观、更本质的认识。文中采用像素级融合方法,目前比较常用的方法有Multiplicative变换、Brovey变换、HIS变换、PCA变换、Gram-Schmidt(GS)变换、Wavelet变换等。这些方法在某些特定方面都取得了较好的应用效果,但是它们也有自身的缺点[23],文中将上述几种常用融合方法进行对比筛选。
波段构造:SPOT-5多光谱影像光谱特征并不突出,但随着分辨率的提高,地物的纹理特征越来越突出,增加纹理信息,可以有效地提高分类精度。影像分类时输入波段包括SPOT-5的4个多光谱波段和由全色波段提取的纹理信息,即Haralick[24]提出的基于灰度共生矩阵(其中d=1,θ=135)计算出的角二阶矩(AS,M)、对比度(CO,N)、熵(EN,T)、局部平稳(HO,M)、和平均(AV,R)、非相似度(DI,S)、方差(VA,R)等7种统计纹理信息。
训练样地:地面数据采集工作要尽量多涵盖具有不同树种、不同地形特征的地块,由于影像成像于2004年,故实地踏察时应选择人为干扰少,植被类型稳定的样点建立10 m×10 m的标准地,记录每个标准地中心的坐标、树种组成、海拔、坡向、坡位及郁闭度。共计在八达岭林场设置了48个标准地,建立森林植被解译标志,作为接下来选取分类样本的依据。
影像分类:森林植被的划分是森林资源调查和监测的基础,依据2003年国家林业局颁布的《森林资源规划设计调查主要技术规定》和2003年《北京市森林资源规划设计调查操作技术细则》,遵循统一性、适用性以及遥感技术可监测性原则,将研究区森林资源的地类划分为林业用地和非林业用地;林业用地分为有林地(含疏林地)和灌木林地,有林地依据林分组成分成针叶林、阔叶林两个类型。在遥感分类研究中,选用支持向量机(SVM)方法和最大似然法。
3.1 融合结果与评价
不同融合方法都明显提高了影像的空间分辨率,更加便于目视解译 。影像融合算法的评价通常有2种方法,即视觉评价和定量评价[25]。
3.1.1 视觉评价
将融合影像和试验区原始影像(图2)进行目视对比。
图2 试验区原始影像(局部)
GS方法融合效果最好,光谱上几乎没有畸变(图3F);PCA方法融合结果产生了较大的光谱扭曲,整个影像显示为红色(图3D);HIS方法融合结果也有较大的光谱失真(图3B);Brovey、Multiplicative方法融合结果没有明显差异(图3A、C)。与其他融合方法相比,基于Wavelet+HIS变换融合法增强了地物间的差异,但同时也产生了一些明显的噪声点(图3E)。对于该区域而言,基于GS方法的影像融合产生了较好的效果。
图3 融合后影像
3.1.2 定量评价
定量评价影像融合效果的统计参数较多[25],文中基于提高空间分辨率、增加信息量和保持融合影像的光谱性质的标准,选取了信息熵、图像均值、标准差、光谱扭曲程度及平均梯度5个指标,统计结果如表2所示。
表2 SPOT-5影像融合效果统计
注:—表示无数据。
影像的熵值是衡量影像信息丰富程度的一个重要指标。几乎所有融合方法在各个波段的熵值都大于原始多光谱影像,说明各种融合方法都在不同程度上增加了影像的信息量。其中基于小波的HIS变换的融合影像在各个波段都具有最大的熵值,说明该算法能够显著地增加融合影像的信息量。
影像均值是像素灰度平均值,对人眼反映为平均亮度。Brovey、Multiplicative、HIS法使均值变小;Wavelet+HIS法使均值变大;GS法几乎没有变化。
标准差是用来评价融合影像与原始影像之间的差异程度。光谱扭曲程度直接反映了多光谱影像的光谱失真程度。值越小,表示融合的效果越好。从标准差和光谱扭曲来看,GS法显著小于其他方法,说明该方法融合影像与原始多光谱影像相比变异较少,HIS法变异最为严重,这与目视评价结果一致。
平均梯度反映了影像清晰程度和微小细节反差及纹理变换特征,所有融合影像平均梯度值都高于原始多光谱影像,说明融合影像纹理更突出,反差更明显,清晰度更高。小波变换的值最大,其余由大到小依次为HIS、Brovey、PCA、GS、Multiplicative方法。
综上所述,5个指标中GS法在提高影像空间分辨率和增强影像清晰度的同时,很好地保持了影像的光谱特征,最适合于本地区使用。
3.2 分类精度
3.2.1 不同分类方法精度比较
分别用最大似然法和SVM法对合成的11波段(T11)影像进行分类(图4A、F)。SVM法采用多项式(Polynomial)核函数,阶数取5,窗口大小取3×3。为检验2种分类方法的精度,采用随机抽样法在分类图上生成200个随机点,然后对照研究区2005年航片判断分类的正确性,生成分类精度矩阵。2种方法的分类精度见表3、表4。
表3 最大似然法分类精度矩阵(T11)
注:Kappa=0.412 7;总体精度=56.00%。
表4 SVM法分类精度矩阵(T11 3×3 Polynomial)
注:Kappa=0.768 8;总体精度=83.50%。
从表3可以看出最大似然法很难把灌木林与阔叶林准确分开,针叶林的分类精度也不高,该方法的总体精度56.00%,Kappa系数为0.412 7。而以多项式为核函数的SVM法能够将针叶林、阔叶林、灌木林较好地分开,总体精度达到了83.5%,Kappa系数为0.768 8。比较2种方法,SVM法能够明显地提高森林植被的分类精度。
3.2.2 不同核函数对分类精度的影响
基于SVM方法,采用3种核函数(多项式Polynomial、线性Linear、径向基Radial Basis)对T11影像进行分类(图4D、E、F),得到分类精度矩阵(表4~表6)。通过分析表4、表5、表6发现,采用Linear、Polynomial和Radial Basis核函数分类的总体分类精度分别为83.00%、83.50%和84.50%,Kappa系数分别为0.761 0、0.768 8和0.781 8,3种核函数对分类精度的影响并不显著,且每一种核函数都可以取得较好的分类结果。
表5 SVM法分类精度矩阵(T11 3×3 Linear)
注:Kappa=0.761 0;总体精度=83.00%。
表6 SVM法分类精度矩阵(T11 3×3 Radial Basis)
注:Kappa=0.781 8 ;总体精度=84.50%。
3.2.3 纹理信息对分类精度的影响
为分析纹理信息对分类精度的影响,选择无纹理信息的多光谱3个波段(T3)影像和有纹理信息的T11影像采用SVM法进行分类比较研究,分类结果见图4B、 F,所得的分类精度矩阵见表4和表7。对比表4和表7可知,T3影像比T11影像的分类精度低,总体精度分别为77.50%和83.50%,Kappa系数分别为0.685 0和0.768 8。
表7 SVM法分类精度矩阵(T3 3×3 Polynomial)
注:Kappa=0.685 0;总体精度=77.50%。
通过比较可以看出基于灰度共生矩阵产生的纹理对于提高影像分类精度有较大的帮助,随着影像分辨率的提高,纹理信息的作用也就显得越来越重要。
3.2.4 不同窗口大小对分类精度的影响
为了分析不同窗口大小对分类精度的影响,分别提取3×3、5×5和7×7窗口的纹理信息基于SVM法进行分类(图4F、 G、 H)。通过比较分类精度矩阵表4、表8和表9发现,3×3窗口和5×5窗口的总体分类精度与Kappa系数差异不显著,以3×3窗口精度略高;7×7窗口的总体分类精度最低,Kappa系数最小,差异显著。由上述分析可以看出,随着窗口的增大,分类精度有降低的趋势。
图4 植被分类图
表8 SVM法分类精度矩阵(T11 5×5 Polynomial)
注:Kappa=0.760 7;总体精度=83.00%。
表9 SVM法分类精度矩阵(T11 7×7 Polynomial)
注:Kappa=0.661 5;总体精度=76.00%。
3.2.5 纹理信息维度对分类精度的影响
纹理信息能够提高影像的分类精度,然而,所采用的纹理信息越多,所产生的波段也就越多,同时增加了分类的运算量和运算复杂程度,找到最少最有效的波段能够提高分类的效率。对T11影像的相关性进行分析,得到各波段的相关性表(表10)。通过分析表10,在尽量保留多光谱信息的前提下,最终选择B1、B2、B3、B6、B8、B9波段合成6波段(T6)影像。
采用SVM法对T6影像进行分类,结果见图4C,所得分类精度矩阵如表11所示。通过比较表4和表11发现,T11影像和T6影像分类结果的总体精度分别为83.50%和82.50%,Kappa系数分别为0.768 8和0.755 4,各类别的分类结果也没有显著差异,说明可以用T6影像替代T11影像进行分类。
表10 波段相关性分析
注:B1~B4为多光谱4个波段;B5~B11分别为AVR、VAR、HOM、CON、DIS、ENT、ASM。
表11 SVM法分类精度矩阵(T6 3×3 Polynomial)
注:Kappa=0.755 4;总体精度=82.50%。
对比不同方法在山区SPOT-5影像融合中的效果,得出Gram-Schmidt光谱锐化法在增加影像信息量、清晰度,保持光谱特征方面都具有优势,是北京西北山区SPOT-5影像最佳的融合方法。
SVM法在高分辨率影像森林植被分类中比最大似然法具有优势,分类精度较高,是一种有潜力的方法,不同核函数对分类精度的影响不显著。
基于灰度共生矩阵产生的纹理信息能够增加SVM法的分类精度。计算GLCM时,方向θ、距离d和窗口大小的选择非常重要,d一般取1,方向采用了Haralick提出的θ=135,而对不同的窗口大小产生的纹理对分类精度的影响进行了对比,随着窗口的增大,分类精度随之降低;3×3窗口是SPOT影像提取纹理信息的最佳窗口。
山区复杂的地物光谱特征决定了信息提取的复杂性。从光谱角度而言,丰富的光谱特征能够提高地物的分辨能力,将高光谱数据应用于山区森林植被分类是今后研究的方向;从地物纹理特征而言,高分辨率影像具有丰富的纹理特征,将高分辨率数据应用于树种级分类是今后研究的另一个方向;从纹理信息提取角度而言,应用小波分析能够有效提取遥感影像中各个层次丰富的信息,小波分析提取纹理信息也是值得进一步研究的方向。
[1] Tucker C J, Townshend J R G, Goff T E. African land-cover classification using satellite data[J]. Science,1985,227:369-375.
[2] 盛永伟,陈维英,肖乾广,等.利用气象卫星植被指数进行我国植被的宏观分类[J].科技通报,1995,40(1):68-71.
[3] 黄建文,鞠洪波.利用航天遥感数据进行植被分类的研究[J].林业科技通讯,1998(10):9-11.
[4] 李晓兵,史培军.基于NOAA/AVHRR数据的中国植被类型NDVI变化规律研究[J].植物学报,1999,41(3):314-324.
[5] 徐丽华,岳文泽,李先华,等.基于二维小波变换的遥感分类研究[J].遥感技术与应用,2003,18(5):317-321.
[6] 刘峰,张贵.基于GIS和RS的广州市森林植被分类研究[J].湖南林业科技,2004,31(1):15-17.
[7] Townshend J R G, Goff T E, Tucker C J. Multispectral dimensionality of images of normalized difference vegetation index at continental scales[J]. IEEE Transaction on Geoscience and Remote Sensing,1985,23(6):888-895.
[8] Philip A T, Stephen J W. Remote sensing of forested wetlands: application of multitemporal and multispectral satellite imagery to determine plant community composition and structure in southeastern USA[J]. Plant Ecology,2001,157(2):129-149.
[9] Lu Dengsheng, Batistella M, Moran E, et al. Fractional forest cover mapping in the Brazilian Amazon with a combination of MODIS and TM images[J]. International Journal of Remote Sensing,2011,32(22):7131-7149.
[10] Aruna V F C, Chen Shengbo. Remote sensing classification of western Sierra Leone using landsat TM and ETM+[J]. Global Geology,2012,15(1):58-65.
[11] Mayaux P, de Grandi G, Malingreau J P. Central African forest cover revisited: a multisatellite analysis[J]. Remote Sensing of Environment,2000,71(2):183-196.
[12] 霍宏涛,王任华,游先祥.三维及相关辅助信息在提高图像分类精度中的研究[J].北京林业大学学报,2001,23(2):28-31.
[13] 游晓斌,王蕾.应用辅助信息提高森林分类和森林区划能力的研究[J].北京林业大学学报,2003,25(特刊):41-42.
[14] 李道峰,田英,郝芳华.基于NDVI数据的黄河流域地表植被覆盖综合分类研究[J].水土保持研究,2003,10(4):88-91.
[15] Agarwal S, Joshi P K, Shukla Y, et al. Spot-vegetation multi-temporal data for classifying vegetation in south central Asia[J]. Current Science,2003,84:1440-1448.
[16] Jing Xia, Wang Jindi, Wang Jihua, et al. Classifying forest vegetation using sub-region classification based on multi-temporal remote sensing images[J]. Remote Sensing Technology and Application,2008,23(4):394-397.
[17] 王任华,霍宏涛,游先祥.人工神经网络在遥感图像森林植被分类中的应用[J].北京林业大学学报,2003,25(4):1-5.
[18] Berberoglu S, Tuluhan Y K, Özkan C. Mapping and monitoring of coastal wetlands of Cukurova Delta in the Eastern Mediterranean region[J]. Biodiversity and Conservation,2004,13(3):615-633.
[19] 刘旭升,张晓丽.基于BP神经网络的森林植被遥感分类研究[J].林业资源管理,2005(1):51-54.
[20] 王立海,赵正勇.基于BP神经网络的针阔混交林TM遥感图像自动分类技术研究[J].林业科学,2005,41(6):94-101.
[21] 李仪,陈云浩,李京.基于微种群遗传算法和自适应BP算法的遥感图像分类[J].光学技术,2005,31(1):17-20.
[22] 武会欣.八达岭林场油松林健康评价[D].保定:河北农业大学,2006.
[23] 李存军,刘良云,王纪华,等.两种高保真遥感图像融合方法比较[J].中国图象图形学报,2004,9(11):1376-1385.
[24] Haralick R M, Shanmugam K, Dinstein I. Texture features for image classification[J]. IEEE Transactions on Systems Man and Cybernetics,1973,3(6):610-621.
[25] 王海晖,彭嘉雄,吴巍,等.多源遥感图像融合效果评价方法研究[J].计算机工程与应用,2003(25):33-37.
Vegetation Extraction in SPOT5 Image with SVM Method/
Li Liangcai, Zhang Xiaoli, Guo Hang(Key Laboratory for Silviculture and Conservation of Ministry of Education, Beijing Forestry University, Beijing 100083, P. R. China)//Journal of Northeast Forestry University.-2014,42(1).-51~56
Image fusion; Gram-Schmidt spectral sharpening method; Gray level co-occurrence matrix (GLCM); Support vector machine (SVM); Vegetation extraction
1) 国家“863”计划课题(2012AA102001-5)、教育部高等学校博士学科点专项科研基金资助课题(20100014110002)。
黎良财,男,1978年11月生,省部共建森林培育与保护教育部重点实验室(北京林业大学),博士研究生;现工作于广西生态工程职业技术学院,副教授。
张晓丽,省部共建森林培育与保护教育部重点实验室(北京林业大学),教授,博士生导师。E-mail:zhang-xl@263.net。
2012年11月19日。
S771.8; TP753
责任编辑:任 俐。
The experiment was conducted to classify the forest vegetation with support vector machine (SVM) method based on SPOT-5 panchromatic and multispectral images and explore the ability with SVM method and the effect by texture information in forest vegetation classification. Gram-Schmidt spectral sharpening method is the best fusion method for SPOT-5 image in Beijing mountain areas. SVM method has higher classification accuracy with the fine resolution images in the forest vegetation extraction. There is no significant difference on classification accuracy with different kernel functions. Image texture information from Gray level co-occurrence matrix (GLCM) method can improve the classification accuracy by SVM method, and the best texture window of 3×3 windows can improve the classification accuracy obviously.